Google, in qualità di motore di ricerca più utilizzato al mondo, in pratica ha il potere e la responsabilità di assegnare ad ogni pagina indicizzata nel web un valore relativo rispetto alle altre, ergo è Google che dice se (tu sito) sei importante o meno all'interno della rete.
Wikipedia riporta una formula semplificata dell'algoritmo:

Dove:
Questa formula, in base alle mie conocenze, è in realtà solo una piccola parte dell'algoritmo effettivo, tiene infatti conto solo della presenza del link al sito che si vuole indicizzare in altre parti del web e quanto queste sono in vista, ma ci sono molti altri elementi che vengono presi in considerazione: quante volte l'accesso ad un determinato sito è frutto di una ricerca andata a buon fine (in pratica se in tanti cercano "discutere" e poi cliccano il link a questo forum la ricerca in questa direzione va a buon fine e il sito riceve quello che potremmo chiamare un +1), da qualche anno a questa parte è preso in considerazione anche il peso delle pagine del sito (perciò la sua navigabilità anche con connessioni non velocissime), questo ha ad esempio determinto in parte il crollo dei siti realizzati con Flash, che per quanto esteticamente molto sostanziosi, risultano più pesanti, a parità di contenuti, contenuti peraltro non visibili ai bot di google (ai quali appaiono solo come codici illeggibili), un altro elemento riguarda un dato curioso visto che si parla di algoritmi matematici: la qualità dei contenuti determinato attraverso altri algoritmi in continua evoluzione, ma di fatto basati sugli algoritmi quantitativi di cui sopra (e la quantità diventa qualità con un misterioso salto di... qualità?), questo pone di fatto in dubbio l'effettiva democraticità del sistema in toto: il link/"voto" di un sito porno conterà meno del link/"voto" di un sito universitario, eppure è discutibile che la cultura accademica sia più popolare della cultura pornografica.
Per non dilungarmi troppo vengo subito alle conclusioni in modo da aprire il discorso alle vostre opinioni: la maggior parte di noi contribuisce quotidianamente in maniera più o meno inconsapevole alla crescita della più mastodontica base di dati che il mondo abbia mai visto, Google ci appare in un certa misura piuttosto anonimo e neutro (sarà la scelta di una pagina iniziale quasi vuota che mette al centro l'utente con il suo campo di ricerca), ma è ne più ne meno di un'azienda, fatta di persone che hanno nomi e cognomi e interessi privati... esiste una definizione nata nella rete attuale (quella che sta crescendo di blog, social network, forum e affini), si chiama web o trust o rete di fiducia, consiste per l'appunto nella fiducia che ogni utente ha di imbattersi in contenuti veri/buoni/utili quando questi sono diffusi e diffondibili da chiunque: io posso scegliere se credere o meno a ciò che scrive Pinco Pallino qui sul forum, ma mi sarà difficile scegliere di non credere a Larry Page (fondatore di Google) quando mi dice che quello che io stavo cercando è quello che il suo algoritmo mi ha messo in alto nella pagina di ricerca. Google presenta se stesso come un gigante buono e democratico (non a caso il suo slogan è don't be evil), ma lo è? Non suscita alcuna curiosità il fatto che una cospicua percentuale di internauti sia pronta ad inveire contro lo strapotere di Bill Gates e Microsoft, ma poi ignori totalmente che la società che gli somiglia di più come modi e obbiettivi sia Google inc. e non abbia mai nulla da ridire sui suoi sistemi?
Wikipedia riporta una formula semplificata dell'algoritmo:
Dove:
- ''PR[A]'' è il valore di PageRank della pagina A che vogliamo calcolare.
- ''n'' è il numero di pagine che contengono almeno un link verso A. ''Pk'' rappresenta ognuna di tali pagine.
- ''PR[Pk]'' sono i valori di PageRank di ogni pagina Pk.
- ''C[Pk]'' sono il numero complessivo di link contenuti nella pagina che offre il link.
- ''d (damping factor)'' è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all'altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio.
Questa formula, in base alle mie conocenze, è in realtà solo una piccola parte dell'algoritmo effettivo, tiene infatti conto solo della presenza del link al sito che si vuole indicizzare in altre parti del web e quanto queste sono in vista, ma ci sono molti altri elementi che vengono presi in considerazione: quante volte l'accesso ad un determinato sito è frutto di una ricerca andata a buon fine (in pratica se in tanti cercano "discutere" e poi cliccano il link a questo forum la ricerca in questa direzione va a buon fine e il sito riceve quello che potremmo chiamare un +1), da qualche anno a questa parte è preso in considerazione anche il peso delle pagine del sito (perciò la sua navigabilità anche con connessioni non velocissime), questo ha ad esempio determinto in parte il crollo dei siti realizzati con Flash, che per quanto esteticamente molto sostanziosi, risultano più pesanti, a parità di contenuti, contenuti peraltro non visibili ai bot di google (ai quali appaiono solo come codici illeggibili), un altro elemento riguarda un dato curioso visto che si parla di algoritmi matematici: la qualità dei contenuti determinato attraverso altri algoritmi in continua evoluzione, ma di fatto basati sugli algoritmi quantitativi di cui sopra (e la quantità diventa qualità con un misterioso salto di... qualità?), questo pone di fatto in dubbio l'effettiva democraticità del sistema in toto: il link/"voto" di un sito porno conterà meno del link/"voto" di un sito universitario, eppure è discutibile che la cultura accademica sia più popolare della cultura pornografica.
Per non dilungarmi troppo vengo subito alle conclusioni in modo da aprire il discorso alle vostre opinioni: la maggior parte di noi contribuisce quotidianamente in maniera più o meno inconsapevole alla crescita della più mastodontica base di dati che il mondo abbia mai visto, Google ci appare in un certa misura piuttosto anonimo e neutro (sarà la scelta di una pagina iniziale quasi vuota che mette al centro l'utente con il suo campo di ricerca), ma è ne più ne meno di un'azienda, fatta di persone che hanno nomi e cognomi e interessi privati... esiste una definizione nata nella rete attuale (quella che sta crescendo di blog, social network, forum e affini), si chiama web o trust o rete di fiducia, consiste per l'appunto nella fiducia che ogni utente ha di imbattersi in contenuti veri/buoni/utili quando questi sono diffusi e diffondibili da chiunque: io posso scegliere se credere o meno a ciò che scrive Pinco Pallino qui sul forum, ma mi sarà difficile scegliere di non credere a Larry Page (fondatore di Google) quando mi dice che quello che io stavo cercando è quello che il suo algoritmo mi ha messo in alto nella pagina di ricerca. Google presenta se stesso come un gigante buono e democratico (non a caso il suo slogan è don't be evil), ma lo è? Non suscita alcuna curiosità il fatto che una cospicua percentuale di internauti sia pronta ad inveire contro lo strapotere di Bill Gates e Microsoft, ma poi ignori totalmente che la società che gli somiglia di più come modi e obbiettivi sia Google inc. e non abbia mai nulla da ridire sui suoi sistemi?

Comment