Genova | La storia di google
Anno 1996 Larry e Sergey cominciano a collaborare alla costruzione di un motore di ricerca detto BackRub
di Armando Ricci
Il motore viene chiamato in questo modo perché ha l’abilità di analizzare i «back links» (collegamenti di ritorno) che puntano a un sito.
L’aspetto matematico si chiama PageRank, metodo per determinare l’importanza di una pagina Web.
I motori esistenti, per indicizzare e posizionare i siti nel loro database, si limitano a contare le ricorrenze nel testo delle pagine e dei termini cercati dagli utenti, quindi mostrano ai primi posti siti non sempre pertinenti con le informazioni richieste.
Page e Brin hanno l’idea di verificare e contare non solo le ripetizioni delle parole, ma anche i collegamenti che provengono da altri siti e che puntano ad una determinata pagina. Il loro ragionamento è semplice: se un certo sito è citato e consigliato da molti altri significa che ha dei contenuti interessanti e quindi è giusto farlo vedere prima di altri. Page riteneva che la logica di classificazione dei siti potesse paragonarsi alle citazioni scientifiche. In altre parole, se uno scienziato metteva in risalto le pubblicazioni dalle quali aveva preso spunto per portare avanti il suo operato, le stesse riscuotevano una certa credibilità nell’intera comunità scientifica. Allo stesso modo, questo ragionamento poteva essere fatto per i link.
In realtà il metodo adottato per calcolare il PageRank è molto più complesso ed articolato, non si limita a contare solo i link ma tiene conto anche della qualità dei contenuti e dell’importanza dei siti da cui provengono i link stessi.
Ad esempio, se il sito di un’azienda importante consiglia o ne cita un altro, quest’ultimo acquista agli occhi di Google un valore maggiore rispetto al sito di un concorrente consigliato da un’azienda sconosciuta, e quindi avrà un PageRank più elevato del concorrente. Pertanto, più il PageRank è alto, più alta sarà la posizione della pagina nelle ricerche su Google. Ci sono poi altri importanti fattori che garantiscono l’importanza di un sito come la sua anzianità e il numero dei visitatori.
L’algoritmo, rappresentato da un’equazione con oltre 500 milioni di variabili e 2 miliardi di termini, viene visto come un modello di comportamento dell’utente, il quale segue i link presenti in una pagina senza una logica particolare. C’è una determinata probabilità che il navigatore casuale visiti una pagina, e questa probabilità è data dal valore di PageRank. La probabilità che lo stesso navigatore segua un link è dato unicamente dal numero di collegamenti presenti nella pagina. Se una pagina A possiede un solo collegamento verso una pagina B, c’è il 100% di possibilità che il navigatore casuale finisca su B. Se A possiede 100 link e uno solo è verso B, ci sarà l’1% di possibilità che giunga a B. Pertanto la probabilità che un navigatore raggiunga una pagina è data dalla somma delle probabilità che il navigatore segua i collegamenti verso di essa. Ora, questa probabilità è ridotta in base a un fattore di aggiustamento, cioè l’utente non segue all’infinito i collegamenti presenti su una pagina, ma a volte si annoia e salta ad un’altra pagina casualmente. Tralasciamo, per ovvi motivi, la formula matematica lasciando al lettore la curiosità di approfondire l’argomento.
Come si comporta un motore di ricerca? Sergey Brin, uno dei fondatori di Google, dà una definizione riferendosi alla Legge di Moore. Gordon Moore, ingegnere fondatore della Intel, formulò negli anni ’60 un’osservazione empirica che si dimostrò poi veritiera riguardo al fatto che il numero di componenti elettronici che costituiscono un processore (chip) raddoppiano ogni anno circa, e di conseguenza anche la potenza di calcolo dei PC si duplica. Con una modalità analoga, Brin sostiene che Google può andare nella stessa direzione in termini di ricerca di pagine Web, ovvero raddoppiare ogni anno.
Venerdì 17 febbraio 2017