Massimo Franceschet
Dipartimento di Matematica e Informatica
Università di Udine
Via delle Scienze 206 -- 33100 Udine, Italia
Email: massimo.franceschet@dimi.uniud.it
Google, il più famoso dei motori di ricerca, al fine di ordinare i risultati (le pagine Web) a fronte di una ricerca fatta da un utente, combina due metodi: la rilevanza e l'importanza. Una pagina è rilevante quando parla dell'argomento cercato dall'utente, e Google assegna ad ogni pagina un punteggio di rilevanza che misura quanto la pagina è attinente rispetto ai termini inseriti dall'utente. Ma il vero punto di forza di Google, che gli ha consentito si surclassare gli altri motori di ricerca, è il metodo che assegna il giudizio di importanza alle pagine. Tale algoritmo prende il nome di PageRank.
Il PageRank assegna un giudizio di importanza ad ogni pagina indipendentemente dalle interrogazioni degli utenti, ma unicamente in funzione della rete dei collegamenti ipertestuali tra pagine Web, rete che forma il World Wide Web. Il PageRank usa la seguente tesi:
Una pagina è importante se viene citata da altre pagine importanti.
Nel contesto del Web, una citazione è un collegamento ipertestuale (link) da una pagina sorgente (la pagina che contiene il link) ad una pagina destinatario (la pagina verso cui il link è diretto). La definizione, apparentemente circolare, è in realtà risolvibile usando strumenti matematici profondi, quali il Teorema di Perron-Frobenius che garantisce l'esistenza e l'unicità di una soluzione al problema della determinazione del PageRank per ogni pagina Web e il Metodo delle Potenze che permette di calcolare in modo iterativo la soluzione.
Più precisamente, il metodo del PageRank usa i seguenti tre fattori per determinare l'importanza di una pagina Web:
Per capire l'importanza dei tre fattori, applichiamo il metodo del PageRank ad una ipotetica rete in cui i giornalisti sono tra loro collegati da giudizi di approvazione da parte di altri giornalisti. Supponiamo, per semplicità, che ogni giornalista possa esprimere un giudizio positivo, non meglio quantificato, detto approvazione, nei confronti di altri suoi colleghi che ritiene meritevoli, mentre non dica nulla se li ritiene neutri o poco meritevoli. Usando il metodo del PageRank per determinare il prestigio dei giornalisti, possiamo reinterpretare i tre fattori esposti sopra nel seguente modo:
Il metodo del PageRank è stato proposto da Sergey Brin e Larry Page nel 1998 durante il dottorato all'Università di Stanford ed è correntemente uno degli ingredienti principali del motore di ricerca Google. Il PageRank è un metodo sottoposto a brevetto. E' curioso come, in realtà, questo metodo fosse già noto ben prima del 1998 in contesti completamente diversi dalle ricerche sul Web. Nell'articolo PageRank: Stand on the shoulders of giants, l'autore Massimo Franceschet, ricercatore del Dipartimento di Matematica e Informatica dell'Università di Udine, traccia la storia di questi illustri predecessori, di seguito riassunta.
In realtà, il vero contributo di Sergey Brin e Larry Page è stato quello di partire da una idea non completamente sconosciuta e farne una idea di successo, costruendo qualcosa di enorme utilità per tutti, in particolare per i ricercatori. Il metodo del PageRank ha cambiato radicalmente i concetti di qualità e di verità dell'informazione che si trova sul Web, allontanandoli dal giudizio erudito degli esperti e associandoli al parere espresso dall'intera comunità. Pare appropriato terminare con un paragrafo di Alessandro Baricco tratto da I barbari. Saggio sulla mutazione (Fandango 2006):
Il valore di un'informazione, nel Web, è dato dal numero di siti che vi indirizzano verso di lei: e quindi dalla velocità con cui, chi la cerca, la troverà. [...] La velocità è generata dalla qualità, non il contrario. I proverbi, diceva Benjamin con una bella espressione, sono geroglifici di un racconto: la pagina web che trovate in testa ai risultati di Google è il geroglifico di tutto un viaggio, fatto di link in link, attraverso l'intera rete.
L'articolo originale: PageRank: Stand on the shoulders of giants
Alcune recensioni: