La web-nauta Stefania si riferisce evidentemente al PageRank, un algoritmo utilizzato per valutare i contenuti presenti sulle pagine Internet utlizzato da Google, il più diffuso motore di ricerca sulla rete. Cercare nei motori di ricerca ha sempre significato ottenere come risultato migliaia di documenti, ordinati secondo la rilevanza dei termini della nostra query, misurata su moltissimi parametri legati alla presenza e alla posizione dei termini nella pagina. La maggior parte delle tecnologie utilizzate dai motori di ricerca, che oggi conosciamo e usiamo frequentemente, fanno riferimento invece anche ai link da e verso una pagina web (Inbound e Outbound link), per valutare l'importanza e determinare il posizionamento della pagina nei confronti di una data keyword. Sapere come i motori di ricerca considerano i link fra le pagine Internet è quindi importante per conoscerli e comprendere sempre meglio i motivi che muovono le pagine all'interno dei loro database. In origine, alla base, di tutto c'è stato il problema/obiettivo di riuscire ad usare un parametro "umano" per determinare quanto fosse rilevante una pagina sulle altre, rispetto a un certo termine. Ma come fare questo senza dover coinvolgere (e quindi pagare) un gran numero di persone e studiare un sistema valido per consentire loro di dare valutazioni "oggettive"? L'unico modo era creare un sistema matematico incentrato sulla valutazione, spesso non espressamente riconosciuta, di un sito da parte di altri responsabili, amministratori e creatori di website. In pratica il sistema doveva poter rispondere alla domanda "Cosa pensano gli altri del mio sito? Quanto lo valutano pertinente e interessante rispetto ad un dato argomento?". Google sembra essere stato un pioniere nell'utilizzo dei collegamenti ipertestuali per la creazione di un sistema di valuazione dell'importanza di un website. Grazie alla tecnologia chiamata PageRank, Google riesce oggi a fornire risultati altamente pertinenti stabilendo in modo del tutto automatizzato una misurazione oggettiva dell'importanza di ogni singola pagina web presente nel suo database. PageRank utilizza un'equazione di circa 500 milioni di variabili e 2 miliardi di termini per creare una struttura dei link della Rete che poi utilizza come strumento di organizzazione e valutazione. Questo sistema non esegue semplicemente un conteggio dei link al nostro sito presenti nelle pagine da lui indicizzate (cioè la Link Popularity) e un conteggio dei link dal nostro sito verso queste stesse pagine, ma valuta anche la provenienza e quindi la "qualità" dei link, o meglio la pertinenza rispetto all'argomento trattato nella nostra pagina. Se si vuole avere idea PageRank di un sito o di una specifica pagina si può scaricare la Google Toolbar ed è anche utile interrogare altri motori per sapere quanti link alle pagine considerate sono presenti nei vari database. Come abbiamo detto la rilevanza di un sito rispetto ad un determinato argomento non si ricava semplicemente dal numero dei link a tale sito presenti sulla rete. Pensiamo infatti a Yahoo!: sicuramente ha un enorme numero di link in tutto il Web e tanti probabilmente anche da siti di carattere scentifico, ma non si può dire che sia anche il sito più autorevole e pertinente rispetto all’argomento "fisica quantistica". Il PageRank di Google vuole invece valutare proprio questa rilevanza. Cerchiamo di comprendere meglio questo strumento: Google interpreta un link dalla pagina A alla pagina B come un voto di A per B e se a sua volta anche B ha un link verso A entrambe ricevono un voto ancora più alto (Feedback-Link). Se la pagina B ha un PageRank più alto il valore di un suo link è ancora più elevato, ma se ha un valore più basso non esiste nessuna penalità. L'importanza di una pagina è data dal voto che questa riceve "dalla Rete" nella sua globalità e i link interni al nostro sito determinano il PageRank delle pagine interne. Se infatti i link che otteniamo dall'esterno sono diretti all'Home Page questa avrà una valore più elevato e le pagine del nostro sito direttamente collegate ad essa (ad esempio quelle relative alle sezioni principali) avranno un valore di PageRank immediatamente minore, ma più elevato di quelle non linkate. Per i progettatori di siti web è quindi fondamentale valutare criticamente la struttura gerarchica delle pagine in fase di restyling del sito oppure di creazione del sito ex-novo, in modo da prevedere sistemi utili a suggerire collegamenti fra le pagine soprattutto in base alla pertinenza di una con l'altra. Con l'obiettivo di aumentare il PageRank delle pagine più importanti potremmo inserire, ad esempio, link diretti dall'Home Page ad alcune pagine con articoli o servizi che si trovano nel 4° o 5° livello. Il fattore principale nella determinazione del PageRank sono i link provenienti dall'esterno, quelli più difficili da ottenere e mantenere se il nostro sito non presenta contenuti validi e facilmente accessibili. Non solo: è fondamentale che i link siano testuali e che il testo ad essi associato contenga parole-chiave in tema alla pagina alla quale puntano. Su questi fattori sono concordi i principali esponenti delle tecnologie di ricerca oggi presenti sul Web, non solo Google, ma anche Ask Jeeves/Teoma e FAST. Tutti consigliano di tessere una rete di relazioni con altri siti del settore, evitando di associarsi a siti mal strutturati e che a loro volta hanno un numero troppo esiguo di link dall'esterno. Ricordiamo, comunque, che i parametri che partecipano al ranking delle pagine, su Google come su altri motori, sono influenzati solo in parte dai link, mentre non ci stancheremo mai di ripetere quanto anche il semplice titolo delle nostre pagine sia fondamentale.
Raffaele Galano – Responsabile MotoriDiRicerca.IT
Nota Redazionale SXT
La risposta del Dr. Galano è un riadattamento di un articolo già apparso sul sito www.MotoriDiRicerca.it da lui coordinato)
|