Esplorando Google: la classificazione delle pagine sulla base di statistiche di utilizzo

29 Luglio 2011

SEO by the SEA, ha scovato un interessante brevetto, depositato da Google lo scorso 24 febbraio, lo stesso giorno in cui Google Panda è entrato in funzione.
Che si tratti della chiave che tutti i webmaster cercano?
Mi sono permessa di riportare e tradurre i punti focali del brevetto, di cui si può comunque trovare la versione originale a questo link.

Ecco come funziona il software:
1. Qualcuno digita una query;
2. Il motore di ricerca restituisce una lista di risultati rispondenti alle query basata su IR (Information Retrieval) e link-basedscores;
3. Le pagine sono riordinate in base alle statistiche di utilizzo (tutte o in parte);
4. I risultati così ottenuti sono ponderati con altre informazioni, come PageRank o tempo di caricamento della pagina.

In pratica si tratta di una reazione di Google a quelle tecniche di Black Hat SEO che rendono un sito appetibile per il motore di ricerca ma non per l’utente finale.
I punti 1 e 4 risultano perfettamente in riga con quanto noto finora, mentre il vero punto critico del processo è rappresentato dai punti 2 e 3, ovvero, su che basi sono calcolati gli indici da Google? Che peso viene fornito ad ognuno di essi?

Il brevetto depositato include un esempio dettagliato su come calcolare il punteggio totale di una pagina (in un linguaggio che penso sia arabo per chiunque non sia un calcolatore o un matematico!):

“In oneparticularversion, the documentsmight be organized by a total score thatequals the usage score multiplied by the squareroot of a query-term-based Information Retrieval (IR) score. The usage score might be calculated by taking a frequency of visit score multiplied by a uniqueuserscoremultiplied by a pathlength score.
The frequency of visit score equals log 2(1+log(VF)/log(MAXVF), where VF is the number of timesthat the documentwasvisited (or accessed) in onemonth, and MAXVF is set to 2000. A small valueisusedwhen VF isunknown. If the uniqueuserislessthan10, itequals 0.5*UU/10; otherwise, itequals 0.5*(1+UU/MAXUU). UU is the number of uniquehosts/IPsthataccess the document in onemonth, and MAXUU is set to 400. A small valueisusedwhen UU isunknown. The pathlength score equals log(K-PL)/log(K). PL is the number of characters in the document’spath, and K is set to 20.”

Vi è però una precisazione da fare, l’esempio proposto, per quanto chiaro (!), è valido solo per alcuni casi particolari, non bene specificati, mentre non vi sono indicazioni su come dovrebbe funzionare negli altri.

Insomma nonostante l’indubbio interesse del documento questo non svela pienamente tutti i segreti che Google custodisce gelosamente; offre però alcuni spunti significativi, ad esempio appare chiaro che i Webmaster nel futuro dovranno tenere conto di nuovi parametri, tra cui:

• Frequenza delle visite: ovvero il numero delle volte che una pagina è stata visitata in certo periodo, al netto delle visite di robot o di altri agenti automatici;
• Numero degli utenti: ovvero il numero degli utenti che hanno visitato il documento in un determinato periodo;
• Statistiche utenti: ovvero coerenza delle visite con l’argomento della pagina.
Si conferma quindi la tendenza, già notata, da parte del motore di ricerca, di privilegiare l’esperienza dell’utente, e quindi la qualità dei contenuti di un sito, concentrandosi non tanto sulla rispondenza del testo al la query, quanto sul reale comportamento degli utenti nella pagina ricercata.

Immagine presa da http://pro.dbatrade.com/

Esplorando Google: la classificazione delle pagine sulla base di statistiche di utilizzo

Ilaria Guarnieri

Articoli correlati

Vuoi scrivere per noi?

I nostri canali social

Mettiti in contatto

Lavora con noi

Ecosistema