SEO by the SEA, ha sco­vato un inte­res­sante bre­vetto, depo­si­tato da Goo­gle lo scorso 24 feb­braio, lo stesso giorno in cui Goo­gle Panda è entrato in fun­zione.
Che si tratti della chiave che tutti i web­ma­ster cer­cano?
Mi sono per­messa di ripor­tare e tra­durre i punti focali del bre­vetto, di cui si può comun­que tro­vare la ver­sione ori­gi­nale a que­sto link.

Ecco come fun­ziona il soft­ware:
1. Qual­cuno digita una query;
2. Il motore di ricerca resti­tui­sce una lista di risul­tati rispon­denti alle query basata su IR (Infor­ma­tion Retrie­val) e link-basedscores;
3. Le pagine sono rior­di­nate in base alle sta­ti­sti­che di uti­lizzo (tutte o in parte);
4. I risul­tati così otte­nuti sono pon­de­rati con altre infor­ma­zioni, come Page­Rank o tempo di cari­ca­mento della pagina.

In pra­tica si tratta di una rea­zione di Goo­gle a quelle tec­ni­che di Black Hat SEO che ren­dono un sito appe­ti­bile per il motore di ricerca ma non per l’utente finale.
I punti 1 e 4 risul­tano per­fet­ta­mente in riga con quanto noto finora, men­tre il vero punto cri­tico del pro­cesso è rap­pre­sen­tato dai punti 2 e 3, ovvero, su che basi sono cal­co­lati gli indici da Goo­gle? Che peso viene for­nito ad ognuno di essi?

Il bre­vetto depo­si­tato include un esem­pio det­ta­gliato su come cal­co­lare il pun­teg­gio totale di una pagina (in un lin­guag­gio che penso sia arabo per chiun­que non sia un cal­co­la­tore o un matematico!):

“In one­par­ti­cu­lar­ver­sion, the docu­men­tsmight be orga­ni­zed by a total score tha­te­quals the usage score mul­ti­plied by the squa­re­root of a query-term-based Infor­ma­tion Retrie­val (IR) score. The usage score might be cal­cu­la­ted by taking a fre­quency of visit score mul­ti­plied by a uni­queu­ser­sco­re­mul­ti­plied by a pathlength score.
The fre­quency of visit score equals log 2(1+log(VF)/log(MAXVF), where VF is the num­ber of time­sthat the docu­ment­wa­svi­si­ted (or acces­sed) in one­month, and MAXVF is set to 2000. A small valuei­su­sed­when VF isun­k­nown. If the uniqueuserislessthan10, ite­quals 0.5*UU/10; other­wise, ite­quals 0.5*(1+UU/MAXUU). UU is the num­ber of uniquehosts/IPsthataccess the docu­ment in one­month, and MAXUU is set to 400. A small valuei­su­sed­when UU isun­k­nown. The pathlength score equals log(K-PL)/log(K). PL is the num­ber of cha­rac­ters in the document’spath, and K is set to 20.”

Vi è però una pre­ci­sa­zione da fare, l’esempio pro­po­sto, per quanto chiaro (!), è valido solo per alcuni casi par­ti­co­lari, non bene spe­ci­fi­cati, men­tre non vi sono indi­ca­zioni su come dovrebbe fun­zio­nare negli altri.

Insomma nono­stante l’indubbio inte­resse del docu­mento que­sto non svela pie­na­mente tutti i segreti che Goo­gle custo­di­sce gelo­sa­mente; offre però alcuni spunti signi­fi­ca­tivi, ad esem­pio appare chiaro che i Web­ma­ster nel futuro dovranno tenere conto di nuovi para­me­tri, tra cui:

Fre­quenza delle visite: ovvero il numero delle volte che una pagina è stata visi­tata in certo periodo, al netto delle visite di robot o di altri agenti auto­ma­tici;
Numero degli utenti: ovvero il numero degli utenti che hanno visi­tato il docu­mento in un deter­mi­nato periodo;
Sta­ti­sti­che utenti: ovvero coe­renza delle visite con l’argomento della pagina.
Si con­ferma quindi la ten­denza, già notata, da parte del motore di ricerca, di pri­vi­le­giare l’esperienza dell’utente, e quindi la qua­lità dei con­te­nuti di un sito, con­cen­tran­dosi non tanto sulla rispon­denza del testo al la query, quanto sul reale com­por­ta­mento degli utenti nella pagina ricercata.

Imma­gine presa da http://pro.dbatrade.com/