Come funzionano Panda e Google: gli aspetti tecnici

Panda

Never say no to Panda!

Per chi ha seguito l’evolversi degli algoritmi di Google nel corso degli anni, Panda rappresenta una rivoluzione sotto molti aspetti.

L’aspetto che ritengo più interessante riguarda il fatto che Panda è il primo algoritmo il cui funzionamento viene spiegato con un grado di dettaglio molto alto, fino a qualche dettaglio matematico.

Di più, da Amit Singhal sono arrivate affermazioni che spiegano non solo il criterio seguito da Panda ma anche indicazioni sulla metodologiia di default seguita da Google per valutare i siti web e classificarli.

L’articolo su Wired.com

Il 3 marzo 2011, Wired.com pubblica un articolo dal titolo “The ‘Panda’ That Hates Farms: A Q&A With Google’s Top Search Engineers“.

Nell’articolo vengono intervistati Matt Cutts e Amit Singhal, ai quali vengono poste domande sugli obiettivi di Panda, sul metodo seguito per separare i buoni dai cattivi e sugli aspetti algoritmici dell’implementazione.

Consiglio la lettura dell’articolo a tutti coloro che vorrebbero approfondire un po’ di più il funzionamento di Panda.

Il metodo

Riassumendo quanto detto dai due portavoce di Google, ecco il metodo seguito:

  • viene preso un campione di siti web
  • vengono inviati a dei valutatori esterni
  • ai valutatori vengono poste domande quali
    • Saresti a tuo agio nel dare la tua carta di credito a questo sito?
    • Saresti a tuo agio a dare ai tuoi bambini le medicine indicate su questo sito?
    • Consideri questo sito autorevole?
    • Vedresti bene questo contenuto su una rivista?
    • Ci sono troppe pubblicità su questo sito?
  • in base alle valutazioni, ciascun sito del campione viene considerato più o meno cattivo
  • nello spazio a più dimensioni usato da Google per attribuire coordinate a ciascun sito conosciuto, viene tracciato un (iper)piano in modo che da un lato vi sia una maggioranza di siti considerati cattivi e dall’altro una maggioranza di siti considerati buoni
  • il piano separatore viene poi usato come classificatore di tutti i siti (non solo quelli valutati manualmente) presenti nello spazio a più dimensioni

Che cosa comporta ciò?

Per comprendere le implicazioni di tale approccio, bisogna porre attenzione alla differenza tra la valutazione dei siti campione e la posizione dei siti web (tutti) all’interno dello spazio.

La valutazione dei siti campione avviene sulla base di domande che non riguardano necessariamente specifiche caratteristiche dei siti web. La domanda “Daresti a questo sito la tua carta di credito?” non tenta di individuare una specifica caratteristica ma cerca invece di registrare una sensazione provata dal valutatore umano.

La metodologia non ha interesse a comprendere perché il valutatore esprima un giudizio ma si limita a prendere atto del giudizio stesso, delle sensazioni provate, dell’opinione positiva o negativa.

Queste valutazioni non incidono sulla posizione dei siti nello spazio. Tutti i siti possiedono delle coordinate in base ad altri fattori, che possiamo solo immaginare, e legati a caratteristiche più tecniche, oggettive e facilmente misurabili (contenuti, PageRank, backlink, autorevolezza, anzianità, ecc.).

Tutta la metodologia seguita si traduce dunque nel rispondere alla seguente domanda: “Che caratteristiche tecniche possiedono i siti fisicamente vicini a quelli che non ispirano fiducia o sensazioni positive nelle persone?“. Dove per “fisicamente” si intende “geometricamente”.

Per fare un esempio pratico delle conseguenze dell’approccio di Google, si potrebbe dire, estremizzando, che se la maggioranza dei siti considerati “cattivi” usasse uno sfondo color nero, allora qualunque sito con lo sfondo color nero sarebbe fisicamente più vicino alla “zona cattiva” delimitata dal piano separatore. Posto che il colore di sfondo sia uno dei fattori usato da Google per attribuire le coordinate ai siti web.

Il metodo è interessante in quanto permette di trasporre una classificazione basata sulle sensazioni e su giudizi umani di pochi siti campione in una classificazione di tutti i siti conosciuti dal motore, sulla base delle loro caratteristiche tecniche.

Per funzionare bene, ovviamente, il metodo deve poter far affidamento su un sistema che attribuisce una coordinata a ciascun sito web conosciuto sulla base di tanti parametri. Tanti: probabilmente molti di essi vanno oltre la nostra immaginazione.

Mi verrebbe da dire che l’intero sistema di valutazione funzionerebbe meglio se Google includesse tra gli elementi raccolti anche roba del tipo “indicazione di un numero verde” o la presenza di testi e frasi tipiche di chi rispetta i diritti dei consumatori.

Quanto ci azzecca Panda?

Panda ci azzecca molto, a mio giudizio. Una delle ragioni per le quali sono di questo parere è che ricordo quando, anni fa, Google annunciava pubblicamente sui forum dei (pesanti) cambi di algoritmo, rimanendo in attesa del feedback dei webmaster e SEO.

In quelle occasioni, il clima che si viveva sui forum era lo stesso di un pubblico linciaggio da parte delle vittime innocenti. Avete presente quando i cittadini si avviano con fiaccole e forconi verso il castello del Dr. Frankenstein? Quello.

Con Panda non è stato così, le reazioni dei proprietari dei siti colpiti sono state estremamente più soft di quelle osservate in passato. La sensazione è che l’introduzione dei vecchi algoritmi abbia fatto molte più vittime innocenti. Questo non significa che Panda non abbia fatto vittime; dico solo che magari le vittime colpite stavolta considerano sé stesse meno innocenti e con meno diritto di lamentela.

A questa congettura del tutto personale, si aggiunge anche il fatto che negli ultimi anni le metodologie seguite da Google per introdurre variazioni all’algoritmo, specie variazioni corpose e destinate ad interessare una grande percentuale delle query, comprendono fasi preliminari di test su campioni di utenti, dei quali viene stimata la soddisfazione. Va online ciò che gli utenti gradiscono di più.

Anche una certa sicurezza che traspare dalle parole di Singhal e Cutts lascia intendere che stavolta ci abbiano azzeccato. Singhal dice: “It’s really doing what we said it would do.”.

Generalizzazione

Singhal ha detto che per Panda hanno usato il loro “sistema di valutazione standard”, ad intendere che l’approccio seguito non è nuovo a Google ma rappresenta in realtà il sistema usato solitamente per classificare i siti web.

In altre parole, trovano un iperpiano che divida al meglio i buoni dai cattivi; la trasposizione moderna della riga verticale che si tracciava sulle lavagne delle scuole elementari, ma usando ben più di due dimensioni.

Tutto ciò mi porta a concludere che ad ottenere maggiore visibilità saranno sempre più i siti che mostreranno di essere vicini a chi si comporta meglio.

Sceglietevi il compagno di banco giusto.

11 Responses to Come funzionano Panda e Google: gli aspetti tecnici

  1. D scrive il 5 April 2011 at 09:54

    È un’ idea che stavano maturando da tempo.

    http://www.google.com/technology/pigeonrank.html

  2. RankLab Studio scrive il 5 April 2011 at 11:02

    Apprezzo questo articolo per la sua chiarezza Enrico, mi è chiaro da tempo che per la classificazione dei siti Google dovesse per forza traslare impressioni ed emozioni umane trasportandole su una interfaccia geometrica o comunque matematica, fin dai miei test su Fibonacci . . .bei tempi.

  3. Michele Papaleo scrive il 5 April 2011 at 11:14

    E’ uno dei migliori aggiornamenti che Google abbia fatto!

  4. Lucio scrive il 5 April 2011 at 18:09

    Nessuna notizia sull’implementazione dell’aggiornamento dell’algoritmo sulla versione italiana? E’ da escludere che sia già avvenuta?

  5. Gregorio scrive il 6 April 2011 at 10:00

    “Va online ciò che gli utenti gradiscono di più”

    Dare meno visibilitàa allo spa trova tutti daccordo, ma mettere in prima pagina quello che vogliono gli untenti mi ricorda i nostri politici che dicono quello che vogliono i sondaggi. Alla lunga porta da una parte sbagliata.

  6. Davide Rosi scrive il 7 April 2011 at 11:09

    Grazie, ho trovato questo post molto chiaro.. e il nuovo algoritmo mi sembra seguire i processi che determinano le penalizzazioni dei singoli siti.
    Staremo a vedere come evolve..

  7. Pietro scrive il 19 April 2011 at 09:55

    Chiaro e scritto bene. Penso che Google non indicizzi secondo “quello che piace ai consumatori”. Non si tratta di gusti, ma di tendenze.

    Se c’è una tendenza generale nel web – seguendo l’esempio proposto – a sfiduciare i siti con sfondo nero, Google interpreterà questa tendenza attribuendo un valore di sfiducia a tutti quei siti con lo sfondo nero. Questo non significa che sta favorendo tutti i siti a sfondo bianco, perché piacciono agli utenti, ma sta semplicemente sfavorendo quei siti che generano sfiducia.

    E il concetto di fiducia / sfiducia è molto ampio e copre diverse tematiche: dall’e-commerce alla prenotazione, dalla grafica al messaggio pubblicitario (es.: un sito con troppi banner genera più fiducia di uno senza?). Et cet et cet

  8. Pingback: Surviving (Google) Panda update in Italia. | Being Stuart

  9. Fradefra - chef a domicilio - ex SEO scrive il 23 August 2011 at 15:20

    Sembrerò folle, ma Panda mi piace, xké collima con la mia idea su come si debbano classificare i siti.

    Tecnologia e codice sono importanti solo in relazione all’esperienza della visita. Ho sempre pensato ke sia meglio 1 sito fatto tecnicamente male, ma ke piace, ad uno fatto tecnicamente benissimo, ma ke nn piace.

    Come nel mio lavoro. A che serve un piatto secondo me perfetto che però poi non piace a nessuno?

  10. Pingback: Content Spinning Avanzato per Article Marketing post Panda? | Posizionamento Zen

  11. teutra scrive il 5 November 2014 at 16:51

    Molto interessante quello che hai scritto in questo articolo.Grazie

Leave a Reply

Your email address will not be published. Required fields are marked *

More in Just SEO
Osservare Google che impara

Dall'apertura ufficiale di questo blog, avvenuta circa dieci giorni fa, diverse persone hanno cercato [lowlevel] su Google. Non trovando questo...

Close