Come funziona Google (sul serio) – Il corso SEO

Collage di alcune slide del corso

Aggiornamento IMPORTANTE: questo è un vecchio post che promuoveva il corso e che contiene informazioni ormai obsolete. Dovreste leggere la pagina dedicata al corso sul mio nuovo sito di lavoro.

Quello che segue è il post vecchio, che tengo pubblicato solo per ragioni storiche.


Questo post è una marketta. Chi vuole, cambi canale. I curiosi, proseguano.

Per oltre un anno, in fondo a tutti gli articoli divulgativi di questo blog ho aggiunto un enigmatico post-scriptum: “Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.”

Adesso è arrivato il momento di annunciarvi un primo “qualche evento” e spero che ne apprezzerete la particolarità.

Ieri ho pubblicato un articolo sul funzionamento di Google ed ho scritto che in alcuni casi la forma scritta non è adatta a spiegare per bene le cose. Per fare chiarezza sul funzionamento di Google e per darvi tanti dettagli, è necessario spiegare le cose di persona. E, sfortunatamente per voi, stavolta non sarà gratis.

Come funziona Google (sul serio) – il corso SEO

La pipeline di Google

Nel corso degli anni mi è capitato di dover valutare le conoscenze di persone che svolgono attività SEO oppure l’output di loro attività. Nel fare ciò mi sono reso conto di una caratteristica molto particolare: a prescindere dalla quantità di esperienza delle persone valutate, la maggior parte degli errori nasce dalla mancanza di semplici informazioni di base sul funzionamento dei motori di ricerca, non dalla mancanza di conoscenze SEO di alto livello.

Questo scenario non deve stupire: la SEO viene solitamente approcciata in modo empirico e il tempo dedicato ad apprendere la teoria è sempre molto poco. Non è quindi raro osservare anche persone di grande esperienza prendere decisioni SEO non ottimali a causa di alcune semplici nozioni che purtroppo non sono mai state acquisite all’inizio della carriera né nel corso degli anni a venire.

Osservando questo scenario, ho deciso di attingere alle mie conoscenze più tecniche sui motori di ricerca per progettare un corso dedicato al funzionamento reale dei motori ed in particolare di Google, con un obiettivo preciso: dimostrare che conoscere la teoria di base può avere ripercussioni molto concrete sulle decisioni SEO tecniche da prendere per i progetti su cui si lavora.

Ho buone ragioni per credere che un corso su Google con questi contenuti e con questo livello di dettaglio non sia mai stato organizzato finora e mi auguro di potervelo dimostrare.

Questo è anche il primo corso che organizzo da me, ho quindi avuto carta bianca su ogni aspetto, a cominciare da quelli didattici.

Destinatari del corso

Il target del corso è rappresentato principalmente da consulenti di search marketing o dipendenti di agenzie che offrono servizi di consulenza SEO ai propri clienti e che desiderano approfondire il funzionamento di un motore di ricerca per evitare decisioni tecniche errate o non ottimali.

In particolare, chiunque debba svolgere con una certa frequenza analisi SEO di tipo tecnico o chi deve assistere aziende durante fasi critiche, quali la migrazione di un sito o la modifica massiccia dei suoi contenuti, potrà beneficiare delle nozioni apprese durante il corso.

I temi trattati possono essere inoltre utili ai colleghi che si occupano, da consulenti o in azienda, di formazione SEO e di attività di ricerca e sviluppo legate ai motori di ricerca.

E’ mio interesse selezionare gli iscritti e aiutare gli interessati ad evitare un investimento poco accorto: il corso è un full-immersion di diverse ore nei meandri teorici e tecnici di Google. Se siete intimoriti da questa prospettiva e dalla scaletta degli argomenti trattati (riportata più sotto) il mio suggerimento è quello di non partecipare. Se siete incerti su quanti benefici pratici trarrete dalla conoscenza del funzionamento interno di Google, vi suggerisco di non partecipare.

Gli acquirenti del corso devono necessariamente essere proprietari di partita IVA.

I cinque obiettivi del corso

Ottenere basi teoriche solide sul funzionamento di Google

Il funzionamento dei motori di ricerca è basato su discipline e tecnologie di pubblico dominio che raramente vengono studiate dai SEO. Diverse informazioni sul funzionamento di Google vengono divulgate pubblicamente dagli ingegneri di Mountain View oppure possono essere acquisite partendo da informazioni pubbliche e procedendo per deduzioni. Aver ottenuto informazioni sulla “anatomia” di Google mi ha fornito una visione estremamente chiara di molti aspetti ed ha rappresentato per me una “marcia in più” che ha fatto comodo in più di un’occasione. Ritengo che aprire questa conoscenza ad altre persone possa chiarire le idee anche a loro.

Imparare la corretta terminologia da usare in ambito motori/SEO

In assenza di una formazione “accademica” il settore SEO è piagato da un uso ambiguo e approssimativo di tante parole ed espressioni. Il danno consiste nel non poter comunicare bene con altri colleghi, clienti o comprendere correttamente quelle informazioni che a volte vengono divulgate dai responsabili stessi di Google. Parole come “indicizzazione” e “ranking” vengono usate a volte come sinonimi, come se non facesse molta differenza. Il corso dimostrerà che la differenza è invece gigantesca e che parlare tutti una lingua 1) comune e 2) corretta rappresenta una caratteristica essenziale in qualsiasi professione, per capire meglio quello che si legge e comunicare correttamente con altre persone.

Scardinare un po’ quella “black box” che è Google

La complessità di Google è alta e non è possibile risalire esattamente al funzionamento del motore di ricerca in tutte le sue fasi. Tuttavia è possibile avvicinarsi a quando avviene all’interno della gigante scatola nera, specialmente per quanto riguarda le fasi di crawling, archiviazione e indicizzazione, per le quali le informazioni sono più abbondanti. Mettendo assieme nozioni di information retrieval, comunicati di Google Research, documenti tecnici, Google Hangout di John Mueller e il risultato di test SEO, è possibile conoscere meglio alcuni ingranaggi interni.

Distinguere le opinioni di qualità dalle congetture stupide

Non è un segreto che il settore SEO sia colmo di congetture e teorie su quanto Google fa, come lo fa e perché lo fa. Bisogna innanzitutto essere consapevoli che la qualità delle informazioni SEO acquisite leggendo il web è fortemente influenzata da opinioni cospirazionistiche e visioni personali che non hanno fondamenta scientifiche solide. Con le conoscenze corrette, è più facile individuare subito le teorie strampalate e le opinioni basate più sull’ignoranza che sulla cultura. A volte persino Google stesso sbaglia a dare direttive e la capacità di accorgersi dei loro errori non deriva da scienza infusa ma dal possedere basi teoriche che possono essere trasmesse a chi seguirà il corso.

Sfruttare la teoria per prendere decisioni SEO corrette

Molte linee guida SEO impartite da Google hanno alle spalle chiare motivazioni tecniche. Può succedere che i SEO siano indotti a seguire le linee guida di Google senza chiedersi troppo il perché della loro esistenza. L’obiettivo più importante del corso è proprio quello di mostrare come una maggiore conoscenza teorica può aiutare a fare scelte più consapevoli e intelligenti, per esempio quando fare strappi alle regole o quando una soluzione tecnica è preferibile ad un’altra. Quando è necessario dedurre/prevedere, si può ragionare meglio possedendo una conoscenza solida di come funziona un motore di ricerca.

Temi principali del corso

Il taglio del corso è molto tecnico, verrà spiegato come funziona un motore di ricerca come Google ed in che modo la conoscenza dei suoi meccanismi interni aiuta a prendere decisioni SEO riguardanti il crawling, l’indicizzazione, la canonicalizzazione delle risorse e l’attribuzione di importanza/autorevolezza attraverso i link.

La teoria verrà associata ad esempi pratici su attività critiche, quali la modifica di una quantità consistente delle risorse di un sito, la migrazione di un sito, la gestione di risorse non più esistenti e il disconoscimento di backlink sgraditi.

Durante la trattazione degli argomenti verranno inoltre indicati gli errori SEO tecnici più tipici che il sottoscritto ha osservato nel corso della propria attività di consulente.

Elenco completo degli argomenti

Circa il 60% del tempo verrà usato per trattare le fasi dal crawling all’indexing. Gli esempi pratici verranno inseriti durante le spiegazioni teoriche.

Introduzione

  • Obiettivi
  • Solide basi teoriche
  • Superare il “black box”
  • Effetti pratici sui progetti
  • Fonti
  • Schema di Google
  • Hangout, interviste, documenti tecnici
  • Information retrieval
  • Temi del corso

Le basi del protocollo HTTP

  • Modello client/server
  • Richiesta e risposta
  • Basato sulla fiducia
  • Proxy e cache
  • Protocollo stateless
  • Semantica dei codici di status
  • Informazioni sulla risorsa, non sul suo contenuto
  • 200
  • 301 e 302
  • 303 e 307
  • 304
  • 404 e 410
  • 403
  • 503 e Retry-After
  • 101 ed HTTP 2.0

Come funziona Google

  • Una visione ad alto livello
  • Presentazione dello schema
  • Focalizzato su indice web
  • Elementi aggiunti
  • Elementi mancanti
  • Connessioni logiche, non fisiche
  • Le principali fasi del processo
  • Il percorso di una risorsa
  • Trasformazione dei dati
  • Attività trasversale: la canonicalizzazione

Le fasi del processo

  • Introduzione al concetto di “crawling”
  • “Crawler” o “Fetcher”?

Il database di URL

  • Fonti di acquisizione
  • Assegnazione di un ID
  • ID usati nelle SERP
  • La presenza non implica il crawling

Lo scheduler

  • Logica di crawling
  • Che cosa, quando, quanto spesso
  • Direttive del webmaster
  • Canonicalizzazione: parametri degli URL
  • GWT: Crawl rate
  • Priorità sitemap
  • Unavailable_after
  • Segnali e parametri
  • Velocità di erogazione
  • Linking interno
  • PageRank
  • Grandezza e profondità del sito
  • Redirezioni e 404/410
  • Errori del server
  • Unicità delle risorse
  • Frequenza di pubblicazione
  • Frequenza di aggiornamento
  • Banda concessa al sito

Il crawler

  • Quello che un crawler è
  • Quello che un crawler non è
  • Non “segue” i link
  • Direttive robots.txt
  • Esempio di richiesta
  • Gestione delle risposte
  • Canonicalizzazione: redirezioni
  • Effetti sui log
  • Crawling distribuito
  • Provenienza USA

Il document datastore (archivio documenti)

  • Copia grezza delle risorse
  • Traduzione in formato simil-XML (PageMap)
  • Aggiunta di meta-informazioni
  • Associazione all’ID
  • Versioni multiple
  • Per cosa viene usato?

Il parser

  • La prima elaborazione dei contenuti
  • Gestione di più formati
  • Funzioni nel crawling
  • URL di risorse necessari alla visualizzazione
  • URL di risorse con relazioni
  • URL di risorse linkate
  • URL di risorse dei FORM
  • URL di risorse ipotetiche
  • URL assoluti e relativi
  • Funzioni extra-crawling
  • Estrazione testi
  • Estrazione link per vari tipi di grafi

L’indexer

  • Che cosa è un indice?
  • Ambiguità del termine
  • Index, inverted index e forward index
  • Definizione che varia da motore a motore
  • Definizione cambiata nel tempo
  • Fare chiarezza: il passato
  • Distinzione tra archivio e indice
  • Metafora del libro
  • Come è fatto un indice
  • Cosa è realmente Hummingbird
  • Inverted index e vector space
  • Effetti di NOINDEX
  • Effetti di NOARCHIVE
  • Fare chiarezza: il presente
  • NOINDEX non significa “non indicizzare”
  • NOARCHIVE non significa “non archiviare”
  • Informazione percepita = informazione archiviata?
  • Impedire a Google di percepire un contenuto

Canonicalizzazione

  • Canonicalizzazione esplicita
  • Risorse equivalenti, non subordinate
  • Estensione automatica delle direttive
  • Canonicalizzazione implicita
  • Far percepire i duplicati a Google
  • Effetti negativi del Disallow

Il link graph

  • Il concetto di grafo
  • La centralità
  • Il PageRank, ieri
  • Il PageRank, oggi
  • Nofollow e svalutazione
  • Disconoscimento di backlink
  • Manipolazione del grafo

Strutture aggiuntive

  • Il knowledge graph
  • Agent/author graph
  • Classificatori di risorse (Panda, Penguin)

Gestione dei siti

  • Grandi cambiamenti strutturali
  • Migrazioni
  • Risorse non (più) esistenti

Primi feedback e controllo qualità

Per accertarmi che la qualità del corso fosse ai livelli da me cercati, prima di procedere con questa pubblica promozione ho provveduto ad erogare il corso “Come funziona Google (sul serio)” ad alcuni professionisti, che si sono gentilmente prestati ad essere i primi acquirenti e che mi hanno dato diversi utili feedback.

Le loro risposte sono state libere e pertanto non riconducibili a numeri e grafici, quindi mi limiterò a dire che il grado di soddisfazione globale dichiarato è stato estremamente alto e che il mio obiettivo di fornire informazioni 1) uniche nel loro genere 2) utili e 3) dettagliate è stato pienamente raggiunto.

Il corso: Durata

Il corso dura un giorno, dalle ore 9:30 alle ore 18:00 con un’ora per la pausa pranzo ed un paio di pause caffè.

Il corso: Approccio didattico

Il corso sarà limitato ad un massimo di quattro persone, questo limite garantirà a tutti gli iscritti un’interazione col docente e permetterà di avere più tempo per domande, risposte e approfondimenti.

Il limite di quattro iscritti implica che svolgerò diverse edizioni del corso, per accontentare tutte le persone interessate.

Durante il corso verranno proiettate delle slide per meglio focalizzare l’attenzione sui temi discussi e per non perdere il filo del discorso.

Agli iscritti verrà fornito del materiale per prendere appunti. Non è necessario essere dotati di PC.

Lo stile del corso sarà informale; immaginatevi seduti ad un tavolo per le riunioni, discutendo ed ascoltando quanto ho da spiegarvi.

Il corso: Dove e Quando

La sede del corso è Milano città, presso il mio ufficio, facilmente raggiungibile attraverso la metropolitana. L’indirizzo verrà comunicato ai corsisti in fase di iscrizione.

Fare diverse edizioni del corso mi permette di concordare con ciascun iscritto la data del suo corso. L’iscritto dovrà fornire una serie di date di propria preferenza ed il sottoscritto comunicherà all’iscritto il giorno esatto.

Il corso: Costo

Il costo di una singola iscrizione è di euro 500 + IVA (per la precisione: imponibile di euro 500 + IVA 22% – ritenuta d’acconto 20%). Un piccolo sconto del 10% potrà essere concesso in caso di acquisto di due o più iscrizioni da parte della stessa azienda.

Il pranzo è compreso nel prezzo e si farà in trattoria. Se siete intolleranti alla cotoletta alla milanese, avvertitemi prima.

Il corso: Come iscriversi

Ci si iscrive al corso pagando anticipatamente il costo attraverso bonifico bancario. Ecco di seguito come fare:

  1. Inviate una email all’indirizzo info@lowlevel.it
    • introducetevi brevemente dicendo chi siete e fornendo qualche informazione sulla vostra azienda
    • dichiarate che volete iscrivervi
    • indicate quante persone sarete al corso
    • indicate tre o quattro date (o un arco di tempo) in cui vi verrebbe comodo fare il corso
    • specificate la vostra P.IVA e gli altri dati fiscali a cui intestare la fattura (no P.IVA no party)
  2. Vi verrà comunicato che cifra versare attraverso bonifico bancario e le coordinate bancarie (IBAN) per il versamento.
  3. Effettuato il versamento, dovrete inviarmi via mail una ricevuta del bonifico comprensiva di codice CRO. Io emetterò subito fattura e comunicandovi la data del vostro corso e le indicazioni logistiche per partecipare.

Il corso: Domande che mi hanno fatto

Puoi venire in azienda da noi ad erogare il corso?

E’ possibile, purché si riesca a fare tutto (compreso l’eventuale viaggio da Milano) in un solo giorno. Il costo varia. Per richiedere un preventivo, inviate una email all’indirizzo indicato in questa pagina.

Puoi erogare il corso a distanza (Skype, Hangout, ecc.) ?

Questo corso è nato per una fruizione in aula e ho deciso che erogarlo a distanza diminuirebbe la qualità dell’esperienza degli iscritti. Quindi la risposta è “no”. Tuttavia sto pensando di modificarlo un po’ affinché possa essere erogato a distanza senza perdere in qualità. Se siete interessati ad una fruizione a distanza, inviate una email all’indirizzo indicato in questa pagina.

Puoi erogare il corso nei weekend?

Preferirei di no, ma se proprio è l’unico modo perché possiate partecipare, possiamo accordarci se inviate una mail all’indirizzo indicato in questa pagina.

Non ho forti basi tecniche, sarò in grado di seguire il corso?

Sì. Il corso serve anche a dare quelle basi. Inoltre state certi che il mio modo di spiegare le cose permette di affrontare temi complessi con parole ed esempi incredibilmente semplici. Il corso è stato proposto a persone provenienti da studi molto diversi tra loro e nessuno ha mai avuto problemi a seguire le spiegazioni. Al massimo certi argomenti sono poco compatibili con il tipico abbiocco del dopo pranzo, ma quello lo si risolve con un caffé lungo o evitando a monte di ordinare una carbonara.

Il corso: Come chiedere maggiori informazioni

Se avete letto con attenzione tutto l’intero post e avete bisogno di informazioni non incluse in questa pagina, potete inviare una email all’indirizzo info@lowlevel.it