LowLevel’s blog

Benedetta SEO, maledetta SEO

LowLevel — Thu, 14 Jan 2016 08:11:57 +0000

Qualche giorno fa mi è capitato di leggere un documento di linee guida SEO, prodotto da un’agenzia e presentato ad un’azienda cliente.

Nel corso degli anni ho avuto l’opportunità di osservare diversi documenti del genere, un po’ per caso ed un po’ perché ho svolto per alcune agenzie degli audit dei propri documenti, volti a controllare la correttezza e la qualità delle linee guida SEO prodotte.

Questa volta però i contenuti del documento che avevo per le mani mi hanno colto di sorpresa e, giunto ad una specifica pagina, mi son messo a ridere come un ebete, senza riuscire a trovare freno all’ilarità.

Il testo che avevo davanti agli occhi era infatti un becero copia-e-incolla di un pezzo di una guida SEO che ho scritto quindici anni fa e che avevo pubblicato sul mio vecchio sito, Motoricerca.info.

Adesso vorrei raccontarvi tutto per bene, spiegarvi perché quel copia-e-incolla è un sintomo di un vasto problema sofferto dalla SEO e approfittare dell’occasione per fare qualche considerazione sullo stato di salute della “industria” SEO, sopratutto per ciò che riguarda le competenze di chi ci lavora.

La storia si ripete

Circa quindici anni fa vengo assalito dallo sghiribizzo di scrivere una guida SEO e di pubblicarla gratuitamente sul web. L’operazione aveva all’epoca un senso perché la disciplina SEO era un mostriciattolo semisconosciuto e di difficile approfondimento per mancanza di fonti italiane.

Oggi non manca certo il materiale SEO da cui studiare (perché, è risaputo, chiunque può scrivere di SEO) ma quindici anni fa la faccenda era assai diversa. Anche per questa ragione, la mia guida ha conosciuto una discreta popolarità in Italia, essendo uno dei primi testi prodotti sull’argomento.

La popolarità ha comportato anche un effetto collaterale negativo: una prolificazione di soggetti che copiavano barbaramente i contenuti della guida spacciandoli per propri o comunque senza mai citare la fonte.

Il mio primo e ingenuo approccio fu quello di tentare di rispondere agli autori delle copie, segnalando che il diritto d’autore proteggeva la mia opera e bla bla bla. Ma più il tempo passava e più il sottoscritto si rese conto che era una gara persa in partenza: per ogni copia eliminata dal web ne apparivano altre cinque. Il sottoscritto ha definitivamente gettato la spugna quando ha trovato la propria guida trasformata in slide usate da un assistente di un’università di Milano per introdurre gli studenti alla SEO. Ovviamente, la fonte non veniva citata.

Diciamoci la verità: un po’ si prova orgoglio, perché quei testi illecitamente copiati hanno probabilmente svezzato un po’ di studenti e webmaster in erba, ma un altro po’ si subisce una titanica rivoluzione ellittica di sferoidi. Tipo un sistema solare, ma concentrato sulle parti basse.

Credo che l’apice del fenomeno sia stato raggiunto quando, in un’altra occasione, sono stato convocato da degli organi inquirenti per rilasciare una deposizione in cui affermavo che quei testi erano effettivamente opera mia. Non vi dirò a che cosa è servita quella testimonianza, ma posso fare una considerazione generale: il fatto che io non faccia più controlli su chi copia la mia roba non implica che il fattaccio non possa essere scoperto da qualcun altro, a svantaggio di chi ha spacciato e magari venduto quei testi come se fossero farina del proprio sacco. Il messaggio è: stateve accuort’.

Sono quindi abbastanza abituato a ritrovare i miei testi qua e là, tuttavia più tempo passa e più rimango incredulo, perché con gli anni le linee guida date in quei testi sono diventate in parte obsolete e mi stupisco che ci sia ancora gente che le suggerisca ai propri clienti.

In particolare, il pezzo di guida copia-e-incollato nel documento che citavo ad inizio articolo riguardava un tema ben preciso, ovvero “Dove inserire le keyword“, un argomento che a mio parere può portare a suggerimenti fuorvianti. Mo’ vi spiego perché.

Keyword un tot al chilo

Quindici anni fa i principali motori di ricerca erano grandemente meno sofisticati rispetto a quelli che esistono oggi. I metodi usati per stabilire la posizione delle risorse nei risultati di ricerca erano sostanzialmente riconducibili ad una semplice accoppiata di attinenza (tra la query dell’utente e ciascuna risorsa) e popolarità (o autorevolezza di ciascuna risorsa).

La caratteristica di attinenza era a sua volta calcolata dai motori in base alla presenza nei documenti delle parole usate dagli utenti nelle query. Banalizzando un po’ il concetto, si può dire che per rendere un documento più attinente ad una query o parola chiave era importante accertarsi che tale query o tale parola chiave apparisse in punti chiave della pagina web.

Di conseguenza, quindici anni fa aveva senso suggerire ai webmaster o ai clienti di scrivere e ripetere spesso in più punti della pagina le parole della query per cui ci si voleva posizionare.

Questo tipo di raccomandazione nascondeva tuttavia due messaggi pericolosi per chi si avvicinava alla SEO:

l’approccio al copywriting SEO era focalizzato su parole chiave da inserire nei testi;
l’attinenza di un documento era legata principalmente a quante volte le parole chiave apparivano al suo interno.

Far percepire alla gente che la tematizzazione di un testo si basava essenzialmente sulla quantità di citazioni di una o più parole era probabilmente corretto quindici anni fa, tuttavia si trattava di una linea guida SEO che non avrebbe superato il passaggio del tempo, perché riguardava solamente l’aspetto quantitativo delle parole, mettendo in secondo piano l’aspetto qualitativo dei testi.

Oggi (scrivo questo articolo nel 2016) spiegare a qualcuno che un copywriting compatibile con la SEO si riduce all’inserimento di parole in punti chiave di una pagina è sia ingenuo sia diseducativo.

E’ ingenuo perché in quindici anni i motori di ricerca ed in particolare Google hanno fatto passi da gigante nell’analizzare i testi delle risorse, passi complessi e che strizzano l’occhio ad analisi sempre più semantiche e sempre meno legate al conteggio di ricorrenze.

E’ diseducativo perché suggerire alla gente di gestire le parole “un tot al chilo” fa percepire una SEO semplicistica, svalutandola da disciplina complessa a insieme di espedienti terra terra.

C’è di più: l’approccio quantitativo di testi e parole è spesso legato ad un ulteriore concetto SEO da cui a mio parere sarebbe bene prendere le distanze, ovvero quello di landing page esterne alla navigazione principale del sito. Le due cose vanno spesso in coppia perché chi si appresta a produrre una pagina ottimizzata per i motori di ricerca, ricca di citazioni di keyword, la considera a volte un elemento talmente estraneo al sito da non includerla nella navigazione principale, linkandola da sezioni secondarie. Anche in questo caso, il messaggio che si trasmette è diseducativo, perché viene suggerito implicitamente che la SEO non è un insieme di pratiche coerenti e compatibili con i contenuti e l’architettura dei siti ma che, al contrario, rappresenti un insieme di tattiche ed espedienti, da attuare attraverso elementi estranei al sito stesso.

Vabbè, chiusa la parentesi sulle landing page. Torno invece all’argomento delle keyword un tot al chilo, per concludere che oggi non si può fornire indicazioni sul copywriting SEO estratte da una guida scritta quindici anni fa, quando tutto era diverso.

Non è un caso che questo approccio quantitativo traspaia all’esterno della cerchia degli addetti ai lavori e che nell’immaginario collettivo la SEO venga vista come un insieme di espedienti che poggiano più sulla quantità che sulla qualità. Date un’occhiata allo screenshot che segue, preso da un articolo dal titolo “Proletari Digitali” che l’Espresso ha scritto tempo addietro e che descriveva, tra varie professioni del web, anche la professione del SEO.

Cazzo, “a valanga”! Notate la presenza dell’aspetto quantitativo? Vedete per caso cenni di aspetti qualitativi? Per quanto la descrizione dell’Espresso faccia accapponare la pelle, è a mio parere importante considerarla un discreto reality check, un’indicazione di come i SEO appaiono agli occhi dei non addetti ai lavori. Lo spettro del link o della keyword da erogare e vendere un tot al chilo è reale e incombe su tutti noi e sarà difficile sdoganarsi da questa figura di venditore di paccottiglia.

Questo è il link all’articolo dell’Espresso. Anche se non vi va di leggerlo, sappiate che la SEO ne esce fuori come un’attività robotizzata, da far fare a personale di bassa manovalanza. E sapete una cosa? (non vi incazzate) In parte ci hanno azzeccato.

C’è una ragione molto pratica se stralci obsoleti di quella mia guida vengono ripresi (e rivenduti) anche oggi e cioè che sul mercato SEO si osserva una grande eterogeneità tra gli operatori del settore. Provo a farne una classificazione in base ad un elemento importante, la competenza.

L’iceberg delle competenze SEO

Due principali e importanti condizioni del mercato di cui bisogna prendere coscienza è che la SEO non viene venduta solo da chi la sa fare e che non viene venduta solo a chi ne ha bisogno. Al contrario, le tattiche di vendita più aggressive che esistono nel settore partono dal presupposto che un servizio SEO possa essere venduto anche alle pietre e prescindono da quanto l’erogazione del servizio sia poi fattibile o facile. Prima si vende, poi si pensa al resto.

La possibilità di operare questo approccio è dovuta al fatto che nel corso del tempo la SEO si è guadagnata la nomea, sia tra le aziende clienti sia tra gli operatori web, di attività di cui nessuno può fare a meno. A sua volta, questa nomea è nata in parte perché le aziende clienti hanno acquisito una consapevolezza maggiore di come funziona il web ed in parte perché diversi servizi SEO low cost sono stati venduti da alcune aziende che erano in condizione di promuoverli capillarmente sul territorio nazionale.

Ho incontrato diverse agenzie web che, dedite allo sviluppo di siti, si son ritrovate a dover vendere servizi SEO solo perché i clienti iniziavano a chiederli. Parte del quadro che mi sono costruito nel corso degli anni è stato quindi quello di un mercato che in un certo senso è stato “costretto” a portarsi al passo coi tempi, prescindendo da quanto vendere un servizio SEO rientrasse nelle sfere e nelle competenze dell’agenzia presa in esame.

Acquisire competenza tuttavia costa. I lettori di questo blog, per il solo fatto che si stanno sciroppando un articolone prolisso sul tema, possono tranquillamente considerarsi dei soggetti che investono tempo in conoscenza e che si aggiornano su siti come questo; tuttavia questo non è un modus operandi comune o diffuso.

Provo a classificare dunque gli operatori sulla base delle proprie competenze e di quanto fanno per migliorarle, partendo dalla base dell’iceberg. La classificazione è soggettiva e fatta in base a quanto ho osservato io. Può non combaciare con valutazioni altrui.

Servizi SEO non erogati

A questa categorie appartengono tutti quei soggetti che non possiedono competenze SEO e che hanno deciso di non proporre servizi SEO alla propria clientela. Potrebbe sembrare a prima vista una decisione coerente, tuttavia esistono alternative valide, in grado di farsi scrupolo delle esigenze del cliente. Si veda per esempio la categoria che segue.

Servizi SEO dati in outsourcing

In questa categoria rientrano quegli operatori del settore che non possiedono competenze SEO consistenti ma che hanno deciso di proporre comunque tale servizio ai propri clienti rivolgendosi a terzi.

Il triangolo amoroso tra l’azienda che dà il servizio in outsourcing, quella che svolge le attività SEO ed il cliente presenta intrinseche criticità, di cui bisogna essere consapevoli per neutralizzarne gli effetti negativi. In particolare, io sono giunto alla conclusione che è indispensabile che il servizio SEO venga proposto e venduto al cliente col supporto degli stessi soggetti che poi svolgeranno le attività. Grandi casini aggiuntivi possono inoltre emergere nel momento in cui l’azienda che dà il servizio in outsourcing lo fa in condizioni di white label, ovvero senza voler far apparire al cliente l’esistenza del terzo soggetto e in particolare senza far dialogare direttamente il cliente con il personale che possiede le competenze SEO.

Dal punto di vista delle competenze SEO, chi dà in outsourcing l’attività deve possedere quelle conoscenze che gli consentano di continuare a supervisionare il progetto e a controllare che esso proceda nel migliore dei modi. E’ importante che tale ruolo costituisca un valore aggiunto per il progetto e che non si riduca ad essere invece una semplice intermediazione che rallenta i processi senza apportare valore.

I soggetti che danno in outsourcing attività SEO solitamente non si aggiornano costantemente sulle novità del settore e raramente investono in formazione SEO.

Personale che svolge anche attività SEO

A questa categoria appartengono, per esempio, quelle agenzie che hanno deciso di incamerare competenze SEO per poter proporre ed erogare autonomamente tali servizi ai propri clienti.

Il personale che si occupa della SEO, tuttavia, deve anche svolgere parecchie altre attività e pertanto non si tratta di dipendenti che sono focalizzati sulla SEO ma dipendenti che devono smazzarsi attività di ogni genere, SEO compresa. Tali condizioni rendono difficile l’acquisizione di competenze molto profonde e pertanto il tipo di servizio SEO erogabile può seguire approcci SEO “old style” e a volte legati a procedure un po’ industriali (selezione keyword + produzione landing page).

Il tempo dedicato alle attività di formazione e aggiornamento SEO deve necessariamente essere limitato e deve tener conto delle esigenze di aggiornamento sulle altre discipline. L’agenzia può stanziare un budget annuale di una manciata di migliaia di euro da sfruttare per la formazione (su tutte le discipline) del personale. La formazione avviene principalmente aggiornandosi online, la partecipazione ad eventi di settore è rara e comunque focalizzata solitamente sui canali di marketing che hanno un ritorno sull’investimento più immediato e più facilmente tangibile per la clientela.

Con tutta probabilità, l’agenzia che ha prodotto il documento SEO citato ad inizio articolo appartiene a questa classe di competenza: le linee guida fornite sono basilari e in alcuni punti anche obsolete o fornite sulla base dei “sentito dire”. A conferma di ciò va aggiunto che, dando un’occhiata al sito dell’agenzia, appare chiaro che essa non si propone sul mercato come esperta SEO. E’ dunque coerente che, in mancanza di forti competenze, qualche dipendente sia stato indotto a creare un documento di linee guida attingendo anche da quanto si può raccattare sul web, senza possedere le competenze per comprendere quanto era grano e quanto era loglio.

Personale dedicato alla SEO

In questa categoria ho voluto inserire quegli operatori del settore che hanno investito per dotarsi di personale dedicato in maniera specifica alla SEO ma che non si posizionano in cima alla piramide a causa della tipologia di servizi SEO offerti.

Esistono infatti tipi di servizi SEO molto standard, per i quali non è necessaria una cultura elevata ma è sufficiente far proprio un processo di produzione di contenuti (testi, link, recensioni, ecc.). E’ il caso tipico di chi ottimizza i siti producendo landing page dedicate a specifiche keyword: una volta appreso il metodo, esso può essere replicato senza troppi problemi da chiunque abbia imparato a ricercare query degli utenti e a scrivere testi ottimizzati. Per le aziende che svolgono servizi SEO di tale genere, non è indispensabile investire in formazione oltre a quella strettamente necessaria ai dipendenti per poter erogare il servizio.

Di contro, esistono agenzie o operatori freelance che invece forniscono servizi SEO più consulenziali e “custom”, ovvero cuciti su misura a seconda delle esigenze del cliente. A costoro viene dedicata la punta dell’iceberg.

Esperti SEO

In questa categoria ricadono tutti quei soggetti che hanno investito maggiormente per acquisire una competenza SEO vasta e conoscenze dettagliate. Tali competenze non si limitano alla conoscenza di tattiche SEO o all’apprendimento di un metodo da applicare sistematicamente per erogare servizi inscatolati, ma vanno oltre e approfondiscono, tra le tante cose, il funzionamento dei motori di ricerca ed il modo con cui essi interagiscono con i siti web.

Le competenze includono le valutazioni di come i consumatori usano i motori di ricerca, l’analisi dei competitor dei clienti, la localizzazione dei siti dedicati a nazioni diverse, la (ri)progettazione delle architetture dei siti, la valutazione degli aspetti SEO tecnici, l’ottimizzazione del codice HTML, la produzione di linee guida per il copywriting, la conoscenza dei funzionamenti di motori di ricerca verticali come quello “local” e quello delle news, la gestione di aspetti tecnici quali l’accesso sicuro alle pagine web e l’ottimizzazione della velocità percepita da utenti e spider. Spesso tali soggetti possiedono anche competenze di web analytics, nozioni di usabilità e basi per l’ottimizzazione del conversion rate.

Le aziende appartenenti a questa categoria investono molto in formazione e aggiornamento, dotandosi di un percorso di formazione interno, facendo partecipare i dipendenti ad eventi di settore e dotandoli di documentazione e materiale da leggere. Il dipendente viene visto come un asset di grande valore, che l’azienda ha tutto l’interesse a far accrescere sempre più, in modo da potersi posizionare sul mercato come azienda esperta e specializzata in SEO.

La categorizzazione che ho appena proposto è volutamente schematica e rigida, ma nella realtà è facile imbattersi in agenzie che potrebbero essere assegnate a più di una categoria. Prendete pertanto la mia classificazione come un semplice esercizio per tentare di dare un po’ più di senso ad uno scenario che nella realtà è molto complesso.

Un esempio di un soggetto che non rientra nelle categorie citate è quello di qualcuno che accetta di svolgere un’attività SEO senza averne le competenze. Personalmente non ho incontrato molte persone che rientrano in questo identikit ma diversi miei colleghi lamentano la presenza di tanti soggetti che si improvvisano SEO.

Adesso che è stata data una classificazione di chi lavora nel nostro settore, va specificato che l’iceberg possiede una punta molto piccola ed una base molto grande. In altre parole, la quantità di soggetti che svolgono attività SEO “vecchio stile” è molto più alta dei soggetti che hanno deciso di puntare all’acquisizione di competenze d’eccellenza.

Quando il sottoscritto partecipa agli aperitivi markettari milanesi, che vedono protagonisti i dipendenti di diverse agenzie di search marketing, è consapevole di stare interagendo con soggetti che si posizionano in cima all’iceberg. La fortuna di poter condividere le mie esperienze con colleghi esperti di search marketing non deve però farmi dimenticare che tali persone sono rappresentative di una parte minoritaria del mercato. Il grosso del mercato è rappresentato dalla parte sommersa dell’iceberg ed è composto da chi si arrabatta, da chi si improvvisa, da chi propone pacchetti precotti, dai proletari digitali citati dall’Espresso. Per queste persone, trovare una guida scritta quindici anni prima da un deficiente e farne copia e incolla nel documento da vendere al cliente appare un’opzione del tutto normale e praticabile.

La puzza al naso

Un grande, gigantesco errore da non commettere è quello di considerare l’esercizio di classificazione che ho appena proposto come un modo per evidenziare la presunta bassa qualità di alcuni servizi.

Sono consapevole che la “reazione di pancia” che si ha di fronte ad alcuni servizi più semplici o più abbozzati può essere quella di considerare chi li eroga dei carciofari, ma esorto tutti a riflettere sul fatto che tutti i tipi di servizio esistenti vanno sempre incontro ad una domanda del mercato.

In passato mi è capitato di dover svolgere e coordinare attività SEO per l’erogazione di servizi low cost e quell’esperienza mi ha insegnato che anche i servizi più modesti possono essere portati avanti e svolti con grande dignità, portando spesso a risultati soddisfacenti per il tipo di investimento affrontato dal cliente.

Non tutte le aziende sono disposte o interessate ad investire budget notevoli e non tutti gli operatori del settore SEO sono interessati a proporre servizi di consulenza dal costo sostenuto. Il mercato è composto da aziende di ogni genere ed è fisiologico che siano nati per esse servizi molto vari, da quelli low cost fatti di landing page e di report di posizionamento TOP10 a quelli cuciti su misura al cliente col portafoglio gonfio.

Non deve nemmeno essere commesso l’errore opposto, ovvero quello di considerare ogni servizio di “top gamma” un servizio intrinsecamente di qualità. Osservo ancora diverse agenzie fare offerte che propongono attività scaturite fuori più dalla fantasia dei SEO che dal risultato di analisi approfondite.

Si tratta di un fenomeno fisiologico e dovuto al fatto che in fase di offertazione non è possibile investire una grande quantità di tempo per studiare il cliente ed il suo mercato. Di conseguenza, l’offerta viene spesso prodotta attingendo a “pacchetti” di attività già ideate e pronte all’uso, col rischio che le varie offerte ricevute da un cliente si somiglino un po’ tutte.

(non proporre affatto una strategia ma tentare di vendere al cliente la definizione di una strategia è invece ancora in buona parte fantascienza, ma su questo argomento divagherei e quindi chiudo la parentesi)

Chiarito che è inopportuno tenersi la puzza al naso e classificare i servizi in buoni e cattivi a seconda di quanto ci piacciono, è arrivato però il momento di svuotare la pancia e dirvi che cosa di maledetto il sottoscritto trova nella SEO e che cosa di benedetto ci ha invece trovato.

Senza alcun ordine in particolare. Pronti? Via!

Maledetta SEO

Le keyword un tot al chilo. Le selezioni keyword e le annesse paginette di landing. I report di posizionamento, tutti. Chi mi copia. Quelli che la SEO è solo contenuti e backlink. La smania di usare tool. I tool che sollevano i SEO dall’attività di ragionare. I documenti di offerta che vengono spacciati per strategie SEO. La comunicazione orrenda di Google. Quelli che non hanno ancora maturato un metodo per interpretare le comunicazioni orrende di Google. Lo spam fatto senza testa. Le ambiguità delle linee guida dei motori. I falsi positivi delle penalizzazioni. Le lamentele di chi è stato penalizzato per aver fatto pupù. Chi si improvvisa. Gli studi statistici sui fattori di ranking. Tutti quelli che non hanno mai studiato statistica e che abboccano come pesci al fascino pseudo-scientifico degli studi sui fattori di ranking. I presunti guru. Chi è affascinato dai presunti guru. Chi confonde popolarità con competenza. Chi si aggiorna una volta l’anno andando al convegno SEO. Chi crede che la SEO fatta all’estero sia più sofisticata. Quelli che “E’ colpa di Google, che ha cambiato l’algoritmo”. La navigazione “faccettata“. Lo strumento di rimozione risorse di Google Search Console. La memoria indelebile di Google, che ti mostra 404 risalenti a secoli prima. I siti web fatti ad cazzum. I web server di Microsoft. La negative SEO. I testi creati solo per i motori di ricerca. Il link building becero. La comparazione di SEO e social marketing. I progetti dove non c’è uno straccio di storico delle attività. Le congetture SEO basate sul nulla. La sovra-semplificazione degli algoritmi dei motori. Gli eventi SEO basati più sui nomi altisonanti degli speaker che sui contenuti. Quelli che Google mi ha buttato giù perché non investo più in AdWords. Quelli che i commerciali di Google gli hanno detto che investendo in AdWords c’è un ritorno positivo sull’organico. Gli aspetti negativi dei tag manager. La diatriba su quanto la SEO sia viva, morta o moribonda. La comparazione di white hat e black hat, come se fosse una gara testosteronica a chi ce l’ha più lungo. Quelli che considerano Panda una algoritmo di penalizzazione. I miti e le leggende SEO. Gli indici proprietari, come il Domain Authority. La keyword density. I segnali di ranking politici, come la lentezza del sito e l’uso del protocollo HTTPS. I luoghi di discussione SEO online dove si fa gara ad insultare Google o altri soggetti. Quel tipo di “reputation management” che in realtà è insabbiamento di informazioni nelle SERP dei motori. Quel casino del Robots Exclusion Standard.

Benedetta SEO

Le nuove leve SEO (quantomeno quelle che frequento io). I progetti in cui prima si fanno analisi approfondite per acquisire dati e poi si usano i dati per stabilire quale strategia SEO adottare. Le analisi di mercato fatte sbirciando le query dei consumatori. L’analisi di dati con Excel. Gli aperitivi markettari milanesi e le SEO Birre. Il fatto che nella SEO nulla è scritto sulla pietra. La condivisione di metodologie e strumenti. Le attività di indagine per scoprire criticità e magagne del passato. L’ottimizzazione di siti giganti e complessi. SearchBrain. Lo sviluppo di tool SEO che ti sollevano da attività scimmiesche. L’analisi della distribuzione del PageRank di un sito. I CMS orrendi, perché se riesci ad ottimizzare i loro siti, puoi ottimizzare anche le pietre. Gli eventi di Giorgio Taverniti & team. I SEO superbravi che nessuno conosce perché poco sociali. Sfatare miti e leggende SEO. La bonifica di backlink e le de-penalizzazioni. L’interazione con colleghi SEO esteri attraverso Google+. Gli eventi SEO basati più sui contenuti che sugli speaker. Smontare il giocattolo Google per vedere come funziona dentro. Le aziende che investono in formazione SEO. La “rivoluzione mobile“. L’information retrieval. Osservare il traffico organico che va su. Fare scraping di roba di Google. Influenzare il Knowledge Graph. Configurare le piattaforme di analytics affinché estraggano informazioni fighe dai referrer del traffico proveniente da Google. Gli aspetti positivi dei tag manager. Lo studio degli utenti target di un’azienda. I test SEO. Fare formazione. Non smettere mai di imparare.

Conclusioni

Spero che abbiate letto le maledizioni e le benedizioni tutto d’un fiato e che il giro sulle montagne russe vi abbia rinvigorito per affrontare un 2016 all’insegna della qualità. Buon anno SEO a tutti!

P.S.
Ma lo sapete che ho una newsletter SEO con oltre tremila iscritti? Andate sul mio sito di lavoro per iscrivervi e ricevere gratis linee guida e suggerimenti SEO.

Mostrilioni di backlink: quello che succede a vendere PageRank

LowLevel — Thu, 15 Oct 2015 07:29:30 +0000

Nota bene: una versione di questo articolo è stata letta in anteprima dalle persone iscritte alla mia bellerrima newsletter. Se te lo sei perso perché non sei ancora iscritto/a, sappi che all’appello manchi solo tu e qualche isolato pastore di cammelli in remote regioni dello Yemen. Iscriviti!

Quello che segue è il resoconto di una penalizzazione su un mio sito web, volutamente protatta per oltre due anni al solo scopo di studiarne lo sviluppo naturale e trarne lezioni SEO utili per il futuro. Oggi condivido con voi quello che ho imparato.

Mostrilioni di link

Da molti anni sono in possesso di una pagina web che riceve una quantità di backlink da capogiro, nell’ordine delle decine di milioni. Tutti naturali. La pagina fornisce semplicemente un servizio di validazione del file robots.txt e suggerisce ai webmaster di pubblicare un bollino/link sui propri siti, per indicare che essi possiedono un file robots.txt valido.

Molti webmaster e addirittura alcuni sviluppatori di CMS hanno deciso di pubblicare il bollino, col risultato che la pagina ha accumulato link da mezzo web e la famigerata barretta verde del PageRank è arrivata a segnare per essa un dignitoso PR6.

L’immagine di copertina di questo post è uno screenshot di Majestic, che testimonia in maniera sborona la quantità di backlink esistenti nel loro database “storico”. Una bella percentuale di quei link risulta oggi cancellata, ma ne rimangono attivi diversi milioni.

La malefatta

Nel 2011 decido di iscrivermi a TextLinkAds, un marketplace di compravendita link, e di vendere link sulla pagina in questione e su altre pagine secondarie dello stesso sito. I link venduti sono do-follow e pertanto trasferiscono PageRank, una caratteristica che li rende contrari alle policy antispam di Google.

Tutto fila liscio fino al 17 maggio 2013, quando sul pannello di quello che si chiamava allora Google Webmaster Tools arriva un messaggio che mi informa che l’intero sito è stato penalizzato per manifesta paraculaggine e vendita di backlink. Curiosamente, non viene penalizzato solo il nome di dominio di terzo livello che ospita le pagine con i link venduti ma anche il dominio principale “www”, che non è mai stato usato per vendere link.

Prima osservazione: quando si tratta di penalizzazioni manuali, ciò che viene penalizzato è il risultato di una valutazione di un essere umano e la pena può estendersi anche a domini correlati. Insomma, dipende tutto da quanto drastico vuole essere il controllore umano che ha svolto la valutazione e da quanto i siti collegati potrebbero essere facilmente oggetto di spam.

Va aggiunto che il mio caso deve essere stato particolarmente problematico, agli occhi del valutatore, perché la pagina PR6 conteneva pochissimi link, col risultato che la quantità di PageRank erogata agli acquirenti era presumibilmente abbastanza alta, tanto da contribuire significativamente alla visibilità dei loro siti sulle SERP di Google. Trovo dunque giustificata la punizione “estesa” e severa.

Assenza di buonsenso

Qualsiasi persona dotata di senno avrebbe probabilmente smesso di vendere link e compilato una richiesta di riconsiderazione per rientrare nelle grazie di Google, ma il sottoscritto non potreva non approfittare dell’occasione per apprendere nuove lezioni di vita SEO e pertanto decido di non muovere un dito e di osservare ben bene la situazione.

Il primo fenomeno che salta agli occhi è che la barretta del PageRank della pagina iperlinkata viene declassata ad un PR3 ma la visibilità sulle SERP dei due domini penalizzati non cambia di una virgola. Questo ci porta alla seconda osservazione: a volte le penalizzazioni sono “estetiche” e “politiche” ed hanno semplicemente l’obiettivo di spezzare certi loschi traffici di PageRank.

Declassare la pagina a PR3 ma mantenerne la visibilità nei risultati di ricerca è l’uovo di colombo che permette a Google di prendere due piccioni con una fava: da un lato il PR3 disincentiva le persone ad acquistare link sulla pagina (e infatti da quel momento non se l’è filata più nessun acquirente…) e dall’altro Google mantiene alta la qualità delle proprie SERP, che non si privano di una pagina che risulta comunque utile a molti utenti.

Qui nasce la terza osservazione: non bisogna mai dimenticare che Google ha tutto l’interesse a proteggere la qualità del proprio prodotto, ovvero le pagine con i risultati delle ricerche. Se una pagina web è di qualità e risulta utile agli utenti, Google ottiene un vantaggio se la mantiene visibile nelle SERP.

La quarta osservazione è una conseguenza delle precedenti due: le modalità di penalizzazione possono variare considerevolmente a seconda del soggetto da penalizzare. Se è vero che il sottoscritto, il venditore di link, s’è beccato solo una riduzione fittizia della barretta verde, immagino che gli acquirenti dei link devono probabilmente aver ricevuto penalizzazioni più serie, di quelle che influiscono sulla visibilità nei risultati naturali, quantomeno per il fatto che la quantità di PageRank acquistata va a farsi benedire.

La faccenda va avanti col sottoscritto che procede nel modo già accennato: me ne infischio di Google e continuo a vendere (pochi) link fino alla fine del 2013.

Penalizzazioni con data di scadenza?

A questo punto il marketplace TextLinkAds, per ragioni che non ho mai approfondito, scompare nel nulla e con esso i link sulle mie pagine. Da questo momento le pagine sono del tutto pulite e in linea con le policy di Google; l’avviso di penalizzazione ovviamente permane sulle pagine di Google Webmaster Tools. Decido di non fare assolutamente nulla e di lasciar passare il tempo al solo scopo di vedere se la penalizzazione “scade da sé” dopo un certo periodo.

Fast forward di un anno: nel dicembre 2014 sto con John Mueller (Webmaster Trends Analyst in Google) a pranzo e gli racconto questa storia che sto raccontando a voi, spiegandogli che non avevo volutamente fatto richiesta di riconsiderazione per vedere se la penalizzazione sarebbe scaduta da sé. John Mueller dice testualmente “Dura tre anni“, in modo così diretto e perentoreo da indurmi a prendere atto dell’affermazione con delle pinze molto grosse.

Ovviamente il sottoscritto non si accontenta della risposta ufficiale e persegue nel folle tentativo di osservare dal vivo se e quando la penalizzazione verrà rimossa.

Si aggiorna il PageRank della toolbar

Nel luglio del 2015 avviene il colpo di scena: ricevo una mail da Matomy SEO, che a quanto pare ha acquisito i database di TextLinkAds ed ha ricostruito il marketplace su un altro nome di dominio. La mail mi informa che qualcuno ha acquistato link sulle mie pagine e che è richiesta la mia approvazione. Incuriosito dal fatto che qualcuno volesse acquistare link su una pagina PR3, torno a visitare la pagina in questione e mi accorgo che il PageRank è magicamente tornato a PR6. Sono tornati ai valori storici anche i PageRank delle altre pagine del sito, che erano stati anch’essi declassati.

Siccome ricordo con chiarezza che il PageRank della pagina era rimasto un PR3 durante l’intero 2014, ne deduco che in qualche momento tra gennaio e luglio 2015 qualcuno o qualcosa deve aver “sbloccato” l’indicatore del PageRank affinché mostrasse il reale PageRank della pagina e non il PageRank fittizio, infertomi dalla penalizzazione.

Si noti che ad essere cambiato è solo il valore indicato dalla baretta verde; sulle pagine di Google Search Console (perché mo’ si chiama così) rimane l’indicazione di penalizzazione manuale.

Per quanto io debba ringraziare Matomy SEO per avermi indotto a ricontrollare il PageRank di quella pagina, sono ormai disinteressato alla vendita di link e quindi decido di rifiutare la proposta di Matomy, impedendogli di vendere ulteriori link per mio conto, in modo che la pagina rimanga compatibile con le policy di Google e che io possa continuare a monitorare saltuariamente il Search Console per vedere se per caso la penalizzazione scadrà da sé.

Un dubbio che sorge a questo punto è che significato dare al fatto che il PageRank della toolbar sia tornato al valore corretto. Potrebbe significare che la penalizzazione è stata rimossa, nonostante su GSC permanga l’avviso? Si tratta di un glitch tecnico?

La quinta osservazione che mi sento di fare è che a volte i valori indicati dalla barretta del PageRank possono subire modifiche anche se Google non ha lanciato un aggiornamento globale della barretta.

Nel mio caso, l’idea che mi son fatto io è che da qualche parte Google abbia mantenuto sia l’informazione sul PageRank reale della pagina (che difatti non ha mai perso visibilità nelle SERP) sia l’informazione del PR3 fittizio. Eliminando quest’ultimo, la barretta è tornata a mostrare il PageRank reale. Sul perché e per come il PageRank fittizio sia stato eliminato si possono fare solo ipotesi campate in aria, che dunque non farò.

Mai resistere alle tentazioni

Giorno 7 agosto 2015 impongo una piccola svolta: decido di pubblicare un link sulla pagina PR6 verso The Search Herald, l’aggregatore di news SEO realizzato assieme a Francesco Terenzani. Del resto, avendo una pagina PR6 sarebbe un vero delitto non approfittarne per linkare una risorsa a tema e (a giudizio mio) di qualità. Detto, fatto! Il testo dell’ancora del link è semplicemente “Search Herald”.

Beh, dopo diverse settimane dalla creazione del link, la linea di visibilità di The Search Herald sulle SERP di Google rimane piatta come l’encefalogramma di zia Cesira, che non c’è più.

Alché, sesta osservazione, si evince che la penalizzazione non aveva colpito fittiziamente solo la barretta del PageRank ma aveva anche impedito alla pagina di erogare PageRank attraverso i link. ‘Sta cosa io la davo per scontato ma è sempre bene avere delle conferme pratiche alle proprie ipotesi.

Apro una parentesi per introdurre un pensiero malato: rendiamoci conto che a questo punto del racconto c’è una pagina per la quale Google mostra un PR6 ma che in realtà non eroga un piffero di PageRank. Ci avrei potuto vendere link ai mammalucchi che credono ancora che la barretta verde sia uno strumento affidabile. Un po’ come vendere la fontana di Trevi ai turisti stranieri. Stateve accuort’. Chiusa la parentesi.

Rammaricato di non poter spingere un po’ la mia nuova creatura attraverso un link da pagina PR6, venerdì 18 settembre 2015 decido di vanificare mesi di osservazione: infischiandomene di scoprire se la penalizzazione manuale svanirà da sè col tempo, invio una richiesta di riconsiderazione a Google. Giorno 24 settembre la penalizzazione viene rimossa.

Quali sono le conseguenze della rimozione della penalizzazione? Beh, i link presenti nella pagina tornano a trasmettere PageRank e quindi dopo un po’ di smottamenti tellurici tipici dei continui aggiornamenti delle SERP, The Search Herald acquisisce un botto di PageRank e mostra miglioramenti su tutti i KPI monitorati.

I risultati

Primo KPI: quantità di query uniche. La quantità di query uniche per le quali un sito riceve traffico organico può essere usata come KPI per capire quanto il sito è visibile. Siti poco popolari tendono ad essere visibili sulle SERP per una quantità di query piuttosto bassa mentre siti più popolari vengono fuori nei risultati di ricerca per query molteplici, per più varianti e più query di long tail.

Il grafico che segue indica come la quantità di query uniche per The Search Herald è cambiata nel tempo; si noti l’aumento successivo al 24 settebre 2015, giorno della rimozione della penalizzazione del sito linkante.

Secondo KPI: numero di impression. La quantità di impression registrate sui risultati organici e acquisita attraverso il pannello di Google Search Console può essere usata come ulteriore indicatore di performance. Nel caso di The Search Herald tale KPI è un po’ fuorviante, tuttavia, perché i contenuti della home page dell’aggregatore cambiano continuamente e quindi la pagina può ricevere più visualizzazioni non tanto perché Google ha deciso di assegnarle posizioni migliori quanto perché i nuovi testi pubblicati intercettano nuovi sciami di ricerche.

Ho deciso di presentarvi comunque i dati di questo KPI perché nel caso specifico l’incremento di impression è da imputare in gran parte a nuova visibilità acquisita per query più competitive; il che ci porta al terzo KPI…

…posizione media per query mediamente competitiva. Sin dalla sua creazione, The Search Herald ambiva a posizionarsi su Google.com per la query [seo news] e il grafico che segue mostra la visibilità per tale query prima e dopo il 24 settembre 2015.

La settima osservazione di questo post riassume quanto appena mostrato nel tentativo di smentire quelle strane voci che girano in certi ambienti SEO, secondo le quali i link sono elementi meno importanti rispetto al passato. Come per tutti i temi SEO, la risposta corretta è sempre “dipende”. Un link a tema, di qualità e che eroga un fracco di PageRank (o qualsiasi altra metrica Google si sia inventato negli ultimi anni) rimane un asset di grande valore perché è in grado di portare risultati.

L’ottava e ultima osservazione consiste nella preghiera di non attribuire peso ai ripensamenti del sottoscritto durante il test appena presentato, che tutto è stato fuorché rigoroso. Dall’obiettivo di capire se le penalizzazioni manuali possiedono una data di scadenza, il sottoscritto ha drasticamente virato verso uno scopo ben più becero e mangereccio: spingere un sito attraverso un backlink. Alla faccia dei test SEO.

Consideratemi pure il proverbiale lupo che non perde il vizio.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

Quando Google spamma sé stesso: una malefatta passata inosservata

LowLevel — Wed, 06 Aug 2014 07:13:25 +0000

All’inizio pensavo di intitolare questo articolo “Quando Google spamma sé stesso: una torbida storia di potere e corruzione” ma sarebbe stato un po’ troppo romanzato e il titolo mi avrebbe stuzzicato la pericolosa idea di trasformare l’articolo in un racconto estivo ambientato in una New York del periodo proibizionista. Immaginavo già Larry Page con un fedora.

Alla fine ho ripiegato verso un titolo che va dritto al punto.

La prima cosa che dovete sapere è che l’immagine di Google che spamma sé stesso è tanto diffusa quanto impropria. È vero che alcune volte i responsabili del motore di ricerca sono arrivati a penalizzare siti web appartenenti all’azienda, ma sarebbe superficiale concludere di trovarsi di fronte ad un singolo soggetto con tendenze schizofreniche. Quindi vi spiegherò perché queste vicende avvengono.

La seconda cosa che dovete sapere è che un po’ di tempo fa ho beccato quello che considero il più atroce esempio di spam operato da un team di prodotto di Google ai danni di Google Search, un’attività di puro spam su larga scala, con l’obiettivo di riempire l’indice del motore di tanta roba di bassa qualità che non avrebbe meritato di essere indicizzata.

Questa aberrante e titanica malefatta è passata inosservata a tutti ed è stata purtroppo notata dal sottoscritto troppo tardi, quando ormai la tecnica di spam non aveva più senso visto che il servizio che tentava di promuovere sulle SERP non esisteva più. Se l’avessi beccata qualche anno fa sarebbe successo probabilmente un mezzo putiferio e mi mangio un po’ le mani per non essermene accorto prima.

La malefatta la racconto comunque, anche se in ritardo, perché è talmente grossa che è bene che tutti voi siate informati della cosa. Prendete i pop corn.

Uno, nessuno e centomila

Nel nostro piccolo mondo markettaro, abitato da esseri umani che hanno prevalentemente contatti con aziende di entità media o piccola, si fa fatica ad immedesimarsi nel funzionamento di una grande multinazionale.

La gente tende a considerare “Google” o qualsiasi altra azienda di pari grandezza come se si trattasse di un soggetto singolo. È anche un modo per “umanizzare” il motore di ricerca e renderlo più comprensibile, riportandolo forzatamente ad un contesto più familiare a noi esseri umani. È però anche un presupposto errato che può condurre ad errori nelle nostre valutazioni; me ne sono lamentato in passato ed è uno degli argomenti affrontati da Valerio Notarfrancesco in questo articolo.

In una qualsiasi multinazionale, i vari prodotti e servizi vengono gestiti da team dedicati, ciascuno dei quali si occupa di portare avanti, migliorare e promuovere il prodotto a cui è stato assegnato. Non è possibile fornire una descrizione dell’organigramma e delle relazioni tra team di prodotto diversi, perché la struttura cambia da azienda ad azienda. Quello che sappiamo è che in Google esiste un modello che è in parte a “compartimenti stagni” e di conseguenza, osservando le cose dall’alto, le azioni di un team non sono necessariamente coerenti con quanto viene fatto un altro team.

Alcuni dipendenti vengono misurati sulla base dei risultati che portano e quindi, detto in modo gratuitamente brutale, gli sbatte sega se fanno qualcosa che va a scapito di altri team o prodotti; l’importante è raggiungere gli obiettivi.

Se esistono controlli da parte di regie superiori, che dovrebbero avere il compito di definire degli standard etici aziendali e di farli rispettare, allora tali controlli a volte non hanno funzionato, perché in passato è successo che un team di prodotto, desideroso di acquisire visibilità sul motore di ricerca, abbia svolto attività che i responsabili del prodotto “Google Search” definiscono spam.

Agli occhi esterni sembra che in signor Google prima faccia una legge e poi non la rispetti, nella realtà io ho sempre spinto affinché si diffondesse questa consapevolezza che non esiste un solo Google ma è più corretto considerare la multinazionale come se fosse un agglomerato di tante piccole imprese, ognuna con una certa autonomia decisionale e con propri obiettivi e modalità operative.

La logica super-super-semplicistica di considerare Google un singolo soggetto guidato da una mente unica è la stessa che porta a fare mischioni pericolosi in altri ambiti legati al search marketing, per esempio quando ci si mette in testa che il motore di ricerca consti di un singolo o principale algoritmo, quando in realtà la macchina è estremamente complessa e gestita da molti algoritmi e software, ciascuno con obiettivi diversi.

Sempre la stessa logica claudicante porta la gente a immaginare che il team di Google Search e quello di Google Adwords siano in grado di influenzare, ciascuno, gli obiettivi ed i criteri dell’altro.

Poi magari si cresce e si capisce che la qualità del prodotto Google Search è abbastanza sacra (per ragioni sia ideologiche sia economiche) e che, se necessario, a subire penalizzazioni nei risultati di ricerca saranno anche siti che vengono gestiti da altri team dell’azienda.

Provo a farvi una lista delle vicende passate.

Cronache spammiane

La mia memoria fa affiorare tre episodi in cui un team di prodotto di Google si sia reso responsabile di attività di spam nei confronti del motore di ricerca. Però ricordo che ce ne sono state più di tre, quindi sto facendo un gioco con me stesso nel momento stesso in cui scrivo questa frase: prima vi accenno a quelli che ricordo io, poi vado a farmi un giro su Search Engine Land per vedere quanti me ne sono dimenticato.

I link acquistati per Google Chrome

L’episodio che ricordo meglio è quello relativo a Google Chrome, perché è probabilmente quello più recente. Il team di Google Chrome si rivolse ad un’agenzia esterna per promuovere il proprio browser e l’agenzia avviò una campagna di article marketing ottenendo articoli di dubbia qualità e a volte comprensivi di un bel link do-follow verso il sito di Google Chrome.

Il team di Google Search penalizzò il sito di Google Chrome, che per un po’ di tempo non venne fuori nei risultati di ricerca nemmeno cercando il nome del prodotto o query generiche come [browser].

Questa vicenda fu l’unica, tra le altre esposte, in cui Google si scusò ma precisò anche che in realtà loro non avevano richiesto all’agenzia la pubblicazione di articoli di cacca. Però, per coerenza, la penalizzazione venne inferta ugualmente perché la responsabilità delle pubblicazioni era comunque di Google.

I link acquistati da Google Japan

Non ricordo bene che tipo di prodotto era stato promosso, ma ricordo che il sito di Google Japan venne penalizzato dal Search Team perché i responsabili si erano resi rei di aver acquistato link.

La penalizzazione, in questo caso, era stata abbastanza blanda, forse anche solo “estetica”, nel senso che era stato abbassato il “Toolbar PageRank” ma forse non il PageRank reale.

Cloaking di Google Adwords

Qui la memoria vacilla ancora di più, ma ricordo distintamente che il team di Google Adwords adottò una tecnica di cloaking su delle pagine di Google.com per presentare a Googlebot contenuti testuali diversi rispetto a quelli presentati dagli utenti.

In questo caso la penalizzazione del team di Google Search fu consistente e quelle pagine perserò visibilità nei risultati di ricerca.

Quanta roba ho ricordato?

Beh, ho dato un’occhiata a Search Engine Land e ho constatato che non me la sono cavata poi tanto male. Non ricordavo un quarto episodio di spam, legato all’acquisizione dell’azienda Beat That Quote da parte di Google. In pratica Google acquisì un comparatore di servizi finanziari come mutui e assicurazioni e tale azienda aveva fatto spam in passato. Di conseguenza Google si ritrovò tra le mani un sito che il Search team fu costretto a penalizzare.

È strano che io non ricordi questa vicenda, perché avevo seguito con interesse l’acquisizione di quell’azienda e la conseguente nascita del minaccioso motore di ricerca verticale di Google per mutui e assicurazioni auto. Il giorno che ‘sta roba verrà estesa all’Italia, in cima alle SERP, prevedo smottamenti tellurici con l’epicentro individuato nei consigli di amministrazione di alcune aziende. Vabbè, chiusa parentesi.

La seconda cosa che non ricordavo è che il team di Google Adwords si è reso responsabile di spam via cloaking due volte e non solo una. Come dire, repetita iuvant.

Leggetevi questo dettagliato articolo di SEL per avere tutti i particolari che non ho riportato io.

Adesso che ho delineato i contorni di questa mitologica idra multitesta, ciascuna dotata di volontà propria, tocca spiegarvi quello che ho notato il 20 dicembre 2013.

La maxi-porcata passata inosservata: il contesto

Ad esclusione dei SEO abitanti in altri sistemi solari, qualunque SEO mediamente dotato dovrebbe sapere che indurre Google ad indicizzare una grande quantità di pagine contenenti generici risultati di ricerca è una pratica considerata spam da Google.

La più grande lotta di Google contro questa tipologia di risorse di bassa qualità è avvenuta alcuni anni fa, quando sulle SERP di Google imperversavano i cosiddetti spam engine. Uno spam engine è un sito che ospita un motore di ricerca per il web e che induce Google (o altri motori popolari) ad indicizzare una grande quantità di pagine contenenti SERP prodotte dallo spam engine.

L’esperienza di un utente era dunque pessima in quanto, dopo aver effettuato una ricerca su Google e dopo aver cliccato su un link che conduceva ad uno spam engine, l’utente si trovava nuovamente di fronte ad una pagina con un elencone di dieci link blu.

La famelicità di Googlebot e lo schema di linking interno usato dagli spam engine permetteva agli stessi di ingolfare l’indice di Google con quantità altissime di pagine spazzatura, che per giunta ottenevano visibilità molto facilmente.

Il sistema funzionava talmente bene che alcuni circuiti di affiliazione avevano creato e mettevano a disposizione dei webmaster degli script pronti per creare il proprio spam engine ed iniziare a riversare montagne di letame sulle SERP di Google, senza che fosse necessario possedere alcuna conoscenza tecnica di come si costruisce un motore di ricerca. Il percorso era dunque del tipo:

Prendi lo script
Installalo su un sito
Osserva come Google indicizza tutte le tue pagine contenenti risultati di ricerche e link di affiliazione
Conta il traffico da Google ed i soldi

Di questa estenuante e lunga battaglia tra Google e gli spam engine è rimasta, dopo la lenta disfatta di questi ultimi, una riga delle linee guida di Google per webmaster che recita:

“Use robots.txt to prevent crawling of search results pages or other auto-generated pages that don’t add much value for users coming from search engines.”

Per tanti anni, Google si è leccato le ferite derivanti dall’efferato conflitto e immagino che voi darete per scontato che un’azienda che ha affrontato tale sfida deve aver maturato una cultura profondamente avversa a tali elementi tossici del web, giusto?

È un po’ come quando assaggi per la prima volta il sidro di mele, te ne scoli qualche litro perché va giù che pare acqua, prendi la più devastante ubriacatura della tua vita e dopo aver passato uno squallido hangover di due giorni, durante il quale il tuo organismo cercava di vomitare quel poco di coscienza di te che ti era rimasta e tu eri fermamente convinto che saresti schiattato da un momento all’altro, da quel momento in poi e per il resto della tua vita il tuo cervello ti invia messaggi di morte imminente non appena senti solo l’odore di quella roba (questa metafora è autobiografica).

Ecco, questo è quello che sarebbe dovuto succedere a Google: un rifiuto endemico per qualsiasi cosa somigliasse ad uno spam engine.

E infatti figurati se a Google Search, dopo tante pene dietro agli spam engine, sarebbe mai venuto in mente di trasformarsi in spammer, spammare il proprio prodotto e far indicizzare al motore quantità stupefacenti di paginacce di risultati di ricerca. Impossibile.

Ma Google Trends è un altro prodotto.

La maxi-porcata passata inosservata: le evidenze

Guardate lo screenshot che segue.

Quello che vedete nello screenshot è un pezzo di un file sitemap (non XML ma di quelli semplici, con un URL per riga) usato a suo tempo dal servizio Google Trends. All’epoca, era possibile cercare su Google Trends il nome di un qualsiasi dominio e ottenere un grafico con la stima dell’andamento del traffico sul dominio indicato. Questa funzionalità, figherrima, è stata successivamente rimossa perché, appunto, figherrima.

Ma durante il periodo in cui la funzionalità esisteva ancora, il team di Google Trends aveva pensato bene di creare dei file sitemap attraverso i quali indurre il motore di ricerca ad indicizzare quantità industriali di pagine di statistiche su una pletora di nomi di dominio.

Nello screenshot allegato ho evidenziato alcune pagine di Google Trends che contenevano le stime di traffico di domini di natura zozzereccia, per farvi vedere che l’elenco non era limitato a pagine dedicate a siti di alta qualità.

Si trattava quindi di pagine di risultati della ricerca di nomi di dominio su Google Trends, in pratica landing pages tematizzate su specifici nomi di dominio e che non ricevevano alcun link: venivano proposte a Google Search solo attraverso file sitemap.

Quanto appena descritto è uno spam engine. E possiamo controllare che tutti gli elementi identificatori di uno spam engine siano effettivamente presenti:

Pagine contenenti risultati di una ricerca. Check!
Quantità industriali delle suddette. Check!
Contenuti di bassa qualità. Check!
Creazione funzionale solo all’indicizzazione da parte di un motore di ricerca popolare. Check!

La faccenda, se non ci fosse da indignarsi, potrebbe passare quasi per una comica surreale. All’interno di un’azienda che ha combattuto per anni contro il danno prodotto dagli spam engine all’indice del proprio motore di ricerca, qualche frangia irrequieta ha creato uno spam engine interno per far indicizzare a Google Search una fracca di risultati di ricerca di Google Trends.

Quale spiegazione può essere trovata di fronte a tale scempio? Quella gente credeva davvero che far indicizzare centinaia di migliaia di pagine con le statistiche di siti della levatura di porcoporco.biz avrebbe incrementato la qualità dei risultati di ricerca su Google?

Ma forse l’aspetto più triste dell’intera vicenda è che nessuno di noi si sia reso conto di questo malaffare durante l’esistenza di tale funzionalità di Google Trends.

I file sitemap con le chilometriche liste di pagine da far indicizzare sono rimasti online per quasi due anni, per dimenticanza o incuria, anche dopo la rimozione da Google Trends della possibilità di fare ricerche sul traffico di nomi di dominio. Tutte le centinaia di migliaia di URL in quei file sitemap generavano uno stato HTTP 404.

Sapete quando Google ha finalmente fatto pulizia di quei file sitemap obsoleti, cancellandoli ed eliminando le ultime prove ancora esistenti del misfatto? Forse non la prenderete bene: è stata colpa mia. La reazione è avvenuta quando John Mueller ha letto il seguente post su Google+:

Insomma, tempo due giorni ed i file sitemap obsoleti sono stati cancellati e, con loro, le pistole fumanti. L’unica testimonianza storica rimasta dello spam engine creato da Google Trends attraverso i file sitemap è il mio screenshot.

La maxi-porcata passata inosservata: l’indagine

Il resoconto del fattaccio termina qua, ma magari possiamo fare di necessità virtù e sostituire la giustificata ma improduttiva indignazione con l’obiettivo di imparare qualcosa di concreto e utile da questa vicenda.

Ho dunque pensato di illustrarvi i passi che ho compiuto per rendermi conto della faccenda, anche per confermarvi che una delle caratteristiche indispensabili di un SEO dovrebbe essere una certa predisposizione a voler indagare, attitudine che viene sopratutto utile nel momento in cui bisogna analizzare la condizione di un sito e capire se, quanto e come il motore di ricerca ha digerito i suoi contenuti.

Il primo passo verso la strada che mi ha portato ad individuare il comportamento spammoso l’ho compiuto perché periodicamente do un’occhiata al file robots.txt di Google.com. Si tratta di un file ricchissimo di informazioni sulle directory usate da Google per i propri servizi web ed in un paio di occasioni si è rivelato prodigo di informazioni in anteprima o di contenuti interessanti non raggiungibili attraverso link dal sito di Google.

Nel caso in questione, tuttavia, la mia attenzione si è focalizzata per la prima volta in fondo al robots.txt, che ospita gli URL di alcuni file sitemap. C’è un po’ di tutto, ma quello che stonava di fronte a tutto il resto era un file sitemap index dedicato a Google Trends. Per quale motivo un servizio con così poche pagine necessitava di un file sitemap index?

Questo file non esiste più online ma viene ancora citato in fondo al robots.txt nel momento in cui scrivo, per quei soliti motivi di incuria che ho compreso essere non rari tra chi ha il compito di gestire questi aspetti.

Il primo file sitemap indicato palesava già il torbido giochino elucubrato da Google Trends: si trattava in maniera estremamente ovvia di URL di query di ricerca, come quelle dello screenshot che vi ho mostrato. Una lettura più approfondita ha reso evidente che la qualità dei domini oggetto delle query era anche estremamente bassa e questo chiudeva il cerchio sulle intenzioni e l’indole di chi aveva pianificato l’attività di spam.

Conclusioni

Spero di avervi trasmesso un’immagine di Google più distante da quella coscienza unica che molte persone gli attribuiscono erroneamente. Google è un’azienda composta da circa 50.000 dipendenti e più che considerare la compagnia una flotta informe di oggetti guidati da una regia comune, è più realistico considerare Google una piccola cittadina all’interno della quale molti abitanti non si conoscono o, più tristemente, si limitano a guardare il proprio orto senza troppi scrupoli nei confronti del Search Team.

Il mio suggerimento, quando si desidera valutare l’operato e le azioni di questa e di altre aziende molto grandi, è quello di definire innanzitutto di quale testa dell’idra si sta parlando.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

La SEO sulla spiaggia: case di link costruite sulla sabbia

LowLevel — Fri, 01 Aug 2014 07:41:50 +0000

E’ notizia di qualche giorno fa che una nota impresa internazionale di spaccio di tool, articoli e graduatorie di fattori di ranking per SEO e webmaster si è pubblicamente indignata del fatto che Google ha considerato di bassa qualità un link presente su una piattaforma di guest blogging appartenente all’azienda stessa.

I nomi sono irrilevanti e quindi non li farò. Ritengo che si possa imparare di più focalizzando la propria attenzione sul “cosa” e tralasciando il “chi”, pronome che spesso apre la strada a considerazioni più ideologiche e politiche che oggettive.

Approfittando allora del periodo estivo durante il quale sto scrivendo questo articolo, ho pensato di usare la metafora delle case costruite sulla sabbia per dettagliare un po’ la vicenda accennata sopra e per spiegare perché alcuni progetti su web sono inesorabilmente destinati a ricevere sprangate sui denti da Google, prescindendo da quanto sia importante il brand che vi sta dietro.

Il mio obiettivo è quello di chiarire alcuni aspetti tecnici dei criteri che stanno dietro alla classificazione dei link operata da Google.

Per garantire un pieno anonimato all’azienda le cui affermazioni mi hanno motivato a scrivere il presente articolo chiarificatore, attribuirò ad essa un nome fittizio e in linea col tono estivo-balneare dell’intero post. La chiamerò pertanto “LaCòz“.

Introduzione alla lettura

Chiarisco subito che in questo articolo non troverete critiche mosse ad alcun soggetto.

Ritengo che alcune affermazioni fatte da un’azienda molto popolare nel settore SEO potrebbero aver insegnato qualcosa di errato ai lettori e pertanto scrivo questo articolo nel tentativo di fare chiarezza su alcuni aspetti strettamente tecnici di come Google valuta i link. Spero che queste linee guida siano chiare ed utili.

Allo stesso modo, un altro soggetto che non sarà oggetto di critiche sarà Google perché, a prescindere da quanti mal di pancia vengono ai SEO a causa delle discutibili politiche penalizzanti seguite dal motore di ricerca, il mio obiettivo resta quello di contribuire alla diffusione di alcune linee guida SEO corrette, fondate per forza di cose su quanto Google gradisce e stabilisce.

Le basi: la penalizzazione manuale

Scrivo due righe sul tema della penalizzazione manuale per chi non ha mai affrontato questa tematica.

Quando un sito web subisce una penalizzazione manuale da Google, significa che del personale di un team antispam di Google si è preso la briga di valutare manualmente un sito web ed ha determinato che una o più caratteristiche individuate sul sito o sui link che puntano ad esso non sono in linea con le linee guida da seguire per concorrere alla visibilità nei risultati delle ricerche.

Breve nota a margine su un equivoco diffuso: i dipendenti di Google che svolgono questi controlli manuali non sono i famosi “Quality Rater”, i quali non sono dipendenti di Google ma collaboratori esterni con contratti temporanei e con mansioni diverse dalle valutazioni svolte dal team antispam di Google.

Quando il team antispam decide di prendere un provvedimento nei confronti di un sito, invia un messaggio sul pannello di Google Webmaster Tools associato al sito stesso. Se il webmaster ha attivato un’apposita opzione su GWT, il messaggio verrà recapitato anche all’indirizzo email associato all’account.

Il messaggio comunica che il team antispam ha notato caratteristiche non in linea con le linee guida di Google e, nel caso di link “non naturali” che puntano al sito, fornisce anche alcuni esempi di pagine di altri siti in cui esistono link che sono considerati non conformi alle linee guida.

Per esempio, io potrei trovare sul pannello di GWT associato a questo blog, LowLevel.it, un messaggio che mi comunica che una pagina di Repubblica.it contiene un link verso LowLevel.it ritenuto “non naturale”.

Al di là degli esempi specifici, che a volte vengono selezionati un po’ ad capocchiam, la reale utilità di questi esempi di risorse linkanti consiste nel far capire al webmaster la tipologia di link che Google non gradisce, in modo da poter fare una bonifica dei backlink del sito sapendo che tipo di roba andare a cercare e neutralizzare.

Questa era la dovuta introduzione, adesso passiamo alla specifica vicenda e alle informazioni che vi devo fornire per dare contesto ai fatti accaduti.

LaCòz!

L’azienda LaCòz possiede e gestisce una piattaforma di guest blogging che accoglie articoli scritti da guest blogger su tematiche inerenti marketing e SEO, inclusa la tematica del link building.

Per darvi l’idea del profilo di contenuti di tale piattaforma di guest blogging e per fornirvi un’informazione sui temi più gettonati, ho calcolato il numero approssimativo (5 più, 5 meno) di articoli per ciascuna categoria del blog e ve li presento ordinati, con in cima le categorie più ricche di post.
Per i posteri: questi dati risalgono al 31 luglio 2014.

Categoria	Numero di articoli
Search Engines	165
Link Building	160
Content	150
Social Media	140
Business Practices	135
LaCòz News	95
Analytics	90
Online Advertising	85
Public Relations	85
Technical SEO	75
Paid Search Marketing	65
Keyword Research	60
On-page SEO	55
Tools	55
Blogging	40
Events	40
Mobile	35
Advanced SEO	30
Branding	30
Design	30
Local SEO	25
Conversion Rate Optimization	20
Marketing Industry	20
E-Commerce	15
Marketing Psychology	15
Basic SEO	10
Consulting	10
International	10
Reputation Management	10
User Experience	10
Video	10
Competitive Research	5
Copywriting	5
Email Marketing	5
LaCòz Tools	5
Productivity	5
Reporting	5

Nota: la pagina della categoria “Link Building” è l’unica tra i 37 argomenti ad ospitare in cima una corposa introduzione al tema del link building, fornendo link a guide introduttive e ad articoli di approfondimento creati da LaCòz.

LaCòz contro Google!

Il “fattaccio brutto” ha avuto inizio quando un webmaster ha mostrato a LaCòz un messaggio di GWT in cui veniva comunicato che Google aveva individuato link “non naturali” che puntavano al suo sito. Nell’elenco di esempi di pagine web che contenevano questo tipo di link, appariva anche l’URL di una pagina web della piattaforma di guest blogging di LaCòz.

C’è di più: a costo di destabilizzarvi con un’imprevedibile rivelazione che coglierà di sorpresa anche i colleghi più scafati del settore SEO, la pagina web da cui proviene il link “non naturale” è un guest post della categoria “Link Building” del blog di LaCòz. Si tratta proprio di quella categoria molto gettonata dai guest-blogger di LaCòz e l’unica a meritare una bella introduzione a questo importante argomento.

L’ultimo particolare che devo fornirvi è che il sito che ha ricevuto il messaggio di backlink innaturali appartiene all’autore del post sul quale Google ha evidenziato la presenza del backlink non conforme alle linee guida.

Riassumento: un autore seriale di guest post della sezione “Link Building” del guest blog di LaCòz ha pubblicato un articolo su LaCòz e ci ha messo dentro un link verso il proprio sito web. Per altre ragioni , il tizio ha successivamente ricevuto da Google un avviso di penalizzazione per link innaturali e uno dei link di esempio è l’articolo che il tizio ha pubblicato su LaCòz.

LaCòz alla riscossa!

Preso atto che Google ha considerato un link su LaCòz “non naturale” e volendo mettere i puntini sulle “i”, un portavoce di LaCòz ha dunque pubblicato un comunicato ufficiale, facendo le seguenti principali affermazioni:

I link provenienti dal guest blog di LaCòz non violano le linee guida di Google sulla qualità;
Tutti i link che i guest blogger inseriscono negli articoli pubblicati su LaCòz sono di natura editoriale e vengono controllati da LaCòz stessa uno per uno prima di accettare la pubblicazione del post su LaCòz;
Il link o i link creati dal guest blogger e ai quali presumibilmente Google si riferiva nel messaggio (ricordate che i messaggi di Google indicano URL di pagine, non forniscono il dettaglio di quali link nelle pagine sono fuori dalle linee guida) sono pienamente supportati dal portavoce di LaCòz;
Viene supportato dal portavoce di LaCòz anche un link che il guest blogger ha creato ma che ha successivamente richiesto che fosse rimosso dal post, per ragioni che non vengono esplicitate;
Il portavoce di LaCòz cita inoltre una discussione con Matt Cutts avvenuta mesi prima in cui quest’ultimo afferma che in media LaCòz linka a buoni siti e quindi non c’è molto da temere per la reputazione che Google si farà di LaCòz;
Conclude ribadendo che il link creato dal guest blogger (non quello rimosso ma quello che è rimasto) era assolutamente editoriale, organico e intenzionale.

Con questo chiudo la cronaca del fatto ma prima di spiegarvi perché queste affermazioni insegnano un paio di lezioni molto errate su come Google valuta i link, ho deciso di proporvi il gioco SEO dell’estate, che si intitola “Scopri l’intruso”!

Il gioco SEO sotto l’ombrellone: scopri l’intruso!

Di seguito vi descriverò due universi. Solo uno dei due universi è quello in cui esistiamo, l’altro può essere considerato reale solo leccando tanti tanti tanti funghi allucinogeni. Il gioco consiste nell’indovinare qual è l’universo nel quale viviamo!

Universo “A”

In questo universo, creare una piattaforma di guest blogging dedicata a SEO e link building produce un ambiente intrinsecamente scevro da manipolazioni e attrae soggetti disinteressati a trarre vantaggi di ranking attraverso le attività di guest blogging.

In questo universo il guest blogging non ha alcuna correlazione con il link building, perché il concetto di link building non esiste e la gente si limita a prendere atto dei backlink spontanei che riceve per merito. Auto-votarsi non è considerato etico e alcuni credono che faccia venire anche la scabbia.

In questo universo, gli autori dei guest post affondano le proprie radici culturali in una disciplina, la SEO, universalmente riconosciuta come esempio sommo di piena adempienza alle linee guida dei motori di ricerca.

In questo universo non esiste il detto “l’occasione fa l’uomo ladro” e tu lasci sempre la porta di casa aperta.

Universo “B”

In questo universo, creare una popolare piattaforma di blogging dedicata a SEO e link building aumenta esponenzialmente le probabilità che gli autori tenteranno di sfruttare la situazione per creare link di ogni genere verso i propri siti.

In questo universo, nonostante una piattaforma di blogging dedicata a SEO e link building sia tenuta in media di qualità alta dal gestore, prima o poi qualche link fuori dalle linee guida di Google verrà sicuramente pubblicato, semplicemente perché il tipo di selettività operata dal gestore è differente dal tipo di selettività operata da Google.

La reale condizione di alcuni link su LaCòz

Avete indovinato quale dei due universi è quello in cui viviamo? Si trattava dell’universo “B”, affettuosamente chiamato “shit happens“. E se crei una piattaforma di guest blogging, persino se selettiva, allora “double shit happens”. E se quella piattaforma è dedicata ad argomenti come la link building, allora si palesa un “reverse one and a half somersaults with three and a half twists shit happens”.

Ovviamente, di fronte ad un comunicato nato per tranquillizzare gli stakeholder di LaCòz, il sottoscritto s’è andato a guardare altri post della categoria “Link Building” di LaCòz per vedere se effettivamente la qualità asserita dal portavoce corrispondeva al vero. Beh, io ho trovato link di pupù. Non uno solo. Più di uno, frutto di una palese abitudine di qualche guest blogger a fare le cose in quel modo. Sono convinto che la presenza di questi link sia un’eccezione e non la regola, ma esistono.

Durante un’attività di bonifica del profilo dei backlink di un sito, il tipo di link di pupù che ho osservato deve inesorabilmente finire nell’elenco di quelli da segare via, attraverso rimozione fisica, nofollow o disavow tool. Perché? Perché è proprio il tipo di link che contribuisce a creare un profilo negativo del sito linkato ed è il tipo di link che Google non gradisce, come la vicenda di LaCòz dimostra.

Significa che LaCòz ha mentito? No no. Chiudendo un occhio e guardando da un’altra parte con quello rimasto aperto, possiamo anche concedere a LaCòz il dubbio della buona fede. La ragione è, più semplicemente, che i criteri di LaCòz sono quelli di LaCòz, non quelli di Google. Quindi LaCòz è magari davvero convinta che tutti i link sul proprio sito rientrino nelle linee guida di qualità di Google e questa convinzione se la porta dentro, insegnando anche ai propri lettori che quel tipo di link è in linea con le linee guida di Google e che quest’ultimo ha sbagliato a classificare negativamente uno di quei link.

Però uno degli obiettivi di noi SEO è quello di evitare che i siti web ricevano penalizzazioni, giusto? Quanto asserisce LaCòz per evitare un danno di immagine e di mercato, a noi non interessa. A noi interessa solo imparare una regola corretta sul link building, in modo da prendere decisioni benefiche per i siti web che curiamo.

Ed è a questo punto che bisogna chiarire un po’ di cose sul link building e sul modo in cui Google valuta manualmente i link.

Delle brutte convinzioni e lezioni SEO

Prima di ogni cosa va spiegato in quale modo le affermazioni di LaCòz non rappresentano un buon insegnamento alla comunità SEO e dei webmaster. La ragione principale è che il link segnalato da Google al guest blogger e quello che lo stesso guest blogger ha chiesto che fosse rimosso appartengono ad una “fascia critica”.

Chiunque di noi può formulare opinioni soggettive su quanto quei link siano compatibili con le linee guida di Google e LaCòz è libera di avallarsi in base alle proprie policy interne, ma è importante capire che alla fine della fiera le decisioni SEO sui link vanno prese immedesimandosi in quello che desidera Google, non sulla base di ciò che desideriamo noi.

Di conseguenza, mi sento di suggerire cautela e vi chiedo di fare attenzione a quanto si può imparare da soggetti che vivono un conflitto di interesse tra insegnare le cose giuste alla propria platea e dover mantenere limpida l’immagine di una piattaforma di guest blogging dedicata anche a link builder.

Poi esistono brutte lezioni e convinzioni di cui LaCòz non è responsabile ma, al contrario, è vittima.

Per esempio, dopo il comunicato pubblicato dal portavoce di LaCòz, mi è capitato di leggere sui social network commenti di questo tipo: “Se questo può capitare ad un sito come LaCòz, figuriamoci ai piccoli siti.”. Ecco, questo è un pensiero che è fondato su alcune falle SEO consistenti e che può venir fuori dalla testa solo in due casi:

Se si crede che la valutazione manuale di un link si basi sulla presunta autorevolezza del sito su cui il link è pubblicato;
Se si crede che i siti presumibilmente autorevoli possiedono un “free pass” di fronte ai controlli manuali antispam.

Le cose non stanno per niente così.

Il suddetto pensiero è fallato anche per una terza ragione, ovvero perché parte dall’errato presupposto che l’indicazione di un link non naturale comporti una svalutazione del sito linkante da parte di Google, cosa che non è necessariamente detta. Ma iniziamo con le precisazioni…

Google valuta il link, non il sito linkante

Limitatamente al contesto dei messaggi che segnalano una penalizzazione, gli esempi di pagine linkanti che il dipendente di Google invia al webmaster sono un’informazione sul tipo di link che Google non desidera, non un’opinione sul sito linkante.

In un mondo ospitante solo SEO svegli, a nessuno verrebbe in mente che un link non naturale individuato su LaCòz equivale ad un giudizio di Google su LaCòz. In questo articolo ho usato l’intestazione “LaCòz contro Google” con ironia per rimarcare l’assurdità di questa visione “X contro Y” ma sia ben chiaro che Google non ha in nessun modo espresso un giudizio su LaCòz.

Il giudizio riguarda dunque il link stesso, non il sito che lo ospita. Purtroppo non tutti i SEO ed i webmaster colgono questa differenza e allora LaCòz rischia di passare tra i webmaster per un sito spammoso, col risultato che è costretta a pubblicare un comunicato di precisazioni.

Nessun sito ha un “free pass”

Non esistono cartellini “esci gratis di prigione” e non esistono sconti per siti popolari solo perché sono popolari: se un link sgradito a Google è presente su un sito popolare o autorevole, rimane un link sgradito a Google.

Se esistessero “free pass” per i siti autorevoli, avverrebbe una catastrofe sui risultati di ricerca: basta dare un’occhiata ai risultati della query [site:edu buy cialis viagra levitra] per realizzare che ci sono un mucchio di serissimi siti che sono piagati da spammer e link spamming della peggiore fattezza.

La decisione di Google (e dei motori di ricerca in genere) di stimare la qualità di un link focalizzandosi sul link in sé consente di trattare tutti i siti in modo paritario e non esiste presunta autorevolezza che possa automaticamente trasformare un link sgradito in un link accettabile.

Nessun sito ha outbound link perfetti

A prescindere da quanto qualcuno asserisca, mantenere un sito 100% pulito sotto l’aspetto della qualità degli outbound link (link verso altri siti) è irrealistico per almeno due ragioni.

Ciascun link non è buono oppure cattivo; questa classificazione “binaria” è fuorviante. Un link può anche essere stimato “in odore di spam” in modo parziale, secondo una percentuale di probabilità. Pensare che tutti i link uscenti di un sito siano perfetti, tutti classificati come “100% naturale” è un grande atto di ingenuità che non trova riscontro nel modo in cui i motori di ricerca valutano i link sul web.
Il web è in continua mutazione e nel corso del tempo i siti web cambiano proprietari e contenuti. In linea puramente teorica bisognerebbe revisionare periodicamente anche i link pubblicati nel passato, per accertarsi che i contenuti del sito linkato non siano cambiati del tutto, ma l’attività risulta complessa e costosa. Il fatto che un sito possieda un controllo editoriale che valuta quanto viene pubblicato oggi non è sufficiente a garantire che in futuro la qualità dei link uscenti rimarrà costante.

Il mio suggerimento, pertanto, è quello di non farsi troppe pippe mentali sulla perfezione degli outbound link di un sito, perché è un obiettivo non raggiungibile nella pratica. Partite invece dal presupposto che ciascun link verrà stimato “naturale” con una percentuale di probabilità e cercate di mantenere questa percentuale alta.

Fare guest blogging per linkare i vostri siti è una cattiva idea

Su questo argomento s’è già pronunciato Google ma anche prima che si pronunciasse i SEO più intelligenti devono aver capito il rischio, perché tutto è correlato con la linea guida principale impartita da Google: piantatela di crearvi i backlink da voi!

Poi ognuno di noi può dissentire e ci possono stare eccezioni alla regola, ma la regola rimane quella.

Un link “Editoriale e intenzionale” non implica “naturale”

Il fatto che un link sia intenzionalmente creato da un link builder ed il fatto che lo stesso link venga approvato dall’organo editoriale del publisher non rende automaticamente il link gradito a Google. Bisogna vedere se il publisher valuta i link con gli stessi criteri con cui li valuta Google e bisogna vedere se le intenzioni dietro la creazione del link erano di spammare oppure no.

Io posso intenzionalmente darti una martellata in testa e posso pure trovare qualcuno che approvi, ma questo non rende il mio gesto intrinsecamente etico.

A volte è difficile per un valutatore stabilire l’intento dietro ad un link, ma c’è un elemento che aiuta moltissimo a chiarirsi le idee: l’attitudine del soggetto valutato.

Non è una questione di link ma di attitudine

Focalizzarsi troppo a capire che tipo di link Google gradisce o non gradisce può essere anche fuorviante.

In fase di una valutazione manuale da parte di un dipendente di Google, l’obiettivo è capire se il webmaster “ci ha provato”, ovvero se ha utilizzato tecniche di link building per far aumentare la visibilità del proprio sito nei risultati di ricerca.

Questo obiettivo viene perseguito costruendosi un “identikit” del profilo dei backlink del sito e cercando di capire quanti di quei link sono stati creati più o meno indirettamente dai soggetti che ne beneficiano e quanti possono invece essere considerati un riconoscimento spontaneo ricevuto da terzi.

Il guest blogger che ha ricevuto la penalizzazione possedeva un profilo di link critico e lo specifico link proveniente dal suo guest post su LaCòz non era probabilmente un link più determinante di altri; era semplicemente un link che confermava ulteriormente la tesi che ‘sto tizio va in giro sul web a mettere link verso i propri siti.

La lezione da trarne è: occhio, che le analisi algoritmiche sono di tipo strettamente tecnico, ma le analisi umane sono invece interessate all’attitudine del soggetto che viene valutato. E’ una questione di pubbliche relazioni, non di link, e per uscire dalla penalizzazione bisogna dimostrare a Google di aver capito che tipo di link (non) rientrano nelle loro linee guida.

Popolare non vuol dire autorevole

A prescindere dal caso specifico preso come esempio in questo articolo, vi invito a pensare al fatto che tutti ‘sti articoli SEO che girano sul web e che sono dedicati alle tecniche di link building possono essere stati scritti anche da persone che in realtà si fanno pure penalizzare per link non naturali.

Il mio consiglio è quello di non partire dal presupposto che i siti più popolari ospitino le lezioni SEO più benefiche. Spesso è così, ma dipende dallo specifico autore, non da quanto il sito è popolare.

La realtà dimostra che sulla categoria dedicata al link building di un sito popolare, riesce a scriverci persino gente che non ha nemmeno chiaro il tipo di link che Google non gradisce.

Questa è una delle ragioni per le quali Google ha dichiarato di essersi posto l’obiettivo di sviluppare un algoritmo che attribuisca un peso ad un articolo prevalentemente in base di chi lo scrive, non tanto in base alla popolarità del sito sul quale viene pubblicato.

Le case costruite sulla sabbia

Torno al gioco SEO sugli universi paralleli per chiudere l’articolo.

Preso atto dell’universo nel quale viviamo, vi chiedo: ma che conseguenze volete che possa avere quello di creare una piattaforma di guest blogging in cui uno dei temi più importanti e gettonati è il link building? In altre parole, che tipo di ambiente credete che possa nascere da questa iniziativa?

Adesso non è il caso di attaccare con un pippone gigante sulla storia della SEO e sulla cultura della SEO ma credo che sia doveroso prendere atto che parte della nostra cultura affonda le radici in attività di spam e che esistono alcuni contesti che, più di altri, attraggono soggetti più inclini allo spam come le mosche sono attratte dal miele.

Cerchiamo quindi di prendere coscienza degli ambienti che frequentiamo, cerchiamo di valutare su che tipo di terreno poggiano, specie se è a quegli ambienti che abbiamo deciso di mettere in mano la nostra formazione SEO.

(la foto della casa sulla sabbia è di Judy Baxter)

Conclusione

Se acquistate un’auto usata da una ditta che si fa chiamare “Honest Joe Used Cars”, ricordate che l’appellativo “Honest” se l’è attribuito da sé. Stateve accuort.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

Tutto quello che (non) sappiamo su Google Hummingbird

LowLevel — Tue, 29 Jul 2014 09:27:14 +0000

Una persona mi ha chiesto come mai, tra i post di LowLevel.it dell’ultimo periodo, non ho pubblicato nulla su Hummingbird (in italiano sarebbe “colibrì”), l’update di Google annunciato nel settembre 2013 e apparentemente dedicato all’analisi delle query. Di questa nuova tecnologia non si sa quasi niente di teorico e assolutamente niente di concreto.

La ragione per la quale me ne sono rimasto zitto è che i fenomeni SEO sociali che solitamente si innescano con l’annuncio di un nuovo algoritmo di Google non mostrano un lato particolarmente felice del nostro settore e questo scenario mi demotiva a scrivere.

Le cose stanno così: la volontà di fare pageview a tutti i costi induce i blogger a cavalcare l’onda della novità e, in assenza di informazioni, a trasformarsi in produttori industriali di minchiate col botto.

Adesso non sono certo che l’espressione tecnica “minchiate col botto” renda abbastanza l’idea e quindi ho deciso di scrivere questo post per affrontare un po’ il tema della qualità dell’informazione SEO online e per spiegare che, rifiutandosi di saltare sul carrozzone del circo equestre dei SEO blogghettari d’assalto, si evita di produrre ulteriori congetture strampalate con cui fuorviare gli assetati lettori che si abbeverano a qualunque fonte gli capiti sotto tiro.

In certi casi, si contribuisce di più alla cultura di un settore standosene zitti.

E’ trascorso un bel po’ di tempo da quanto Hummingbird è stato annunciato ma le discussioni e congetture su di esso non si sono placate. Di seguito farò il punto sull’argomento e proporrò le mie considerazioni su quanto male facciamo a noi stessi quando diffondiamo fantasie basate sul nulla.

E chissà se, tra un vaneggiamento e l’altro, qualcosa di interessante e concreto su Hummingbird non possa venir fuori lo stesso…

Quel poco che sappiamo di Hummingbird

Hummingbird è stato rivelato al pubblico il 26 settembre 2013, durante una conferenza che celebrava i quindici anni di Google. In questa occasione è stato anche aggiunto che la nuova tecnologia veniva già usata da un po’ di tempo (da uno a tre mesi a seconda di chi ha riportato l’informazione).

La tecnologia è stata sviluppata per dotarsi di un modo migliore di analizzare le query degli utenti e di comprendere con maggiore precisione che cosa gli utenti desiderano.

Il ricorso ad Hummingbird si è reso necessario perché il modo con cui gli utenti interagiscono con i servizi di ricerca sta cambiando e col tempo aumenterà sempre più la percentuale di query pronunciate a voce attraverso dispositivi mobile, i cui contenuti sono profondamente diversi rispetto a quelli delle query digitate con una tastiera.

Il fatto che nessuno si sia accorto che la tecnologia veniva usata già da tempo stride col fatto che Hummingbird rappresenta, secondo quanto dice Amit Singhal, la più grande rivisitazione della metodologia di analisi delle ricerche. Dalla sua introduzione, Hummingbird ha avuto infatti influenza su oltre il 90% delle ricerche fatte dagli utenti.

Una prima lezione da trarre è che non necessariamente un grande cambiamento tecnologico produce effetti diretti e dirompenti sui risultati di ricerca. Va inoltre considerato che è più probabile che le migliorie maggiori siano avvenute nei risultati di ricerca scaturiti da query di long tail, solitamente poco monitorate dai SEO.

La relazione con la semantica

Prima di addentrarci nei dettagli, è bene chiarire un primo punto sulla natura di Hummingbird, visto che molte persone si son chieste se questo nuovo algoritmo sia correlato a nuove capacità di analisi semantica da parte di Google.

La risposta dipende molto da cosa può essere definito “approccio semantico” tra i tanti metodi di analisi dei dati che Google opera.

Se usiamo una definizione di “approccio semantico” estremamente larga, per esempio “qualsiasi metodo che parta dai testi per produrne una rappresentazione più astratta”, allora possiamo considerare “approcci semantici” pressocché tutti gli algoritmi di Google adibiti alla valutazione e alla gestione dei testi, Hummingbird compreso. Tuttavia, facendo così, non potremmo considerare il legame tra semantica e Hummingbird più stretto di quello che esiste tra la semantica e qualsiasi altro algoritmo di analisi dei testi usato da Google.

Definizioni di “approccio semantico” più strette, invece, non permetterebbero di considerare Hummingbird un algoritmo focalizzato su un’analisi semantica dei testi. Per esempio, non sappiamo se Hummingbird analizza le parole delle query sfruttando le entità del Knowledge Graph e se la nostra definizione di “approccio semantico” pretendesse lo sfruttamento di un database di conoscenza contenente entità e relazioni tra esse, allora Hummingbird potrebbe anche non rientrare nella definizione.

Per evitare inutili disquisizioni sul sesso degli angeli, diciamo che Hummingbird aiuta sicuramente a comprendere meglio l’oggetto a cui l’utente è interessato e pertanto lo consideriamo un algoritmo in grado di far emergere significato più chiaramente di quanto facessero gli approcci precedenti. Insomma, se lo si vuole definire inerente l’analisi semantica del testo, non diciamo castronerie.

Non tutto è ranking

Nella visione SEO degli algoritmi di Google, dove tutto viene ricondotto al ranking sia per interesse sia per la necessità di semplificare oltre ogni buonsenso una complessa macchina che si nutre di libri di cibernetica e insalate di matematica, è difficile insinuare l’idea che un algoritmo di Google possa anche non avere nulla a che fare col ranking.

E’ difatti diffusa l’espressione “Google ha cambiato l’algoritmo”, come se esistesse davvero un singolo algoritmo o come se ne esistesse uno principale.

E’ certo che Hummingbird abbia un’influenza sul ranking, ovvero con i criteri di selezione e ordinamento dei risultati delle ricerche, ma questo non implica che sia un algoritmo di ranking, ovvero che si occupi di ordinare i risultati tra loro prima che vengano mostrati agli utenti.

Pressoché tutte le attività che Google svolge a monte della fase di ranking (crawling, indicizzazione, canonicalizzazione, ecc.) sono infatti state progettate per acquisire, analizzare e trasformare dati che verranno sfruttati alla fine del processo per dare risposte agli utenti.

L’esempio più semplice da fare è quello dell’attività di crawling, che è necessaria per acquisire i contenuti dei documenti. Se un documento non viene richiesto dallo spider, i suoi contenuti non potranno dare un contributo alla fase di ranking finale. Quindi gli algoritmi usati durante la fase di crawling hanno un’influenza indiretta su quello che al termine dell’intero processo finirà nelle SERP ma non sono algoritmi di ranking, perché la loro sfera di competenza è circoscritta alle attività degli spider, non alle risposte da dare agli utenti.

Bisogna pure tener conto che oltre agli algoritmi esiste anche l’infrastruttura grazie alla quale gli algoritmi funzionano. Per esempio, l’update Caffeine di Google, lanciato nel 2010, non è stato solo un aggiornamento degli algoritmi di indicizzazione ma è stato innanzitutto un cambiamento dell’infrastruttura sulla quale l’indice si appoggiava. Alcuni di questi cambiamenti a volte impongono anche modifiche all’hardware usato, modifiche alla loro organizzazione o modifiche al network attraverso il quale i server sono collegati tra loro.

Oltre alle considerazioni su quanto possono influire sul ranking le fasi precedenti ad esso, va ricordato che la fase stessa di ranking è in realtà suddivisa in sotto-fasi, ognuna delle quali si occupa di attività ben specifiche:

Acquisizione della query
Comprensione della query
Matching (1): estrazione delle risorse dall’archivio
Filtraggio delle risorse
Matching (2): Ordinamento delle risorse

In questa lista mi sono fermato al primo livello gerarchico di questa suddivisione. In realtà si potrebbe andare ancor più in profondità, per esempio discutendo la sotto-fase di comprensione della query e suddividendola ulteriormente in altre attività, come quella della revisione/espansione che la query subisce prima che il motore inizi a farne un matching con le risorse in archivio.

Tutta ‘sta pappardella serve solo a mostrare che non esiste “un” algoritmo di ranking ma, invece, un complesso insieme di algoritmi che contribuiscono al risultato finale in diversi modi. Il punto è: quali di queste attività sono state oggetto delle modifiche a cui Google ha dato il nome “Hummingbird”?

In piena carenza di informazioni, non è nemmeno possibile avanzare ipotesi fondate sulla reale natura di Hummingbird: potrebbe aver richiesto una revisione completa dell’infrastruttura usata dall’indice e dagli algoritmi di ranking di Google oppure potrebbe trattarsi di un miglioramento di una specifica fase o sotto-fase della pipeline. Più avanti fornirò le ipotesi migliori.

In altre parole, non sappiamo quasi nulla su che cosa è e su come funziona. Questo non sarebbe un problema in altri settori, ma diventa un problema quando si è consapevoli di quello che succede tra i SEO quando un’informazione ritenuta importante non è purtroppo disponibile.

Il fenomeno sociale

Non è raro osservare SEO che si sentono spinti ad elucubrare le fantasie più colorite quando sono costretti a reagire all’assenza di informazioni su un argomento giudicato importante. Il fenomeno è particolarmente accentuato tra quei SEO blogger che devono necessariamente produrre articoli in contesti in cui la qualità del prodotto finale non è un parametro preso in grande considerazione.

Lo scenario regala tinte di ignoranza ancor più devastanti quando la necessità di scrivere qualsiasi roba pur di produrre un articolo si estende anche ai “giornalisti” del web, magari associati a testate altisonanti, pratici della parola digitata ma solitamente estranei ai temi sui quali hanno incautamente accettato di erogare caratteri.

Ma se ai giornalisti inesperti può essere ascritta solo la “colpa” di essersi imbarcati in un’impresa solitaria, fuori dalla portata delle proprie conoscenze, a quei SEO che hanno dato vita a confuse vacuità in formato ASCII non può che essere attribuita una responsabilità maggiore del danno prodotto all’informazione online, peraltro circoscritta ad un settore del quale dovrebbero mostrare una piena padronanza e che invece trattano come una discarica di pensieri fallati.

All’annuncio ufficiale di Hummingbird, in condizioni di assoluta assenza di informazioni, si sono sprecati fiumi di inchiostro digitale su interpretazioni personali e ipotesi fondate sul nulla, aumentando la confusione e l’incertezza più di quanto le scarne affermazioni di Google non facessero già. La qualità dei contenuti SEO sul web è mediamente bassa, ma la summa della mediocrità si osserva in tutta la propria vergogna proprio a seguito di questi annunci di update di Google, che vengono seguiti dopo pochi minuti da caterve di articoli che sembrano sapere tutto, anche quando di informazioni non ce ne sono.

Perché mai ad ogni nuovo annuncio importante emerge nel settore SEO questo irrefrenabile impulso a sottoporsi a travagli testuali che conducono solo a parti intestinali di oblunga materia fecale?

Forse una risposta sta nel fenomeno della compravendita di sicurezza psicologica.

Personalmente non ho mai ritenuto che questi discutibili post rappresentino il prodotto che l’autore intende proporre ai propri lettori. In un contesto molto markettaro, a volte intriso di attività di personal branding, il prodotto da promuovere è in realtà l’autore stesso. Il post è solo uno strumento per rinforzare il valore dell’autore agli occhi dei potenziali acquirenti.

Questo, beninteso, vale anche per me in questo momento e per voi nel momento in cui leggerete questa frase.

Tale interpretazione non dovrebbe suscitare più stupore di tanto, perché la SEO ha sempre sguazzato felice in un contesto pesantemente markettaro, la cui fauna è ricca di guri e paguri e la cui flora ha sempre regalato miti e fantasie pendenti dalle generose fronde dell’albero della colla sniffabile.

Ciò che molti lettori desiderano ottenere, magari, non è tanto l’incremento delle proprie conoscenze quanto l’individuazione di una o più figure autorevoli a cui prestare attenzione, in aggiunta a saltuarie conferme di aver scelto per bene tali guide. Insomma, si cerca sicurezza. Non ci si focalizza tanto sul “cosa” quanto sul “chi”, una tendenza che ho sempre considerato deleteria perché l’ho vista sempre andare in coppia con un pericoloso outsourcing delle proprie capacità cognitive.

Secondo questa interpretazione, la correttezza di quanto viene esposto in un articolo perde di rilevanza, non è più una variabile dell’equazione, perché il fenomeno che regola l’attribuzione di qualità dipende più dalla percezione dell’autorevolezza di un soggetto piuttosto che da un effettivo controllo della validità dei contenuti pubblicati.

Del resto, come potrebbe essere altrimenti? Da un lato sono presenti esperti che hanno accuratamente selezionato la propria platea in modo da focalizzarsi su soggetti meno in grado di mettere in discussione le affermazioni di una percepita autorità. Dall’altro i lettori si trovano privi di quelle conoscenze che permetterebbero loro di stimare la correttezza di un’affermazione e quindi decidono di focalizzarsi sulle personalità di rilievo, partendo dal presupposto che è meno probabile che una persona apparentemente autorevole possa sbagliare nelle proprie affermazioni rispetto ad un pinco pallino che nessuno si fila. Non è un ragionamento del tutto fallato, anzi.

Ad essere cinici, bisogna dare atto che il fenomeno è win-win: il guru paguro incrementa la propria esposizione e rafforza la propria immagine di esperto, mentre Pino e Mariuccia leggono l’articolo e vengono tranquillizzati con un cocktail di fregnacce stordenti prima di tornare serenamente ad occuparsi di link bulding su Altervista. La transazione è avvenuta e la validità delle affermazioni espresse nell’articolo è irrilevante.

Anche nel caso di Hummingbird sono state osservate diverse affermazioni assurde. Ve ne riporto alcune.

Che cosa si inventa la gente pur di scrivere roba

Ho letto più di un articolo nel quale si asseriva che Hummingbird fosse correlato alle domande a voce fatte agli smartphone e alla capacità di Google di mantenere il soggetto della ricerca tra sessioni diverse. Questa capacità prescine da Hummingbird ed è stata presente in Google da diverso tempo prima dell’introduzione della nuova tecnologia.

Ma sapete perché questa errata associazione è nata? Semplice: durante lo stesso evento in cui è stato annunciato Hummingbird da Amit Singhal, un’altra persona ha fatto degli esempi di ricerca vocale da mobile (che al momento è l’unica a mantenere il soggetto tra query diverse). E quindi in qualche modo gli autori dei post hanno fatto 1+2=47 ed hanno stabilito che, forse per proprietà transitiva, gli argomenti discussi durante la stessa giornata dovevano essere ovviamente correlati tra loro.

E’ un po’ come guardare un telegiornale e dedurre che ciascuna notizia è strettamente legata alle altre semplicemente perché sono state lette in sequenza all’interno della stessa trasmissione.

La seconda voce che è nata e che persino Wikipedia afferma di Hummingbird, è che la nuova tecnologia avesse a che fare con l’espansione del Knowledge Graph. La ragione per la quale la voce è nata è che all’interno del post ufficiale di Google che celebrava i quindici anni dell’azienda, si elencavano alcune migliorie al Knowledge Graph e alla sua capacità di fornire informazioni agli utenti. Quindi doveva necessariamente a che fare con Hummingbird, secondo criteri di associazione del tutto incomprensibili visto che stavolta l’articolo di Google non accennava ad Hummingbird nemmeno di sbieco!

La terza voce di cui ho letto è contorta e delirante: siccome Hummingbird è stato creato per comprendere meglio il “significato” delle query lunghe, per esempio quelle che pongono domande a Google, qualcuno ha dedotto che Hummingbird fosse un algoritmo di analisi di pagine web e che attribuisse maggiore importanza alle pagine contenenti FAQ e glossari.

La quarta voce la creo io in questo momento asserendo che Hummingbird abbia a che fare con l’incremento di produzione di ‘nduja in Calabria nel 2013. I due eventi sono palesemente correlati perché li ho appena citati all’interno della stessa frase. Non voglio far passare questo paragrafo per una battuta, perché l’associazione che ho fatto è palesemente idiota ma segue esattamente il modello standard con cui altre informazioni SEO vengono create e diffuse sul web, gli esempi che ho citato sopra sono una piccola testimonianza. Questa consapevolezza dovrebbe quantomeno spaventarvi e darvi un’idea di quanto stiamo messi male.

Altri articoli su Hummingbird che ho letto, invece, seguono il modello del minestrone di informazioni. Contengono la parola “Hummingbird” nel titolo ma poi nel testo scrivono di tutt’altro. Panda, Penguin, penalizzazioni, authorship, knowledge graph, nani e ballerine, tutto fa brodo ed è possibile giustificare la presenza della parola “Hummingbird” semplicemente definendolo come un framework dal quale qualsiasi altra attività di Google può trarre beneficio.

Altri articoli sfruttano l’approccio terroristico e associano Hummingbird a disastri e sfaceli proponendo soluzioni per sopravvivere alla morte imminente. Tutto ciò per un update di cui nessuno si è reso conto se non all’annuncio ufficiale, avvenuto dopo mesi di funzionamento.

Altri articoli non possiedono nemmeno le basi dell’ABC di Google e arrivano ad asserire robe tipo “Hummingbird è il successore di Google Caffeine” (il primo è un algoritmo di analisi delle query, il secondo è stato un cambio dell’infrastruttura necessario a velocizzare l’indicizzazione delle risorse web).

In altre parole Hummingbird è tutto e niente e la definizione cambia a seconda di chi è l’autore dell’affermazione, quanta umidità c’è nell’aria ed il terzo estratto sulla ruota di Napoli. Google non ha fornito informazioni in più, quindi non ci resta che fare come tutti: cedere alle lusinghe dell’affermazione facile e tirare a indovinare, magari facendo attenzione a supportare le affermazioni con un po’ di conoscenza del funzionamento del motore.

L’ipotesi più plausibile

Da fonti ufficiali sappiamo che Hummingbird ha l’obiettivo di “comprendere” meglio le query degli utenti. E’ quindi certo che uno dei campi di azione dell’update riguarda la fase di analisi delle query. In particolare è stato affermato dai portavoce di Google che Hummingbird pone maggiore attenzione a ciascuna parola della query, cercando di far emergere le relazioni con le altre parole.

Non c’è modo di sapere se questo tipo di analisi sfrutta le entità del knowledge graph o meno.

Non c’è modo di sapere se l’analisi si fonda su dati aggiuntivi che è stato necessario creare, per esempio se è stato necessario rivalutare il contenuto dei documenti sul web secondo nuovi criteri.

Tuttavia…

Sappiamo che Danny Sullivan ha ricevuto dai portavoce di Google alcuni esempi sul tipo di query che Hummingbird è in grado di comprendere meglio. Questi esempi sono stati pubblicati sulla sua pagina di FAQ su Hummingbird di Search Engine Land. Riporto l’estratto che mi interessa evidenziare:

“What’s the closest place to buy the iPhone 5s to my home?” A traditional search engine might focus on finding matches for words — finding a page that says “buy” and “iPhone 5s,” for example.
Hummingbird should better focus on the meaning behind the words. It may better understand the actual location of your home, if you’ve shared that with Google. It might understand that “place” means you want a brick-and-mortar store.

Adesso comparate il precedente paragrafo con il seguente:

For example, the user may enter the search query “What is the best place to find and eat Chicago deep dish style pizza?” In determining whether the term “restaurant” is a synonym for the query term “place”, a synonym engine may evaluate the query term in the context of adjacent terms, such as “best” or “to,” as well as non-adjacent terms, such as “Chicago” and “pizza.” Such an evaluation may result in the decision that, in the context of the non-adjacent term “pizza,” the term “restaurant” is a synonym of the query term “place.”

Questo secondo paragrafo è un estratto di questo brevetto, dissezionato da Bill Slawski in questo suo articolo nel quale si ipotizza che sia correlato ad Hummingbird.

Per quanto non vi sia la certezza che il brevetto corrisponda a tutte le attività svolte da Hummingbird, non si può negare che l’ambito di applicazione è esattamente lo stesso (interpretazione della query) e che il match tra l’esempio fatto a Danny Sullivan da Google e quello indicato nel brevetto sono del tutto simili, facendo l’esplicito riferimento al modo in cui è possibile estendere la parola “place” e comprendere che va considerata sinonimo di un termine più specifico.

Il brevetto, peraltro, offre un dettaglio ben maggiore proprio su questo esempio dell’espansione del termine “place”, quindi non si tratta di una pura coincidenza ma davvero uno degli obiettivi principali che l’algoritmo discusso nel brevetto si pone.

Non possiamo concludere che Hummingbird si componga esclusivamente dell’algoritmo illustrato nel brevetto, ma è possibile che tale nuova modalità di ricerca di sinonimi rappresenti una sua parte principale.

Imparare a dire “Non lo so”, imparare ad accettare un “Non si sa”

Questo micro-paragrafo lo lascio volutamente corto perché il suo senso sta già nell’intestazione. Nessuno è onniscente e la SEO è spesso costellata di informazioni mancanti: non dovremmo mai vergognarci di dare visibilità ai limiti della nostra conoscenza perché le decisioni vanno prese anche tenuto conto di quanto non sappiamo, altrimenti c’è il rischio di spendere tempo e denaro in attività legate a supposizioni prive di fondamento.

Conclusioni

Hummingbird ha palesemente l’obiettivo di fornire agli utenti documenti correlati a quanto l’utente ha cercato prescindendo dalla presenza nei documenti delle parole della query. Può essere considerato un modo di espandere la query, aggiungendo termini più specifici laddove l’utente avesse usato solo termini più generici o più ambigui. L’ambiguità viene risolta osservando il contesto e le altre parole della query e associando le parole più ambigue con parole più specifiche.

Non si può escludere che ci sia molto di più “sotto il cofano” e che per raggiungere questo obiettivo Google non sia stato costretto a mettere mani all’indicizzazione o ad altre fasi critiche della pipeline.

Per il momento ci portiamo a casa la consapevolezza che invece di tutte le boiate che si leggono in giro (comprese le eventuali mie) rimane alta la probabilità che si possa trattare davvero di quello che Google ha sempre affermato, cioè di un “semplice” modo per togliere ambiguità alle query.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

Come funziona Google: il ranking – Il corso SEO

LowLevel — Fri, 25 Jul 2014 07:57:45 +0000

Aggiornamento IMPORTANTE: questo è un vecchio post che promuoveva il corso e che contiene informazioni ormai obsolete. Dovreste leggere la pagina dedicata al corso sul mio nuovo sito di lavoro.

Quello che segue è il post vecchio, che tengo pubblicato solo per ragioni storiche.

Questo post è una marketta. Chi vuole, cambi canale. I curiosi, proseguano.

L’anno scorso ho aperto le iscrizioni al primo corso SEO interamente pianificato e organizzato da me. Il corso si intitola “Come funziona Google (sul serio)” ed ha riscosso un bel po’ di interesse e di gradimento tra chi ha partecipato.

Adesso vi annuncio la seconda tappa di “Come funziona Google”, dedicata interamente agli algoritmi e ai segnali di ranking.

Come funziona Google (sul serio) – il ranking

La prima tappa di “Come funziona Google” era dedicata al funzionamento del motore di ricerca durante le fasi di crawling, archiviazione e indicizzazione. La conoscenza di questi funzionamenti è utile per prendere decisioni SEO sensate e per sfatare miti e convinzioni errate che sono molto diffusi nel settore.

Questa seconda tappa di “Come funziona Google” riprende il discorso da dove la prima tappa si era fermata e fornisce una panoramica ampia e dettagliata su come Google seleziona ed ordina i risultati di ricerca, toccando numerosi temi che contribuiscono a determinare il contenuto delle pagine dei risultati.

Destinatari del corso

Il target del corso sul ranking è rappresentato principalmente da consulenti di search marketing o dipendenti di agenzie che offrono servizi di consulenza SEO ai propri clienti e che desiderano approfondire i criteri di ranking di Google, sia desktop che mobile, per evitare decisioni tecniche errate o non ottimali.

In particolare, la panoramica fornita dal corso risulta utile a chiunque voglia dotarsi di forti basi sui criteri che regolano il ranking Google per sfruttarlo durante la definizione di strategie SEO per sé o per i propri clienti.

I temi trattati possono essere inoltre utili ai colleghi che si occupano, da consulenti o in azienda, di formazione SEO e di attività di ricerca e sviluppo legate ai motori di ricerca.

E’ mio interesse selezionare gli iscritti e aiutare gli interessati ad evitare un investimento poco accorto: il corso è un full-immersion di diverse ore nei meandri tecnici di Google. Se siete intimoriti da questa prospettiva e dalla scaletta degli argomenti trattati (riportata più sotto) il mio suggerimento è quello di non partecipare. Se siete incerti su quanti benefici pratici trarrete dalla conoscenza del funzionamento interno di Google, vi suggerisco di non partecipare.

Gli acquirenti del corso devono necessariamente essere proprietari di partita IVA.

I cinque obiettivi del corso

Ottenere basi teoriche solide sul funzionamento di Google

Il funzionamento dei motori di ricerca è basato su discipline e tecnologie di pubblico dominio che raramente vengono studiate dai SEO. Diverse informazioni sul funzionamento di Google vengono divulgate pubblicamente dagli ingegneri di Mountain View oppure possono essere acquisite partendo da informazioni pubbliche e procedendo per deduzioni. Aver ottenuto informazioni sul reale funzionamento di Google mi ha fornito una visione estremamente chiara di molti aspetti ed ha rappresentato per me una “marcia in più” che ha fatto comodo in più di un’occasione. Ritengo che aprire questa conoscenza ad altre persone possa chiarire le idee anche a loro.

Imparare la corretta terminologia da usare in ambito motori/SEO

In assenza di una formazione “accademica” il settore SEO è piagato da un uso ambiguo e approssimativo di tante parole ed espressioni. Il danno consiste nel non poter comunicare bene con altri colleghi, clienti o comprendere correttamente quelle informazioni che a volte vengono divulgate dai responsabili stessi di Google. Parole come “indicizzazione” e “ranking” vengono usate a volte come sinonimi, come se non facesse molta differenza. Il corso dimostrerà che la differenza è invece gigantesca e che parlare tutti una lingua 1) comune e 2) corretta rappresenta una caratteristica essenziale in qualsiasi professione, per capire meglio quello che si legge e comunicare correttamente con altre persone.

Scardinare un po’ quella “black box” che è Google

La complessità di Google è alta e non è possibile risalire esattamente al funzionamento del motore di ricerca in tutte le sue fasi, sopratutto per quanto riguarda il ranking. Tuttavia è possibile avvicinarsi a quando avviene all’interno della gigante scatola nera mettendo assieme nozioni di information retrieval, comunicati di Google Research, guide ufficiali di Google per i propri quality rater, documenti tecnici e il risultato di test SEO.

Distinguere le opinioni di qualità dalle congetture stupide

Non è un segreto che il settore SEO sia colmo di congetture e teorie su quanto Google fa, come lo fa e perché lo fa. Bisogna innanzitutto essere consapevoli che la qualità delle informazioni SEO acquisite leggendo il web è fortemente influenzata da opinioni cospirazionistiche e visioni personali che non hanno fondamenta scientifiche solide. Con le conoscenze corrette, è più facile individuare subito le teorie strampalate e le opinioni basate più sull’ignoranza che sulla cultura. A volte persino Google stesso sbaglia a dare direttive e la capacità di accorgersi dei loro errori non deriva da scienza infusa ma dal possedere basi teoriche che possono essere trasmesse a chi seguirà il corso.

Sfruttare la teoria per prendere decisioni SEO corrette

Molte linee guida SEO impartite da Google hanno alle spalle chiare motivazioni tecniche. Può succedere che i SEO siano indotti a seguire le linee guida di Google senza chiedersi troppo il perché della loro esistenza. L’obiettivo più importante del corso è proprio quello di mostrare come una maggiore conoscenza teorica può aiutare a fare scelte più consapevoli e intelligenti, per esempio quando fare strappi alle regole o quando una soluzione tecnica è preferibile ad un’altra. Quando è necessario dedurre/prevedere, si può ragionare meglio possedendo una conoscenza solida di come funziona un motore di ricerca.

Temi principali del corso

Il taglio del corso è molto tecnico, verranno introdotti gli obiettivi di Google nei confronti della propria utenza e come tali obiettivi hanno indotto il motore di ricerca a definire la propria metodologia di ranking.

Una prima sezione del corso è dedicata ad illustrare il contributo al ranking portato dai “Quality rater“, il personale che Google usa per valutare la qualità dei propri risultati di ricerca. Comprendere in che modo Google definisce il concetto di qualità fornisce un indispensabile chiarimento sugli obiettivi SEO di qualsiasi sito web o progetto.

Buona parte del corso è dedicata ad approfondire le classi di segnali di ranking che determinano la visibilità delle risorse nei risultati e particolare attenzione verrà data a quelle classi di segnali di ranking, importantissimi per Google, che solitamente vengono ignorate dai SEO.

Una sezione speciale del corso sarà dedicata anche al ranking su dispositivi mobile, che in alcuni casi costituiscono una buona percentuale degli accessi dei siti di alcuni settori. Verrà inoltre spiegata la differenza dei risultati di ricerca che emerge quando si comparano le ricerche effettuate digitando la query con quelle fornite a voce.

Dettaglio degli argomenti

Introduzione

Che cosa si intende per "ranking"
Complessità (nuvola dei concetti)

Obiettivi

Dare risposte
Conversare
Anticipare

Contesti

Dispositivi diversi
Input diversi

Queryless

Basi di Information Retrieval

Che cosa è
Che discipline comprende
Modelli di IR
Valutazione dei risultati

Il modello vettoriale

Trasformazione delle risorse
Trasformazione delle query
Matching

La pipeline

Indicizzazione delle risorse
Acquisizione della query
Comprensione della query
Estrazione delle risorse
Filtraggio delle risorse
Canonicalizzazione delle risorse
Ranking delle risorse

Indicizzazione delle risorse

Relazione tra indicizzazione e ranking
"Things, not strings"
Spazio delle parole
Spazio dei concetti
Freebase, Wikipedia e Knowledge Graph

Acquisizione della query

Testo
Immagini
Voce

Comprensione della query

Voce

NLP e reti neurali
Trasformazione della query

Testo

Da frase ad n-grammi
Espansione della query
Trattamento testuale
Trattamento semantico (Hummingbird)
Sfruttamento del contesto
Output finale

Immagini

Estrazione di caratteristiche
Reti neurali

Estrazione delle risorse

Scelta degli indici
Matching query-risorse (1)
Pre-ranking

Filtraggio delle risorse

SafeSearch
Filtri anti-spam

Canonicalizzazione delle risorse

Risorse canoniche
URL canonici

Ranking delle risorse

Un esempio pratico
Senza query e con query
Una semplice moltiplicazione

Segnali di ranking

Matching query-risorse (2)
Contesto
Sorgenti di dati

Testi
Link
Query
Reazioni degli utenti

Ranking mobile

Criterio di fondo
Differenze tra ranking desktop e ranking mobile
Esempi pratici

Il corso: Durata

Il corso dura un giorno, dalle ore 9:30 alle ore 18:00 con un’ora per la pausa pranzo ed un paio di pause caffè.

Il corso: Approccio didattico

Il corso sarà limitato ad un massimo di quattro persone, questo limite garantirà a tutti gli iscritti un’interazione col docente e permetterà di avere più tempo per domande, risposte e approfondimenti.

Il limite di quattro iscritti implica che svolgerò diverse edizioni del corso, per accontentare tutte le persone interessate.

Durante il corso verranno proiettate delle slide per meglio focalizzare l’attenzione sui temi discussi e per non perdere il filo del discorso.

Agli iscritti verrà fornito del materiale per prendere appunti. Non è necessario essere dotati di PC.

Lo stile del corso sarà informale; immaginatevi seduti ad un tavolo per le riunioni, discutendo ed ascoltando quanto ho da spiegarvi.

Il corso: Dove e Quando

La sede del corso è Milano città, presso il mio ufficio, facilmente raggiungibile attraverso la metropolitana. L’indirizzo verrà comunicato ai corsisti in fase di iscrizione.

Fare diverse edizioni del corso mi permette di concordare con ciascun iscritto la data del suo corso. L’iscritto dovrà fornire una serie di date di propria preferenza ed il sottoscritto comunicherà all’iscritto il giorno esatto.

Il corso: Costo

Il costo di una singola iscrizione è di euro 500 + IVA (per la precisione: imponibile di euro 500 + IVA 22% – ritenuta d’acconto 20%). Un piccolo sconto del 10% potrà essere concesso in caso di acquisto di due o più iscrizioni da parte della stessa azienda.

Il pranzo è compreso nel prezzo e si farà in trattoria. Se siete intolleranti alla cotoletta alla milanese, avvertitemi prima.

Il corso: Come iscriversi

Ci si iscrive al corso pagando anticipatamente il costo attraverso bonifico bancario. Ecco di seguito come fare:

Inviate una email all’indirizzo info@lowlevel.it
- introducetevi brevemente dicendo chi siete e fornendo qualche informazione sulla vostra azienda
- dichiarate che volete iscrivervi al corso dedicato al ranking
- indicate quante persone sarete al corso
- indicate tre o quattro date (o un arco di tempo) in cui vi verrebbe comodo fare il corso
- specificate la vostra P.IVA e gli altri dati fiscali a cui intestare la fattura (no P.IVA no party)
Vi verrà comunicato che cifra versare attraverso bonifico bancario e le coordinate bancarie (IBAN) per il versamento.
Effettuato il versamento, dovrete inviarmi via mail una ricevuta del bonifico comprensiva di codice CRO. Io emetterò subito fattura e comunicandovi la data del vostro corso e le indicazioni logistiche per partecipare.

Il corso: Domande che mi hanno fatto

Puoi venire in azienda da noi ad erogare il corso?

E’ possibile, purché si riesca a fare tutto (compreso l’eventuale viaggio da Milano) in un solo giorno. Il costo varia. Per richiedere un preventivo, inviate una email all’indirizzo indicato in questa pagina.

Puoi erogare il corso a distanza (Skype, Hangout, ecc.) ?

Questo corso è nato per una fruizione in aula e ho deciso che erogarlo a distanza diminuirebbe la qualità dell’esperienza degli iscritti. Quindi la risposta è “no”. Tuttavia sto pensando di modificarlo un po’ affinché possa essere erogato a distanza senza perdere in qualità. Se siete interessati ad una fruizione a distanza, inviate una email all’indirizzo indicato in questa pagina.

Puoi erogare il corso nei weekend?

Preferirei di no, ma se proprio è l’unico modo perché possiate partecipare, possiamo accordarci se inviate una mail all’indirizzo indicato in questa pagina.

Non ho forti basi tecniche, sarò in grado di seguire il corso?

Sì. Il corso serve anche a dare quelle basi. Inoltre state certi che il mio modo di spiegare le cose permette di affrontare temi complessi con parole ed esempi incredibilmente semplici. Il corso è stato proposto a persone provenienti da studi molto diversi tra loro e nessuno ha mai avuto problemi a seguire le spiegazioni. Al massimo certi argomenti sono poco compatibili con il tipico abbiocco del dopo pranzo, ma quello lo si risolve con un caffé lungo o evitando a monte di ordinare una carbonara.

Per capire bene le nozioni di questa seconda parte di “Come funziona Google”, devo prima seguire la prima parte?

No, non è necessario. Gli argomenti trattati nella seconda parte sono la continuazione di quelli spiegati nella prima. Suggerisco di seguire entrambe le “puntate” solo a chi ha l’obiettivo di ottenere una visione ampia, completa e aggiornata di quello che fa oggi il motore di ricerca, dal crawling, all’indicizzazione, alla canonicalizzazione delle risorse, al ranking.

Il corso: Come chiedere maggiori informazioni

Se avete letto con attenzione tutto l’intero post e avete bisogno di informazioni non incluse in questa pagina, potete inviare una email all’indirizzo info@lowlevel.it

Trarre lezioni SEO dal gigantesco bug di Google Plus

LowLevel — Wed, 12 Mar 2014 08:51:50 +0000

Siccome non uso questo blog per affrontare temi che ritengo meno interessanti, non ho scritto un articolo sul gigantesco bug di Google+ scoperto due settimane fa, quello che permette di attribuire ad una pagina di Google+ una quantità di +1 sostanzialmente arbitraria, “copiandoli” da quelli di una qualsiasi altra pagina.

Se questo bug fosse emerso su Facebook, tutti i blog markettari internazionali avrebbero probabilmente evidenziato l’incredibile falla ed i vari servizi di “vendita di like” avrebbero stappato bottiglie di Dom Pérignon. Ma siccome Google+ se lo filano in quattro gatti ed i suoi utenti attivi si calcolano sulle dita di una mano di un monco (sì, è un’iperbole) la faccenda è passata relativamente inosservata.

Se non avete idea del bug del quale sto parlando, vi segnalo un articolo riassuntivo su Engeene ed un approfondimento tecnico su Ideativi. Ne consiglio la lettura per prendere familiarità col tema di cui sto per scrivere.

L’articolo che state leggendo, tuttavia, non è dedicato al bug in sé quanto a che cosa è possibile imparare sul funzionamento di Google ragionando un po’ sulla falla che è stata trovata e sul perché essa esiste.

Sarà anche un modo per approfondire un po’ parte del processo di canonicalizzazione delle risorse.

Buona lettura!

Cenni storici sull’hijacking

Per molti anni è stato possibile sfruttare i meccanismi interni di Google per effettuare almeno due forme di “hijacking”: PageRank hijacking e hijacking della posizione di una risorsa nelle SERP.

Il PageRank hijacking è una tecnica dedicata alla famigerata barretta verde della toolbar di Google e consiste nel riuscire a mostrare per una risorsa web un valore di PageRank che in realtà appartiene ad un’altra risorsa. Per esempio, la home page del sito del vostro ferramenta di fiducia, potrebbe mostrare un valore di PageRank corrispondente a quello assegnato alla home page di Repubblica.it

Va precisato che il fenomeno è esclusivamente estetico: una risorsa non acquisisce realmente il valore di PageRank di un’altra risorsa, rendendo la tattica assolutamente ininfluente per la visibilità sui risultati di ricerca.

Per tanto tempo, tuttavia, questa pratica è stata usata da alcuni domainers e rivenditori di siti per vendere nomi di dominio a prezzi più alti, facendo credere ad acquirenti sprovveduti che la home page del dominio venduto possedesse valori di PageRank alti o comunque non nulli.

Non seguo più il contesto dei domainers da un po’ di tempo, ma se volete farvi una cultura in merito, basta cercare [fake pagerank] per prendere visione dell’ecosistema che è nato attorno a questa tecnica di hijacking.

Una seconda tecnica di hijacking, più critica, si era invece resa disponibile in passato a causa di un bug di Google. In alcuni casi era possibile, attraverso un semplice redirect che puntava ad una risorsa web da “colpire”, prendere il posto di quella risorsa nei risultati di ricerca di Google, a prescindere dalla query cercata dall’utente.

Vale la pena di precisare che la sostituzione era totale: non si trattava di risorse-fotocopia che superavano di posizione i siti ufficiali, ma proprio di una completa scomparsa della risorsa ufficiale e della sua sostituzione con quella farlocca.

A differenza del PageRank hijacking, questa seconda forma di hijacking produceva ovviamente conseguenze molto concrete, disastrose per le vittime che scomparivano dalle SERP e benefiche per i proprietari dei siti che riuscivano a sostituirsi in tutto e per tutto in posizioni precedentemente occupate da altri siti.

Questa seconda tecnica non è più attuabile, perché Google ha modificato da molti anni i propri algoritmi per evitare questi gravi incidenti di sostituzione delle risorse nelle SERP, tuttavia è importante sottolineare che tutte e due le tecniche di hijacking avevano una cosa in comune: sfruttavano delle falle (concettuali o di implementazione) del sistema di canonicalizzazione delle risorse.

Quel gran casino della canonicalizzazione

Inizio subito col dire che la canonicalizzazione delle risorse, ovvero la comprensione di cosa sia una copia e che cosa sia un originale, rappresenta un obiettivo molto complesso per un motore di ricerca, reso difficile anche dalla quantità smisurata di duplicati che esistono sul web.

Molti CMS sembrano siano stati progettati senza il minimo scrupolo nei confronti della quantità di URL raggiungibili attraverso i link interni al sito. La conseguenza è che basta un qualsiasi sistema di “faceted navigation” per generare in modo incontrollato quantità smisurate di URL raggiungibili dagli spider dei motori.

A proposito, questo post sul blog di Google è un po’ incasinato ma comunque molto utile per affrontare i potenziali problemi derivanti dall’uso di faceted navigation. Magari dategli una letta, se non l’avete ancora fatto.

Per un po’ di tempo è girata voce tra i SEO che Google fosse in grado di gestire autonomamente i problemi di duplicazione dei siti web e che non vi fosse necessità per i webmaster di occuparsi del problema. Questa generalizzazione è purtroppo errata ed un buon modo per creare danni. Se è vero che Google non ha grandi problemi a gestire le risorse duplicate dei siti piccoli e medi, un discorso del tutto diverso va fatto per i siti molto grandi, complessi e popolari, sui quali i crawler di Google sono più famelici e assidui. Queste problematiche, oltre ad essere state osservate, sono state anche successivamente confermate da John Mueller.

Di fronte ad una notevole complessità di URL e a duplicazioni indiscriminate di grandi quantità di risorse, una percezione corretta dell’organizzazione degli URL di un sito diventa difficile persino ad un essere umano. Un motore di ricerca si può confondere ancora di più.

Per ottenere una visione più chiara e semplificata delle risorse che compongono un sito, ogni motore di ricerca necessita di sviluppare un sistema per la loro canonicalizzazione. Quello di Google è particolarmente complesso, per ragioni che non avrei modo di riassumere in poche righe, ed è proprio questa complessità che nel corso degli anni ha lasciato aperte alcune falle che sono state sfruttate da SEO e webmaster per trarre benefici immeritati.

Queste falle a volte sono dipese da errori di programmazione, altre volte sono invece di tipo concettuale, ovvero imputabili al meccanismo di base di un qualsiasi sistema di canonicalizzazione delle risorse, che funziona definendo per ogni risorsa primaria un elenco di URL alternativi, che potremmo considerare degli “alias” o “pseudonimi”.

Due tipi di canonicalizzazione

Io divido la canonicalizzazione in due tipi diversi, quella “esplicita” e “quella implicita”.

La canonicalizzazione esplicita avviene quando Google riceva dai gestori di un sito dei segnali espliciti che aiutano il motore a determinare che alcuni URL sono solo degli alias di un URL canonico. L’esempio più semplice di questi segnali espliciti sono le redirezioni e il rel=”canonical”.

A volte per la canonicalizzazione esplicita uso l’aggettivo “assistita”, perché sono i webmaster ad aiutare Google a capire quali URL sono quelli canonici.

La canonicalizzazione implicita è invece ciò a cui Google deve ripiegare quando non gli vengono forniti espliciti segnali da parte dei gestori dei siti web.

La canonicalizzazione implicita

Un esempio molto semplice di canonicalizzazione implicita esiste da molti anni e consiste nel tentare di individuare URL non canonici della home page di un sito web, limitatamente a quei casi in cui la richiesta di un alias non produce una redirezione ma eroga una copia dei contenuti della home page.

Per esempio, l’URL http://www.sito.com/ può essere considerato da Google canonico ed il motore di ricerca può individuare vari suoi alias, come:

http://www.sito.com/index.html
http://sito.com/
https://www.sito.com/

Ognuna di queste associazioni non viene fatta di default, ma viene confermata da un’analisi dei contenuti che i server erogano quando gli URL secondari vengono richiesti dallo spider del motore.

Se i contenuti delle risorse restituite alla richiesta degli URL secondari combaciano con i contenuti dell’URL canonico, allora Google opera un “clustering” e inizia a considerare gli URL secondari dei semplici alias di quello canonico.

Al contrario, se i contenuti degli URL secondari non combaciano con quelli erogati chiedendo l’URL canonico, allora l’associazione non avviene e l’URL secondario viene considerato una risorsa a sé stante.

Un problema che Google incontra nel canonicalizzare le risorse autonomamente, senza segnali espliciti da parte dei webmaster, è che può essere difficile determinare quale dei vari URL di un gruppo va considerato quello canonico. Un grande aiuto a prendere questa decisione arriva dal PageRank e dai link che Google osserva sul web. In linea di massima, l’URL che viene linkato di più e che possiede il PageRank più alto diventa quello canonico e tutti gli altri diventano i suoi alias.

Questo sistema di canonicalizzazione di Google non è prono agli hack, perché è limitato agli URL interni di uno specifico sito e il peggior effetto negativo che può avvenire è che Google si sbagli ad individuare nel gruppo degli URL quello che il webmaster desidera essere quello canonico.

Gli errori sono diminuiti ancor di più da quanto su Google Webmaster Tools esiste l’opzione per dichiarare esplicitamente quale versione di un nome di dominio va considerata canonica.

La canonicalizzazione esplicita

A complicare l’intero processo di canonicalizzazione intervengono segnali espliciti da parte dei webmaster, che in teoria dovrebbero aiutare il motore a comprendere più facilmente quali URL sono quelli canonici ma che nella pratica aggiungono anche un livello di complessità maggiore al sistema. Ecco i principali:

Link tra risorse
Relazione di tipo “canonical”
GWT: gestione dei parametri degli URL
GWT: indicazione del nome di dominio canonico
Redirezioni tra risorse

In teoria potri aggiungere anche la relazione di tipo “alternate“, che tuttavia non sarebbe proprio corretto considerare un segnale di canonizzazione anche se, per esempio, contribuisce al meccanismo di canonicalizzazione tra risorse desktop e risorse mobile.

I primi quattro di questi segnali esulano dal tema di questo articolo e mi focalizzerò quindi solo sull’ultimo segnale della lista: le redirezioni.

Le redirezioni lato server sono un segnale di canonicalizzazione esplicito estremamente chiaro e netto: una redirezione dichiara che l’URL richiesto è (temporaneamente o definitivamente) da considerare secondario e che un secondo URL va considerato quello principale, ovvero l’URL al quale l’utente viene rediretto dal browser.

Il segnale è molto forte in quanto l’URL che fa redirezione non corrisponde più, di fatto, ad una risorsa con un contenuto. Pertanto l’unico contenuto esistente è ospitato all’URL di destinazione ed i motori di ricerca preferiscono considerare canonico l’unico URL che ospita i contenuti.

Per diversi anni Google si è comportato diversamente tra redirezioni lato server di tipo 302 (temporanee) e redirezioni di tipo 301 (definitive o permanenti che dir si voglia). Nel corso del tempo, tuttavia, le cose son cambiate parecchio e adesso le redirezioni temporanee vengono sostanzialmente equiparate da Google a quelle permanenti nel momento in cui il motore di rende conto che sono state erroneamente usate dal webmaster quelle temporanee.

Ai fini della canonicalizzazione, oggi una redirezione 301 o 302 produce gli stessi effetti, anche se quelle 302 possono in alcuni casi richiedere un po’ più di tempo affinché Google comprenda che possono essere equiparate a quelle permanenti.

Da dove vien fuori il bug di Google+?

Quando una redirezione viene implementata e acquisita correttamente da Google, il motore determina che l’URL che fa redirezione è un alias dell’URL di destinazione della definizione.

Un alias non è altro che uno pseudonimo dell’URL canonico e quindi se si chiede a Google di fornire una caratteristica di un alias, Google risponderà con la corrispondente caratteristica dell’URL canonico. Per esempio, chiedendo il valore di PageRank di un alias, Google fornirà in realtà il valore di PageRank della risorsa canonica.

Il valore di PageRank è solo una delle informazioni sugli URL che è possibile chiedere a Google. Da quando è nato Google+, ciascun URL conosciuto dal motore di ricerca si è arricchito di un’informazione in più: la quantità di “+1” attribuiti dagli utenti all’URL.

Ovviamente, come avviene per il PageRank, chiedendo la quantità di +1 di un alias, Google risponderà con la quantità di +1 dell’URL canonico a cui l’alias è stato associato. Spero che iniziate a capire dove sta la magagna.

Quando si crea una pagina Google+ è possibile associare ad essa l’URL del sito web a cui la pagina fa riferimento. Non appena questa associazione viene fatta, i +1 accumulati dalla pagina Google+ non sono altro che i +1 accumulati dall’URL del sito a cui la pagina è stata associata.

Di conseguenza, fare +1 della pagina Google+ o fare +1 dell’URL del sito associato alla pagina è esattamente la stessa cosa perché il “contatore di +1” è lo stesso.

Il bug di Google+ nasce perché è possibile associare ad una pagina un URL che fa redirezione verso un’altra risorsa.

La redirezione induce il sistema di canonicalizzazione di Google a decidere che l’URL che fa redirezione non è altro che un alias di quello di destinazione e da quando la canonicalizzazione viene fatta, chiedere la quantità di +1 dell’URL del sito associato alla pagina Google+ equivale a chiedere la quantità di +1 dell’URL di destinazione della redirezione.

E’ dunque sufficiente che l’URL della homepage del mio sito faccia una redirezione verso http://www.google.com/ e da quel momento una richiesta della quantità dei suoi +1 corrisponderà ad una richiesta della quantità di +1 attribuiti all’URL http://www.google.com/

Ovviamente, all’atto pratico, l’hacker ha anche l’obiettivo di evitare che la redirezione scatti quando gli utenti visitano il sito, ma se avete letto i due articoli di approfondimento che ho citato all’inizio di questo post, avrete già scoperto quanto sia facile risolvere questo problema.

Lezione 0: le redirezioni sono una manna per la canonicalizzazione

Numerata come “lezione zero” perché sicuramente già conosciuta e palese ai lettori di questo blog, va comunque ricordato quanto forte sia il segnale di una redirezione e quanto è utile questo strumento quando si ha l’obiettivo di gestire contenuti duplicati ed evitare la dispersione di qualsiasi roba Google oggi trasmetta attraverso i link.

Lezione 1: c’è un problema e Google lo sa

Ad una valutazione superficiale, potrebbe sembrare che questo hack faccia leva su un aspetto sconosciuto dell’infrastruttura di Google+ o che la sua esistenza dipenda solo da qualche microscopica falla che gli sviluppatori di Google non avevano notato. Non è così.

Persino nelle linee guida ufficiali di Google+, si chiede espressamente di non associare alle pagine Google+ un URL che faccia redirezione verso altri. Adesso sappiamo il perché: da un lato esiste un sistema di canonicalizzazione che si accontenta di una redirezione per equiparare due URL e dall’altro esiste un Google+ che non effettua controlli su quali URL vengono associati alle pagine business.

Lezione 2: aggiustare le cose non è facile

Qualora Google volesse rimuovere il bug, è molto improbabile che mette mani all’ultra-incasinato sistema di canonicalizzazione usato dal motore di ricerca, perché sarebbe come cercare di uccidere una mosca con un bazooka. Inoltre il sistema di canonicalizzazione sta alla base di tantissimi processi delicati del motore di ricerca e del ranking: mettersi a giocare con esso per eliminare un semplice bug su Google+ sarebbe una follia.

E’ più probabile che la falla verrà coperta lavorando lato Google+, che è un sistema più semplice da gestire e da modificare, nonché meno critico per l’azienda californiana.

Lezione 3: le falle concettuali non muoiono mai

La possibilità di fare oggi hijacking di +1 sfruttando esattamente gli stessi meccanismi che in passato si usavano per fare hijacking di PageRank o di posizioni nelle SERP ci insegna che i tempi cambiano ma la pupù emana sempre lo stesso olezzo.

Il sistema di canonicalizzazione e il fatto stesso che alcuni URL possano essere considerati equivalenti ad altri sarà sempre un lato debole dell’infrastruttura tecnologica di Google, perché non esistono modi completamente diversi per gestire la canonicalizzazione delle risorse: l’obiettivo rimarrà sempre quello di associare risorse secondarie a risorse primarie e per far questo bisogna implementare un sistema di clustering degli URL ed abbracciare il concetto di “alias” affinché le informazioni raccolte sugli alias vengano poi attribuite all’URL canonico.

Coloro che hanno abbracciato il lato oscuro della SEO sono consapevoli quante nuove opportunità nasceranno da una falla ultradecennale.

Lezione 4: l’importanza di Google+

Consideratelo un semplice teorema: “La popolarità di un social network è inversamente proporzionale alla quantità di tempo impiegata per rimuovere un bug grosso come un palazzo.”. Più tempo passa e più significa che gli sviluppatori di Google+ sono consapevoli che non esiste una massa critica che sfrutterebbe il bug per scopi malevoli.

Lezione 5: il reverse engineering insegna tante cose

Il fenomeno di hijacking dei +1 è stato scoperto per puro caso ma il suo studio e la sua analisi hanno permesso di apprendere nuovi dettagli sul funzionamento del motore…

…e di farsi venire nuove idee per il futuro.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

Come funziona Google: guarda (gratis) il corso SEO in diretta video

LowLevel — Thu, 28 Nov 2013 08:24:44 +0000

A volte mi vengono idee demenziali, ma penso che la demenzialità vada rivalutata, specie quando viene applicata consapevolmente.

Siccome sono sempre stato affascinato dai quei ristoranti con vista sulla cucina che permettono di osservare i cuochi trafficare con le pietanze, mi son chiesto se potevo fare qualcosa di simile per il corso “Come funzione Google (sul serio)”, che sto tenendo in questi giorni e che tanto è piaciuto agli iscritti. Mi è venuta un’idea…

Corso SEO con vista cucina

Ecco l’idea: lunedì 2 dicembre terrò il corso ad alcune persone e l’intera giornata di formazione sarà liberamente osservabile su Google+ e YouTube in diretta. Potete considerarlo un piccolo regalo alla comunità SEO per festeggiare il buon successo del corso, ma siccome non sono ancora del tutto scemo, voglio evidenziare che ho scritto “osservabile” ma non “ascoltabile”, perché non diffonderò l’audio.

La telecamera riprenderà la proiezione della presentazione PowerPoint e parte dell’ambiente circostante. Potrete osservare dalle slide il tema discusso e beccare persino qualche sparuta linea guida SEO, ma a meno che non sappiate leggere il labiale non vi sarà possibile acquisire il grosso delle informazioni, che è giusto riservare agli iscritti che hanno pagato i dindini.

Insomma, a caval donato non si guarda in bocca e in questo caso il cavallo è muto. Però cammina.

Una nota importante sul corso: se non sapete di che cosa si tratta, sappiate che è un corso molto tecnico. E’ pieno di spiegazioni dettagliate sul funzionamento di Google, in particolare vengono spiegate le fasi di crawling, di indicizzazione e di canonicalizzazione. Potete leggere il programma completo sulla pagina in cui promuovo corso.

Non ho idea di come andrà questo esperimento ma qui sotto trovate tutte le informazioni per assistere alla diretta.

Se vi va, informate altre persone di questo appuntamento e fatemi capire con “like” e +1 se l’idea vi piace.

Quando è 'sta roba?

Lunedì 2 dicembre 2013 dalle ore 9:30 alle ore 18:00. Faremo pausa pranzo dalle ore 13 alle ore 14, circa, e ci saranno un paio di pause caffé a metà mattina e metà pomeriggio.

C’è modo di avere un promemoria?

Ho creato la pagina dell’evento su Google+. La puoi usare per segnalare la tua partecipazione (non è obbligatorio ma mi farà piacere) e se lo fai dovresti ricevere un promemoria su Google Calendar e Google+.

Come posso guardare la diretta?

Puoi accedere alla diretta video da due pagine diverse, a tua scelta.

Pubblicherò un post con la diretta video sulla mia pagina di Google+.

Il video apparirà contemporaneamente anche sulla mia pagina YouTube.

Quindi poco prima delle ore 9:30 di lunedì 2 dicembre controlla un po’ una delle due pagine.

Ho bisogno di permessi/accessi particolari per vedere la diretta?

No. Sarà pubblica e visibile a tutti.

Ho bisogno di software particolari per vedere la diretta?

No. Basta un browser. Ma se userai qualche smartphone anteguerra, il suo browser potrebbe non farcela.

Rimarrà una registrazione video della giornata?

No. Sarà solo trasmessa in diretta.

Garantisci che la diretta avverrà senza problemi?

No. Se la mia connessione schioppa o se a Google viene il singhiozzo proprio quel giorno, amen.

Verrò rimborsato per il calo di produttività che avrò guardando la diretta?

No.

Senza audio non ho capito bene una cosa, posso romperti le scatole per un chiarimento?

No.

C’è modo di ricevere l’audio? Sono disposto a pagare.

No.

Sono disposto a pagare e a fornire una cugina figa.

Parliamone.

La distanza gastronomica

LowLevel — Sun, 24 Nov 2013 20:44:43 +0000

Photo by Ehud Kenan – www.flickr.com/photos/ehud/

A Milano, nel mio quartiere, ha aperto da poco quello che si definisce “Luogo di incontro con cucina”, perché chiamarlo “ristorante” evidentemente je faceva schifo.

Ma se ti scrivo solo questo, tu non capisci, perché bisogna prima introdurre il contesto. Il contesto è quello di “zona Tortona”, l’area attorno a via Tortona che è piena di uffici di aziende di moda, modelle aliene che vanno a farsi i book fotografici, la sede della Endemol e tante società del settore del design e dell’arte.

E insomma il contesto è ultrafighetto e invece del ristorante c’è il luogo di incontro con cucina ed io me lo immagino che ci vanno le coppie alternative, quelle che al bambino gli fanno studiare il sanscrito perché l’inglese è troppo barbone.

Dico “immagino” perché io in questo luogo di incontro con cucina non ci sono mai entrato. Ci passo continuamente davanti quando vado a fare la spesa all’Esselunga, quindi voi immaginatemi camminare sul marciapiede con i sacchetti gialli della spesa mentre fiancheggio il luogo di incontro con cucina, magari chiedendo scusa e permesso ai clienti che sostano lì davanti.

Il contrasto culturale stordisce. E’ gente che veste bene, deve avere qualche risparmio sul conto corrente, gente che non va al ristorante, va al luogo di incontro con cucina, perché glielo impone lo status sociale. Io nel sacchetto ho la mortazza a blocchi, quella ancora da tagliare, perché le logiche di risparmio familiare a volte inducono ad approvviggionarsi all’ingrosso. E allora paragono la mortazza con quello che mangeranno questi signori.

Fuori c’è la lavagna coi nomi delle pietanze, di quelli che non si intuiscono gli ingredienti o che propongono accoppiamenti improbabili. Per la gente alternativa immagino che ci vogliano cibi alternativi. Alternativi a cosa? Ma è ovvio, alla mortazza.

E allora, in un raptus populista, mi immagino fermarmi lì davanti, aprire il sacchetto giallo ed estrarne la mortazza con gesto slanciato e nobile. La voglio porgere alle famiglie indigene come simbolo di fratellanza, a voler ristabilire i ponti con dei cugini distanti ma accomunati da un DNA pur sempre umano. Toh, ragazzino antistante il luogo di incontro con cucina, prendi! Ti regalo la mortazza! Lui non la prende, però sorride e mi dice qualcosa.

Solo che io il sanscrito non lo so.

Come organizzare un documento di analisi SEO [Infografica]

LowLevel — Thu, 21 Nov 2013 09:06:12 +0000

In fondo a questo articolo trovate un’infografica. Lo scrivo in cima per non rischiare che ve la perdiate e perché mi dicono che le infografiche piacciono molto, a prescindere da quanto siano utili o fatte bene. Per testare di persona il fenomeno, ho prodotto un’infografica inutile e fatta male.

Nel corso degli anni mi è capitato di modificare pian piano l’organizzazione dei documenti di analisi SEO che ho realizzato.

Partendo da un modello molto lineare, che coincideva con un elenco di criticità SEO riscontrate su un sito e con linee guida SEO per risolverli, ho iniziato a considerare un documento di analisi tecnica non tanto l’output di un’attività più o meno scimmiescamente eseguita quanto un ulteriore strumento di comunicazione nei confronti del cliente, strumento che può essere sfruttato per far percepire l’utilità delle analisi svolte e la competenza di chi le ha svolte.

Senza snaturare gli obiettivi tecnici di questi documenti, a mio parere è possibile organizzarli in modo da inserirli in una più ampia visione di marketing e consulenziale.

In questo articolo vi propongo una possibile traccia da seguire; attingete ad essa e modificatela in piena libertà, a seconda delle vostre specifiche esigenze.

Il tipo di documento

E’ necessario che io spieghi subito di quale tipo di documento sto per fornire una traccia.

Il documento di analisi tecnica a cui mi riferisco può essere considerato il corrispondente SEO di un referto medico. Non è un documento che elenca dati e informazioni SEO estratti da strumenti o servizi online ma è il risultato di un’analisi che è stata fatta per far emergere eventuali criticità SEO di un sito web o di un network di siti web.

E’ un tipo di documento che è molto diverso da un report contenente numeri: non fornisce indici di keyword density (sigh!) o di domain authority, non serve ad indicare quanti backlink il sito possiede né quanti gatti vanno scuoiati sull’altare per salire di posizione su Google. E’ invece un documento che mostra problemi e propone soluzioni, scendendo spesso anche nei dettagli tecnici.

Il destinatario principale di questo tipo di documento è un responsabile tecnico del cliente, che dovrà prendere in esame i suggerimenti in esso contenuti e valutarne la fattibilità ed i costi. Una parte del documento è però dedicata ad un responsabile di marketing o comunque ad una figura di alto livello che avrà il compito di decidere quali suggerimenti accogliere, anche in funzione dei loro costi di implementazione.

Questa tipologia di documenti di analisi è solitamente piuttosto discorsiva. Esistono molte alternative ai documenti strutturati in questo modo, per esempio a volte può essere opportuno sfruttare una presentazione PowerPoint, più essenziale in contenuti e forma, qualora non vi sia necessità di scendere nei dettagli. Questo mio post è tuttavia dedicato a quelle analisi lunghe e dettagliate per le quali è più consigliato produrre un documento di testo.

Prerequisiti indispensabili

Le analisi SEO volte ad evidenziare problemi di un sito web non possono essere svolte senza che il consulente possieda informazioni chiave sull’azienda proprietaria del sito o senza che il consulente possieda gli accessi alle piattaforme di analytics usate dal cliente.

L’espressione “piattaforme di analytics” include Google Webmaster Tools o eventuali altri servizi usati dal cliente per monitorare e valutare il sito dal punto di vista tecnico o dal punto di vista dell’usabilità. Informazioni provenienti da software quali Pingdom o ClickTale sono dunque benvenute perché forniscono al SEO un quadro più ampio e dettagliato della situazione.

E’ infine necessario possedere una visione degli obiettivi di business dell’azienda proprietaria del sito, perché alcune indicazioni tecniche fornite dal consulente non possono che dipendere dalle finalità che l’azienda si è posta.

Per esempio, se l’azienda ha obiettivi di vendita all’estero, è importante che le informazioni relative a tali obiettivi vengano fornite al consulente in modo che possa decidere se suggerire una strategia di (search) marketing fondata su un singolo sito/dominio o su siti/domini diversi per mercati diversi.

In assenza di informazioni sugli obiettivi di business o di marketing dell’azienda, un’analisi SEO può venire fuori zoppa o banale o limitata ai meri aspetti informatici.

Nel fornire un documento di analisi SEO, il consulente si pone obiettivi di tipo consulenziale, di comunicazione e persino commerciali.

Obiettivi consulenziali

Proporre soluzioni

Il primo obiettivo è quello di fornire soluzioni ai problemi SEO (e più generalmente di search marketing) emersi a seguito dell’analisi. Il documento conterrà dunque delle linee guida che, applicate dal cliente, potranno correggere quei problemi che frenano la visibilità del sito web sui risultati di ricerca dei motori.

Suggerire miglioramenti

Al di là dei problemi riscontrati, il consulente può anche indicare opportunità che, se colte, potrebbero migliorare ulteriormente le condizioni del sito web, la sua visibilità online, il suo grado di usabilità o il suo conversion rate.

Nello svolgere un’analisi SEO, infatti, è facile che vengano notate caratteristiche del sito o assenza di caratteristiche del sito da trasformare in ulteriori suggerimenti migliorativi da comunicare al cliente.

Mettere il cliente in condizione di poter decidere

La decisione finale di quali attività SEO verranno svolte sul sito web spetta comunque al cliente, che è l’unico a poter valutare i costi da sostenere per implementare ciascuna delle attività suggerite dal consulente e che è dunque l’unico a poter stabilire, budget alla mano, quali attività è possibile concretizzare e quali no.

L’obiettivo del consulente è quello di fornire indicazioni sulla gravità di ciascuno dei problemi SEO riscontrati in modo che il cliente possa essere messo in condizione di calcolare un rapporto benefici/costi.

Obiettivi di comunicazione

Usare un linguaggio comprensibile al target

Nel documento va utilizzato un linguaggio di facile comprensione da parte del target del documento stesso. Solitamente i documenti SEO tecnici hanno come destinatario principale un responsabile tecnologico del cliente che ha dimestichezza con i termini informatici tipici dello sviluppo web e della parte sistemistica.

Siccome una breve sezione del documento è dedicata invece al responsabile di marketing o comunque al decisore che dovrà stabilire quali attività svolgere in base agli obiettivi aziendali, è necessario che in tali contesti il linguaggio cambi, mettendo da parte le indicazioni più tecniche per focalizzarsi sugli obiettivi di search marketing e la strategia suggerita per raggiungerli.

La consulenza non coincide col documento

Una visione che cerco di far passare da anni è che non c’è una convenienza per un consulente a far percepire al cliente che la consulenza coincide col documento erogato. Un documento di analisi va considerato un supporto alla funzione consulenziale del SEO, non il principale risultato della consulenza stessa.

Questa visione è particolarmente ostica a chi ha deciso di approcciare la SEO in modo molto industriale ed è invece di adozione più facile da chi si pone l’obiettivo di valorizzare la funzione consulenziale delle persone che fanno SEO.

Nessuno dei due approcci è intrinsecamente migliore dell’altro, dipende tutto dagli obiettivi del singolo SEO o dell’agenzia di search marketing. Nel caso in cui voi vi poniate l’obiettivo di valorizzare gli aspetti consulenziali, ho due suggerimenti per voi:

Non limitatevi a fornire linee guida tecniche ma fate percepire nel documento stesso che esse vanno incastonate in una strategia di search marketing chiara, da definire congiuntamente tra cliente e consulente;
Non limitatevi a consegnare il documento di analisi lasciando che sia il cliente a valutarlo autonomamente ma proponete al cliente di sentirvi/vedervi affinché voi possiate presentare e discutere il documento stesso e i ragionamenti che stanno dietro ai suggerimenti che avete dato.

Far percepire il lavoro che c’è dietro

Non tutte le analisi svolte faranno emergere problemi e quindi l’elenco di criticità che inserirete nel documento darà una visibilità parziale di quali valutazioni SEO avrete fatto.

E’ importante che il cliente abbia invece visione di tutto il lavoro che è stato svolto, pertanto il documento dovrà contenere da qualche parte un elenco completo delle attività che il SEO ha portato avanti.

Obiettivi commerciali

Durante un’analisi SEO a volte emergono caratteristiche del sito che possono indurre il consulente a suggerire ulteriori analisi di approfondimento (esempio: un’analisi di usabilità dei risultati del motore di ricerca interno ad un e-commerce, con la finalità di migliorarne la fruizione e il contributo di quello step al CR).

Il documento di analisi può dunque includere brevi suggerimenti su nuove attività da svolgere, non previste in fase di definizione del servizio venduto ma pensate dal consulente sulla base di quanto ha osservato sul sito durante lo svolgimento dell’analisi stessa.

Mappa dei contenuti

A fianco ed in cima a questo articolo ho incluso una mappa mentale in cui i contenuti del documento di analisi SEO sono stati organizzati. Di seguito, invece, spiegherò nel dettaglio che contenuti vengono ospitati da ciascuna tipologia di pagina di cui il documento si compone.

Copertina

La copertina indica il titolo dell’analisi, specifica il nome del sito su cui è stata svolta (se il sito era singolo) ed il nome dell’azienda cliente. Un semplice “Analisi SEO tecnica per NomeSito.it” ed un sottotitolo del tipo “NomeConsulente per NomeCliente” sarà più che sufficiente.

Suggerisco inoltre di inserire in copertina la data di erogazione del documento, in modo che risulti subito evidente in futuro di quale esatto momento storico l’analisi aveva scattato una fotografia.

Indice degli argomenti

Accertatevi che le voci dell’indice siano cliccabili una volta che avrete prodotto il documento nel suo formato finale.

Introduzione

La prima pagina di reale contenuto del documento ospita delle informazioni essenziali sugli obiettivi del documento stesso e le sue principali caratteristiche.

Bisognerà dunque spiegare chi ha prodotto il documento, per quale azienda e dedicandolo a quale sito web, con che obiettivi e che i risultati dell’analisi si basano su quanto è stato osservato ad una data ben precisa, che va indicata.

Verrà quindi spiegato che il documento contiene un elenco di linee guida da seguire per affrontare le criticità che sono emerse in fase di analisi e che la serie completa di analisi svolte viene fornita nella sezione finale del documento stesso.

E’ importante, nell’introduzione, indicare esplicitamente anche i limiti dell’analisi stessa. Bisogna far capire che essa ha scattato una fotografia di un particolare momento e, se il consulente non aveva ricevuto accesso a informazioni inizialmente richieste, il perimetro dell’analisi è stato limitato dall’assenza di tali informazioni. Se le linee guida SEO fornite sono dedicate a rendere il sito appetibile ad uno specifico motore di ricerca, va indicato il nome del motore. Se le analisi dei contenuti testuali sono state limitate ad una specifica lingua/nazionalità, questo va esplicitato.

Di seguito, l’introduzione spiega come leggere le pagine dedicate alle criticità. Il modello che uso io divide ciascuna criticità in tre sezioni (“contesto”, “problema”, “soluzione”) e fornisce per ciascuna di esse un indice di gravità. In questa fase si introduce quindi al lettore il modo in cui le pagine delle criticità sono state strutturate ed il modo in cui avrete deciso di indicare gli indici di gravità.

La parte finale dell’introduzione ospita invece un breve glossario dei termini più tecnici. La terminologia usata dai SEO varia purtroppo da consulente a consulente ed è quindi importante mettersi d’accordo su che cosa il consulente intende per “indicizzare” oppure con orrende espressioni ambigue quali “bloccare lo spider”. Evidenzio ancora che il glossario deve essere breve; non un vocabolario ma poche righe per accordarsi su pochi termini tecnici chiave.

Nel complesso, l’introduzione non dovrebbe richiedere più di due pagine, col glossario che solitamente richiede al massimo mezza pagina.

Executive summary

A differenza del resto del documento di analisi, che è dedicato ad una figura tecnica che dovrà valutare le implementazioni suggerite dal consulente, l’executive summary consiste in una singola pagina dedicata al responsabile marketing.

L’obiettivo di questa pagina è quello di indicare, con linguaggio non tecnico e andando dritti al punto, quali sono le tre o quattro criticità più gravi riscontrate sul sito analizzato. Andranno dunque selezionate quelle criticità che, una volta risolte, contribuiranno maggiormente a migliorare la visibilità del sito e la sua fruizione da parte degli utenti provenienti dai servizi di ricerca.

Io uso solitamente un semplicissimo grafico a torta, composto da soli tre fette o al massimo quattro, ciascuna rappresentante una macro-criticità (es: Testi non unici, Mancata aderenza al protocollo HTTP, Lentezza del sito, Organizzazione dei contenuti confusa, Bassa web popularity, ecc.) e la cui ampiezza indica quanto quella criticità sta contribuendo a rendere il sito search engine unfriendly.

L’executive summary è anche la pagina nella quale possono essere suggeriti alcuni possibili obiettivi di search marketing sulla base delle potenzialità SEO del sito che sono state percepite dal consulente. Questi suggerimenti hanno maggiore importanza se l’azienda cliente non si è mai soffermata a definire obiettivi di search marketing a monte.

Laddove il consulente non possieda sufficienti informazioni (anche sul business dell’azienda cliente) per suggerire obiettivi nuovi o più convenienti da perseguire, nell’executive summary si potrà semplicemente indicare che, sulla base di quanto il consulente ha notato, sono emerse alcune idee e considerazioni sugli obiettivi da porsi che potranno essere approfondite e valutate solo discutendone col cliente stesso.

L’executive summary è dunque la pagina attraverso la quale si fa percepire che il documento di analisi SEO ha la funzione di scattare una fotografia che dovrà servire per prendere decisioni sugli obiettivi e la strategia finale da perseguire. Per alcune criticità strettamente tecniche il documento potrà fornire subito soluzioni, per criticità di livello più alto (es: come progettare e strutturare i contenuti in base ai mercati sui quali l’azienda vorrà proporsi) sarà necessario prendere decisioni assieme al cliente.

Riassunto delle criticità

La parte successiva del documento ospita un elenco di tutte le criticità emerse e, per ciascuna di esse, un indice di gravità che verrà riportato anche sulla pagina dedicata a ciascuna delle criticità.

E’ una sezione che fa da ponte tra l’alto livello dell’executive summary e il livello più dettagliato delle pagine delle criticità. Se la figura a cui è dedicato l’executive summary vorrà dare un’occhiata anche agli aspetti tecnici (come mi è capitato di osservare nella stragrande maggioranza dei casi) potrà beneficiare di questa pagina per avere una visione di insieme dei problemi.

L’elenco delle criticità può essere ordinato per indice di gravità, mostrando in cima quelle più serie. Nel formato finale del documento, ciascuna voce potrà essere un link alla pagina della relativa criticità.

Pagina delle criticità

Per ciascuna criticità riscontrata dal consulente, verrà creata una pagina o un’insieme di pagine dedicate ad essa.

Un signore chiamato Luca Panarella, che ringrazierò sempre, mi ha insegnato anni fa a suddividere ciascuna criticità in tre sotto-sezioni: contesto, problema e soluzione. Se volete, potete introdurre ciascuna sotto-sezione con un’icona apposita, in modo che in fase di consultazione/scanning del documento sia facile individuare le sotto-sezioni dedicate alle soluzioni, solitamente quelle che vengono poi consultate più spesso dalle figure tecniche che si occuperanno di effettuare le implementazioni.

A fianco del titolo attribuito alla criticità, io espongo un numero di quadratini rossi che aumenta con l’aumentare della serietà del problema. Solitamente uso da uno a tre quadratini, sforando raramente in quattro quando la criticità indica che le cose sono davvero state fatte a cazzo di cane. Però non scrivo “cazzo di cane” nel documento.

Contesto

La sotto-sezione “contesto” introduce l’argomento SEO che è oggetto della criticità e che spiega perché una specifica caratteristica può rendere la vita più difficile ai motori di ricerca. Per esempio, se la criticità ha a che fare con i contenuti duplicati, la zona “contesto” servirà a spiegare brevemente perché i contenuti duplicati possono costituire un problema SEO. Se la criticità è legata al linking interno confusionario, verrà qui spiegato che i link vengono usati dai motori per stabilire quali pagine del sito sono più importanti di altre.

La sotto-sezione “contesto” serve dunque ad indottrinare un minimo il lettore e a fargli capire perché quanto segue rappresenta un problema.

Problema

In questa sotto-sezione viene dichiarato qual è il problema riscontrato nel sito, in quali casi si manifesta, se è localizzato in sezioni specifiche o se è un problema pervasivo.

Se la criticità riguarda una caratteristica del sito che è percepibile visualmente, è in questa sezione che può essere incluso uno screenshot che mostra il punto o la sezione di una pagina in cui la caratteristica si manifesta.

Se il problema è emerso solo effettuando analisi specifiche (es: crawling del sito, uso di servizi per valutare la velocità delle pagine, ecc.) consiglio in questo contesto di fornire un singolo e breve esempio del problema (es: un URL linkato che restituisce un codice di status HTTP di classe 5XX, l’URL di alcuni file javascript che rallentano il rendering delle pagine, ecc.) e rimandare il lettore a documenti di dettaglio che conterranno l’elenco completo di quanto è stato riscontrato. Per esempio, se in questa sezione viene dichiarato che diverse immagini del sito sono troppo pesanti in termini di byte da scaricare, potrà essere fatto uno specifico esempio e rimandare il lettore ad un elenco completo delle immagini da ottimizzare, che può essere fornito nella sezione “Allegati” del documento di analisi stesso oppure in un file a parte.

Se la criticità è emersa usando tool specifici, è possibile includere uno screenshot del tool che mostra la criticità individuata. Questa inclusione avrà anche l’obiettivo di far percepire al lettore il lavoro che sta dietro l’individuazione di una criticità.

La sotto-sezione “problema” ha dunque il compito di mostrare qual è il problema, specificando quando si manifesta e come si manifesta.

Soluzione

Una volta mostrato il problema, in questa sotto-sezione viene innanzitutto indicato qual è l’obiettivo da raggiungere al fine di eliminare la criticità.

L’obiettivo va indicato nel modo più semplice e diretto possibile, per esempio: “Ciascuna pagina di categoria deve avere un tag TITLE ospitante un testo diverso”.

Una volta dichiarato l’obiettivo da raggiungere, si passa a fornire indicazioni su come può essere risolto. Se una criticità può essere affrontata in diversi modi, è bene specificare le varie opzioni e, per ciascuna di esse, indicare quanto è ottimale rispetto alle altre. Soluzioni diverse hanno a volte costi diversi ed è bene dunque fornire alcune alternative in modo da consentire al cliente di stimare il costo di ciascuna possibile implementazione.

Ci sono criticità la cui soluzione non può essere fornita subito o comunque non nel dettaglio. Per esempio, un problema di duplicazione derivante da un uso “leggero” di parametri negli URL va approfondito col cliente per stabilire assieme come gestire ciascuno dei parametri degli URL. In casi come questi, va detto al cliente che è necessario investire del tempo assieme per prendere decisioni a cui si può arrivare solo col contributo di chi ha sviluppato il sito web.

Questa sezione può ospitare anche un dettaglio di alcune linee guida SEO. Per esempio, se i testi degli attributi ALT delle immagini non vengono usati correttamente, sarà necessario fornire delle linee guida per la scrittura dei testi da inserire in detti attributi.

Se la soluzione proposta prevede di seguire un protocollo o uno standard esistente, è suggerito fornire direttamente il link ad una pagina web dedicata allo standard o al protocollo che dovrà essere rispettato, possibilmente una pagina che scenda nei dettagli di implementazione.

Box integrativi: approfondimenti

All’interno delle pagine dedicate alle criticità è anche possibile inserire dei box di approfondimento del tema discusso, se reputato opportuno e senza esagerare con la loro quantità.

In particolare, se il tipo di relazione tra consulente e cliente include l’obiettivo di rendere il cliente più consapevole degli aspetti SEO della propria attività, questi box possono essere usati nella sotto-sezione “contesto” per fornire dettagli sul perché una certa caratteristica può causare problemi, per esempio linkando una pagina web di approfondimento (una news, una pagina di Google per i webmaster, ecc.).

Box integrativi: opportunità

Uno dei box che è possibile aggiungere alla sotto-sezione “soluzione” ospita suggerimenti che, sulla base di quanto osservato, consentirebbero di cogliere nuove opportunità.

Questi box possono essere usati per consigliare il cliente ad approfondire uno specifico aspetto attraverso lo svolgimento di analisi aggiuntive. Una pagina stracolma di link fino al punto di costituire un eccesso per gli spider del motori, può indurre il consulente a suggerire una sfoltitura dei link anche (e sopratutto) sulla base di un’analisi di usabilità della pagina o del sito in genere.

I box delle opportunità non vanno trasformati in banner pubblicitari per ulteriori servizi da vendere e devono sempre essere correlati alla criticità a cui vengono affiancati.

Il loro obiettivo è quello di far notare elementi del sito che non vengono sfruttati a dovere, contenuti di qualità non valorizzati all’esterno, assenza di sezioni del sito che potrebbero attrarre target interessanti se venissero sviluppate, contenuti creati dagli utenti che potrebbero essere sfruttati meglio. Il fatto che cogliere queste opportunità richiederebbe nuovo lavoro (peraltro non necessariamente svolto dallo stesso consulente) va fatto percepire come una conseguenza ovvia, non come un becero tentativo di upselling.

Lista delle analisi svolte

Questa è la sezione del documento che ospita un elenco completo di tutte le analisi svolte. L’obiettivo è quello di far capire al lettore che le criticità che non sono emerse non derivano da una incompletezza delle analisi fatte ma dal fatto che in quegli ambiti non è stata riscontrata alcuna criticità.

Invece di un elenco, è possibile usare una mappa mentale in cui ciascuna analisi viene incastonata in una macro-categoria (es: Testi, Meta-informazioni, Web popularity, Velocità, Usabilità, Aderenza ai protocolli, Spam, ecc.).

Strumenti utilizzati

Io consiglio sempre di dare evidenza degli strumenti e servizi che sono stati usati dal consulente per svolgere le analisi. L’obiettivo di questa sezione è far percepire la ricchezza ed il grado di approfondimento delle analisi, esplicitare il fatto che il consulente conosce ed usa i migliori strumenti disponibili e rendere il cliente un po’ più informato sulle metodologie di analisi che i SEO applicano.

Ho conosciuto persone che tremano di paura ad ogni azione che potrebbe rendere il cliente più edotto o autonomo. Personalmente, rendere alcuni clienti più autonomi è qualcosa che ritengo possa rientrare nei servizi di consulenza venduti, ma questa è solo la mia opinione.

Allegati

In questa sezione possono prendere posto tutti quei dati sul sito che, accennati nelle pagine dedicate alle criticità, non era opportuno specificare direttamente in quel contesto per motivi di impaginazione e di organizzazione dei contenuti.

Nello specifico, gli allegati possono contenere elenchi di dati (URL, backlink, file da ottimizzare) acquisiti attraverso i tool ed i servizi sfruttati durante l’analisi. Ricordate sempre che a volte ha poco senso fornire tali elenchi in un documento testuale, specie se si tratta di liste molto lunghe. In questi casi è più opportuno fornire i dati in documenti separati e indicare il nome di questi documenti nella sezione “allegati”.

L’infografica: come organizzare un documento di analisi SEO

Vi avevo promesso che sarebbe stata inutile e fatta male e sono certo di aver raggiunto il mio obiettivo. Se volete, stampatela come promemoria o ragionateci su per decidere quante e quali caratteristiche del documento che vi ho descritto possono andare bene anche per voi.

Conclusione

Arrivederci.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.