Commenti

Pubblicato da LowLevel in Just SEO

il 18 October 2011

Continuare a smontare Google: un’altra scoperta SEO

Questo post segue l’esempio di un articolo scritto un po’ di tempo fa assieme ai colleghi di SearchBrain: “Come ti smonto Google: una piccola scoperta SEO“, che vi suggerisco di leggere se non l’avete già fatto.

Chiave inglese su Google L’articolo esponeva una piccola ricerca che Giacomo Pelagatti ed io avevamo svolto e che aveva rivelato una caratteristica di Google nell’archiviare i testi dei link testuali.

Smanettando con le ricerche, ho individuato una nuova caratteristica del motore di ricerca e questo post ha l’obiettivo di presentare i risultati e di illustrare il processo logico seguito per arrivarci.

Il sottoscritto non riuscirà a garantire la precisione di esposizione che Giacomo aveva infuso all’articolo sopra citato e farò del mio meglio per esporre i risultati di questa nuova ricerca nella maniera più chiara possibile.

Introduzione ad un quesito SEO mai risolto

Per anni i SEO si sono chiesti quale fosse la quantità massima di caratteri di un tag TITLE indicizzata da Google, considerando la risposta utile per chi fa copywriting.

E’ un’informazione così essenziale? Non tanto. All’atto pratico, ha più senso decidere quanto testo scrivere in un titolo basandosi su considerazioni sull’usabilità (es: la quantità di testo visualizzata nelle SERP e nelle condivisioni sui social network) invece che sui limiti di archiviazione dei motori.

Tuttavia quando i SEO si incaponiscono su una cosa non c’è modo di distrarli: il web è pieno di articoli su test volti a cercare una risposta esatta al quesito. I risultati non tornavano mai ed una regola generale non è mai stata trovata.

Qual è la scoperta SEO?

Una regola generale non è stata mai trovata perché c’è un errore di fondo nella domanda: è stato dato sempre per assunto che l’unità di misura/indicizzazione di un testo fossero i caratteri, mentre la risposta esatta alla domanda è che Google indicizza al massimo le prime dodici parole di un tag TITLE.

C’è di più: nel processo che ho seguito per quantificare le parole indicizzate, le query svolte hanno fatto emergere alcuni comportamenti di Google finora sconosciuti e la cui diffusione potrà essere utile a SEO, copywriter e anche a progettisti di CMS che dovessero prendere decisioni sui titoli delle pagine web.

Tutti i test SEO che finora si sono sforzati di trovare una lunghezza massima in caratteri sono purtroppo fallati nelle premesse e fuorviati nelle conclusioni.

Il perché della ricerca

Le informazioni che ho ottenuto svolgendo la ricerca sono un esempio concreto dei benefici che si possono avere nel percorrere una strada anche quando il traguardo da raggiungere è apparentemente poco interessante.

Alla fine di un percorso si può scoprire che le cose imparate camminando sono di più o più interessanti/utili di quelle imparate arrivando a destinazione.

Che la lunghezza dei titoli fosse misurata in parole e non caratteri era intuibile, sopratutto dopo l’esperienza maturata durante il precedente test svolto con Giacomo Pelagatti, tuttavia il motivo che mi ha spinto a voler quantificare con precisione tale lunghezza è che sono consapevole che “smontando il giocattolo” vengono sempre fuori cose interessanti e inaspettate.

E infatti, come mostrerò, son venute fuori anche questa volta.

Più in generale, fare reverse engineering dovrebbe essere un’attività tipica dei SEO che vogliono comprendere meglio il funzionamento base dei motori di ricerca: oltre ad essere un eccellente esercizio di logica ed un allenamento per il proprio cervello, cercare di capire i criteri seguiti da un motore di ricerca costringe anche a ripassare tante nozioni SEO di base, per esempio quelle legate al funzionamento degli operatori di ricerca o degli spider o dei processi di indicizzazione.

A queste motivazioni generali, se ne aggiunge una circostanziale: alcuni giorni fa ho letto un articolo di SEOmoz che contribuiva a diffondere informazioni SEO errate proprio sulla lunghezza dei tag TITLE.

Oltre a commentare il loro articolo fornendo qualche indicazione sul perché dell’errore, ho pensato di cogliere l’occasione per fare qui su LowLevel.it un po’ di didattica, lanciando un quiz sull’argomento e scrivendo il presente post per chiarire nei dettagli come vengono gestiti i tag TITLE da Google.

Reverse engineering: ferri del mestiere

Per capire la strada che ho percorso per scoprire il limite che Google si impone sulla lunghezza dei titoli, è importante conoscere alcuni concetti base sul funzionamento di un motore di ricerca. Se siete SEO, dovreste già conoscerli:

Google non cerca realmente ciò che l’utente digita. Ogni query digitata può essere oggetto di modifiche prima di passare alla fase di ricerca negli archivi. Queste modifiche avvengono internamente e sono trasparenti all’utente, che vede solo la query digitata.
Ci sono operatori di ricerca che dicono a Google di limitare la ricerca a specifici elementi delle risorse. Per esempio, l’operatore “intext” limita la ricerca ai contenuti testuali della pagina e l’operatore “intitle” limita la ricerca ai contenuti del titolo delle risorse (nelle risorse HTML corrisponde al tag TITLE). Quando non si usa alcun operatore del tipo “inX”, Google restituisce risorse che “hanno a che fare” col testo digitato, a prescindere che lo contengano o meno.
L’operatore per cercare una frase esatta, ovvero le virgolette (“), non sempre induce Google a cercare esattamente il testo virgolettato. A seconda della frase scritta tra virgolette, Google può decidere di cercare piccole varianti del testo virgolettato.
Per forzare Google a cercare esattamente una parola, evitando sue espansioni o interpretazioni, si usa l’operatore “+” davanti alla parola stessa.

Tutti i testi delle ricerche che mostrerò nei prossimi paragrafi sono stati attentamente selezionati per essere certi che Google cercasse esattamente ciò che digitavo.

Reverse engineering: il metodo di base

Il metodo che ho seguito consiste nel cercare frasi abbastanza lunghe su Google, che per certo esistono nei titoli di alcune pagine web, usando l’operatore “intitle” per limitare la ricerca ai soli titoli di pagina.

Se Google ha archiviato una pagina che possiede un titolo molto lungo e se una ricerca dell’intero testo del titolo non restituisce tale pagina, ciò può solo significare che Google non ne ha indicizzato l’intero titolo.

A seguito di ricerche multiple di lunghezze diverse della stessa frase è possibile capire se un limite esiste e quale esso è.

Per tutti gli esempi che seguiranno ho dunque fatto ricerche con le seguenti caratteristiche:

Cercano frasi abbastanza lunghe, che ho accertato esistere come titoli di alcune pagine web archiviate da Google;
Fanno uso dell’operatore di ricerca esatta, ovvero delle virgolette;
Fanno uso dell’operatore “intitle”, che restringe la ricerca ai soli titoli delle risorse;
Sarebbe corretto che facessero anche uso dell’operatore “+” davanti a ciascuna parola della frase, tuttavia per obiettivi di leggibilità delle query che seguono io ho scelto le frasi da cercare in maniera che la presenza o assenza dell’operatore “+” fosse ininfluente sui risultati restituiti da Google.

Reverse engineering: l’esistenza di un limite

Proviamo innanzitutto a cercare pagine che contengono nel testo del proprio titolo i primi dodici numeri in lingua inglese:

[intitle:”one two three four five six seven eight nine ten eleven twelve”]

La ricerca restituisce diverse pagine che nel titolo hanno un testo che inizia con la frase cercata, come potete vedere nello screenshot che allego.

Adesso attenzione: diverse pagine restituite nella ricerca hanno titoli che non si fermano a “twelve” ma che continuano elencando i numeri inglesi successivi: thirteen, fourteen, ecc. Potete voi stessi visitare alcune delle pagine restituite e rendervi conto di persona della lunghezza reale delle frasi presenti nei titoli.

Logica vorrebbe che se Google non si imponesse alcun limite all’indicizzazione dei testi dei titoli, cercando fino a tredici dovrebbero venire restituiti ancora dei risultati:

[intitle:”one two three four five six seven eight nine ten eleven twelve thirteen”]

E invece non vien fuori alcunché, come mostrato dallo screenshot che segue. Non perché Google non possieda in archivio pagine con il titolo più lungo ma perché il motore si è imposto un limite.

A questo punto della ricerca siamo arrivati a concludere che esiste un limite alla quantità di testo dei tag TITLE che Google decide di indicizzare ma non abbiamo ancora determinato con precisione qual è il limite.

Reverse engineering: i caratteri non c’entrano

Accettiamo per un attimo la congettura che Google sia una gigantesca macchina da scrivere invece di un software che fa uso di indici e che la sua naturale unità di misura per i testi siano i caratteri.

Abbiamo appurato che Google arriva ad indicizzare la quantità di testo “one two three four five six seven eight nine ten eleven twelve”, pari a 62 caratteri. Non arriva invece ad indicizzare la quantità di testo “one two three four five six seven eight nine ten eleven twelve thirteen”, di 71 caratteri.

Se il limite di Google fosse misurato in caratteri, potremmo teorizzare che esso debba stare da qualche parte tra i 63 ed i 71 caratteri di testo, perché siamo certi che fino a 62 ci arriva e che a 71 già non je la fa.

Per dichiarare incorretta la suddetta teoria sarebbe sufficiente trovare un titolo di lunghezza superiore a 71 caratteri indicizzato da Google, no?

Beh, di titoli superiori a 71 caratteri e indicizzati da Google ce ne sono una quantità smodata, ma io ho voluto esagerare e mi sono messo a cercare una pagina archiviata da Google e che possedesse un titolo particolarmente lungo in caratteri.

La chilometrica query [intitle:”Pneumonoultramicroscopicsilicovolcanoconiosis Lung Disease : Causes, Symptoms, Diagnosis, Treatment, Cures and Remedies for Pneumonoultramicroscopicsilicovolcanoconiosis”] contiene una frase lunga la bellezza di 169 caratteri e restituisce una pagina. Segue screenshot.

Qualcosa non quadra con la nostra illuminata e modernissima teoria: eravamo convinti che ci fosse un limite in caratteri e che dovesse stare tra i 63 ed i 71 caratteri. Come si spiega l’indicizzazione di ben 169 caratteri?

Vale la pena osservare un po’ meglio la query appena proposta. Se contate quante parole ci sono nella frase, noterete che sono dodici. La pagina restituita, tuttavia, ha un titolo che va anche oltre le dodici parole. Che succede se proviamo a cercare quel titolo fino alla sua tredicesima parola?

[intitle:”Pneumonoultramicroscopicsilicovolcanoconiosis Lung Disease : Causes, Symptoms, Diagnosis, Treatment, Cures and Remedies for Pneumonoultramicroscopicsilicovolcanoconiosis / Pneumoconiosis”]

Google non restituisce più la pagina incriminata.

Qualcosa dunque non torna: la teoria che avevamo e che si basava su un limite misurato in caratteri è stata facilmente smontata con una semplice ricerca.

Reverse engineering: la regola finale

A questo punto i casi sono due: o Google è talmente scemo da definire limiti in caratteri che cambiano pagina per pagina secondo criteri complessi, oppure tutto sto carosello sui caratteri è fallato alla base e stiamo cercando di misurare quanti metri dura una giornata.

Quello che possiamo osservare è che sia nel primo esempio sia nel secondo, Google è arrivato a indicizzare le prime dodici parole dei titoli, ma non si è spinto fino alla tredicesima. Può significare qualcosa?

Taglio corto. Facendo molte altre ricerche simili noterete che il criterio è sempre lo stesso: Google indicizza al massimo le prime dodici parole di un tag TITLE. La lunghezza in caratteri non c’è mai entrata un fico secco.

Questa conclusione spiega anche perché i conti finora non tornavano mai a tutti i SEO che si sono cimentati in passato a calcolare una lunghezza massima in caratteri del testo indicizzato dal motore.

A volte sembrava che il limite stesse tra X e Y caratteri, altre volte sembrava che il limite esistesse tra Z e K caratteri. La ragione era che le conclusioni cambiavano a seconda delle frasi usate dai SEO per fare i test: chi aveva usato frasi con parole mediamente più lunghe aveva avuto l’impressione che Google indicizzasse più caratteri e chi aveva usato frasi con parole mediamente più corte aveva avuto l’impressione che Google indicizzasse meno caratteri. In realtà nessuno ha mai notato che la misura era in parole e che il limite era dodici.

Per sicurezza, mi sono preso la briga di andare a cercare i test SEO più conosciuti sull’argomento, anche quelli più vecchi, ed ho confermato che tutti i loro risultati incerti sono in realtà riconducibili al modello delle “dodici parole”. Ho anche scoperto che altri test abbastanza famosi erano fallati per altre ragioni (es: l’inutilizzo dell’operatore “intitle”) ma questo è un altro discorso.

Con queste ultime considerazioni chiudo l’argomento sulla lunghezza dei titoli e apro quello sulle informazioni inaspettate che sono venute fuori durante la ricerca della soluzione al quesito.

Query subdole ma rivelatrici

Se anche voi vorrete svolgere alcuni test e ricerche, sappiate che nel corso delle mie sono incappato in frasi subdole, che apparentemente non rispondevano alla regola delle dodici parole ma che in realtà sono anch’esse delle conferme alla regola.

Approfondendo il perché di certi strani risultati di ricerca e la natura delle query che facevo sono emerse però ulteriori informazioni su comportamenti di Google che finora non erano mai stati notati o che non erano mai stati spiegati nei dettagli.

Un primo consiglio che do a chi vorrà cimentarsi in test simili è quello di fare attenzione ai testi che cercate, specie se fate copia-e-incolla da titoli di pagine web già esistenti. Anche se tra virgolette, infatti, le frasi possono accidentalmente contenere degli operatori di ricerca che modificano il significato della query stessa e di conseguenza i suoi risultati.

Per esempio, sul web esiste una pagina del sito Centralpark.com che ha esattamente per titolo “Alice in Wonderland | Your Complete Guide to Central Park”.

La pagina è archiviata da Google ma cercando il suo titolo con le modalità seguite finora non vien fuori alcun risultato: [intitle:”Alice in Wonderland | Your Complete Guide to Central Park”]. Riuscite a vedere nel testo della frase qual è il problema che inficia la ricerca?

Il problema è che la frase contiene l’operatore di ricerca “OR”, ovvero il carattere “pipe” (“|”). Questo operatore dice a Google di restituire i risultati che contengono solo una delle due parole che stanno a fianco del simbolo. Applicato alla frase indicata sopra, tale operatore induce dunque Google a cercare due distinti titoli, nessuno dei quali esiste:
[intitle:”Alice in Wonderland Complete Guide to Central Park”]
[intitle:”Alice in Your Complete Guide to Central Park”]

Il consiglio che do a chiunque voglia smanettare con ricerche che contemplano frasi esatte (tra virgolette) è quello di fare attenzione a non introdurre nelle frasi degli operatori di ricerca perché essi vengono interpretati da Google in quanto tali e non cercati letteralmente, nonostante la frase sia tra virgolette.

I fenomeni inaspettati sono iniziati quando ho cercato di far restituire a Google la pagina eliminando dalla query il carattere “|”: [intitle:”Alice in Wonderland Your Complete Guide to Central Park”]. Google restituisce un risultato ma non si tratta della pagina del sito sopra citanto quanto di una pagina di un altro sito con un titolo molto simile, privo del carattere “|”.

Perché quella pagina non viene più fuori? Il fatto che eliminando il simbolo “|” dalla ricerca non venga restituita la pagina di Centralpark.com significa che, in fase di indicizzazione, Google non si è limitato ad ignorare quel carattere bensì ci ha fatto qualcosa. Ma che cosa?

Google divide i titoli in blocchi

Come forse già sapete, quando Google estrae testo dalle pagine web tiene conto della loro struttura e non si limita ad archiviare tutto il testo come se fosse una sequenza continua di parole.

L’esempio più semplice da fare è quello delle intestazioni (tag HTML Hx) e dei testi immediatamente successivi ad una di esse. Prendo come esempio una pagina di un mio vecchio sito web, Motoricerca.info, per dimostrare che cercando come frase il testo dell’intestazione H3 seguito dalle prime parole del paragrafo che gli succede, Google non restituisce la pagina di quel sito: [“Scegliere un host a misura di SEO Chi si avvicina per la prima volta al posizionamento”].

La pagina di Motoricerca.info viene invece mostrata se si inserisce l’operatore “*” tra il testo dell’intestazione e quello del paragrafo: [“Scegliere un host a misura di SEO * Chi si avvicina per la prima volta al posizionamento”].

Quello che avviene è che in fase di parsing e indicizzazione del testo della pagina, Google ha archiviato il testo dell’intestazione e quello del paragrafo che gli segue in due “blocchi” separati. Cercando i due testi come se fossero consecutivi e appartenenti ad un’unica frase, la pagina di Motoricerca.info non viene restituita mentre usando l’operatore “*” la ricerca della frase viene estesa a blocchi di testo differenti.

Google fa lo stesso con i titoli delle pagine, decidendo di separare il testo dei titoli in blocchi differenti quando incontra nel testo dei titoli dei caratteri speciali, uno dei quali è proprio il simbolo di “pipe” (“|”).

Tornando all’esempio della pagina del sito Centralpark.com, il cui titolo contiene per l’appunto un carattere di “|”, l’unico modo per farla venir fuori nei risultati della ricerca è cercare separatamente le due frasi che compongono il titolo: [intitle:”Alice in Wonderland” intitle:”Your Complete Guide to Central Park”] oppure usare l’operatore asterisco per attivare la ricerca tra blocchi diversi: [intitle:”Alice in Wonderland * Your Complete Guide to Central Park”].

Quando ho scoperto il fenomeno mi era anche venuto il dubbio che piuttosto che un separatore di blocchi, il simbolo “|” venisse trattato da Google come parola a sé e quindi indicizzata come le altre, tuttavia questo si è dimostrato falso. Non solo, intuitivamente, sarebbe inutile per il motore di ricerca gestire come parola un simbolo che non può essere cercato dall’utente in alcun modo, ma continuando a fare ricerche su altri titoli è emerso che la presenza di uno o più simboli “|” non induce Google a “scalare” la quantità di parole rimanenti dalle famigerate dodici. In sintesi, è certo che il simbolo non viene considerato una parola, lasciandoci solo con la risposta del separatore.

Che cosa cosa può implicare questa scoperta in termini SEO? Implica che nel decidere i simboli da utilizzare nei tag TITLE dei propri siti è opportuno fare attenzione a quali di essi sfruttiamo.

Se il nostro desiderio è quello di far percepire l’intero titolo come un’unica frase oppure se c’è l’obiettivo sfruttare tutte le parole/keyword presenti nel titolo, allora potrebbe essere un’idea evitare i simboli grafici particolari, sostituendoli con semplice punteggiatura.

Non ho fatto un elenco dei simboli grafici che inducono Google a separare i testi del titolo in blocchi diversi. Per certo, ho individuato delle situazioni abbastanza subdole e non facilmente intuibili. Per esempio, il semplice trattino “-” (carattere ASCII 45) non induce Google ad archiviare il testo in blocchi diversi mentre il molto simile trattino “–” (entirà HTML –) produce la separazione in blocchi.

Google accorpa i caratteri singoli

Provate a cercare [intitle:”a b c d e f g h i l m n o p q r s t u v z”] e vedrete che Google restituirà delle risorse nonostante le parole nella frase cercata siano più di dodici. Ma dei singoli caratteri possono essere considerati “parole”? Non secondo Google.

Quello che fa Google quando trova sequenze di singoli caratteri separati da uno spazio è accorparli in una o più parole multicarattere sia in fase di indicizzazione del testo sia in fase di trattamento della query dell’utente.

La ricerca sopra riportata non è composta dunque da molte parole ma viene interpretata da Google come se fosse “abcdefghilmnopqrstuvz” e restituisce titoli che contengono “abcdefghilmnopqrstuvz” oppure “a b c d e f g h i l m n o p q r s t u v z”.

Mi son chiesto se questo accorpamento influisse in qualche modo sul limite massimo di dodici parole e la risposta è no. Occhio ai fraintendimenti, però!

Se provate a cercare un titolo di apparentemente undici parole quale [intitle:”a b c d e f g h i j k l m n o p q r s t u v w x y z now i noe my abc nxt tym wnt u sng”] verrà fuori una pagina web che in realtà contiene un titolo più lungo della frase cercata. Aggiungendo la dodicesima parola del titolo (“wid”) Google non restituirà più la pagina, come se il limite massimo di parole indicizzabili si fosse abbassato ad undici parole.

In realtà Google ha indicizzato la sequenza “a b c d e f g h i j k l m n o p q r s t u v w x y z” in due parole diverse e potete notarlo cercandole accorpate: [intitle:”abcdefghijklmnopqrstu vwxyz now i noe my abc nxt tym wnt u sng”], constatando che il limite di dodici parole è stato rispettato.

Perché Google ha deciso di accorpare quella sequenza di caratteri in due parole separate invece che in un’unica parola corrispondente all’intero alfabeto? Mistero. Non ho trovato giustificazioni tecniche di alcun genere e non escludo che i criteri dell’accorpamento dei caratteri possano seguire valutazioni fatte sul contenuto dell’intero indice (es: l’esistenza di acronimi popolari potrebbe favorire alcuni accorpamenti piuttosto che altri).

Riassunto dei risultati

Riassumo di seguito quanto è stato scoperto con questa piccola ricerca.

E’ stato dimostrato che Google indicizza un massimo di dodici parole estratte dal tag TITLE delle pagine web;
E’ stato osservato che il testo del tag TITLE può essere archiviato in blocchi separati così come avviene per il testo del corpo delle pagine HTML;
E’ stato osservato che in presenza di sequenze di singoli caratteri separati da spazio, Google indicizza parole create accorpando i caratteri stessi secondo criteri non ancora chiari. Il limite delle dodici parole viene comunque sempre rispettato.

Quanto stiamo messi male?

Se i risultati di questa ricerca insegnano qualcosa al di là degli aspetti tecnici, è che noi SEO stiamo messi piuttosto male.

Il divario tra le nostre conoscenze/supposizioni e la realtà di un motore di ricerca è così vasto che per tredici anni abbiamo brancolato nel buio chiedendoci qualcosa a cui poteva essere data risposta in qualsiasi momento, in pochi minuti.

La prima osservazione che mi viene spontaneo fare è che le modalità di archiviazione dei testi in parole, tipica di in un motore di ricerca, dovrebbe risultare palese a qualunque progettista di database che abbia affrontato il compito di creare un piccolo indice fulltext.

Il fatto che questa conoscenza, molto semplice e sicuramente banale agli occhi di un progettista di database, non appartenga alla comunità SEO è purtroppo un segnale chiaro su quanto poco ne sappiamo di come un motore di ricerca è fatto e di come funziona.

La seconda considerazione che mi viene spontaneo fare è che il valore aggiunto di queste pratiche di reverse engineering risiede sicuramente nella possibilità di acquisire un metodo di indagine.

Fin troppe volte i SEO vengono lasciati privi di informazione da parte dei progettisti dei motori di ricerca: gli algoritmi devono rimanere segreti per ovvie ragioni ma questa carenza di informazioni può trasformarsi in un’opportunità di crescita nel momento in cui inducesse i SEO a far pratica di logica e a sviluppare una forma mentis capace di pensare come chi i motori di ricerca li crea.

67 Responses to Continuare a smontare Google: un’altra scoperta SEO

Pingback: Quiz SEO bastardo numero 4: lunghezza massima del TITLE - LowLevel’s blog
Riccardo scrive il 18 October 2011 at 10:35

Uhm.. a questo punto mi sovviene una domanda: se, come scoperto da Giacomo, Google indicizza al massimo le prime otto parole del testo associato a un dato link, nel caso tale testo sia un Title, questa regola non vale in quanto Google archivia al massimo le prime dodici parole di un tag TITLE.

Giusto?

Reply
- LowLevel scrive il 18 October 2011 at 11:14
  
  @Riccardo: In quel caso si tratta di un testo di un backlink (indicizzato al massimo per 8 parole) che diventa anche uno dei titoli assegnato alla pagina. In tal caso rimane un titolo di 8 parole, perché la fonte di quel testo contiene solo 8 parole.
TheBigMtt scrive il 18 October 2011 at 11:08

Ciao e complimenti per l’articolo, l’ho trovato molto chiaro e interessante.

Ho pero’ un dubbio sulle premesse dell’esperimento.

Tu sostieni (correggimi se sbaglio) che nonostante Google mostri in SERP soltanto fino a c.ca 69 caratteri legga in realta’ le “parole”, 12 per l’esattezza.

Il fatto che se includi “thirteen” non restituisca risultati dovrebbe dimostrarlo.

Pero’ mi sembra che manchi una verifica, e cioe’: se il titolo contenesse tutti in numeri da uno a venti, e la mia query contenesse da 13 a 19, la ricerca darebbe qualche risultato? Insomma, Google smette di leggere dopo la 12esima o semplicemente non ne esistevano?
(Credo) finora hai dimostrato che NON esistono pagine che contengono i numeri da uno a tredici. Al contrario, cerchicamo di dimostrare che e che pur esistendo, Google non ne legga il titolo fino in fondo.

Spero di vada di rileggere tutto con calma, non riesco a essere piu chiaro 🙂

Hai ragione nel dire che alla fine un titolo va scritto pensando all’usabilita’… ma e’ un tema interessante e vorrei capire se davvero e’ una dimostrazione o se esiste ancora la possibilita’ che ancora non abbiamo capito come funziona!

Grazie,

Mtt

Reply
- LowLevel scrive il 18 October 2011 at 11:25
  
  @TheBigMtt : Ciao, grazie dei complimenti. 🙂
  
  > se il titolo contenesse tutti in numeri da uno a venti, e la mia query contenesse da 13 a 19, la ricerca darebbe qualche risultato?
  
  No, la pagina con i numeri da uno a venti non viene restituita da Google per qualunque parola dalla tredicesima in poi. E’ proprio una ghigliottina.
  
  Hai ragione nel dire che non ho riportato per iscritto la prova che le parole indicizzate siano le prime dodici.
  
  Nel precedente test svolto assieme a Giacomo Pelagatti sulla lunghezza dei testi dei link lo avevamo esplicitato, in questo secondo test sono andato di fretta ma provvederò all’aggiunta.
  
  Grazie per la correttissima segnalazione. 🙂
- LowLevel scrive il 18 October 2011 at 11:56
  
  @TheBigMtt : Hmm… ho riletto il post e mi sono accorto che in realtà avevo scritto quanto dicevi. 😀
  
  <Adesso attenzione: diverse pagine restituite nella ricerca hanno titoli che non si fermano a “twelve” ma che continuano elencando i numeri inglesi successivi: thirteen, fourteen, ecc. Potete voi stessi visitare alcune delle pagine restituite e rendervi conto di persona della lunghezza reale delle frasi presenti nei titoli.>
  
  Nel caso in cui l’affermazione non basti, sono andato a prendere una pagina specifica per farvi vedere che il suo titolo intero va ben oltre “twelve”. 🙂
  
  Questa ricerca dei numeri da “one” a “twelve” restituisce una sola e specifica pagina perché fa uso di un operatore “site” che restringe la query alle sole risorse appartenenti ad uno specifico sito.
  
  Il titolo completo della pagina restituita è (tenetevi forte): “One two three four five six seven eight nine ten eleven twelve thirteen fourteen fifteen sixteen seventeen eighteen I’m sohuld be sleeping but I don’t wnat to sleep even though im mighty tired. When spanish people type their laughter like ‘jajajajajajajaja’ the voice in my head actually goes ‘jajajajajaja’ instead of ‘hahahahaha’. JAJAJAJAJA JA.JA.JA.JA.JA ja.ja.ja.ja. haha night, amirite? – amirite? Touch”
  
  Facendo la ricerca di una (qualsiasi) parola successiva a “twelve”, la pagina non viene mai restituita.
  
  Così dovrei aver chiarito tutti gli ultimi dubbi. 🙂
teoseo scrive il 18 October 2011 at 11:47

La mia perplessità è sugli operatori.
Sei sicuro che il limite delle 12 parole non sia solo una limitazione al numero di parametri che prende in considerazione l’operatore intitle?

Reply
- LowLevel scrive il 18 October 2011 at 12:00
  
  @teoseo: Sì, ti confermo che non è un limite dell’operatore “intitle”. Dai un’occhiata alla mia ultima risposta data a TheBigMtt per notare che la pagina non viene restituita anche quando si cerca una sola parola: dalla tredicesima in poi. 🙂
andrea scrive il 18 October 2011 at 11:53

Molto interessante provo a fare dei test su alcuni siti che utilizzano l’operatore “|” e ti faccio sapere…Complimenti!

Reply
fedefede0101 scrive il 18 October 2011 at 12:01

Perdonami Enrico, ma allora la domanda è stata posta in modo sbagliato….o sono io che non capisco! 🙂

Premesso che la “scoperta” è utile, non avresti dovuto parlare di “archiviazione” perchè nelle tue considerazioni stai parlando della creazione dell’indice.

Direi che sono due cose ben distinte…no?

Google archivia *TUTTO* quello che il “field type” dedicato al TAG TITLE consente (sempre che esista) e poi crea l’indice sulla base di alcune “regole”, di cui una è molto probabilmente quella da te/voi “scoperta”.

Che dici….devo rileggere meglio il post con la domanda o sei d’accordo con me? 😉

Clickz

Reply
- LowLevel scrive il 18 October 2011 at 12:31
  
  @fedefede0101 : Hai ragione, la confusione l’ho generata io. 🙂
  
  Il quiz parlava di archiviazione in senso generico (e infatti nella risposta dice anche che in tipologie di archivi non strutturati viene archiviato tutto) mentre nelle intenzioni questo articolo è incentrato solo sull’indicizzazione del titolo.
  
  Dove sta la magagna? Che ho riletto con più attenzione e mi sono reso conto che in più punti invece di “indicizzazione” ho scritto “archiviazione”, un errore grossolano di poca precisione. Ho corretto e ti ringrazio per la segnalazione. 🙂
  
  Sul “field type” però non ho capito bene a che cosa ti riferisci. Non si può escludere che gli unici sistemi di archiviazione usati siano semplicemente i dati grezzi (l’intero codice di una pagina) e l’indice (le uniche parole cercabili).
Giacomo Pelagatti scrive il 18 October 2011 at 12:26

Faccio pubblicamente i complimenti a Enrico per la chiarezza espositiva dell’articolo, che a mio modesto parere non ha nulla da invidiare a quello che a suo tempo avevamo scritto a due mani. 🙂

Reply
fedefede0101 scrive il 18 October 2011 at 12:27

maledetto…..ora sto perdendo tutta la mattina per leggere e discutere sulle differenze tra un db relazionale e non!!

arghhhh

Reply
Simone scrive il 18 October 2011 at 12:41

Conoscevo già il limite delle 12 parole, il resto no.
Devo rileggere tutto con calma perché l’argomento è molto interessante.

Reply
fedefede0101 scrive il 18 October 2011 at 12:57

ho parlato di field type del campo title per cercare di chiarire (con la mia testa a DB relazionale) la fase di archiviazione.

trattandosi però di DB distribuito e NON relazionale, molto probabilmente (come dici tu) non esistono nemmeno i field type e viene archiviato ogni singolo bit di documento (simile al concetto di classe) e poi viene creato un indice dove il title e i vari elementi che definiscono il ranking sono vicini al concetto di attributi dinamici della classe….

che dici? 🙂 troppo contorto?

ora ho fame…vado a pranzo!

p.s. se oggi non riesco a lavorare nemmeno 5 minuti in tutto il giorno è colpa tua! 😀

Reply
- LowLevel scrive il 20 October 2011 at 13:16
  
  @fedefede0101 : come ci dicevano in altri contesti, non c’è modo di risalire dall’esterno alla struttura dei database di Google, specie da quando esiste Caffeine. Anche se non esiste un concetto di “campo” per come viene inteso comunemente nei database relazionali, l’unica conclusione che possiamo desumere dall’hacking è che in quello specifico contesto (il titolo) esiste sicuramente un limite alla quantità di parole archiviata. Se volessimo basarci solo su quello che si sa di Bigtable, per esempio, troverei plausibile la presenza in DB di un “campo” (intendilo come un concetto astratto) per l’archiviazione di tutto il contenuto raw di una risorsa e poi altri “campi” che fungono da indici di parole o frasi estratte dal raw. Giacomo aveva notato che alcuni elementi identificatori, come per esempio gli URL, non sottostanno esattamente alle stesse tecniche di indicizzazione dei contenuti delle risorse. Quindi sarebbe anche opportuno non generalizzare quanto è stato scoperto a contesti diversi.
  
  Quanto e sopratutto come ciò sia cambiato con Caffeine, nessuno di noi lo sa. 🙂
marco scrive il 18 October 2011 at 13:10

Ottimo articolo, anche io ho sempre avuto dubbi in merito e vado per tentativi affinche google indicizzi quello che voglio che mostri.

Hai visto che google ha indicizzato questa pagina con la keyword: Scegliere un host a misura di SEO Chi si avvicina per la prima volta al posizionamento

…e con questo mio commento gli diamo subkeyword da indicizzare.

Complimenti ancora, Ciao!

Reply
Alessandro scrive il 18 October 2011 at 13:51

Ciao Enrico, bell’indagine e ottima esposizione.

L’unica parte che mi sento di discutere è l’ultima.
Se si può dire che “stiamo messi piuttosto male” non è certo perché non siamo riusciti a dare risposta alla domanda “Quante parole/caratteri indicizza Google nel title” ma piuttosto perché ci siamo fatti questa stessa domanda. La tua scoperta è senza dubbio interessante, ma all’atto pratico, quanti di noi avrebbero fatto scelte significativamente diverse nel confezionare i title delle pagine se fossero stati a conoscenza di quanto detto nel tuo articolo? E tu? Quanto saranno diversi i title che scriverai o che farai scrivere prima e dopo questa scoperta?

Non sono un fan di Matt Cutts e delle sue dichiarazioni però mi viene in mente quanto disse a Rand Fishkin durante una conferenza a Seattle (cito a memoria, il senso è quello): “Voi continuate a cercare di acchiappare l’algoritmo. Dovreste invece concentrarvi sull’acchiappare l’utente che, dopo tutto, è quello che sta cercando di fare l’algoritmo“.

Una conoscenza di base del funzionamento delle tecnologie che fanno funzionare l’Internet e dei motori di ricerca (soprattutto della differenza fra crawling e indicizzazione) è fondamentale per chiunque voglia fare SEO: è importante capire che le cose non accadono per magia ma che esistono processi, architetture e limiti.
Oltre una certa soglia però fare reverse engineering dei motori è un esercizio che lascia il tempo che trova, preferirei fare reverse engineering delle persone (che con qualche eccezione compilano più preventivi degli spider).

Quindi alla tua domanda “Come stiamo messi?” la mia risposta è: “Sarete messi male voi che per tredici (!!!) anni vi siete fatti delle pippe intorno alla quantità massima di caratteri di un tag TITLE indicizzata da Google. A quella domanda, io nemmeno ci avevo pensato 😉

Alla fine credo che fare SEO (e non solo) significhi farsi le giuste domande e di conseguenza andare alla ricerca delle risposte più convincenti. Ed in entrambi i casi funziona applicare i “Three Layers Of So What”.

Reply
- LowLevel scrive il 18 October 2011 at 16:43
  
  @Alessandro: Sono stato il primo a scrivere che dovrebbe essere l’usabilità (e più in genere il rapporto con l’utente) e non il tecnicismo a regolare certe scelte.
  
  Non sono tuttavia d’accordo sul fatto che, nello svolgere pratiche di reverse engineering, l’assenza di un un ritorno immediato dimostri un’inutilità intrinseca della pratica. Di ogni pratica di allenamento, compreso l’allenamento del pensiero, esistono anche benefici che possono essere percepiti solo nel tempo.
  
  La ragione per la quale non sono d’accordo è anche che ci sono tanti modi di allenare il cervello e non è scontato concludere che un allenamento di logica in contesti come quelli discussi non possa portare benefici in ambiti diversi dai tecnicismi; persino in contesti sociali.
  
  Sarebbe un errore far coincidere il SEO esclusivamente con le pippe mentali tecniche, così come sarebbe un errore pensare che siano inutili.
  
  Una definizione condivisa di “SEO” non esiste e sull’ampiezza degli interessi, delle discipline e delle attività di sperimentazione che il search marketing può abbracciare, ognuno applica i limiti che preferisce.
  
  Continuerò a sostenere che per un SEO non sapere come un motore di ricerca indicizza un testo sia una mancanza ed un indice di “essere messi male”? Sì, non tanto per la sconoscenza dell’informazione in sé quanto per il fatto che tutto il tempo trascorso a pensarci (a prescindere dall’utilità) senza cavare un ragno dal buco denoti una mancanza di basi o di metodo analitico. E siccome l’ignoranza non ha mai fatto bene a nessuno, allora si segnala la criticità e se ne approfitta per dare un esempio di come si potrebbe fare per scoprire autonomamente certe cose. Senza pretese.
  
  Come alcuni avranno intuito, la ragione per la quale faccio quiz su tecnicismi idioti o pubblico ricerche su minuzie tecniche sui titoli (sono il primo a chiamarle “cagate”) è che è un pretesto per fare didattica, spronare le persone ad interessarsi di aspetti del SEO snobbati, compresi quelli tecnici. Oggi tocca al tecnicismo, la prossima settimana toccherà all’analytics di fenomeni social, in passato è toccato a considerazioni generali sul search marketing, su come difendersi dai SEO e a sfatare i luoghi comuni che abbondano nel nostro settore.
  
  Concludo svelando un segreto: dire che “siamo messi male” fa parte delle tecniche di formazione. 😉
Luca scrive il 18 October 2011 at 14:20

Complimentissimi per l’analisi tecnico/logica.
Quindi mi chiedo.
Se google non archivia title più lunghi di 12 parole, dov’è che tronca il titolo nelle serp quando le parole sono molto lunghe?

grazie

Reply
fedefede0101 scrive il 18 October 2011 at 17:03

@alessandro

this is just food for your brain! enjoy it!

Reply
fedefede0101 scrive il 18 October 2011 at 17:20

@alessandro

scusa volevo solo aggiungere una cosa che non c’entra nulla con la SEO.

il tuo modo di pensare è emblematico ed è il motivo per cui nella società in cui oggi viviamo non c’è più spazio per pensare e ragionare su qualcosa che non abbia un riscontro pratico/economico immediato o futuro.

esempio e magari dico anche una stupidaggine ma non credo: il pensiero puramente filosofico…mi sembra sia abbastanza scomparso no? perchè? perchè oggi non è più necessario porsi delle domande, trovare risposte anche fine a se stesse e sopratutto perchè nella maggior parte dei casi non genera revenue ma è solo un centro di costo 🙂

#rant

Reply
Giacomo Pelagatti scrive il 18 October 2011 at 18:04

Vorrei tranquillizzare il buon Alex sul fatto che quelle che scegliamo periodicamente di pubblicare, sui nostri blog personali o su quello del team, sono una parte assolutamente infinitesimale delle “pippe” che ci facciamo quotidianamente in SearchBrain, riguardo a come funzionano i motori di ricerca, e a come funziona la testa degli utenti che li usano. 😀

Per il resto sono certo che tutti concordiamo con Enrico sul fatto che condividere (per quanto mi riguarda, senza alcuna pretesa didattica) piccole scoperte, indipendentemente da quanto siano immediatamente utili e applicabili nella pratica quotidiana di chi fa il nostro mestiere, non sia un esercizio del tutto sterile, per vari motivi. In primis quello che la ricerca e le domande che spesso ne derivano hanno un valore in sé, che prescinde dalla loro utilità immediata: la conoscenza di un dettaglio che oggi può sembrarmi insignificante potrebbe rivelarsi più utile in futuro, alla luce di nuove evidenze (o di nuove esigenze che oggi non posso prevedere).

Ma c’è un’altra ragione, forse più importante. Pur non essendo mai stato un sostenitore della visione della SEO come reverse engineering (che, oggi più che mai, è da considerarsi pura utopia), sono fermamente convinto che farsi qualche domanda ogni tanto sui meccanismi interni dei motori di ricerca, chiedersi “come funziona questa cosa?”, non limitandosi a considerarli una scatola nera, sia un esercizio potenzialmente utile anche al più user-oriented dei SEO. Il perché è presto detto: il nostro è un mestiere ibrido e multidimensionale, che risulta maledettamente difficile svolgere bene ragionando a compartimenti stagni e senza una dose di curiosità a livelli quasi patologici.

Credo anzi che la tendenza a porsi domande che sembrano “pippe” sia un abito mentale assolutamente imprescindibile per un SEO, perché è cercando di trovare la risposta a domande apparentemente fini a sé stesse che spesso s’incappa in evidenze interessanti, e si scoprono cose che può risultare utile sapere. Non a caso, anche durante lo scambio di mail con Enrico che ha preceduto e seguito la pubblicazione di questo post abbiamo sperimentato alcune anomalie che hanno fatto scaturire nuove domande, e la cui analisi potrà forse permetterci di capire qualcosina in più, rispetto a quanto esposto qui, su come funziona l’indicizzazione di testi in Google. Se, come mi auguro, emergeranno novità interessanti, non dubito che Enrico vorrà condividerle.

Scusate la divagazione; mi sembrava importante. 🙂

Reply
Seo Anziano scrive il 18 October 2011 at 18:07

Ragazzi (@fede @lowlevel @alessandro), così però mi fate commuovere.. è la prima volta che vedo un post SEO prendere derive filosofiche così alte. 🙂

L’articolo è interessante, ma il dibattito che ne è nato fras voi lo è molto di più.

Credo lo scopo di Enrico (di fatto uno dei pochi “animatori culturali” del SEO in italia) sia ancora una volta colto in pieno con questo post.

Questo tipo di “divagazioni” non può che fare del bene ad un settore come questo, che richiede capacità analitiche/deduttive piuttosto sofisticate.

Ringrazio Enrico per questa sua attività di animazione culturale che rende questo lavoro sicuramente anche un pò “meno palloso” per chi lo fa da parecchi anni..

@lowlevel: Keep going man, e non pentirti di aver scritto questo mastodontico pippone Seo. Mi spiace solo che dovrò prendere un giorno di ferie per leggerlo tutto…

Reply
TheBigMtt scrive il 18 October 2011 at 18:17

Grazie del link nella seconda risposta, quello mi ha chiarito ogni dubbio 🙂
Adesso sono ancora piu’ impressionato dalla scoperta eheheh.

Non ho mai letto SEO blogs in italiano ma ti sei fatto un nuovo lettore (da oltre-manica) !

Ciao e buon lavoro! 😀

Reply
Roberto Polli scrive il 18 October 2011 at 18:53

Il post è interessante, anche se mi lascia un po’ perplesso…

Forse se andate a vedere i paper di google su come funzionano i motori di ricerca vi risparmiate un po’ di tempo.

Pace,
R.

Reply
- LowLevel scrive il 20 October 2011 at 09:05
  
  @Roberto Polli : purtroppo (o fortunatamente, sotto certi aspetti) non esistono paper di Google che forniscono i dettagli di implementazione dei propri algoritmi o delle proprie infrastrutture. In ogni caso, quando anche esistessero, l’obiettivo di un po’ di hacking non sarebbe quello di risparmiare tempo ma proprio quello di trovare da sé informazioni non esplicite.
Alessandro scrive il 18 October 2011 at 19:00

@Enrico, so bene che sostieni da tempo che dovrebbe essere l’usabilità e non il tecnicismo a regolare certe scelte.
E’ proprio per questo che non capisco è come mai trovi sia un buon metodo didattico pubblicare ricerche su “minuzie tecniche sui titoli”. Non credi che abbia l’effetto opposto? Ovvero portare le persone a concentrarsi sulla suddetta minuzia invece che su altro?

Da quel che ho capito quello che ti interessa alla fine è trasmettere un metodo analitico, non pensi che la stessa cosa sarebbe possibile affrontando questioni che abbiano una utilità pratica? Magari no, e tu ci avevi già pensato.

Pensa, con i dovuti adattamenti, a quando si impara a programmare: ho trovato sempre abbastanza noiosi e poco utili quegli esempi o esercizi che ti pongono di fronte ad un problema matematico (es. calcola il fattoriale) mentre quello che mi ha fatto avvicinare ed appassionare alla programmazione è la possibilità di risolvere problemi concreti — anche semplici — come ad esempio leggere, rinominare e modificare una serie di file. Entrambi gli approcci sono utili ad acquisire un metodo, solo che uno è un esercizio teorico, l’altro ti lascia qualcosa che produce un risultato concreto.

@fedefede0101 Sarà che son rimasto traumatizzato da una laurea in sociologia (è roba che fa danni peggio di certi trip), ma la speculazione filosofica fine a se stessa non mi ha mai entusiasmato. Ma questa è una questione di gusti 😉

Reply
- LowLevel scrive il 20 October 2011 at 11:15
  
  @Alessandro: comprendo e condivido in buona parte la tua perplessità. Anche io mi son chiesto in passato se per indirizzare i SEO verso una concezione del search marketing meno legata agli aspetti tecnici non fosse opportuno elimininare del tutto tali “ricerche tecniche” da quanto condivido con gli altri. La risposta che mi sono dato è che non esiste una convenienza a abbracciare l’estremo del “techless” e che all’interno di un percorso didattico per chi fa SEO possono rientrare esperimenti di hacking i cui ritorni sono inizialmente solo informativi e non pratici.
  
  In realtà io non sarei d’accordo nemmeno su “inizialmente solo informativi”: a seguito di un mio post ho già incontrato un nostro collega che mi ha spiegato come ha implementato nel concreto e nel suo lavoro le informazioni che si possono trarre dalla sperimentazione fatta. Dalla mia esperienza, il ritorno c’è sempre, solo che a volte non si concretizza nel momento stesso in cui si chiude l’attività di ricerca.
  
  Non sottovaluterei nemmeno l’attività di “ripasso” che è implicita nel tipo di ricerche come quella proposta: sai quanti SEO ho conosciuto non sanno bene come usare i basilari operatori di ricerca di Google? E non parlo di “intitle” ma persino di “site”, che per un SEO dovrebbe essere un comando essenziale a prescindere dal livello di astrazione dai tecnicismi che ha deciso di imporsi.
  
  Alla fine e sopratutto tenendo conto del panorama SEO in cui operiamo ho deciso che, senza nulla togliere al “learning by doing”, ci può stare anche un “learning by hacking” perché, ammesso che esista un modello teorico e condiviso di SEO al quale auspicare, non sono convinto che per abbracciare visioni più ampie esso debba perdere la componente tecnica o di hacking che ha contribuito per anni al profilo di questa figura. E’ una componente che fa da àncora e che inficia l’acquisizione di una mentalità più vicina al marketing? Secondo me no. Uno dei post più apprezzati di questo blog è quello sulla macromiopia applicata al search marketing e gli apprezzamenti li ho ricevuti da persone che possiedono anche grandi capacità tecniche.
  
  Persino quando mi capita di dare un consiglio su temi non tecnici, la mia percezione è che certe capacità di intuizione, di ragionamento e di applicazione del buonsenso abbiano beneficiato di tutta la formazione fatta, non solo di quella che aveva prodotto un tornaconto materiale immediato.
  
  La ricompensa dell’hacking non sarà immediata, così come non c’è ricompensa concreta nel vincere una partita a scacchi. Solo che a volte per alcune persone è piacevole giocare una partita a scacchi contro Google e allenare un po’ le proprie capacità analitiche.
Gregorio scrive il 18 October 2011 at 20:38

Ragionamento piacevole, anche se si fosse trattato di piante esotiche cambiava poco.
Oltre a comprendere e imparare cose nuove, che fa sempre bene, è utile anche nell’immediato. Insomma è meglio usare 12 parole per fare un titolo invece che 60 caratteri!

Reply
Roberto Pala scrive il 18 October 2011 at 22:01

Complimenti, veramente un bel test.
Interessante anche il discorso legato alle singole lettere spaziate e accorpate in automatico, cosa che al contrario non succede con i numeri in cifre stile 1 2 3 4 5 6 7 8 9 0 1 2 3 i quali giustamente non vengono accorpati.
In merito al caso di lettere singole, sbaglio o l’accorpamento avviene esclusivamente nei casi in cui tali lettere siano all’inizio del titolo?

Reply
- LowLevel scrive il 20 October 2011 at 12:12
  
  @Roberto Pala : L’accorpamento di singole lettere avviene a prescindere dal punto del testo in cui esse si trovano. Non è limitato ai titoli: anche il testo della pagina viene trattato in questo modo.
andrea "gareth jax" scarpetta scrive il 19 October 2011 at 10:43

Bell’articolo! La ricerca pura serve sempre, poi sta a noi applicarla in ambito pratico.

Reply
Fra_T scrive il 19 October 2011 at 11:00

Post interessante, aggiungo una cosa che forse ti è sfuggita.
Dalle 13° parola in poi le parole vengono comunque indicizzate, non più come title, ma come testo.

Per testarlo puoi usare una pagine con parole nel title che non compaiono nel testo. L’operatore intext non da risultati per la 12° parola, ma inizia a darne dalla 13° in poi!

Reply
- LowLevel scrive il 19 October 2011 at 11:04
  
  @Fra_T : Più tardi avrò tempo per rispondere anche agli altri commenti, ma questo tuo mi è balzato all’occhio: complimenti per lo spirito di osservazione. 😉
  
  Sì, ci eravamo accorti di questa caratteristica ed era ciò a cui Giacomo si riferiva nel suo commento quando scriveva “alcune anomalie”. 🙂 L’analisi continuerà in questi giorni perché non escludiamo che possa essere un indizio per qualcosa di più interessante.
  
  Grazie per il tuo commento, è sempre un piacere rileggerti. 🙂
Andrea Moro scrive il 19 October 2011 at 12:46

Il tuo studio e’ sicuramente interessante, ma inutile come dici tu stesso.

All’atto pratico, ha più senso decidere quanto testo scrivere in un titolo basandosi su considerazioni sull’usabilità. Da qui tutte le seghe mentali che per anni hanno attanagliato i SEO di tutto il mondo.

Del resto avere un titolo lungo 12 parole, ma vederlo troncato dai puntini di sospensione perche’ non entra nello spazio a disposizione, che senso ha?

Poi, permettimi ancora una volta di spezzare una lancia a favore di questa metrica (conteggio dei caratteri) imbecille se vuoi.
Fintanto che hai il web designer dentro casa, il copywriter al piano di sotto (o se lo vogliamo leggere all’italiana il SEO e’ anche quello che fa il sito e il copywriter) tutto risulta piu’ facile.

Le cose si fanno complicate quando inizi a lavorare in ambienti distribuiti, dove le collaborazioni e le lungaggini burocratiche per i processi decisionali smontano ogni logica e ogni sforzo.

In queste circostanze, dire ad un copywriter hai 64 o 70 caratteri a disposizione, fa una grandissima differenza con hai 12 parole a disposizione. Con 12 parole potrebbero scriverti anche un romanzo, con 70 caratteri o quelli che vuoi sai che il limite e’ quello.

Detto questo … faccio un loop e torno all’inizio del commento…. “… all’atto pratico, ha più senso decidere basandosi sull’usabilità”.

Reply
- LowLevel scrive il 20 October 2011 at 12:13
  
  @Andrea Moro : giustissima e sacrosanta considerazione su quello che conviene comunicare ad altri per raggiungere il risultato più opportuno. 🙂
Pingback: Netafim: Un Blog Sui Sistemi Di Irrigazione [Case Study]
Carlo Rubino scrive il 19 October 2011 at 14:15

Decisamente interessante…
Utile come sempre, Enrico!

Reply
Andrea Moro scrive il 19 October 2011 at 14:32

P.S. Hai questo link nell’articolo che immagino sia sbagliato … leggendo quello che scrivi sopra

[intitle:”Alice in Your Complete Guide to Central Park”]

Dovrebbe essere

[intitle:”Your Complete Guide to Central Park”]

Reply
ciastella1 scrive il 19 October 2011 at 19:51

Beh, sicuramente potrebbe essere interessante considerato il differente comportamento esistente tra numeri e lettere. Nel caso in cui si inserisse una stringa di 12 numeri staccati (un codice prodotto?) all’interno di un titolo (all’inizio) il resto del titolo verrebbe considerato in maniera completamente differente dal motore.

Reply
Giorgio Taverniti scrive il 20 October 2011 at 09:01

Hey Roberto Polli, mi segnali su quale paper di Google hai letto come si ottimizza un sito…voglio ottimizzarlo come il tuo in firma (http://www.robertopolli.it/)

Non voglio perdere troppo tempo…

Pace,
G.

Reply
Giacomo Pelagatti scrive il 20 October 2011 at 09:37

@Andrea Moro:

[intitle:”Alice in Your Complete Guide to Central Park”]

Dovrebbe essere

[intitle:”Your Complete Guide to Central Park”]

No, non si tratta di un refuso; l’esempio di Enrico è corretto. Nella query [intitle:”Alice in Wonderland | Your Complete Guide to Central Park”] l’OR booleano è fra i termini “Wonderland” e “Your”.

@Fra_t: Complimenti anche da parte mia; hai la vista acuta, e hai visto giusto. 😉

E, giacché “the cat is out of the bag”… Enrico ed io ce ne eravamo accorti poco dopo la pubblicazione di questo post, testando questa pagina ad hoc:

http://www.google.it/search?q=dodici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=tredici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=intitle%3Adodici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=intext%3Adodici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=intitle%3Atredici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=intext%3Atredici+site%3Agiacomopelagatti.it
http://www.google.it/search?q=%22Uno%2C+due%2C+tre%2C+quattro%2C+cinque%2C+sei%2C+sette%2C+otto%2C+nove%2C+dieci%2C+undici%2C+dodici%2C+tredici%22+site%3Agiacomopelagatti.it

Ciao 🙂

Reply
flavio scrive il 20 October 2011 at 09:38

…eh…..quanti polli ci sono ancora in giro!

Reply
Giacomo Pelagatti scrive il 20 October 2011 at 11:29

@Alessandro:

Da quel che ho capito quello che ti interessa alla fine è trasmettere un metodo analitico, non pensi che la stessa cosa sarebbe possibile affrontando questioni che abbiano una utilità pratica?

Da quanto hai scritto si direbbe che tu ritenga che la questione affrontata in questo articolo “analitico” (quanta parte del contenuto del tag <title> è indicizzata da Google, e come) e le sue implicazioni non abbiano alcuna utilità pratica: è questo che pensi? Se sì, perché? Parliamone.

Reply
Fra_T scrive il 20 October 2011 at 23:55

@Enrico e @Giacomo: complimenti a voi per questi post 🙂

@Giacomo: ecco a cosa serviva quel post. L’avevo visto, ma non avevo notato il title 😀

Reply
Fra_T scrive il 21 October 2011 at 00:00

… e non oso pensare a cosa serva il post sugli “altri numeri” 😀

Reply
Roberto Fumarola scrive il 23 October 2011 at 15:17

Post dettagliati ed approfonditi (e chilometrici), richiedono poi extra epr rispondere ai commenti, da parte degli autori.
E spesso anche nei commenti ci sono chicche interessati 🙂

@Enrico, complimenti per il post!

Reply
Vincenzo Galliano scrive il 25 October 2011 at 20:08

Questo non è un post, è arte.
Complimenti e massima stima.
Vincenzo

Reply
Pingback: Storia di Google: Brandy (2004) « Seo
Carmelo scrive il 1 January 2012 at 16:44

Bell’articolo che mi dispiace a mia volta smontare, perchè state smontando Google con una “chiave inglese” quando invece è sufficiente un “giravite” per arrivare alla soluzione ??

Google come qualsiasi altro sito internet o pagina web è fatto anche di fogli di stile CSS e oggetti grafici da mostrare agli utenti.

Il title che vine fuori nelle SERP è solo una questione di pixels, che usando uno schermo standard 1024×768, tutti i caratteri che entrano nel div corrispondente al title, non possono superare i 512px, cioè la metà di 1024px!

E’ chiaro che in base al numero e tipo dei caratteri in output, il font utilizzato (quello di Google è = arial 16px + justify) inserito nel tag usciranno più o meno caratteri, in base a vari fattori, tra cui: minuscolo, maiuscolo, spazio, numeri, ect.

cmq c’è un numero max di caratteri visibili nel title = 36 caratteri, che includendo gli spazi vuoti diventano = 84 come è possibile notare in questa query = http://www.google.it/search?q=a+b+c+d+e+f+g+h+i+j+k+l+m+n+o+p+q+r+s+t+u+v+w+x+y+z+1+2+3+4+5+6+7+8+9+0

ma non è una regola basata sul numero di caratteri, ma sui fogli di stile + formattazione + proprietà dello schermo (user-agent)
allego un immagine che spiego meglio di tante di tante parole.

http://seowebmaster.it/google/TITLE.png

un saluto a presto.

Reply
Carmelo scrive il 1 January 2012 at 20:02

Forse devo rivedere ciò che ho scritto prima… tranne la larghezza (width:512px) non c’è un limite prestabilito alla lunghezza di un titolo, ma c’è nella lunghezza della query che è di 32 parole.

http://www.google.com/search?hl=en&source=hp&q=Videos+for+Videos+for+A+B+C+D+E+F+G+H+I+L+M+N+O+P+Q+R+S+T+U+V+Z+1+2+3+4+5+6+7+8+9+0+a+b+c+d+e+f+g+h+i+l+m+n+o+p+q+r+s+t+u+v+z+1+2+3+4+5+6+7+8+9+0+A+B+C+D+E+F+G+H+I+L+M+N+O+P+Q+R+S+T+U+V+Z+1+2+3+4+5+6+7+8+9+0+a+b+c+d+e+f+g+h+i+l+m+n+o+p+q+r+s+t+u+v+z+1+2+3+4+5+6+7+8+9+0+A+B+C+D+E+F+G+H+I+L+M+N+O+P+Q+R+S+T+U+V+Z+1+2+3+4+5+6+7+8+9+0+a+b+c+d+e+f+g+h+i+l+m+n+o+p+q+r+s+t+u+v+z+1+2+3+4+5+6+7+8+9+0+A+B+C+D+E+F+G+H+I+L+M+N+O+P+Q+R+S+T+U+V+Z+1+2+3+4+5+6+7+8+9+0

Reply
Carmelo scrive il 2 January 2012 at 10:07

non vorrei occupare troppo spazio, ma continuo io lo smontaggio di Google 🙂
sono riuscito a far creare a google una SERP con un titolo lungo più di 1.000 caratteri aumentabile all’infinito, a quanto sembra…

per non inficiare questo blog con i risultati, anche perchè verrebero indicizzati, invece io ho bloccato tutto con dei meta tags, ho postato il tutto qui, con le mie conclusioni a proposito.

http://seowebmaster.it/google/query.html

il tutto inizia perfino a essere divertente.

Reply
Enrico scrive il 10 January 2012 at 00:18

Avevo conservato questo post nei preferiti e, finalmente, sono riuscito a leggerlo: complimenti Enrico, fantastico, non posso dire altro. Un unico dubbio, irrilevante ai fini dell’esperimento: sto ripassando gli operatori di google search e trovo nozioni discordanti sull’operatore +, alcuni sostengono non venga più considerato da google, altri il contrario; di contro è perfettamente funzionante in adwords e fornisce il risultato di cui parli nel post. Nonostante questo Io, di primo acchito, userei le virgolette ” su singola parola per ottenere appunto risultati non “inquinati” dalle interpretazioni che google offre della stessa. Sicuramente sbaglio, ma che ne pensi?

Reply
trancedesigner scrive il 2 March 2012 at 18:43

Questo articolo ha un chè di…. virale…… 🙂

Reply
Pingback: How to write titles that “kill” for posts that drive traffic | Dofollow24.org
Pingback: » Titolo lungo
Pingback: SEO on page: 3 regole per scrivere titoli di qualità | alVerde.net
Alessandro scrive il 29 October 2012 at 18:21

Qua ci sono più di 12 parole mostrate nel titolo dello snippet… Ho capito male io il concetto?
https://www.google.it/search?q=In+thi+till+trill+little+litter+fill&oq=In+thi+till+trill+little+litter+fill

Reply
- LowLevel scrive il 17 December 2012 at 20:01
  
  @Alessandro: l’articolo spiega quante parole vengono indicizzate mentre la query che evidenzi tu mette in risalto quanto viene visualizzato ed evidenziato nelle SERP.
  
  La differenza tra i due concetti è la stessa che c’è tra causa ed effetto.
  
  La posizione di una risorsa per una query è causata (tra le tante cose) da quanti e quali contenuti della risorsa sono stati indicizzati dal motore ma non è una conseguenza di quello che il motore mostra nei risultati di ricerca, che sono invece l’effetto finale.
  
  Quindi sì, stai facendo riferimento ad un aspetto diverso da quello trattato nell’articolo.
Pingback: Tag Title: 3 SEO Test per fare i Raggi X | AppuntiSEO.it
Massimo scrive il 10 July 2014 at 14:28

Mi chiedo se dopo l’avvento del pinguino e del colibrì, la regola delle 12 parole sia ancora valida

Reply
- LowLevel scrive il 18 July 2014 at 00:12
  
  @Massimo: non c’è attinenza tra quanto fanno gli algoritmi di classificazione (come Penguin) e le logiche di indicizzazione delle parole, che stanno dietro al limite delle 12 parole.
  
  Già Hummingbird è un più vicino al contesto dell’indicizzazione, almeno in senso lato, ma non abbastanza da aver toccato aspetti che non gli competono.
  
  Di sicuro per ora non è cambiato nulla per la regola delle 12 parole, chiunque può seguire il metodo indicato nell’articolo e controllare che è ancora valida nel momento in cui scrivo.
  
  Come regola generale, avendo una mappa delle distinte fasi di cui si compongono le attività svolte da Google e una volta che si determina in quale fase subentra uno specifico algoritmo o metodologia, viene molto facile capire al volo quanto è probabile che porti cambiamenti ad altre fasi.
  
  Se due fasi non sono attinenti tra loro, hanno obiettivi diversi e si interessano di cose diverse, è improbabile che un cambiamento della prima fase abbia ripercussioni sulla seconda.
Cris scrive il 16 January 2017 at 17:42

Ciao e grazie per il tuo contributo a comprendere i motori di ricerca.
Volevo chiederti se c’erano degli aggiornamenti riguardo questa questione della lunghezza dei title!

Grazie mille e complimenti!

Reply
- LowLevel scrive il 31 March 2018 at 09:30
  
  Ciao Cris, io non ho aggiornamenti e non so se qualcun altro ha fatto test simili.
  
  L’articolo tuttavia fornisce le due ricerche su Google che chiunque può fare per controllare se la regola delle dodici parole è ancora valida.
roberto scrive il 9 September 2017 at 17:07

Prima di chiedere e dire qualcosa… chiedo, al 2017, quasi 2018, vi è qualcosa che la tua esperienza e conoscenza toglierebbe e o aggiungerebbe a questo articolo?
Questo mi permette…prima… di rileggere il tutto, poiche lo apppena letto ma come un tuffo in mare aperto dopo 11 mesi di ufficio, e ora volgio nuotarci, ma eviterei correnti oramai inutili!Quindi ci sono novità a quanto sopra? (scusa la verbosità..)
p.s. la cosa mi interessa molto poiche sono alle soglie dal pubblicare on line il mio blog che ora è in locale…e vorrei sistemare”PRIMA”…
Complimenti e grazie

Reply
- LowLevel scrive il 31 March 2018 at 09:36
  
  Ciao Roberto,
  
  personalmente non ho molto da aggiungere e la ragione è che l’articolo aveva principalmente lo scopo di mostrare come pianificare un test e come fare un’indagine per raggiungere una conclusione.
  
  Penso che la conclusione in sè (solo le prime 12 parole di un tag TITLE vengono considerate “parole del TITLE” da Google) sia più una curiosità che un’informazione importante, io stesso non ci bado per niente quando devo scrivere testi. 🙂