Quiz SEO bastardo numero 5: che cavolo mostra questa SERP?

Dopo alcuni mesi dall’ultima volta, è tornato il momento di traumatizzare un po’ di SEO.

Se non avete idea di che cosa siano i quiz SEO bastardi, vi basti sapere che sono un pretesto per fare gli smanettoni con i motori di ricerca nella speranza di capire un po’ meglio come funzionano e che il loro elenco si trova nell’apposita categoria Quiz del blog.

Il nuovo quiz SEO che sto per proporvi si differenzia da tutti i precedenti perché la risposta è libera e può essere data semplicemente commentando il post sul blog.

Bando alle ciance, ecco la domanda:

Che contenuti vengono mostrati dalla query [link:zhool8dxBV4J:www.lowlevel.it] e che cosa essa chiede esattamente a Google?

Allego anche uno screenshot dei contenuti attuali della SERP, così come li osservo io via Firefox da utente non loggato.

Screenshot della SERP strana.

Sia ben chiaro che verrà dichiarata vincitrice la persona che fornirà nei commenti entrambe le informazioni richieste: 1) che cosa viene mostrato e 2) che cosa la query chiede a Google!

I commenti sono aperti e tra qualche giorno modificherò l’articolo per dare la soluzione e per dichiarare il vincitore, sempre se ce ne sarà uno. 😀

Buon quiz!

La risposta al quiz

La query chiede a Google di eseguire il comando “link:” sull’URL “http://www.google.com/”, il cui identificativo è la stringa “zhool8dxBV4J”. La SERP mostra, di conseguenza, i risultati tipici di quel comando, ovvero una selezione di risorse che offrono un link all’URL suddetto.

La stringa è identificatrice di uno specifico URL, non di un nome di dominio o di qualche altro genere di entità. Potete svolgere alcune ricerche per rendervi conto che gli URL “https://mail.google.com/” e “http://mail.google.com/” hanno ID diversi.

Quando viene fornito un ID attraverso la sintassi indicata, l’URL specificato in coda viene controllato affinché corrisponda ad un URL valido ma viene ignorato in fase di scelta dell’URL da usare col comando “link:”.

And the winner is…

Riguardo il vincitore del quiz, nessuno ha fornito una risposta precisa, sopratutto perché nella maggior parte delle risposte si è parlato genericamente di “link a google.com” invece di un URL esatto. Tenuto conto che gli ID cambiano anche al cambiare di un solo carattere dell’URL, si trattava di un particolare con una certa rilevanza.

Tuttavia il concetto di base è stato azzeccato da molti e quindi assegno la vittoria a Danilo Petrozzi, che lo ha espresso per primo! :)

Il premio della critica va a Giuseppe, che ha dettagliato un po’ in che modo può essere usato l’ID e a Criss, che è stato l’unico a indicare esattamente a quale URL si riferiva l’ID.

Due parole sugli ID degli URL

Gli ID usati nei contesti descritti dall’articolo e nei commenti esistono da molti anni e, per quello che è possibile osservare dall’esterno, la loro modalità di uso da parte di Google non è cambiata nel tempo. La loro lunghezza è sempre stata di dodici caratteri, l’ID dell’URL “http://www.google.com/” non è mai cambiato da quando, diversi anni fa, tali ID sono stati resi visibili esternamente.

Viene da chiedersi se la quantità di identificatori che possono essere contenuti in quella quantità di testo è sufficiente a contenere tutti gli URL sul web e quelli futuri. Si fa presto a fare due calcoli…

L’alfabeto usato per l’ID è composto da 63 simboli diversi: l’alfabeto inglese maiuscolo, l’alfabeto inglese minuscolo, le dieci cifre decimali e il carattere underscore “_”.

Essendo la stringa lunga dodici caratteri, la quantità di ID generabili è 63^{12}, ovvero 3.909.188.328.478.827.879.681, che sono sufficienti per contenere la quantità di URL di cui il web è attualmente composto.

Non c’è modo di sapere dall’esterno in che modo l’ID viene generato e gestito da Google. Potrebbe trattarsi di un semplice valore pseudocasuale, generato e assegnato ad ogni nuovo URL scoperto dal motore facendo attenzione che non sia già stato assegnato ad un altro URL, oppure potrebbe trattarsi di un valore derivante da una formula di hash ben precisa, che ovviamente avrebbe costretto i progettisti del motore a tener conto delle collisioni e a sfruttare una funzione di hash perfetto.

Non si tratta dell’unico ID usato esternamente da Google per gli URL. Per esempio, per i link che dalle SERP puntano alle risorse esterne viene usato il parametro “usg”, il cui contenuto identifica l’URL di destinazione del link e che fa uso di uno spazio molto più grande di quello usato per l’ID discusso finora.

Fine dei pipponi informatici! Di qualche altro dettaglio parlerò rispondendo ai commenti. :)

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.

15 Responses to Quiz SEO bastardo numero 5: che cavolo mostra questa SERP?

  1. Danilo Petrozzi scrive il 21 April 2012 at 14:27

    I risultati mostrati sono gli stessi di un eventuale “link:www.google.com” senza spazio dopo i due punti. (zhool8dxBV4J si riferisce solo a google.com, credo faccia riferimento a sottoindici ma non ne sono sicuro al 100%. L’aggiunta di http://www.lowlevel.it è solo per deviarci, “link:zhool8dxBV4J:www.noobchilegge.com” ci da gli stessi risultati 😀 ).
    Per quanto riguarda “cosa stiamo chiedendo a bigG”, si tratta di tutti quei siti che contengono tag <a> (link) che puntano direttamente alla homepage di “www.google.com”. Il primo risultato è http://www.w3.org/XML/ perchè nel suo codice troviamo:

    You could also try a search engine such as <a href=”http://www.google.com/” rel=”nofollow”>Google</a> for:

    Un saluto da Terni 😉

    • LowLevel scrive il 24 April 2012 at 10:40

      @Danilo Petrozzi: complimenti per l’analisi corretta! :) Aggiungo solo una precisazione riguardo il funzionamento della sintassi di quel comando: l’aver scelto “www.lowlevel.it” è servito ovviamente per depistare 😀 tuttavia l’aggiunta di un URL in coda non è opzionale ma necessaria affinché la query venga interpretata correttamente.

  2. Giuseppe scrive il 21 April 2012 at 15:03

    Allora, provo a dire qualcosa di più o meno sensato.

    link: è un operatore che restituisce la pagine che puntano a un URL

    zhool8dxBV4J è una roba che salta fuori chiedendo una copia cache. A quanto ho visto a ogni URL viene associato un codice fisso, replicabile in qualsiasi sessione o browser o estensione di google. Per http://www.lowlevel.it è MdkTrtSlvqUJ

    http://webcache.googleusercontent.com/search?q=cache:MdkTrtSlvqUJ:www.lowlevel.it/

    a patto di cliccare il link nella SERP ora posto nella preview, altrimenti la copia cache è locata a http://webcache.googleusercontent.com/search?q=cache%3Ahttp%3A%2F%2Fwww.lowlevel.it

    zhool8dxBV4J è associato a google.com

    http://webcache.googleusercontent.com/search?q=cache:zhool8dxBV4J:www.lowlevel.it/ (o di qualunque altro sito) infatti restituisce la cache di google.com

    la query link:zhool8dxBV4J:www.lowlevel.it quindi mostra le pagine che linkano a google.com (si può fare la query link:google.com) anche se provava a chiedere quelle linkanti a http://www.lowlevel.it con il codice associato a un altro sito.

    le query che si possono fare su questo codice sono quelle relative a un’URL

    cache:
    link:
    related:
    info:

    Non so che uso google faccia del codice, per il resto spero di non aver detto vaccate…

    Giuseppe

    PS. Enrico forse hai un problema con WP touch, vedo la versione mobile da desktop

    • LowLevel scrive il 21 April 2012 at 15:26

      Ciao Giuseppe, grazie per la segnalazione del problema con la versione mobile del sito! Ho disabilitato il plugin in attesa di risolvere definitivamente il problema. :)

  3. Sebastiano Montino scrive il 21 April 2012 at 15:22

    Ecco la soluzione:
    – link:www.androidiani.com
    link:4a-m2gnL_scJ:www.androidiani.com

    Sbaglio o queste due query ritornano lo stesso risultato?

    In pratica si riferisce alla copia cache di Google. Infatti è ciò che si passa a webcache.googleusercontent.com tramite il parametro in GET “q”.

    Quindi link:zhool8dxBV4J:www.lowlevel.it mostra i link in ingresso per “la copia cache” di lowlevel.it, e cioè lowlevel.it stesso.
    Spero di non aver scritto imprecisioni gravi 😀
    Ciao!
    S.

  4. Sebastiano Montino scrive il 21 April 2012 at 15:25

    Ok, detto la cavolata. Il “parametro” associato a lowlevel.it è MdkTrtSlvqUJ. Quei link sembrano di google.
    No matter what you append :)

  5. Criss scrive il 21 April 2012 at 16:05

    Ciao Enrico, ti rispondo in modo breve e conciso.
    1)Stai mostrando i backlink di http://www.google.com
    2)Gli stai chiedendo in un determinato momento che lui ha fissato con “zhool8dxBV4J” i backlink proprio di quel momento. Lo fa per risparmiare tempo e risorse. Quando farà un’altra scansione il codice sarà diverso e anche i risultati.

    Ho vinto qualche cosa? 😀

    • LowLevel scrive il 24 April 2012 at 10:43

      @Criss: no, non hai vinto. 😛

      E’ corretta la tua prima risposta ma non la seconda, perché l’ID non fa riferimento a contesti temporali ed è basato solo sull’URL.

    • Criss scrive il 24 April 2012 at 11:34

      Spiego qua cos’ho notato e cosa mi ha fatto pensare ad un’ID “temporale”..o meglio forse ad un errore di google a questo punto 😉

      link:zhool8dxBV4J:www.lowlevel.it
      questo comando ci offre i backlinks di http://www.google.com come detto, ma provando in maniera empirica a vedere cosa succedeva variando il nome a dominio dopo i due punti
      link:zhool8dxBV4J:www.google.com
      accadeva la stessa cosa, quindi sempre gli stessi backlink
      e quindi mi son detto…variamo invece il codice per vedere cosa succede…e tra tutti questo:
      link:zhool8dxBV4F:www.lowlevel.it
      Mi da il medesimo risultato.
      Il codice quindi NON è univoco e mi ha fatto pensare ad una variazione temporale…
      A te Enrico illuminarmi adesso 😉

    • LowLevel scrive il 1 May 2012 at 22:18

      @Criss: non è possibile sapere che algoritmo viene usato per produrre un ID da associare ad un URL e quindi non c’è modo di sapere perché diversi ID facciano riferimento allo stesso URL, però il fenomeno non dimostra che siano stati prodotti ed usati da Google ID diversi per lo stesso URL. L’ID leggermente diverso che hai creato tu… l’hai creato tu e non sta nel DB di Google. :) Poi c’è un algoritmo di conversione da ID a URL che mappa anche l’ID da te creato (e diversi altri che ho trovato) sullo stesso URL, ma la ragione di ciò è semplicemente correlata all’algoritmo di hashing, a noi sconosciuto, che viene usato per produrre gli ID partendo dagli URL.

  6. Maurizio Petrone scrive il 22 April 2012 at 00:39

    Hai trovato un’identificatore dell’URL.

    http://www.google.it/search?q=link:zhool8dxBV4J:www.example.com
    Esattamente gli stessi backlink.
    Quello zhool8dxBV4J è con ogni probabilità l’ID dell’URL (in questo caso google.com, grazie ai commentatori precedenti per la dritta) utilizzato nella struttura di database di Google.

    Controprova:
    http://webcache.googleusercontent.com/search?q=cache:zhool8dxBV4J:www.example.com (nota l’ID)

    E mi pare che Google faccia un controllo incrociato della corrispondenza tra l’URL dichiarato e l’ID (come misura “di sicurezza”).

    Ora come ora non ne sono certo, ma l’interrogazione al servizio che fornisce il toolbar pagerank, non usava una logica simile (se non proprio la medesima)? Se sì, ricordo che la formula per calcolare l’ID a partire dall’URL era pure nota.

    • LowLevel scrive il 24 April 2012 at 10:53

      Ciao Maurizio! Sì, anche il servizio che fornisce il toolbar PR richiede un hash dell’URL e il codice per calcolarlo è noto. Si tratta comunque di un algoritmo di hashing diverso rispetto a quello discusso nell’articolo ed è usato esclusivamente per il servizio della toolbar.

  7. Raffaello Tolfa scrive il 22 April 2012 at 09:44

    In merito al tuo PS: beh non sarebbe male un avento dove si parli solo di SEO e avanzato! Non ne posso più di questi eventi “contenitori”, 30 minuti, massimo un’ora per dire poco o nulla (e poi tutti argomenti slegati tra loro). Ok, polemica finita :)

  8. Giuseppe scrive il 25 April 2012 at 12:19

    Il premio della critica non è affatto male :)

    L’ultimo commento di Criss comunque mischia un po’ le carte in tavola… :/

    • Criss scrive il 26 April 2012 at 12:55

      Eggià…e poi a seconda della risposta che riceverò ho già un’altra obiezione pronta 😀

Lascia un commento

More in Quiz
Quiz SEO bastardo numero 4: lunghezza massima del TITLE

Proprio quando pensavate che il post sulle "10 cagate SEO" vi avrebbe purificato e reso dotti sui motori di ricerca,...

Close