Tag Archives: Canonical

Trarre lezioni SEO dal gigantesco bug di Google Plus

Hijacking

Siccome non uso questo blog per affrontare temi che ritengo meno interessanti, non ho scritto un articolo sul gigantesco bug di Google+ scoperto due settimane fa, quello che permette di attribuire ad una pagina di Google+ una quantità di +1 sostanzialmente arbitraria, “copiandoli” da quelli di una qualsiasi altra pagina.

Se questo bug fosse emerso su Facebook, tutti i blog markettari internazionali avrebbero probabilmente evidenziato l’incredibile falla ed i vari servizi di “vendita di like” avrebbero stappato bottiglie di Dom Pérignon. Ma siccome Google+ se lo filano in quattro gatti ed i suoi utenti attivi si calcolano sulle dita di una mano di un monco (sì, è un’iperbole) la faccenda è passata relativamente inosservata.

Se non avete idea del bug del quale sto parlando, vi segnalo un articolo riassuntivo su Engeene ed un approfondimento tecnico su Ideativi. Ne consiglio la lettura per prendere familiarità col tema di cui sto per scrivere.

L’articolo che state leggendo, tuttavia, non è dedicato al bug in sé quanto a che cosa è possibile imparare sul funzionamento di Google ragionando un po’ sulla falla che è stata trovata e sul perché essa esiste.

Sarà anche un modo per approfondire un po’ parte del processo di canonicalizzazione delle risorse.

Buona lettura!

L’articolo continua, leggi il resto… »

Cosa non fare col rel=canonical

Ho scoperto con un po’ di ritardo che le specifiche del rel=canonical sono state pubblicate in una RFC, la numero 6596.

Canonical relationPer chi non fosse pratico di Internet, basti sapere che le RFC sono i documenti che, tra le altre cose, definiscono il funzionamento di protocolli e standard usati sulla rete.

Nel caso del canonical, non si è arrivati a considerarlo un vero e proprio standard ma la RFC pubblicata di recente è la cosa che si avvicina di più ad un documento di linee guida ufficiali/ufficiose.

Io vi invito a leggere l’intero documento e mi limiterò ad evidenziare in questo breve post solo alcune delle cose che la RFC suggerisce di non fare col canonical.

Per comodità userò l’espressione informale “rel=canonical”, do per scontato che sappiate bene di che si tratta e di come tale relazione va esplicitata nel codice delle pagine HTML o nelle intestazioni HTTP.

Niente redirezioni permanenti

L’URL indicato come canonico non dovrebbe restituire un codice HTTP 301 o 300, in altre parole non dovrebbe essere una redirezione di tipo permanente.

Niente catene di rel=canonical

L’URL indicato come canonico non dovrebbe a sua volta presentare un altro rel=canonical indicante un URL diverso.

Nota mia: i rel=canonical non sono redirezioni lato server e quindi è sconsigliato creare catene di rel=canonical così come invece accade di creare catene di redirezioni.

Niente status di errore

L’URL indicato come canonico non deve restituire uno status HTTP della famiglia 4xx. Ovvero, la risorsa indicata non deve essere un errore 404 o di altro genere.

Paginazione

In caso di paginazioni, le pagine successive alla prima non dovrebbero presentare nel proprio rel=canonical l’URL della prima pagina dell’elenco.

La ragione è che l’URL indicato come canonico dovrebbe ospitare i contenuti degli URL che lo indicano come canonico.

Nota mia: per le paginazioni è corretto usare le relazioni di tipo “next” e “prev”.

P.S.
Pensavo che sarebbe interessante parlare di argomenti simili in qualche evento. Giusto per dire.