Post recenti
Commenti recenti
Tutti i post
-

Questa opera di Enrico Altavilla è concessa in licenza sotto la Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Unported.
Quiz SEO bastardo numero 6: il comando “inmeta”

Torna, a richiesta di quei poveri dipendenti da quiz che me li chiedono spesso, un nuovo Quiz SEO bastardo!
I quiz SEO bastardi sono accuratamente progettati per far scervellare i SEO. L’obiettivo dei quiz è quello di studiare un po’ i motori di ricerca e magari imparare qualcosa di nuovo durante il processo di analisi che a volte è necessario intraprendere per arrivare alla risposta corretta.
Se non conoscete i quiz SEO bastardi, date un’occhiata alla categoria del blog che li raccoglie. Adesso bando alle chiacchiere e leggete il quiz!
Quiz SEO bastardo numero 5: che cavolo mostra questa SERP?
Dopo alcuni mesi dall’ultima volta, è tornato il momento di traumatizzare un po’ di SEO.
Se non avete idea di che cosa siano i quiz SEO bastardi, vi basti sapere che sono un pretesto per fare gli smanettoni con i motori di ricerca nella speranza di capire un po’ meglio come funzionano e che il loro elenco si trova nell’apposita categoria Quiz del blog.
Il nuovo quiz SEO che sto per proporvi si differenzia da tutti i precedenti perché la risposta è libera e può essere data semplicemente commentando il post sul blog.
Quiz SEO bastardo numero 4: lunghezza massima del TITLE
Proprio quando pensavate che il post sulle “10 cagate SEO” vi avrebbe purificato e reso dotti sui motori di ricerca, torna un nuovo ed umiliante quiz SEO bastardo, a ricordarvi che chiunque può essere preso in castagna.
Se non conoscete ancora i quiz SEO bastardi vi segnalo la pagina di categoria che li raggruppa e vi comunico che la particolarità di questi quiz è che sono subdoli. Leggete bene, ragionate bene, rispondete bene.
L’unico buon modo per presentarvi questo quarto quiz è dirvi che non vi conviene archiviarlo come qualcosa che non vi cambierà la vita qualsiasi sia la risposta perché, al contrario, la risposta a questo quiz sarà dirompente e riuscirà a stanare quelli che tra di voi non sanno come funziona nemmeno l’ABC di un motore di ricerca. Promesso.
Quiz SEO bastardo numero 3: formati dei file
E’ un vero piacere riprendere l’abitudine dei quiz SEO bastardi, che tanto successo hanno riscosso prima dell’estate. Siamo giunti a quota tre e potete trovare i precedenti quiz nell’apposita categoria Quiz.
Per questo terzo quiz SEO c’è il rischio di fornire troppe informazioni se scendessi nei particolari o persino se tentassi di confondervi fornendo indizi falsi, come ho fatto in passato. Invece verrò subito al dunque e vi invito a rispondere al quesito che segue, limitandomi a dare una piccola assicurazione: la domanda non nasconde alcuna ambiguità o doppio senso.
In Google, l'operatore di ricerca "filetype:" serve a restringere i risultati ai documenti che sono nel formato indicato dall'utente. Tale affermazione è:
- Vera (79%, 46 Voti)
- Falsa (21%, 14 Voti)
Votanti totali: 58
Essendo un quiz strutturato in modo un po’ diverso dai precedenti, a prescindere che la vostra risposta sia “Vera” o “Falsa”, vi chiedo magari di scrivere un commento e spiegare perché avete risposto nel modo in cui avete risposto. Non siate timidi! I quiz sono un’occasione per fare didattica, se fornite qualche dettaglio nei commenti andrà a beneficio dell’apprendimento di tutti.
Il commento non è obbligatorio, ovviamente. Potete mantenere il vostro anonimato e limitarvi a votare.
Come al solito, lascerò le risposte aperte per un po’ di tempo e poi tra qualche giorno tireremo le somme assieme, svelando la soluzione giusta. Buon quiz a tutti!
La risposta al quiz
Essendo trascorsi un paio di giorni e notando che tra i commenti la soluzione è già stata segnalata, chiudo i voti e comunico che la risposta corretta era “Falsa”. Ovvero l’operatore “filetype:” non restituisce file del formato specificato dall’utente ma solo file che hanno l’estensione indicata dall’utente.
Il 78% di voi ha sbagliato e di ciò sono molto soddisfatto.
Come ci si poteva arrivare
Innanzitutto va detto che per “formato” di un file si intende il tipo di dati che esso contiene e sopratutto come essi vengono codificati e ordinati all’interno del documento. Questo significa che per capire in che formato è un file, è necessario aprirlo e guardaci dentro.
L’estensione del file è invece semplicemente una parte del suo nome: può dare un indizio sul formato ma non determina il formato che, come detto, è determinato solo dai contenuti.
Ovviamente, formato ed estensione possono anche non combaciare, nessuno vieta di prendere un file JPEG e rinominarlo associandogli l’estensione MP3. Rimane un file che contiene un’immagine in formato JPEG ma il cui nome ha l’estensione MP3.
Uno dei modi più semplice per rendersi conto di ciò che l’operatore “filetype:” fa realmente era cercare su Google [filetype:pdf] e indagare sui file che non presentano il “tag” [PDF] né la dicitura “Formato file: PDF/Adobe Acrobat”: alcuni di essi sono normali pagine in formato HTML con un’estensione errata.
Un secondo modo è stato segnalato nei commenti: usare l’operatore specificando un nome di formato inesistente ed osservare che vengono comunque restituiti risultati, ad indicare che ciò che l’operatore fa davvero è semplicemente restringere la ricerca ai file con l’estensione indicata dall’utente.
Relazioni col SEO
Yuri, nei commenti, chiedeva giustamente quali fossero le relazioni del quiz col SEO. Anche se mi vengono in mente un paio di usi black hat (ma fessi) di questa limitazione di Google, la vera ragione per la quale vi ho dedicato un quiz è che smontando gli strumenti di Google si comprende sempre qualcosa in più del funzionamento del motore di ricerca e si possono notare fenomeni che possono insegnare qualcosa.
Per esempio, osservando i risultati della query sopra indicata si notano dei documenti in formato PDF che non vengono etichettati da Google come file PDF. Il che potrebbe indurre a congetturare che l’identificazione del formato di un file avvenga in una fase di analisi successiva a quella dell’indicizzazione oppure, altra ipotesi, che vi siano tipologie di formati PDF che l’algoritmo di Google non è in grado di riconoscere ancora.
Nel secondo caso, un approfondimento del fenomeno potrebbe portarci a scoprire se esistono tipologie di formati PDF da evitare quando desideriamo che gli stessi vengano indicizzati e valutati in quanto tali dal motore di ricerca.
Una ultima e più semplice relazione col SEO esiste, se includiamo nella cultura tipica di questa disciplina una corretta conoscenza degli operatori di ricerca dei motori.
Quiz SEO bastardo numero 2: il PageRank rubato
Non riuscirete ad azzeccare la risposta a questo nuovo quiz. E’ tutto congegnato affinché non vi riusciate, persino la sicurezza che ostento nell’affermazione appena fatta rientra tra le subdole tattiche psicologiche per impedirvi di rispondere correttamente.
Il primo quiz SEO bastardo sembra aver riscosso abbastanza successo e approfitto dell’occasione per segnalarvi che lo trovate, assieme a tutti i quiz futuri, nella categoria Quiz di LowLevel.it.
L’argomento di questo secondo quesito è il PageRank; già da tempo Google sta facendo pressione affinché i webmaster ed i SEO prestino meno attenzione alla barretta verde e questo avviene probabilmente per cercare di incentivare un approccio più markettaro che tecnologico.
Ciò è buono, ma nel riportare il verbo di Google bisogna evitare le eccessive generalizzazioni: si dice che il PageRank sia pressoché inutile ma nessuno specifica inutile per quale obiettivo. Ciò è male. Cosa c’entra tutto questo disquisire con il quiz? Nulla, divago per confondervi.
Quiz SEO bastardi a cui credete di saper rispondere (1)
Alla luce dell’inevitabile confusione che alberga nel mondo empirico del SEO, ove tutto sembra opinabile, mi è venuta l’idea di proporre qualche post “didattico” sfruttando quell’infido stratagemma che è il quiz.
Con questo articolo inauguro dunque una serie di quesiti che vi verranno posti attraverso semplici sondaggi.
Come funziona: voi rispondete al quiz e poi tornate dopo qualche giorno per vedere se ci avete azzeccato o se sono riuscito a fregarvi in qualche modo. I commenti saranno a vostra disposizione per eventuali reclami e linciaggi.
Una nota alla quale tengo molto: i quiz saranno bastardi, perché metterò le dita nelle piaghe più doloranti della cultura SEO e perché potrei anche fuorviarvi tendendovi volutamente dei trabocchetti.
Adesso bando alle ciance e rispondete al seguente quiz!
Il quiz
A cosa serve l'istruzione Disallow nel file robots.txt?
- A chiedere allo spider di non effettuare richieste di una o più risorse (52%, 37 Voti)
- A non far indicizzare una o più risorse (24%, 17 Voti)
- A chiedere al motore di non effettuare richieste HTTP GET di una o più risorse, consentendo però le richieste di tipo HEAD (20%, 14 Voti)
- A chiedere al motore di rimuovere una o più risorse dall'indice (3%, 2 Voti)
- A non far apparire nelle SERP una o più risorse (1%, 1 Voti)
Votanti totali: 71
Avete votato? Tra qualche giorno, quando saranno stati accumulati un po’ di voti, potrò rendere pubblici i risultati e la risposta esatta.
Nel frattempo fatemi sapere se l’iniziativa è di vostro gradimento.
La risposta al quiz
Dopo una settantina di risposte, ho deciso che il quiz poteva essere chiuso. Ecco di seguito i risultati.
La maggioranza ha risposto “A chiedere allo spider di non effettuare richieste di una o più risorse” e ha dato risposta esatta!
Detta in parole più spicce ma non proprio precise, il Disallow serve solo a chiedere agli spider di non scaricare una risorsa. E questo non produce affatto una “non indicizzazione”, come spiegherò tra poco.
La gogna pubblica e le spiegazioni
Passo adesso alla pubblica gogna, fortunatamente anonima nei confronti di tutti i votanti, e spiego perché nessuna delle altre risposte andava bene.
“A chiedere al motore di non effettuare richieste HTTP GET di una o più risorse, consentendo però le richieste di tipo HEAD” è una risposta che mi sono inventato di sana pianta per introdurre un’opzione affascinante per i geek in vena di tecnicismi.
Ho fatto di più: ho volutamente votato questa risposta errata subito dopo la pubblicazione del sondaggio, nella speranza di creare qualche dubbio ai votanti successivi e incentivare indirettamente congetture e approfondimenti.
In realtà l’istruzione Disallow chiede allo spider di non accedere ad alcuna risorsa prescindendo dalla modalità HTTP: che sia GET, HEAD, POST o altro, il divieto vale sempre.
Se beccate uno spider ad accedere ad una risorsa in Disallow con un metodo HEAD, sappiate che lo sta facendo perché ha deciso di fregarsene del robots.txt e non perché l’accesso di tipo HEAD sia contemplato o accettabile o previsto dal Robots Exclusion Standard.
Nota utile per eventuali quiz futuri: il fatto che un Disallow non consenta nemmeno le richieste via HEAD significa che una risorsa bloccata non permette agli spider di sapere nemmeno che intestazioni HTTP essa restituisce (redirect 30X, 404, ecc.).
“A non far indicizzare una o più risorse” si è beccata ben 17 voti e si è piazzata al secondo posto dopo la risposta esatta.
Quando scrivevo di “le piaghe più doloranti della cultura SEO” pensavo proprio all’ambiguità del termine “indicizzazione” e all’incredibile confusione che esiste nel settore attorno a questo termine. Un secondo posto non dovrebbe dunque sorprendere.
La spiega: ogni risorsa è identificata da un URL e quando un motore di ricerca viene a conoscenza di un nuovo URL, può già considerarlo una risorsa a propria disposizione. A questo punto inizia ad associare alla risorsa e ad inserire in un indice (questo significa indicizzare) quante più informazioni riesce a trovare.
Nel caso in cui lo spider abbia accesso alla risorsa, sarà possibile associare ad essa (indicizzare) anche i suoi contenuti, per esempio il testo nel corpo di una pagina HTML.
Nel caso in cui lo spider non possa accedere alla risorsa a causa del Disallow, sarà possibile associare ad essa (indicizzare) solo informazioni esterne alla risorsa, per esempio il testo dei link che puntano ad essa.
In entrambe i casi, la risorsa è presente nell’indice, solo che nel caso in cui essa sia in Disallow la quantità di informazioni nell’indice sarà inferiore, perché non saranno presenti i suoi contenuti.
Questa è la ragione per la quale una risorsa in Disallow può apparire in una SERP: di fatto è indicizzata, sebbene con meno dati rispetto ad una risorsa a cui lo spider può accedere.
La risposta “A chiedere al motore di rimuovere una o più risorse dall’indice” è errata per quanto appena spiegato: il Disallow non impedisce al motore di indicizzare la risorsa.
Risposta “A non far apparire nelle SERP una o più risorse“: vedi sopra.
Conclusioni
Arrivare alla risposta esatta è facile se si conoscono un po’ le basi del robots exclusion standard e come il motore indicizza le risorse. Inoltre la risposta era già presente nel flow chart sull’indicizzazione che vi avevo proposto in un post precedente.
Spero che questo primo quiz SEO bastardo vi sia piaciuto, perché ne ho in cantiere già un altro paio ed uno in particolare sarà davvero meschino.
Per approfondimenti e discussioni i commenti sono sempre a vostra disposizione.

