Tag Archives: Formato

Quiz SEO bastardo numero 3: formati dei file

Quiz SEOE’ un vero piacere riprendere l’abitudine dei quiz SEO bastardi, che tanto successo hanno riscosso prima dell’estate. Siamo giunti a quota tre e potete trovare i precedenti quiz nell’apposita categoria Quiz.

Per questo terzo quiz SEO c’è il rischio di fornire troppe informazioni se scendessi nei particolari o persino se tentassi di confondervi fornendo indizi falsi, come ho fatto in passato. Invece verrò subito al dunque e vi invito a rispondere al quesito che segue, limitandomi a dare una piccola assicurazione: la domanda non nasconde alcuna ambiguità o doppio senso.

In Google, l'operatore di ricerca "filetype:" serve a restringere i risultati ai documenti che sono nel formato indicato dall'utente. Tale affermazione è:

  • Vera (79%, 46 Voti)
  • Falsa (24%, 14 Voti)

Votanti totali: 58

Essendo un quiz strutturato in modo un po’ diverso dai precedenti, a prescindere che la vostra risposta sia “Vera” o “Falsa”, vi chiedo magari di scrivere un commento e spiegare perché avete risposto nel modo in cui avete risposto. Non siate timidi! I quiz sono un’occasione per fare didattica, se fornite qualche dettaglio nei commenti andrà a beneficio dell’apprendimento di tutti.

Il commento non è obbligatorio, ovviamente. Potete mantenere il vostro anonimato e limitarvi a votare. 🙂

Come al solito, lascerò le risposte aperte per un po’ di tempo e poi tra qualche giorno tireremo le somme assieme, svelando la soluzione giusta. Buon quiz a tutti! 🙂

La risposta al quiz

Essendo trascorsi un paio di giorni e notando che tra i commenti la soluzione è già stata segnalata, chiudo i voti e comunico che la risposta corretta era “Falsa”. Ovvero l’operatore “filetype:” non restituisce file del formato specificato dall’utente ma solo file che hanno l’estensione indicata dall’utente.

Il 78% di voi ha sbagliato e di ciò sono molto soddisfatto. 😀

Come ci si poteva arrivare

Innanzitutto va detto che per “formato” di un file si intende il tipo di dati che esso contiene e sopratutto come essi vengono codificati e ordinati all’interno del documento. Questo significa che per capire in che formato è un file, è necessario aprirlo e guardaci dentro.

L’estensione del file è invece semplicemente una parte del suo nome: può dare un indizio sul formato ma non determina il formato che, come detto, è determinato solo dai contenuti.

Ovviamente, formato ed estensione possono anche non combaciare, nessuno vieta di prendere un file JPEG e rinominarlo associandogli l’estensione MP3. Rimane un file che contiene un’immagine in formato JPEG ma il cui nome ha l’estensione MP3.

Uno dei modi più semplice per rendersi conto di ciò che l’operatore “filetype:” fa realmente era cercare su Google [filetype:pdf] e indagare sui file che non presentano il “tag” [PDF] né la dicitura “Formato file: PDF/Adobe Acrobat”: alcuni di essi sono normali pagine in formato HTML con un’estensione errata.

Un secondo modo è stato segnalato nei commenti: usare l’operatore specificando un nome di formato inesistente ed osservare che vengono comunque restituiti risultati, ad indicare che ciò che l’operatore fa davvero è semplicemente restringere la ricerca ai file con l’estensione indicata dall’utente.

Relazioni col SEO

Yuri, nei commenti, chiedeva giustamente quali fossero le relazioni del quiz col SEO. Anche se mi vengono in mente un paio di usi black hat (ma fessi) di questa limitazione di Google, la vera ragione per la quale vi ho dedicato un quiz è che smontando gli strumenti di Google si comprende sempre qualcosa in più del funzionamento del motore di ricerca e si possono notare fenomeni che possono insegnare qualcosa.

Per esempio, osservando i risultati della query sopra indicata si notano dei documenti in formato PDF che non vengono etichettati da Google come file PDF. Il che potrebbe indurre a congetturare che l’identificazione del formato di un file avvenga in una fase di analisi successiva a quella dell’indicizzazione oppure, altra ipotesi, che vi siano tipologie di formati PDF che l’algoritmo di Google non è in grado di riconoscere ancora.

Nel secondo caso, un approfondimento del fenomeno potrebbe portarci a scoprire se esistono tipologie di formati PDF da evitare quando desideriamo che gli stessi vengano indicizzati e valutati in quanto tali dal motore di ricerca.

Una ultima e più semplice relazione col SEO esiste, se includiamo nella cultura tipica di questa disciplina una corretta conoscenza degli operatori di ricerca dei motori.