Post recenti
Commenti recenti
Tutti i post
-
Questa opera di Enrico Altavilla è concessa in licenza sotto la Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 3.0 Unported.
Quiz SEO bastardo numero 3: formati dei file
E’ un vero piacere riprendere l’abitudine dei quiz SEO bastardi, che tanto successo hanno riscosso prima dell’estate. Siamo giunti a quota tre e potete trovare i precedenti quiz nell’apposita categoria Quiz.
Per questo terzo quiz SEO c’è il rischio di fornire troppe informazioni se scendessi nei particolari o persino se tentassi di confondervi fornendo indizi falsi, come ho fatto in passato. Invece verrò subito al dunque e vi invito a rispondere al quesito che segue, limitandomi a dare una piccola assicurazione: la domanda non nasconde alcuna ambiguità o doppio senso.
In Google, l'operatore di ricerca "filetype:" serve a restringere i risultati ai documenti che sono nel formato indicato dall'utente. Tale affermazione è:
- Vera (79%, 46 Voti)
- Falsa (24%, 14 Voti)
Votanti totali: 58
Essendo un quiz strutturato in modo un po’ diverso dai precedenti, a prescindere che la vostra risposta sia “Vera” o “Falsa”, vi chiedo magari di scrivere un commento e spiegare perché avete risposto nel modo in cui avete risposto. Non siate timidi! I quiz sono un’occasione per fare didattica, se fornite qualche dettaglio nei commenti andrà a beneficio dell’apprendimento di tutti.
Il commento non è obbligatorio, ovviamente. Potete mantenere il vostro anonimato e limitarvi a votare. 🙂
Come al solito, lascerò le risposte aperte per un po’ di tempo e poi tra qualche giorno tireremo le somme assieme, svelando la soluzione giusta. Buon quiz a tutti! 🙂
La risposta al quiz
Essendo trascorsi un paio di giorni e notando che tra i commenti la soluzione è già stata segnalata, chiudo i voti e comunico che la risposta corretta era “Falsa”. Ovvero l’operatore “filetype:” non restituisce file del formato specificato dall’utente ma solo file che hanno l’estensione indicata dall’utente.
Il 78% di voi ha sbagliato e di ciò sono molto soddisfatto. 😀
Come ci si poteva arrivare
Innanzitutto va detto che per “formato” di un file si intende il tipo di dati che esso contiene e sopratutto come essi vengono codificati e ordinati all’interno del documento. Questo significa che per capire in che formato è un file, è necessario aprirlo e guardaci dentro.
L’estensione del file è invece semplicemente una parte del suo nome: può dare un indizio sul formato ma non determina il formato che, come detto, è determinato solo dai contenuti.
Ovviamente, formato ed estensione possono anche non combaciare, nessuno vieta di prendere un file JPEG e rinominarlo associandogli l’estensione MP3. Rimane un file che contiene un’immagine in formato JPEG ma il cui nome ha l’estensione MP3.
Uno dei modi più semplice per rendersi conto di ciò che l’operatore “filetype:” fa realmente era cercare su Google [filetype:pdf] e indagare sui file che non presentano il “tag” [PDF] né la dicitura “Formato file: PDF/Adobe Acrobat”: alcuni di essi sono normali pagine in formato HTML con un’estensione errata.
Un secondo modo è stato segnalato nei commenti: usare l’operatore specificando un nome di formato inesistente ed osservare che vengono comunque restituiti risultati, ad indicare che ciò che l’operatore fa davvero è semplicemente restringere la ricerca ai file con l’estensione indicata dall’utente.
Relazioni col SEO
Yuri, nei commenti, chiedeva giustamente quali fossero le relazioni del quiz col SEO. Anche se mi vengono in mente un paio di usi black hat (ma fessi) di questa limitazione di Google, la vera ragione per la quale vi ho dedicato un quiz è che smontando gli strumenti di Google si comprende sempre qualcosa in più del funzionamento del motore di ricerca e si possono notare fenomeni che possono insegnare qualcosa.
Per esempio, osservando i risultati della query sopra indicata si notano dei documenti in formato PDF che non vengono etichettati da Google come file PDF. Il che potrebbe indurre a congetturare che l’identificazione del formato di un file avvenga in una fase di analisi successiva a quella dell’indicizzazione oppure, altra ipotesi, che vi siano tipologie di formati PDF che l’algoritmo di Google non è in grado di riconoscere ancora.
Nel secondo caso, un approfondimento del fenomeno potrebbe portarci a scoprire se esistono tipologie di formati PDF da evitare quando desideriamo che gli stessi vengano indicizzati e valutati in quanto tali dal motore di ricerca.
Una ultima e più semplice relazione col SEO esiste, se includiamo nella cultura tipica di questa disciplina una corretta conoscenza degli operatori di ricerca dei motori.
Falso, anche se ricordo bene che una volta era vero. Qualche tempo fa usavo filetype:mp3 per, ehm, trovare musica… e funzionava, oh se funzionava.
Adesso invece filetype funziona grossomodo come inurl.
Ciao Enrico,
complimenti per questi simpatici test, bella idea!
Io ho risposto che la tua affermazione è vera, google non si limita a cercare solo pagine web, ma ha alcuni “comandi” che ti fanno entrare più nello specifico nella tua ricerca. Se per esempio io nella ricerca scrivo:”filetype:pdf manuale seo”, trovo tutti i manuali in pdf SEO.
Buona giornata
@Martino
La ricerca di MP3 potrebbe essere in qualche modo filtrata onde evitare il download di files musicali coperti da diritto d’autore.
Un “filetype:pdf” restituisce risultati molto pertinenti ed abbinandolo ad un “site:” si rileva spesso molto comodo.
Un saluto dal DON
Vera….ma:
Vera se le “risorse” richieste hanno le 10 estensioni supportate da Google: .PDF, .PS, .DWF, .KML, .KMZ, .XLS, .PPT, .DOC, .RTF, .SWF
Vera se ci soffermiamo su “restringere i risultati”. Ci sono eccezioni che confermano la regola (come si dice) ed evidenziano che Google non restituisce un file ad esempio PDF, ma restituisce una risorsa con un URL che termina con .PDF. Una risorsa .PDF, non un file PDF, ma una pagina html con estensione .PDF viene mostrata nelle SERP.
Ecco la stringa di ricerca http://www.google.com/search?num=100&hl=en&q=bombardier+filetype%3Apdf&oq=bombardier+filetype%3Apdf
O anche un’altra eccezione: http://www.google.com/search?num=100&hl=en&q=filetype%3Axls+-inurl%3A.xls&oq=filetype%3Axls+-inurl%3A.xls
Comunque il risultato fornito con filetype: è una “restrizione a risorse di quel formato” per gran parte dei risultati…e all’utente va bene così ;).
Pronto ad essere smentito.
non lo uso praticamente mai questo operatore, ma a vedere l’output direi che la ricerca si limita ai file con “estensione” selezionata, non al tipo di file. So che è sottile, ma questa sembra anche essere la linea guida ufficiale di google
Volevo rispondere vero però mi son detto che è troppo scontato per Enrico, ho pensato alla relazione alla SEO ed anche se non ci trovo molta relazione: impostando un mime type diverso sul server si potrebbe imbrogliare Google e quindi offrire formati diversi da quelli cercati dall’utente.
Ciao,
Yuri.
Nei commenti leggevo la frase: “Vera se le “risorse” richieste hanno le 10 estensioni supportate da Google”. Io nel tempo ho utilizzato quell’operatore per cercare anche file di altri formati (es ov2, i file dei punti di interesse del tomtom). Riguardando ora in effetti li filtra ma trova anche pagine che hanno estensione .0v2 ma non sono file di quel formato.
Quoto Gareth e DrSeo. Quindi Falso. Da un punto di vista squisitamente linguistico i file in questione non “sono” ma “sembrano” essere di un certo tipo.
Diavolo!!!
Non ho mai fatto test su file non-html e non sono in grado di dare una risposta certa.
Per la mia esperienza in qualità di utente direi che è falso, dipende dal tipo di file cercato.
Cercando “filetype:dwg” vengono mostrati i risultati che riportano nell’url l’estensione richiesta, ma tutti linkano una pagina html.
@Dr. SEO: le estensioni sono molte di più.
http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=35287
When you use the filetype: operator in a Google search (for example, filetype:xml galway, Google searches for files with the .xml extension, not for files of file type XML.
la risposta è qui http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=35287
@Marco … grazie 🙂
Una ricerca con l’operatore filetype restituisce documenti con URL non parametriche che finiscono con la stringa cercata preceduta da un punto
(La stringa cercata non deve contenere spazi o caratteri speciali)
Per esempio filetype:lowlevel restituisce risultati, perché anche se non esistono documenti in formato lowlevel, esistono documenti che finiscono per .lowlevel
Mi spiace che…Google non ci arrivi ancora a capire il formato tramite mime type, eppure se indicizza i PDF ad esempio (http://googlewebmastercentral.blogspot.com/2011/09/pdfs-in-google-search-results.html ) dovrà anche riconoscerlo, si baserà solo sull’estensione?
Hehe, felice di averci azzeccato 😉
Interessanti come sempre. Posso suggerirti tuttavia di mettere un link anche al quiz, invece che di embeddarlo solo?
Normalmente leggo tramite RSS e gli embed non ci vanno d’accordo, sicchè me li perdo sempre :=)