Opinion spam: un nuovo algoritmo becca le recensioni false

Alla recente conferenza WWW tenutasi a fine aprile sono state presentate, come ogni anno, una nutrita serie di documenti e studi che proponevano nuove metodologie per meglio comprendere e analizzare il web.

Opinion spammingUna parte delle paper presentate alle conferenze WWW riguardano spesso nuovi algoritmi per classificare informazioni, fare il ranking di risorse o individuare lo spam. In altre parole, algoritmi di information retrieval, la disciplina su cui si basa la tecnologia dei motori di ricerca.

Leggere i documenti presentati ad ogni conferenza è un buon modo per capire di che cosa sono teoricamente capaci gli ingegneri dei motori di ricerca o di altri servizi web che gestiscono grandi quantità di dati. Io ritengo che le informazioni acquisite leggendo questi documenti siano molto più significative di quelle che si acquisiscono leggendo i brevetti degli algoritmi di Google.

Quest’anno, un documento in particolare ha attratto la mia attenzione e vi linko anche il PDF: “Spotting Fake Reviewer Groups in Consumer Reviews“.

Si tratta di una nuova metodologia chiamata GSRank, nata per individuare attività di opinion spamming e in particolare gruppi di recensori falsi tra quelli veri e genuini che scrivono recensioni o opinioni sui portali di prodotti o servizi.

Il documento non è scritto in inglese molto scorrevole e rutta anche un po’ di matematica; il presente articolo ha l’obiettivo spiegarvi questa nuova metodologia in modo che chiunque possa capirla.

L’articolo continua, leggi il resto… »

Share

Arriva il meta referrer: conseguenze per la web analytics

Un paio di mesi fa Google annunciò una novità che sarebbe stata introdotta nel codice HTML delle SERP.

Con l’obiettivo di rendere la fruizione delle SERP più veloci per l’utente e di farlo approdare sulla pagina di destinazione il più velocemente possibile, Google ha deciso di implementare il meta tag referrer, una proposta del Web Hypertext Application Technology Working Group che rende possibile ai siti web di chiedere ai browser come gestire i contenuti dell’intestazione HTTP referer.

Utente PC disperatoQuesta soluzione, quando verrà applicata, cambierà nuovamente le carte in tavola per la web analytics.

Questo articolo mostra i primi tentativi di implementazione del meta tag referrer sulle SERP di Google, che conseguenze esso avrà per i siti sulle SERP e qualche problemino temporaneo che mi è capitato di osservare.

L’articolo continua, leggi il resto… »

Share

Quiz SEO bastardo numero 5: che cavolo mostra questa SERP?

Dopo alcuni mesi dall’ultima volta, è tornato il momento di traumatizzare un po’ di SEO.

Se non avete idea di che cosa siano i quiz SEO bastardi, vi basti sapere che sono un pretesto per fare gli smanettoni con i motori di ricerca nella speranza di capire un po’ meglio come funzionano e che il loro elenco si trova nell’apposita categoria Quiz del blog.

Il nuovo quiz SEO che sto per proporvi si differenzia da tutti i precedenti perché la risposta è libera e può essere data semplicemente commentando il post sul blog.

L’articolo continua, leggi il resto… »

Share

La mia battaglia contro le query Not Provided

Quando ho iniziato la mia ricerca per tentare di risalire alle reali query degli accessi “Not Provided” davo già per scontato che non sarei riuscito nell’impresa di risalire ai testi digitati dagli utenti.

Beninteso, non si trattava di mancanza di fiducia ma della normale conseguenza di un’osservazione: i siti su cui approdano gli utenti delle SERP non ricevono apparentemente alcuna informazione sulla query digitata.

E quindi rassegnazione e morta lì, giusto? Sbagliato. E vi spiego il perché…

L’articolo continua, leggi il resto… »

Share

Aumentare il CTR sulle SERP usando titoli alternativi

Già da diversi anni si è persa corrispondenza tra i testi che i gestori dei siti inseriscono nel tag TITLE delle pagine web ed i testi che Google poi pubblica nelle SERP per titolare i risultati in elenco.

In passato e per molti anni Google e gli altri motori di ricerca si sono limitati a mostrare il testo trovato in tale tag; la corrispondenza era così rigida che webmaster e proprietari dei siti arrivarono a dedurre che quella riga di testo sulla SERP fosse uno spazio proprio, da gestire liberamente e attraverso il quale mostrare agli utenti dei motori ciò che preferivano.

Ovviamente si trattava di un’illusione: ogni spazio sulle SERP appartiene solo ed esclusivamente al motore di ricerca e non esistono accordi con i proprietari dei siti o standard da rispettare riguardo quali testi il motore deve o non deve pubblicare nei risultati delle ricerche.

Per tale ragione, quando Google iniziò a mostrare risultati intitolati con testi diversi da quelli estratti dai tag TITLE, nacque un po’ di malumore tra i proprietari dei siti che non gradivano il fatto che Google cambiasse i “loro” titoli.

In realtà la possibilità di mostrare sulle SERP titoli diversi a seconda dei contesti è solo positiva e può essere anche sfruttata dai proprietari dei siti per aumentare il CTR sui propri risultati.

L’articolo continua, leggi il resto… »

Share

Perché il filtro anti-pubblicità di Google non è un filtro anti-pubblicità

Recentemente Google ha annunciato l’introduzione di un nuovo filtro che ha effetto sui risultati delle ricerche. Il filtro abbasserà la posizione di quei siti web che non mostrano in cima alle pagine il contenuto che dà risposta alla query dell’utente ma che costringono quest’ultimo a fare scroll per visualizzare quanto effettivamente di suo interesse.

A causa dei meccanismi tipici della comunicazione online (un mix micidiale di fonti poco chiare e condivisori che vanno sempre di fretta) il messaggio arrivato a diversi SEO è che il nuovo filtro colpisca i siti con troppa pubblicità e banner in cima alle pagine.

Questa è una semplificazione eccessiva della novità introdotta e vorrei spiegarvi perché questa interpretazione rischia di causare qualche danno se diffusa e perché conviene ragionare quache minuto in più sulla natura del nuovo algoritmo.

L’articolo continua, leggi il resto… »

Share