Penalizzazione per anti-duplicazione: come l’ho vista e come ne sono uscito

Scritto il 19 mag 2009 in Posizionamento8 commenti letto 1295 volte.

Dell’esistenza del malefico filtro anti-duplicazione di Google ormai ne conosciamo tutti l’esistenza, è il peggiore incubo dei webmaster e avversario dei SEO. Probabilmente molti di noi ne hanno avuto a che fare direttamente, suo malgrado, e ne hanno subito le inflessibili punizioni e penalizzazioni.

Anche io non mi nascondo ed ho conosciuto la sua pesante zavorra a mie spese, proprio con questo blog, di cui ne curo minuziosamente ogni sua più piccola parte, al fine di spingere al massimo la scalata nelle serp di mio interesse. Ho sbagliato agendo in maniera piuttosto grottesca e banale, ma sinceramente non credevo che gli algoritmi di Google fossero così affinati.

Nulla sfugge a Google

Anzitutto chiariamo un concetto molto importante: non vengono penalizzati solo i contenuti duplicati identici, ma anche quelli molto simili. Per quanto possa sembrare scontato ed ovvio non è così per tutti, e sopratutto bastano brevi frasi composte da 3 o 4 parole per insospettire Google e farlo arrabbiare.

Questo è il mio post incriminato, il quale appariva copiato da questo articolo sul blog di Google. Effettivamente vi erano dei piccoli stralci di frasi piuttosto uguali o comunque molto simili, che parevano ripresi pari pari da una fonte già esistente ( e con un trustrank palesemente più elevato del mio).

Nonostante questo il mio articolo si posiziona piuttosto bene fin da subito, come succede più o meno sempre per qualunque nuova pagina venga pubblicata su internet, anche per key legate appunto ad Analytics, quindi ben competitive. Dopo un paio di giorni però inizia il mio dramma più totale.

Dal mio quotidiano controllo dei principali posizionamenti di IoWebmaster, mi accorgo di essere stato retrocesso di circa 30 posizioni (tre pagine) su tutte le serp di mio interesse, solo cercando il nome di questo blog tutto rimane invariato. Per cui intuisco che non si tratta di una vera e propria penalizzazione, ma di una improvvisa perdita di Trustrank.
Quello che non mi tornava era che non avevo fatto nulla di particolare, sopratutto in merito ai backlink che sono stati il mio primo pensiero.

L’intuizione e il filtro anti-duplicazione

Utilizzo subito tutti gli strumenti di controllo dei link in entrata, per avere un quadro immediato della mia situazione. Dapprima mi collego col mio account al centro webmaster, ma non trovo niente di strano. Passo quindi al setaccio col Site Explorer di Yahoo, ma anche questo mi dà esito negativo.

Penso che probabilmente se la causa è un link molto recente ancora non lo troverà con questi strumenti, per cui cerco l’url non attivo di questo blog (iowebmaster.com) nella speranza di trovare la pagina che contiene un eventuale rimando, ma anche in questo caso non trovo nulla.

Alla fin fine l’unico mio intervento è stato pubblicare l’ultimo post riguardante appunto Google Analytics. Per cui controllo il suo posizionamento e mi accorgo che è misteriosamente sparito. Anche cercandolo col suo nome preciso ed identico non appare mai nelle serp. A questo punto la situazione appare più chiara e la soluzione più vicina.

Eseguo la prova del nove che dà conferma ai miei sospetti. Prendo degli spezzoni di frasi di circa 6-7 parole da quell’articolo e le cerco su Google, mettendole rigorosamente frà virgolette (ad es. “frase del mio articolo incriminato”) e le vedo apparire oltre che su questo blog, anche su quello ufficiale di Google. Ormai la causa di tutto appare evidente, così come la soluzione.

Google, il gigante buono

Per evitare ogni ulteriore conseguenza decido di eliminare quell’articolo, poichè lasciarlo anche se modificato potrebbe non bastare.

Per prima cosa lo blocco tramite il file robots.txt, in questo modo posso richiederne la rimozione nel centro webmaster di Google, poichè qualche volta non è sufficiente che la pagina da eliminare restituisca errore 404.
Fatto ciò dal pannello di amministrazione del blog elimino il post in questione. Ormai l’ho tolto dalla faccia della terra ed ho indicato a Google di cancellarlo dai suoi archivi.
Non resta che aspettare e sperare.

Dopo circa 30 minuti noto che ha già scaricato il nuovo robots.txt, per cui ha già recepito il comando di non accedere più in quella pagina. Infatti a dimostrazione di questo per una keyword ho già ripreso la mia vecchia posizione. Segno questo che nonostante il mio errore, si fida ancora del mo sito e ne tiene comunque di conto.

La situazione poi non cambia fino al giorno dopo. La mia richiesta di rimozione ancora non è stata portata a termine, ma quel che conta è che ho già recuperato le mie amate posizioni, quindi Google mi ha perdonato per il mio errore in meno di 18 ore.

La curiosità è che dopo quanto successo, per il post successivo ho notato una certa diffidenza di Google, poichè anche a poche ore dalla sua pubblicazione non si è posizionato subito bene, quasi come che ancora fosse un pò diffidente nei miei confronti.

Conclusioni

Dopo questa mia case history ho capito alcune cose veramente importanti:

  • Il filtro anti-duplicazione agisce senza pietà al primo accenno di contenuto non originale
  • Solitamente la penalizza consiste nella diminuzione del Trust Rank di un sito
  • Non solo ciò che è identico viene punito, ma anche i contenuti molto simili rientrano trà le sue vittime
  • Nello sviluppo di un sito è bene agire un passo alla volta, in maniera tale da capire subito se si sbaglia, dove stà l’errore per intervenire prontamente

Spero di aver fatto cosa gradita condividendo questo mio episodio e di aver aiutato qualcuno a farsi voler bene da Google.

Articoli che potrebbero interessarti

8 comments

» Comments RSS Feed
  1. Interessante, ma credo che il filtro sia stato affinato proprio in questi giorni, mi è capitata la stessa cosa, con un aggregatore di rss autorizzato dai siti fonte, per mesi si faceva i suoi 3000/3500 unici al giorno, circa due settimane fà senza alcun preavviso il sito si macina 6000 unici in una giornata, la mattina dopo la triste scoperta, a malapena oggi si fà 500 unici al giorno fiondando tutti i risultati frà la quarta e quinta pagina delle serp…
    Il problema nel mio caso è che non si parla di un unico articolo, ma di excerp di migliaia di articoli, dovrei brasare a zero il sito per uscire dalla penalizzazione…
    la domanda sorge spontanea, aggregatori come liquida, wikio che utilizzano la stessa tecnica, come vengono visti? non incappano in penalizzazioni?
    ciao

  2. Ciao Marco,
    credo che tutto dipenda sempre dai backlink e dal trustrank acquisito. Il problema secondo me, esiste per i pesci medio-piccoli o per chi vuole iniziare, i grossi portali hanno acquisito un apprezzamento consolidato negli utenti, quindi credo anche con Google.

  3. Ciao Psyco… Ma agisce anche se hai copiato 2 righe da un sito in un testo di 100 righe per esempio?

  4. Ciao Turbo,
    beh non posso essere così preciso nel fare una valutazione, però ho notato che Google stà diventando sempre più severo ed inflessibile in questo ambito.

  5. Interessante. Non credevo che ci fosse una penalizzazione così drastica. Sei sicuro della correlazione delle due cose?

    Domanda: allora io che sul mio blog, nella barra laterale, ho un’elenco di articoli recenti dalla blogosfera che ho trovato interessanti (con un piccolo excerpt) avrei una penalizzazione esagerata su tutte le pagine?

    Non sono in grado di fare test in quanto il blog è relativamente nuovo e, ad esempio, non ha ancora un attribuzione di PR (almeno “pubblica”).

  6. Ciao Matteo,
    beh la correlazione è stata dimostrata dal fatto che appena ho rimosso l’articolo incriminato tutto è tornato alla normalità.

    Ho visto il tuo sito e credo che Google sappia riconoscere dei piccoli estratti da una più volgare scopiazzatura, io però terrei li occhi aperti sopratutto se non hai un trust solido o una buona link popularity.

  7. Ciao,
    però si diceva anche che quando si postano parti di articoli, è sufficiente e altresì importante, mettere il link alla risorsa originaria. Ciò al fine di evitare la duplicazione dei contenuti.
    Ad esempio, se lavori su più magazine e vuoi riportare un link di un articolo che tu stesso hai scritto, dovrebbe essere senza rischio penalizzazione, se metti il link al primo.

    E i contenuti che Facebook riporta integralmente? Su questo mi interrogo spesso, perché FB impiega pochi minuti a piazzare il post fra le note. E’ opportuno evitare (dato il trust sicuramente maggiore del mio)?
    Non vorrei che Google interpretasse come copiati nel blog i contenuti di FB.
    Insomma, i miei problemi sono cominciati proprio in concomitanza con l’iscrizione ad alcuni social e non riesco a riemergere.
    Tu che ne pensi?

  8. Ciao kristalia,
    purtroppo non basta mettere il link alla fonte per scongiurare il rischio della penalizzazione per duplicazione.

    Il consiglio è di aumentare il trustrank del tuo sito, non importa che superi FaceBook, l’importante è che tu ne abbia a sufficienza anche (e sopratutto) nelle pagine interne.

    Ricorda che Google sà che tu hai pubblicato per prima una notizia, ma lui ritiene più utile farla presente su un network apprezzato (ossi FB) che sul tuo sito.

Scrivi un commento

- Torna alla Home Page di IoWebMaster