Disavventure di un Webmaster: la "root" da 6 Giga...

Ritornano le “Disavventure di un Webmaster”: oggi vi racconto un “Case Study” su un Plugin WP che è stato capace di creare dei danni giganteschi…

Quando un server, di colpo, comincia ad impazzire, e sai che il server funziona benissimo, è giunta l’ora di rimboccarsi le maniche. Ed è ciò che mi appresto a raccontarvi.

Tutto è cominciato quando notai che, da qualche mese, lo spazio sul server si esauriva nel giro di trenta giorni: possibile mai che un blocco da 3 GigaByte di traffico vada esaurito in così poco tempo? Il mistero s’infittiva settimana dopo settimana, e le risorse venivano “cannibalizzate” inspiegabilmente. Inizialmente davo la colpa al plugin di cache: pensavo che le copie cache sul server che velocizzano l’apertura del sito, potessero creare tanto scompiglio. Anche AlterVista, il provider, era della mia stessa idea. Mah.

Tutto andava pressoché bene, a parte questo strano problema, finché non mi accorgo che qualcosa sta andando per il verso sbagliato: referral da motori di ricerca che calano a vista d’occhio. Il mistero s’ingigantisce. I problemi pure.

Inizialmente ho detto “vabbè, cosa vuoi, sarà il periodo festivo”, visto che quanto vi sto raccontando è accaduto verso metà dicembre. Mi sbagliavo, e di grosso. Perdita verticale di visite, giorno dopo giorno. Assurdo. E spazio sul server costantemente esaurito.

Eppure, non avevo pensato a fare “due più due”: passate le feste, per monitorare la situazione, ed accorgermi che il “periodo festivo” non c’entrava nulla, comincio ad investigare il problema.

Dopo diverse settimane di prove, calcoli, test, e chi più ne ha più ne metta, l’idea: chiedere a Google una “richiesta di riconsiderazione del sito”, fosse mai che c’è qualche penalizzazione in corso. Qualche giorno dopo, Google stessa dice: “non abbiamo nulla da riconsiderare, in quanto non ci sono procedure di infrazione in corso”. Buio totale, e spazio ancora azzerato.

Nel frattempo, a spese mie, ho dovuto aumentare lo spazio sul server da 1 GB fino a 8 GB, dal momento che, praticamente ogni mese, ero in rosso!

Continuo a guardarmi in giro, chiedo a colleghi e Forum vari che ipotizzano le cose più disparate, dai problemi di Validazione W3C fino a problemi di natura semantica che possano confondere il crawler. Ma, qualche giorno dopo, la svolta.

Arriviamo, finalmente, a capire che sito è, probabilmente, penalizzato “algoritmicamente” per contenuti duplicati. Si, bella storia, ma duplicati de che? E soprattutto, dove li sono andati a beccare questi “contenuti duplicati”?

La faccenda è ancora più spinosa in quanto non c’è un intervento manuale, ma è una penalizzazione dettata dall’algoritmo Google, ovvero un robot che fa tutto in automatico. Così come ti ha penalizzato, quando ritiene di toglierti la penalizzazione lo fa automaticamente, facendo tornare il tutto alla normalità.

Con tanta calma e pazienza, quindi, su consiglio di alcuni colleghi che mi hanno dato “la dritta”, disiscrivo il sito dai vari siti di “Social News” che “scopiazzano” senza citare fonte e, armato di file “robots.txt”, e “Strumenti per i Webmaster di Google”, comincio ad inviare richieste di blocco dei contenuti duplicati. Ancora nulla. Per sicurezza, tramite il “Disavow Tool” di Google, blocco alcuni “backlink sospetti”, che potrebbero aggravare le cose. Niente di niente.

Due giorni fa, mentre armeggiavo con “Strumenti per i Webmaster” di Google, alla voce “descrizioni duplicate”, noto qualcosa di strano: ci sono dei duplicati derivanti dalla “versione tradotta” del sito. Premettiamo che la traduzione del sito era affidata al plugin “Global Translator”. VUOI VEDERE CHE….? :idea:

Inizio a cercare un po’ in giro, e mi accorgo che altri utenti lamentano i miei stessi problemi: mi fiondo sul server e… Sorpresa! Trovo una cartella sul server… DA 6 GIGABYTE! :shock:

Secondo voi, cosa poteva contenere questa cartella? Dai, sparate… Dai! Bravi: conteneva le copie cache generate da “Global Translator”!

Ecco cosa è successo: il plugin traduce il sito in diverse lingue basandosi sul traduttore di Google. Per rendere più veloce le traduzioni, però, crea delle “copie cache” delle pagine già tradotte, salvandole sul server. Il punto è che le copie cache aumentano con l’aumentare delle visite! Immaginate cosa può accadere, come nel mio caso, se sul Blog arrivano 11.000 utenti al giorno! Un disastro.

Ma questa è solo la “punta dell’iceberg”: le “copie cache” di cui sopra sono andate a finire su Google, che le ha indicizzate e, rullo di tamburi… Hanno generato una penalizzazione algoritmica per contenuti duplicati! #-o

Il plugin, infatti, crea delle “copie del sito tradotte” che, agli occhi di Google, appaiono come delle vere “fotocopie” del sito stesso: se il sito è tradotto in cinque lingue, ad esempio, Google vede i contenuti duplicato per 5 volte. Immaginate il disastro: se su Google sono indicizzate 5.000 pagine, è come se ne fossero indicizzate 25.000, di cui 20.000 duplicate! (5.000 Pagine Originali X 5 lingue di traduzione = 25.000 Pagine – 5.000 Originali = 20.000 doppioni!)

A Palermo si dice “Buttana ‘ra miseria”, e proprio il caso di dirlo… :incazzato:

Un vero e proprio disastro: a questo punto, la prima cosa da fare è stata rimuovere, al volo, il plugin, quindi cancellare la root da 6 GB, che ha impiegato oltre un’ora a cancellarsi totalmente dal server, quindi chiedere a Google di bloccare tempestivamente i contenuti duplicati. Contenuti che, dopo appena due ore dalla richiesta, sono stati rimossi.

Insomma: un vero disastro da cui ancora non c’è stata una ripresa totale, dal momento che ci vorranno mesi prima che tutti i duplicati vengano totalmente “digeriti” dal motore di ricerca. Morale della favola: se potete, evitate il plugin. Eviterete di sbattervi la testa contro ogni muro per trovare una soluzione impossibile da trovare…

Scrivi un commento

SEGUIMI ORA SU TWITTER: Non perderti il mio format in diretta e partecipa in prima persona! I tuoi commenti saranno letti in diretta! CLICCA QUI!