Nella sezione degli "strumenti per webmaster" offerta da google da un po' di tempo rilevo che GoogleBot non riesce più a recuperare la sitemap del sito adw.altervista.org
Ogni volta che google prova a riscaricare la sitemap, l'errore ricevuto è di tipo
"Errore HTTP generale: Errore HTTP 403 (Non consentito)".
Il file che GoogleBot cerca di acquisire è http://adw.altervista.org/sitemap.txt
Verso la fine di febbraio il sito è stato oggetto di attacchi con uno script che utilizzava l'IP del GoogleBot (probabilmente mediante spoof, non ho approfondito l'argomento. Purtroppo il Nuke Sentinel ha bannato automaticamente l'IP, impedendo al crawler di visitare le pagine nei giorni seguenti).
Ho rimosso il ban da Nuke Sentinel da una settimana, gli IP di google hanno la possibilità di accedere liberamente, ma tutt'ora GoogleBot da errore 403 (accedendo al file di testo che non dipende comunque da Nuke).
L'ultima volta che ha provato è stata circa mezz'ora fa, nel tentativo di accedere al file sitemap.txt (Fino a qualche mese fa accedeva liberamente a quel file).
Ho fatto qualche ricerca e ho scoperto che anche altre persone hanno avuto un problema simile, e quelli che lo hanno risolto il sono coloro che hanno notato un blacklisting di quel determinato IP da parte del servizio di hosting. I loro hosting in quel caso avevano rilevato un comportamento troppo aggressivo/potenzialmente pericoloso.
Potreste verificare per cortesia se è questa la situazione?
@Mytecnology:
Grazie per i suggerimenti.
Per quanto riguarda l'indicizzazione delle pagine, so che non ha ancora visitato il sito, la copia cache di google è del 3 marzo e mostra ancora la pagina di blocco di phpnuke
http://209.85.129.132/search?hl=it&q...meta=&aq=f&oq=
Ma lo spider "GoogleAds" era pochi minuti fa tra i post del forum.
Il ban dell'IP è stato rimosso la settimana scorsa, e nell'interfaccia web di google dice che il tentativo di accesso è stato rieffettuato circa un'ora fa.
Ho provato sia con il file con permessi 664 che 775, editandoli mediante filezilla, ma nulla da fare.
Ulteriori informazioni:
Ho rimosso per sicurezza anche tutti gli IP bloccati dal sentinel che erano stati inseriti nel file .htaccess
anche questa soluzione sembra non sortire effetti.