Visualizzazione risultati 1 fino 11 di 11

Discussione: Compilazione file robots.txt per crawler

  1. #1
    FrankyFive non è connesso Utente giovane
    Data registrazione
    11-06-2004
    Messaggi
    59

    Predefinito Compilazione file robots.txt per crawler

    Come si compila un file robots.txt utilizzato dai motori di ricerca per indicizzare il proprio sito?

    Sarebbe utile postare un file base già pronto.

    Grazie,
    FrankyFive

  2. #2
    Guest

    Predefinito

    su internet trovi molte guide
    eccone una: http://www.motoricerca.info/robots.phtml

  3. #3
    Guest

    Predefinito

    Avevo creato un pò di tempo fa questo tool: http://allo.altervista.org/robots.htm

    Ciao!

  4. #4
    FrankyFive non è connesso Utente giovane
    Data registrazione
    11-06-2004
    Messaggi
    59

    Predefinito

    Grazie mille ad entrambi!!

    Dunque, il file robots.txt serve esclusivamente ad escludere alcune pagine web dall'indicizzazione e non ad indicare la mappatura del proprio sito agli spider.
    Se non si hanno questo tipo di esigenze si potrebbe, allora, fare a meno di questo file, ma leggendo le pagine del sito segnalato da phpone, consigliano di inserirlo comunque nel proprio spazio web indicando di lasciare via libera all'indicizzazione ed il codice dovrebbe essere il seguente:

    Codice HTML:
    User-agent: *
    Disallow:
    anche se il validator di www.clockwatchers.com dà l'errore.

    Confermate che si tutto corretto?
    Ultima modifica di FrankyFive : 02-11-2006 alle ore 14.36.08

  5. #5
    Guest

    Predefinito

    Si.. il file robots.txt serve per escludere pagine e/o directory dall'indicizzazione. Per scegliere invece le pagine da indicizzare puoi usare Google Sitemap (http://www.google.com/webmasters/sitemaps/?hl=it)

    Ciao!

  6. #6
    Guest

    Predefinito

    ma dove bisogna messo esattamente il file robots.txt??

  7. #7
    Guest

    Predefinito

    Citazione Originalmente inviato da giannissima
    ma dove bisogna messo esattamente il file robots.txt??
    se ti interessa vai sul mio sito e clicca sul logo di convalida robots.txt


    lo devi compilare cosi' apri il notepad e scrivi nella sezione disallow le cartelle che non vuoi che siano ricercate dai motori

    esempio:

    User-agent: *
    Disallow: /miamusica/
    Disallow: /miefoto/
    Disallow: /mieidati/
    Disallow: /latuasezione/
    Disallow: /privato/

    *= motori di ricerca che non vuoi che leggano determinate cartelle
    %20= questo simbolo sostituisce lo spazio e va inserito tra i nomi delle cartelle
    se lasci l'asterisco indichi che non vuoi che nessun moytore di ricerca spii all'interno delle cartelle da te inserite altrimenti devi inserire il nome del motore che non vuoi che ricerchi determinati file

    Ultima modifica di Bluroy : 12-11-2006 alle ore 15.48.22 Motivo: robots

  8. #8
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Citazione Originalmente inviato da giannissima
    ma dove bisogna messo esattamente il file robots.txt??
    Devi metterlo nella root del tuo spazio.
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  9. #9
    Guest

    Predefinito

    troppo complicato...lascio perdere...grazie cmq

  10. #10
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Citazione Originalmente inviato da giannissima
    troppo complicato...lascio perdere...grazie cmq
    Prova a leggere questa guida, magari è più semplice.
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  11. #11
    malvisti non è connesso Neofita
    Data registrazione
    23-06-2006
    Messaggi
    7

    Predefinito

    Inserirlo vuoto serve ad evitare che i log del proprio sito presentino errori 404 in continuazione, dovuti alla richiesta di un file inesistente da parte dei vari spider.

    Per quello può essere utile avere l'abitudine di inserirlo anche vuoto.
    Claudioweb
    Il mio sito per la sfida dei phpisti malvisti

Regole di scrittura

  • Non puoi creare nuove discussioni
  • Non puoi rispondere ai messaggi
  • Non puoi inserire allegati.
  • Non puoi modificare i tuoi messaggi
  •