Visualizzazione risultati 1 fino 15 di 15

Discussione: Robot.txt

  1. #1
    L'avatar di miki92
    miki92 non è connesso AlterGuru 2500
    Data registrazione
    21-04-2007
    Residenza
    Procida (NA)
    Messaggi
    4,226

    Question Robot.txt

    Ciao, volevo conoscere un po' meglio il robot.txt nel senso che io ho usato un generator per creare il mio robots.txt

    Codice:
    # Robots.txt file for http://miki92.altervista.org/
    
    User-agent: *
    Disallow: /procida/
    Disallow: /flash/
    Disallow: /js/
    Praticamente se ho capito bene questo file mi dovrebbe "proteggere" le sottodirectory "procida, flash, js" come da me impostate da tutti gli spider.
    Ma con questo file i miei meta tag delle pagine presenti in quelle sottodirectory vengono annullati o no? Poi vorrei chiedere se il file deve essere chiamato robot.txt o robots.txt perchè su google ne dicono di tutti e due i tipi.
    Ultima modifica di funcool : 02-07-2007 alle ore 17.26.42

  2. #2
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Il file si deve chiamare "robots.txt". Con il codice che hai scritto tu, tutti gli spider non indicizzeranno le pagine che si trovano nelle cartelle "procida", "flash" e "js".
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  3. #3
    L'avatar di phpone
    phpone non è connesso AlterGuru
    Data registrazione
    05-09-2005
    Residenza
    Roma
    Messaggi
    1,217

    Predefinito

    mi permetto di specificare che
    inserendo questi disallow nel robots.txt non blocchi gli spider
    gli spider troveranno ugualmente queste pagine, ma non ne salveranno i contenuti
    quindi "non indicizzazione" si intende che i motori non salveranno informazioni sui tuoi file, ma ne salveranno ugualmente l'indirizzo

    rischi anche che in alcune ricerche possa uscire il tuo indirizzo bloccato dal robot

    in quel caso su google vedrai solamente l'indirizzo del file e nessun'altra informazione

  4. #4
    L'avatar di miki92
    miki92 non è connesso AlterGuru 2500
    Data registrazione
    21-04-2007
    Residenza
    Procida (NA)
    Messaggi
    4,226

    Predefinito

    Wow questo non lo sapevo vi ringrazio tanto!

  5. #5
    Ospite Guest

    Predefinito

    è possibile per esempio impedire l'accesso ad una pagina se non da un'altra determinata pagina?

  6. #6
    L'avatar di bastardofuori
    bastardofuori non è connesso AlterGuru
    Data registrazione
    04-04-2006
    Messaggi
    1,535

    Predefinito

    Citazione Originalmente inviato da scworld
    è possibile per esempio impedire l'accesso ad una pagina se non da un'altra determinata pagina?
    Scusa ma non ho capito cosa intendi...

  7. #7
    Ospite Guest

    Predefinito

    ad esempio consentire l'accesso ad una pagina del mio sito solo se si clicca sul link dall'homepage e non digitando l'url della pagina nella barra degli indirizzi

  8. #8
    L'avatar di phpone
    phpone non è connesso AlterGuru
    Data registrazione
    05-09-2005
    Residenza
    Roma
    Messaggi
    1,217

    Predefinito

    dovresti lavorare con l'htaccess e il refer
    cosi' su 2 piedi non so dirti
    prova a fare una ricerca su google magari qualcosa trovi
    se la trovo te la posto ;)

  9. #9
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Codice PHP:
    <?php
    if ($_SERVER['HTTP_REFERER']!="pagina precedente")
    exit();
    ?>
    Qui tutto il codice della pagina.
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  10. #10
    Ospite Guest

    Predefinito

    grazie

  11. #11
    L'avatar di darkwolf
    darkwolf non è connesso Salvatore Noschese
    Data registrazione
    18-04-2007
    Residenza
    Reggiolo (RE)
    Messaggi
    6,556

    Predefinito Info!

    Scusate l'intromissione!
    Io l'ho fatto manualmente così:
    Codice:
    User-agent: *
    Disallow: /pyg/
    Disallow: /script/
    Disallow: /not_found.html/
    Disallow: /berlusca.html/
    Disallow: /firmware.html/
    Disallow: /img/
    Disallow: /file/
    Disallow: /forum/Games/
    not_found.html - berlusca.html e firmware.html sono delle cartelle che contengono un redirect php alle nuove pagine quindi penso siano corrette così (ma non vorrei che il bot li veda come file e non come cartelle).
    Il dubbio più grosso comunque riguarda /forum/Games/.
    Forse dovrei mettere prima del
    Codice:
    Disallow: /forum/Games/
    un
    Codice:
    Allow: /forum/

    Facendo una ricerca su google vedo i link dei giochi (quindi possono giocarci senza passare per il sito) e preferirei che ciò non accadesse.
    I giochi sono nella sottodirectory indicata (/forum/Games/) ma non vorrei che impostando in quel modo il robots si neghi l'indicizzazione del forum stesso!
    Spero di essermi spiegato bene
    Grazie per ogni eventuale risposta, DarkWolf
    Ultima modifica di darkwolf : 02-07-2007 alle ore 17.26.12

  12. #12
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Facendo come hai fatto tu, non dovrebbe essere indicizzato tutto il contenuto della cartella "Games" che si trova all'interno della cartella "forum".
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  13. #13
    L'avatar di darkwolf
    darkwolf non è connesso Salvatore Noschese
    Data registrazione
    18-04-2007
    Residenza
    Reggiolo (RE)
    Messaggi
    6,556

    Predefinito

    Citazione Originalmente inviato da funcool
    Facendo come hai fatto tu, non dovrebbe essere indicizzato tutto il contenuto della cartella "Games" che si trova all'interno della cartella "forum".
    Quindi il forum continuerà ad essere indicizzato regolarmente...
    Ok! PS scusa ho editato sopra all'ultimo secondo.... puoi dirmi gentilmente se è corretto? Grazie
    Magari così è più corretto?
    Codice:
    User-agent: *
    Allow: /
    Disallow: /pyg/
    Disallow: /script/
    Disallow: /not_found.html/
    Disallow: /berlusca.html/
    Disallow: /firmware.html/
    Disallow: /img/
    Disallow: /file/
    Allow: /forum/
    Disallow: /forum/Games/
    Ultima modifica di darkwolf : 02-07-2007 alle ore 17.29.19

  14. #14
    L'avatar di funcool
    funcool non è connesso Utente storico
    Data registrazione
    05-02-2004
    Residenza
    Qui... Non lì, qui!
    Messaggi
    15,433

    Predefinito

    Puoi anche non mettere:
    Codice:
    Allow: /forum/
    Mattia vi manda a FunCool - Matriz - Directory Gogol - Sfondo rosso per la Birmania
    «Tu mi dai fastidio perché ti credi tanto un Dio!» «Bè, dovrò pur prendere un modello a cui ispirarmi, no?» Woody Allen

  15. #15
    L'avatar di darkwolf
    darkwolf non è connesso Salvatore Noschese
    Data registrazione
    18-04-2007
    Residenza
    Reggiolo (RE)
    Messaggi
    6,556

    Predefinito

    Citazione Originalmente inviato da funcool
    Puoi anche non mettere:
    Codice:
    Allow: /forum/
    Ok grazie!
    PS dato che i giochi sono in swf (flash) metto anche un bel Disallow: /*.swf$
    Ultima modifica di darkwolf : 02-07-2007 alle ore 17.34.17

Regole di scrittura

  • Non puoi creare nuove discussioni
  • Non puoi rispondere ai messaggi
  • Non puoi inserire allegati.
  • Non puoi modificare i tuoi messaggi
  •