Visualizzazione risultati 1 fino 5 di 5

Discussione: Utilizzo banda eccessivo per sito condiviso tra pochi amici

  1. #1
    casadiziafanta non è connesso Neofita
    Data registrazione
    12-05-2019
    Messaggi
    2

    Predefinito Utilizzo banda eccessivo per sito condiviso tra pochi amici

    Salve, ho ricevuto la seguente mail, in data 3 Luglio

    Gent. Webmaster,

    il tuo sito ha generato fino ad ora piu` di 4 GB di traffico, procedendo di questo passo il traffico generato a fine mese potra` superare i 41 GB, mentre il tuo traffico limite e` di 30 GB, e` quindi possibile che il tuo sito divenga inaccessibile per alcuni giorni prima della fine del mese.

    Per evitare questo inconveniente puoi:

    1) limitare il download dei tuoi files
    2) entrare nel pannello di controllo (sezione Risorse) e attivare dei blocchi aggiuntivi di traffico fino ad arrivare a 42 GB, che e` il traffico che di questo passo il tuo sito produrra`

    A presto
    -AlterVista-
    Stessa cosa mi era successa il mese scorso con un altro account che ha letteralmente lo stesso sito, quindi stesso codice, ed il sito era stato bloccato gli ultimi giorni del mese di giugno per aver superato il limite mensile.

    La mia domanda è:

    Come è possibile una cosa del genere considerando che il sito consiste letteralmente in un progetto amatoriale per mostrare i risultati del fantacalcio tra un gruppo di amici, sito che viene aggiornato una volta all'anno, e riceve dalle 0 alle 1 visite mensili da detto gruppo di max una decina di persone?

    Da dove vengono le altre 99.9% di visite che mi bloccano il sito prima dellla fine del mese?

    Ho analizzato le statistiche di entrambi i siti e questa è la situazione (uguale per entrambi): per i primi 4 anni il traffico era esattamente quello che ci si aspettava, pochi visitatori unici mensili, e pagine visitate nell'ordine delle decine.

    Poi a fine ottobre 2023, qualcosa è successo e sono iniziati ad esserci 400 visitatori unici e 3000 pagine visitate, in aumento ogni mese fino ad arrivare ai 1700 visitatori e 7000 pagine visitate in 3 (TRE) giorni in questo mese di Luglio.

    Da totale inesperto credo sia ovvio siano bot o crawler come è anche scritto nella pagina statistiche del sito.

    Quindi chiedo, cosa posso fare?

    E' possibile risalire al traffico per capire da dove vengono le visite?

    E' possibile bloccare visite "sospette" di crawler e bot?

    E' possibile ci sia qualcosa nel mio codice che faccia ricursivamente consumare banda o qualcosa del genere?

    E' possibile mettere un freno temporaneo per evitare che il sito venga bloccato nei prossimi giorni e diventi inutilizzabile per il resto del mese mentre trovo una soluzione?

    Grazie per eventuali risposte e scusate la lunghezza del messaggio



  2. #2
    GraphOGLRisorse non è connesso AlterGuru 2500
    Data registrazione
    14-02-2015
    Messaggi
    4,191

    Predefinito

    Salve,
    l'unica pagina che vedo indicizzata su Google è questa: casadiziafanta.altervista.org/fantasito/pagine/stagione.php?codice_stagione=s2021

    Solo questa pagina pesa circa 17 MB più 6 MB delle relative risorse, per un totale di 22.6 MB. Mentre le altre pagine (risorse comprese) si aggirano sui 5 MB l'uno. Visitando anche una sola volta la pagina in questione più le altre 8 del menu principale, si può arrivare ad un totale di circa 62 MB ad utente.

    Con valori simili, tra qulache utente reale e alcuni bot che possono visitare tutte le pagine anche più volte al giorno, non è difficile pensare che venga consumata tutta la banda mensile.

    Potrebbe impedire l'indicizzazione delle pagine tramite il meta tag no index:
    Codice HTML:
    <meta name="robots" content="noindex">
    Tenga però presente su AlterVista i siti devono poter essere visibili e liberamente accessibili. Il servizio non è pensato per la crazione di siti ad uso privato di alcuni utenti, ovvero, creare un sitema chiuso.

    Ridurre il peso delle pagine è di certo una buona pratica, anche se poi andrebbero comunque bloccati i bot responsabli del problema.

    Una soluzione, potrebbe essere di limitare laccesso alle pagine più pesanti tramite password. Ricordo comunque che da regolamento (Art. 41.2), non è consentito abusare del servizio di restrizione aree tramite password.

    Cordiali saluti.
    Ultima modifica di GraphOGLRisorse : 04-07-2024 alle ore 14.23.24

  3. #3
    L'avatar di dreadnaut
    dreadnaut non è connesso Super Moderatore
    Data registrazione
    22-02-2004
    Messaggi
    6,306

    Predefinito

    Particolarmente pesanti sono le immagini SVG, sia esterne che inserite nelle pagine HTML. Sono ENORMI, ed alcune conengono a loro volta PNG (codificate in base64 quindi ancora più grosse), perdendo ogni vantaggio del formato vettoriale. Cambiando formato (od aggiustando le immagini) potresti ridurre drasticamente il traffico.

    Detto questo, il problema dei bot è reale. Non sei l'unico che ha segnalato questa cosa, e forse è collegata a tutta una serie di nuovi scraper collegati a chatGPT e compagnia.

    Il problema si estende anche oltre AlterVista. Di recente Cloudflare ha introdotto un bottone per bloccare questi scraper — lo menziono come esempio, non come una cosa che AlterVista supporta.

  4. #4
    casadiziafanta non è connesso Neofita
    Data registrazione
    12-05-2019
    Messaggi
    2

    Predefinito

    Ciao, grazie delle risposte. In pratica il problema c'è, ma è esacerbato dal fatto che il mio sito non sia per niente efficiente.

    Essendo un progetto amatoriale (nato per dare vita a quanto stavo imparando delle basi di php, html, css e js) e unito alla mia passione per la grafica e quindi numerose immagini vettoriali, probabilmente il codice è pieno di scelte "sbagliate" su cose che potrebbero essere ottenute con minor sforzo di risorse senza perdita di qualità.

    Da ignorante chiedo, generare una pagina scaricando le risorse, consuma lo stesso traffico di caricare la stessa pagina già generata e poi salvata come pagina html? Perchè essendo il sito fondamentalmente statico, la prima volta che ogni pagina possibile viene generata, questa viene salvata con le immagini svg di codice inline. Sto dicendo cose senza senso?

  5. #5
    L'avatar di dreadnaut
    dreadnaut non è connesso Super Moderatore
    Data registrazione
    22-02-2004
    Messaggi
    6,306

    Predefinito

    Da ignorante chiedo, generare una pagina scaricando le risorse, consuma lo stesso traffico di caricare la stessa pagina già generata e poi salvata come pagina html? Perchè essendo il sito fondamentalmente statico, la prima volta che ogni pagina possibile viene generata, questa viene salvata con le immagini svg di codice inline.
    Purtroppo la "banda" è consumata dallo spedire la pagina dal server al browser dei visitatori. Che sia dinamica o statica la dimensione non cambia; al massimo una statica "parte" più veloce, ma la quantità di dati in movimento non cambia.

    Io proverei a semplificare le immagini SVG, in particolare quelle piccole e semplici: alcuni stemmi potrebbero essere disegnati con una decina di vertici, ma le immagini nel contengono centinaia! Software come Inkscape hanno stumenti per ridurre il numero di vertici mantenendo le forme, riducendo la dimensione finale.

Regole di scrittura

  • Non puoi creare nuove discussioni
  • Non puoi rispondere ai messaggi
  • Non puoi inserire allegati.
  • Non puoi modificare i tuoi messaggi
  •