Visualizzazione risultati 1 fino 14 di 14

Discussione: XHTML e encoding UTF-8 per il sito

  1. #1
    L'avatar di heracleum
    heracleum non è connesso Utente storico
    Data registrazione
    21-01-2004
    Messaggi
    3,333

    Predefinito XHTML e encoding UTF-8 per il sito

    Ciao a tutti,
    mi chiedevo se qualche "temerario" si era cimentato nell'impresa di usare in tutte le pagine del proprio sito la codifica utf-8 per i caratteri (charset)

    + Magari anche utilizzando come DOCTYPE l'XHTML1.0 o 1.1
    (direi Transitional visto che con Strict non si può utilizzare l'attirbuto target e altro, sospetto)

    + Per completezza, mi chiedevo anche se riesce a passare correttamente senza errori il servizio di validazione W3C le pagine.
    Avvertimento: richiedere in privato questioni tecniche produrrà inevitabilmente una supercazzola prematurata come risposta. (5 served)

  2. #2
    Guest

    Predefinito

    Ricordami un attimo qual'è (vista l'ora), sbaglio a pensare che, semplicemente, è quella di scrivere ad esempio & al posto di & ecc?


    Ciaooooo!!!!!!

  3. #3
    L'avatar di heracleum
    heracleum non è connesso Utente storico
    Data registrazione
    21-01-2004
    Messaggi
    3,333

    Predefinito

    Beh sì la validazione w3c di XHTML ti segnala come errore un & scritto direttamente in un link (per es.) e ti consiglia piuttosto le entità html ( & ).
    Questo per xhtml.. comunque la curiosità principale era sulla codifica utf-8
    per sapere se hanno avuto problemi o semplicemente se qualcuno ha dritte per evitarli
    ...

    Perché al mio primo tentativo di validare un xhtml pulito (e validato con altri charset, per es. quello occidentale iso-8859-1) MA con encoding utf-8 mi segnalava caratteri non interpretabili in posizioni assurde.... dove c'erano solo </chiusureditag> e andate a capo..
    Quindi mi sembra molto impegnativo come passo e al momento sono tornato subito al iso-8859-1 senza pensarci due volte, ma è anche vero che con utf-8 il trasferimento dei caratteri dovrebbe essere molto più rapido (la metà se non erro, ma appunto non ho approfondito oltre).
    Avvertimento: richiedere in privato questioni tecniche produrrà inevitabilmente una supercazzola prematurata come risposta. (5 served)

  4. #4
    L'avatar di NoWhere
    NoWhere non è connesso Moderatore
    Data registrazione
    14-02-2003
    Residenza
    New Balarm
    Messaggi
    4,118

    Predefinito

    io ho vari problemi con tale codifica, sopratutto con pspad quando mi apre un file che é fatto in altra modifica me lo autotraforma in utf-8 sballandomi tutto il testo cancellando le e accentate eccetera!! O_O un disastro!!

    difatti spessissimo nelle mie pagine web scrivo direttamente il codice delle lettere speciali [anche se nei metatag setto una codifica iso-...-15 quel maledetto editor cambia lo stesso!!]

    cmq, basta divagare.. con il validator del w3c é così: o setti i caratteri speciali col relativo codice o te lo segna non come errore ma come warning!! - morale della favola non ti valida la pagina!! -.-

    ci vorrebbe una bella guida chiara sull'uso delle codifiche, come sceglierla in base alle proprie esigenze e come usarla!!

  5. #5
    L'avatar di heracleum
    heracleum non è connesso Utente storico
    Data registrazione
    21-01-2004
    Messaggi
    3,333

    Predefinito

    Citazione Originalmente inviato da NoWhere
    .. con il validator del w3c é così: o setti i caratteri speciali col relativo codice o te lo segna non come errore ma come warning!! - morale della favola non ti valida la pagina!! -.-
    Sì, ok..
    mi sembra anche buona abitudine scrivere invece delle accentate (è) le corrispettive entity (&egrave;), e appunto in quella pagina che avevo fatto per testare l'utf-8 le avevo sistemate tutte..
    Il problema è che mi dava comunque delle segnalazioni di presenza di caratteri NON interpretabili con utf-8:
    non cominciava neanche ad elencarmi gli errori come di consueto ma si fermava subito indicandomi in un unico messaggione di spiegazioni la presenza di questi caratteri non interpretabili e mi dà solo la posizione dei numeri di riga nel quale trova questo problema, tipo "90, 100-101, 130-131 ..." qualcosa del genere!
    Azz ora non l'ho sotto mano se volete domani lo rimetto online e vi do il link.

    (comunque appunto, pare piuttosto faticosa l'esperienza)
    Avvertimento: richiedere in privato questioni tecniche produrrà inevitabilmente una supercazzola prematurata come risposta. (5 served)

  6. #6
    Guest

    Predefinito

    Citazione Originalmente inviato da heracleum
    Ciao a tutti,
    mi chiedevo se qualche "temerario" si era cimentato nell'impresa di usare in tutte le pagine del proprio sito la codifica utf-8 per i caratteri (charset)
    cough..cough .... presente

    comunque non è eccessivamente "faticosa" una volta che prendi la mano

    mavericck

  7. #7
    Guest

    Predefinito

    Mah io da sempre scrivo tutto codificato (&amp; nei links compreso... una volta ho scritto per sbaglio (automatismi...) sar&agrave; codificata così in una mail solo testo ad un mio professore... Sto decisamente dando di matto...)

    Tra una decina di giorni metterò online la nuova versione del sito che sto sviluppando (per l'appunto XHTML 1.0 e UTF-8, come si parlava in un altro thread, quindi presumibilmente tra 6/7 giorni metterò a validare le pagine che al momento ho solo in locale, quindi se vuoi ti mando un mp (o metto qui nel thread) i risultati dell'operazione...

    Comunque, TEORICAMENTE non dovrebbe essere troppo gravosa la cosa (tra il dire e il fare...)

  8. #8
    L'avatar di NoWhere
    NoWhere non è connesso Moderatore
    Data registrazione
    14-02-2003
    Residenza
    New Balarm
    Messaggi
    4,118

    Predefinito

    mav, ma vedo che cmq hai usato tutti caratteri speciali codificati e non scritti direttamente così&é°ecc.....

    quindi l'unica solution x usare la codifica utf-8 é scrivere il codice degli speciali??

    proviamo a unire il nostro sapere così da far uscire uno pseudo testo guida!!

  9. #9
    Guest

    Predefinito

    Che io sappia per usare l'UTF-8 è assolutamente obbligatorio usare la codifica dei caratteri speciali.

    Per il resto, ho spulciato un po' google nei giorni scorsi in proposito, e non mi sembra che ci siano da fare altre operazioni particolari.

    Addirittura la W3C dice di usare l'UTF-8 sempre a meno che non ci siano particolari eccezioni... E non dà regole particolari, se non scrivere i caratteri speciali come codifica comanda

    Citazione Originalmente inviato da W3C, quei gran burloni
    On the other hand, it is a good idea to use a Unicode encoding wherever possible, since it simplifies many aspects of Web internationalization and is supported widely by HTML user agents, and by all XML processors. [...] An important consequence of the document character set is that values of numeric character references (such as &#x01F5; and ǵ for LATIN SMALL LETTER G WITH ACUTE) are interpreted as Unicode characters - no matter what encoding you use for your document. This is a common source of error among those who are not clear about the distinction.
    D'altra parte, infatti, gli altri charsets sono tutti sottoinsiemi dell'Unicode, come puntualizzano nella stessa pagina

    Citazione Originalmente inviato da W3C, quei gran burloni
    Any encoding can be used for your document as long as it is properly declared and a subset of the Unicode repertoire. (It would be extremely unusual to find one that wasn't a subset.)

  10. #10
    Guest

    Predefinito

    Citazione Originalmente inviato da NoWhere
    mav, ma vedo che cmq hai usato tutti caratteri speciali codificati e non scritti direttamente così&é°ecc.....

    quindi l'unica solution x usare la codifica utf-8 é scrivere il codice degli speciali??
    già, provando a sbattergli un 'è' restituisce il classico punto interrogativo e tentando la validazione
    Sorry, I am unable to validate this document because on line 48 it contained one or more bytes that I cannot interpret as utf-8 (in other words, the bytes found are not valid values in the specified Character Encoding). Please check both the content of the file and the character encoding indication.
    EDIT: cosa che non avviene con il charset ISO-8859-1, vedendo il sorgente e tentando la validazione di questa pag del vbulletin (che non effettua la conversione in entità dei caratteri speciali)

    mavericck
    Ultima modifica di mavericckweb : 07-01-2006 alle ore 17.59.17

  11. #11
    Guest

    Predefinito

    Mio buon Heracleum, vuoi divertirti? Io domani o stasera metto online la nuova versione XHTML del sito, e sono stato costretto a:

    1) inserire un codice che va a vedere negli HTTP_ACCEPT se un browser è XHTML-compliant: se lo è gli dà un content type application/xhtml, se no (ovvero se è IE) gli dà un text/html. Avendo cura di dare application/xhtml al w3c validator...

    2) se metti l'apostrofo come normalmente con il tasto apostrofo, XHTML 1.0 strict lo riconosce come virgolette: va usato invece &apos;. E qui viene il bello: IE NON RICONOSCE &apos;, perché a lui arriva text/html e non supporta l'XHTML!!!
    Quindi, come consiglia http://fishbowl.pastiche.org/2003/07..._curse_of_apos
    bisogna mettere come apostrofo & #39(funziona così bene che se non metto il codice con spaziatura, il forum lo mostra come un apostrofo anche se lo metto in un blocco HTML gghghgh). Peraltro, checché se ne dica in quel link, non è vero che si possono tranquillamente mettere gli apostrofi normali... Esperienza personale

    P.S. la bellezza di Emacs è che con il syntax highlightning ti fa notare impietosamente che hai usato un apostrofo, e inizia a mostrare il seguito come un testo tra virgolette...
    Ultima modifica di pietrovischia : 12-01-2006 alle ore 16.18.02

  12. #12
    Guest

    Predefinito

    ciao ragazzi,
    io mi trovo benissimo con html-kit (della chami)
    dopo alcune semplici (ma complicate) impostazioni sono riuscito a portare un intero sito html 4.01 a xhtml 1.0

  13. #13
    L'avatar di heracleum
    heracleum non è connesso Utente storico
    Data registrazione
    21-01-2004
    Messaggi
    3,333

    Predefinito

    Sì sì mi diverto,
    pronto con i pop corn

    Intanto ho visto il sito com'è ora.. poi vabè non è che visualmente dovrebbe cambiare così tanto no? tramite qualche apostrofetto.
    Ah comunque ho sempre usato l'entity &#39; (anche con punto e virgola direi, no?) non digitando i testi eh noo mica so' matto.. ma soprattutto con contenuti passati per il mysql, se non ricordo male anche la funzione con param:
    htmlentities( testo , ENT_QUOTES)
    di converte gli apostrofi ' in &#39;
    anzi di sicuro direi.

    Edit:
    zerotrentanove &#039; mi dicono dalla regia non so se cambia, niente, sono codici unicode no?
    Ultima modifica di heracleum : 12-01-2006 alle ore 17.48.06
    Avvertimento: richiedere in privato questioni tecniche produrrà inevitabilmente una supercazzola prematurata come risposta. (5 served)

  14. #14
    Guest

    Predefinito

    ... e ciononostante IE6 non mi visualizza il & there4 ; & #8756 ; & #x2234 ;

    Provate anche voi:
    http://www.htmlhelp.com/reference/ht...s/symbols.html

    con Internet Explorer vi si visualizzano tutti, oppure la maggior parte è sostituita da quadratelli?

    P.S. lì sulla lista li danno tranquillamente senza lo 0 in cima


    [EDIT]: ho installato il supporto per i caratteri in giapponese, e ora il 90% di quella lista viene visualizzato da IE... A questo punto cercherò di far installare il supporto per le lingue piu' strane, cosi' magari alla fine li vedo tutti...

    [EDIT 2:LE STRANEZZE DEL W3C]: http://validator.w3.org/check?uri=ht...ogValidator%2F
    la pagina è un valido xhtml1.0, utf-8. Ma se andate a vederla, http://www.w3.org/QA/Tools/LogValidator/ , essa contiene al posto delle lettere accentate i punti di domanda... Il che vuol dire che non erano codificate... mmm...
    Ultima modifica di pietrovischia : 13-01-2006 alle ore 02.19.08

Regole di scrittura

  • Non puoi creare nuove discussioni
  • Non puoi rispondere ai messaggi
  • Non puoi inserire allegati.
  • Non puoi modificare i tuoi messaggi
  •