Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĆ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rĆØgle gĆ©nĆ©rale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur Ć l'affichage, le diamant point d'interrogation ou carrĆ© vide � apparaĆ®t.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĆ© vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prĆ©ciser que tous les caractĆØres ASCII du code 0 Ć 127 gardent toujours les mĆŖmes codes sans changement quelque soit le codage des caractĆØres, ASCII, GBK, Unicode...
Tous les caractĆØres ASCII Ć©tendus du code 0 Ć 255 (2**8=256, uni-octet, mono-byte) peuvent ĆŖtre stockĆ©s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractĆØres multi-octet (multi-byte) avec un code supĆ©rieur ou Ć©gal Ć 256, qui ne peuvent ĆŖtre conservĆ©s que dans un fichier Unicode comme UTF-8, ou bien dans un format spĆ©cifique (code page pays) tel le GBK pour les idĆ©ogrammes chinois.
Sur le web, un caractĆØre Unicode peut en outre s'exprimer en code entitĆ© HTML, ainsi stockĆ© dans un fichier du codage ASCII. Par exemple, l'idĆ©ogramme čÆ signifiant Langue, peut ĆŖtre stockĆ© en mode ASCII par la chaĆ®ne 语, composĆ©e uniquement des ampersand &, diĆØse #, suivi par des chiffres du numĆ©ro dĆ©cimal de ce caractĆØre en Unicode, et terminĆ© par un point-virgule ;.
äøå½åŗåƹäŗŗē±»ä½åŗč¾å¤§ēč“”ē®ļ¼
La Chine doit faire une contribution relativement grande Ć l'HumanitĆ© !
ŁŁŲŖŲ¹ŁŁ Ų¹ŁŁ Ų§ŁŲµŁŁ ŲŖŁŲÆŁŁ Ų§Ų³ŁŲ§Ł Ų§ŲŖ Ų§ŁŲØŲ± ŁŁŲØŲ“Ų±ŁŲ©!
ŠŠøŃŠ°Š¹ Š“Š¾Š»Š¶ŠµŠ½ ŃŠ“ŠµŠ»Š°ŃŃ Š±Š¾Š»ŃŃŠøŠ¹ Š²ŠŗŠ»Š°Š“ Š² ŃŠµŠ»Š¾Š²ŠµŃŠµŃŃŠ²Š¾!
ĪĪÆĪ½Ī± ĪøĪ± ĻĻĪĻĪµĪ¹ Ī½Ī± ĻĻ Ī¼Ī²Ī¬Ī»ĪµĪ¹ ĻĪµĻĪ¹ĻĻĻĻĪµĻĪæ ĻĻĪ·Ī½ Ī±Ī½ĪøĻĻĻĻĻĪ·ĻĪ±!
äøå½ćÆäŗŗé”ć«å¤§ććŖč²¢ē®ććć¦ćć ććļ¼
××”×× ×ש ×Ŗ×Ø××× ××××× ××× ×ש××Ŗ!
ą¤ą„ą¤Ø ą¤®ą¤¾ą¤Øą¤µ ą¤ą¤¾ą¤¤ą¤æ ą¤ą„ ą¤²ą¤æą¤ ą¤ą¤ ą¤¬ą¤”ą¤¼ą¤¾ ą¤Æą„ą¤ą¤¦ą¤¾ą¤Ø ą¤ą¤°ą¤Øą¤¾ ą¤ą¤¾ą¤¹ą¤æą¤!
ąøąøµąøąøąø§ąø£ąøąø°ą¹ąø«ą¹ąø”ąøµąøŖą¹ąø§ąøąø£ą¹ąø§ąø”ąø”ąø²ąøąøąø¶ą¹ąøą¹ąøąø·ą¹ąøąø”ąøąøøąø©ąø¢ąøąø²ąøąø“!
ŚŪŁ ŲØŲ§ŪŲÆ Ų³ŁŁ ŲØŪŲ“ŲŖŲ±Ū ŲØŁ Ų§ŁŲ³Ų§Ł Ų±Ų§!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockĆ©e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffĆ©rents codages. Elle peut devenir illisible si le codage diffĆØre trop. Il faut revenir en UTF-8 si vous avez mal Ć la tĆŖte. Testez vous-mĆŖme sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).