ASCII 和 UTF-8 内容的倒置效果

Cette page encodée en ANSI/ASCII (charset=Windows-1252) a été mal interprétée par le navigateur en charset=ISO-8859-5: Cyrillic (ISO-8859-5).

Ã©

UTF-8 => ASCII

Page stockУЉe en fichier local en format Unicode UTF-8 interprУЉtУЉe par erreur en ASCII

�

ASCII => UTF-8

Page stockУЉe en fichier local en format ASCII interprУЉtУЉe par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en Ã©

Il Ã©tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

хЈщЈ<=>шЃщЅАх::!хБщфКщЈхфКЇхщцЉ!

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrщ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rшgle gщnщrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur р l'affichage, le diamant point d'interrogation ou carrщ vide � apparaюt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrщ vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prщciser que tous les caractшres ASCII du code 0 р 127 gardent toujours les mъmes codes sans changement quelque soit le codage des caractшres, ASCII, GBK, Unicode...

Tous les caractшres ASCII щtendus du code 0 р 255 (2**8=256, uni-octet, mono-byte) peuvent ъtre stockщs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractшres multi-octet (multi-byte) avec un code supщrieur ou щgal р 256, qui ne peuvent ъtre conservщs que dans un fichier Unicode comme UTF-8, ou bien dans un format spщcifique (code page pays) tel le GBK pour les idщogrammes chinois.

Sur le web, un caractшre Unicode peut en outre s'exprimer en code entitщ HTML, ainsi stockщ dans un fichier du codage ASCII. Par exemple, l'idщogramme 语 signifiant Langue, peut ъtre stockщ en mode ASCII par la chaюne 语, composщe uniquement des ampersand &, diшse #, suivi par des chiffres du numщro dщcimal de ce caractшre en Unicode, et terminщ par un point-virgule ;.

Citation de Mao pour tester:

中国应对人类作出较大的贡献！

La Chine doit faire une contribution relativement grande l''Humanitщ!

ويتعين على الصين تقديم اسهامات اكبر للبشرية!

Китай должен сделать больший вклад в человечество!

Κίνα θα πρέπει να συμβάλει περισσότερο στην ανθρωπότητα!

中国は人類に大きな貢献をしてください！

בסין יש תרומה גדולה לאנושות!

चीन मानव जाति के लिए एक बड़ा योगदान करना चाहिए!

จีนควรจะให้มีส่วนร่วมมากขึ้นเพื่อมนุษยชาติ!

چین باید سهم بیشتری به انسان را!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockщe dans le disque dur en format ANSI/ASCII. Mais je vous propose de l'afficher en diffщrents codages. Elle peut devenir illisible si le codage diffшre trop. Il faut revenir en ASCII si vous avez mal р la tъte. Testez vous-mъme sur votre navigateur en cliquant sur les liens suivants:

ASCII 和 UTF-8 内容的倒置效果

Citation de Mao pour tester:

цфОхщІцшЇ (0)

цГцЅхяМ | шЏЗ7/7чЕшЏшчГЛ ☎ 00 33 467 790 487 (чЕшЏ)

ASCII 和 UTF-8 内容的倒置效果

Citation de Mao pour tester:

цфОхщІцшЇ (0)

цГцЅхяМ | шЏЗ7/7чЕшЏшчГЛ ☎ 00 33 467 790 487 (чЕшЏ)

цфОхщІцшЇ (0)

цГцЅхяМ | шЏЗ7/7чЕшЏшчГЛ ☎ 00 33 467 790 487 (чЕшЏ)