UTF-8 ๅ’Œ ASCII ๅ†…ๅฎน็š„ๅ€’็ฝฎๆ•ˆๆžœ

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=TIS-620: Thai (TIS-620).
Affichage du caractรจre รฉ
Mnรฉmonique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockรฉe en fichier local en format Unicode UTF-8 interprรฉtรฉe par erreur en ASCII
ASCII => UTF-8
Page stockรฉe en fichier local en format ASCII interprรฉtรฉe par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrรฉ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rรจgle gรฉnรฉrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur ร  l'affichage, le diamant point d'interrogation ou carrรฉ vide � apparaรฎt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrรฉ vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prรฉciser que tous les caractรจres ASCII du code 0 ร  127 gardent toujours les mรชmes codes sans changement quelque soit le codage des caractรจres, ASCII, GBK, Unicode...

Tous les caractรจres ASCII รฉtendus du code 0 ร  255 (2**8=256, uni-octet, mono-byte) peuvent รชtre stockรฉs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractรจres multi-octet (multi-byte) avec un code supรฉrieur ou รฉgal ร  256, qui ne peuvent รชtre conservรฉs que dans un fichier Unicode comme UTF-8, ou bien dans un format spรฉcifique (code page pays) tel le GBK pour les idรฉogrammes chinois.

Sur le web, un caractรจre Unicode peut en outre s'exprimer en code entitรฉ HTML, ainsi stockรฉ dans un fichier du codage ASCII. Par exemple, l'idรฉogramme ่ฏญ signifiant Langue, peut รชtre stockรฉ en mode ASCII par la chaรฎne 语, composรฉe uniquement des ampersand &, diรจse #, suivi par des chiffres du numรฉro dรฉcimal de ce caractรจre en Unicode, et terminรฉ par un point-virgule ;.

Citation de Mao pour tester:

ไธญๅ›ฝๅบ”ๅฏนไบบ็ฑปไฝœๅ‡บ่พƒๅคง็š„่ดก็Œฎ๏ผ

La Chine doit faire une contribution relativement grande ร  l'Humanitรฉ !

ูˆูŠุชุนูŠู† ุนู„ู‰ ุงู„ุตูŠู† ุชู‚ุฏูŠู… ุงุณู‡ุงู…ุงุช ุงูƒุจุฑ ู„ู„ุจุดุฑูŠุฉ!

ะšะธั‚ะฐะน ะดะพะปะถะตะฝ ัะดะตะปะฐั‚ัŒ ะฑะพะปัŒัˆะธะน ะฒะบะปะฐะด ะฒ ั‡ะตะปะพะฒะตั‡ะตัั‚ะฒะพ!

ฮšฮฏฮฝฮฑ ฮธฮฑ ฯ€ฯฮญฯ€ฮตฮน ฮฝฮฑ ฯƒฯ…ฮผฮฒฮฌฮปฮตฮน ฯ€ฮตฯฮนฯƒฯƒฯŒฯ„ฮตฯฮฟ ฯƒฯ„ฮทฮฝ ฮฑฮฝฮธฯฯ‰ฯ€ฯŒฯ„ฮทฯ„ฮฑ!

ไธญๅ›ฝใฏไบบ้กžใซๅคงใใช่ฒข็Œฎใ‚’ใ—ใฆใใ ใ•ใ„๏ผ

ื‘ืกื™ืŸ ื™ืฉ ืชืจื•ืžื” ื’ื“ื•ืœื” ืœืื ื•ืฉื•ืช!

เคšเฅ€เคจ เคฎเคพเคจเคต เคœเคพเคคเคฟ เค•เฅ‡ เคฒเคฟเค เคเค• เคฌเคกเคผเคพ เคฏเฅ‹เค—เคฆเคพเคจ เค•เคฐเคจเคพ เคšเคพเคนเคฟเค!

เธˆเธตเธ™เธ„เธงเธฃเธˆเธฐเนƒเธซเน‰เธกเธตเธชเนˆเธงเธ™เธฃเนˆเธงเธกเธกเธฒเธเธ‚เธถเน‰เธ™เน€เธžเธทเนˆเธญเธกเธ™เธธเธฉเธขเธŠเธฒเธ•เธด!

ฺ†�Œู† ุจุง�Œุฏ ุณู‡ู… ุจ�Œุดุชุฑ�Œ ุจู‡ ุงู†ุณุงู† ุฑุง!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockรฉe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffรฉrents codages. Elle peut devenir illisible si le codage diffรจre trop. Il faut revenir en UTF-8 si vous avez mal ร  la tรชte. Testez vous-mรชme sur votre navigateur en cliquant sur les liens suivants:

[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).

jin่ดงๅธ | zhong้’Ÿ่กจ | yi็ฟป่ฏ‘ | ci่ฏๅ…ธ | xieไนฆๅ†™ | zhuanๅญ—็ ่ฝฌๆข

ๆไพ›ๅ้ฆˆๆ„่ง (1)

1. ๆฅ่ฎฟ่€… *.*.182.* - 2015-10-19 10:04:52
ูˆูŠุชุนูŠู† ุนู„ู‰ ุงู„ุตูŠู† ุชู‚ุฏูŠู… ุงุณู‡ุงู…ุงุช ุงูƒุจุฑ ู„ู„ุจุดุฑูŠุฉ!
็”ตๅญไฟก็ฎฑ ็ฝ‘็ซ™ๅœฐๅ€

่ฏทๅœจ็ฉบๆ ผ้‡Œๆ‰“ๅ…ฅไปฅไธ‹ๅฎ‰ๅ…จๅญ—็ฌฆไธฒ:
ๆ‹ท่ดๅญ—็ฌฆไธฒใ€‚

ไบšๆดฒไน‹ๅฎถ > ๅทฅๅ…ท > UTF-8 ๅ’Œ ASCII ๅ†…ๅฎน็š„ๅ€’็ฝฎๆ•ˆๆžœ | ๅŸบๆœฌ้”€ๅ”ฎๆกๆฌพ | ้€€ๆขๅ’Œ่ฟ˜ๆฌพ | ไฟๅฏ†ๆกๆฌพ | ๅธธ้—ฎ้—ฎ็ญ”
  

ๆƒณๆฅๅ—๏ผŸ | ่ฏท7/7็”ต่ฏ่”็ณป00 33 467 790 487 (็”ต่ฏ)

็ˆ†่ตท็ช—ๅฃ    ๅ…ณ้—ญ
่ฏท่€ๅฟƒ็ญ‰ๅพ…ๅ†…ๅฎน็š„ๅˆฐๆฅ...