ISO/IEC 8859-11

ISO 8859-11: タイ語のための8ビット文字コード



ISO 8859-11は、タイ語の文字を表示するために設計された8ビットの文字コードです。ISO 8859標準規格群の一つとして1999年に追加されました。タイの国家標準であるTIS-620 (1990年制定) と非常に高い互換性を持ち、その違いはわずかです。具体的には、ISO 8859-1116進数A0にノーブレークスペースを定義しているのに対し、TIS-620では未定義であるという点のみが異なります。このわずかな相違は、実際には無視されることが多いです。

ISO 8859-11は、ISO 8859シリーズのIANAキャラクタセットの標準的な命名規則に従っていますが、登録されたIANAキャラクタセット名ではありません。しかし、ノーブレークスペースを除いたTIS-620IANAに登録されています。これは、ISO 8859-11とTIS-620が事実上同一であることを示しています。

Microsoft Windowsのコードページ874や、Apple Macintoshのタイ語版で使用されるコードページも、TIS-620をベースに拡張されています。しかし、これらのコードページ同士は互換性がありません。これは、異なるプラットフォームやソフトウェアで独自の拡張が行われたためです。

ISO 8859-11の下位128文字(コード00~7F)は、ASCIIコードと完全に互換性があります。これは、ISO 8859シリーズの他の文字コードと共通の特徴です。上位128文字はタイ語の文字を表現しており、Unicodeにも同じ順序で登録されています。Unicodeへのマッピングは、A1からU+0E01へと単純なシフトになっています。そのため、ISO 8859-11で用いられる文字は、Unicodeでも容易に扱えます。

表示のためには、文字サイズを200%程度に拡大する必要がある場合があります。これは、タイ文字の細かい形状を正確に表示するためです。標準的なスペース文字はコード20、ノーブレークスペースはコードA0で表現されます。

ISO/IEC 8859-11では、特定のコード範囲には文字が割り当てられていません。これらのコードは使用できません。具体的には、00-1F、7F80-9FDB-DEFC-FFのコード範囲です。さらに、D1D4-DA、E7-EEのコード範囲は、結合文字が割り当てられています。結合文字とは、他の文字と組み合わせて使用される文字です。

ISO 8859-11は、タイ語の文字を扱うための効率的な文字コードとして、長年にわたって使用されてきました。しかし、Unicodeの普及に伴い、近年はUnicodeが主流となっています。Unicodeは、世界中の様々な言語の文字を網羅した文字コードであり、ISO 8859-11よりも多くの文字を表現できます。ただし、既存のシステムや文書との互換性を維持するため、ISO 8859-11は依然として利用されています。今後、Unicodeへの移行が進むことが予想されますが、ISO 8859-11タイ語処理における歴史的な重要性を持ち続けています。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。