ISO-2022-JP

ISO-2022-JPは、主にインターネット上、特に電子メールで日本語のテキストを扱うために設計された文字符号化方式です。この規格は、ISO/IEC 2022|ISO_IEC 2022で定義されたエスケープシーケンスを用いて、異なる文字集合を切り替える7ビットコード体系を特徴としています。しばしば「JISコード」という通称で呼ばれることもあります。

概要



ISO-2022-JPは、日本語の表記を目的とした文字コードであり、日本語が用いられるネットワーク環境において、日本の規格を基に開発されました。この文字コードは、漢字、ひらがな、カタカナといった日本語の基本文字はもちろんのこと、ラテン文字ギリシア文字キリル文字など、広範な文字集合をサポートしており、学術分野や産業界での利用にも適応できるように設計されています。規格名に、ISOの日本語の言語コード「ja」ではなく、国・地域コードである「JP」が用いられているのは、この文字コードが特定の言語だけでなく、日本という地域での利用を想定していることを示しています。

この規格では、JIS X 0211のC0集合(制御文字)、JIS X 0201のラテン文字集合、ISO 646の国際基準版図形文字、そしてJIS X 02081978年版、1983年版、1990年版が利用可能です。ただし、JIS X 0201の片仮名文字集合は利用できません。ISO-2022-JPは、1986年以降、日本の電子メールで使われていたJUNETコードを基に、1993年にRFC 1468として標準化されたもので、その後、JIS X 0208:1997の附属書2としてJIS規格にも取り入れられました。また、MIMEにおける文字符号化方式の識別名としてIANAに登録されています。

より詳細な符号化の仕様については、ISO/IEC 2022|ISO_IEC 2022の規格を参照することが推奨されます。

類似の符号化方式



ISO-2022-JPには、以下のような類似の符号化方式が存在します。これらの多くは、MIMEで使用される文字符号化方式としてIANAに登録されています。

ISO-2022-JP-1: RFC 2237で定義されており、ISO-2022-JPの文字集合に加え、JIS X 0212の文字も利用可能にした拡張規格です。
ISO-2022-JP-2: RFC 1554で定義されており、ISO-2022-JPの文字集合に加えて、JIS X 0212、KS X 1001、GB 2312、ISO 8859-1、ISO 8859-7の文字集合も利用できるように拡張された規格です。
ISO-2022-JP-3: JIS X 0213:2000の附属書2で規定された符号化表現で、ISO-2022-JPの漢字集合をJIS X 0213に置き換えるなどの変更が加えられています。IANA登録が提案されましたが、手続き上の問題で却下されました。
ISO-2022-JP-2004: JIS X 0213:2004の附属書2で規定された符号化表現で、ISO-2022-JP-3の漢字集合をJIS X 0213:2004に変更したものです。IANAへの登録はまだされていません。

ISO-2022-JPと非標準的拡張使用



ISO-2022-JPの規定では、その仕様に厳密に従う必要がありますが、実際には、Windows環境では、CP932コード(Shift_JISの拡張版)による独自拡張が広く使われています。この拡張により、ISO-2022-JPの範囲外の文字が使用されることが多く、異なるアプリケーション間での文字化けの原因となることがあります。

例えば、Internet ExplorerやOutlook Expressといったマイクロソフト製のアプリケーションだけでなく、EmEditor、秀丸エディタ、Thunderbirdなど、他のWindowsアプリケーションでも同様の現象が見られます。これらのアプリケーションでISO-2022-JPの範囲外の文字を使用すると、異なる製品間では未定義の文字として扱われたり、文字化けを引き起こすことがあります。そのため、一部の電子メールクライアントでは、独自拡張文字の使用を警告したり、意図的に使用を制限するなどの対策が取られています。また、ISO-2022-JPの範囲内の文字であっても、CP932に含まれる非標準文字(全角チルダなど)も文字化けの原因となることがあります。

Javaでは、バージョン6以降、「x-windows-iso2022jp」というコード名で、マイクロソフトのCP932ベースの拡張ISO-2022-JPに対応しています。また、一部のケースでは、ISO-2022-JPの名称を使用しながら、JIS X 0212(補助漢字)やJIS X 0201の片仮名文字集合(半角カナ)を符号化している例もあります。これらの文字は、ISO-2022-JPの仕様では許可されていません。

このような独自拡張は、ISO/IEC 2022|ISO_IEC 2022の仕様にも準拠していない場合があり、受信側の電子メールクライアントがこれらの拡張に対応していない場合、文字化けやテキスト全体が正しく表示されない問題を引き起こす可能性があります。

脚注



関連情報として、以下の項目も参照ください。

JIS[[漢字コード]]
日本[[産業規格]](情報処理)の一覧
国際標準化機構が定める国際標準一覧 (ISO 2000 から ISO 2999 まで)

参考資料



J. Murai 他 (1993年6月). RFC 1468 Japanese Character Encoding for Internet Messages
M. Ohta 他 (1993年12月). RFC 1554 ISO-2022-JP-2: Multilingual Extension of ISO-2022-JP
K. Tamaru 他 (1997年11月). RFC 2237 Japanese Character Encoding for Internet Messages
日本規格協会 (2000年). JIS X 0213:2000 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』 附属書2「ISO-2022-JP-3符号化表現」
日本規格協会 (2004年). JIS X 0213:2000/AMENDMENT 1:2004 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合 (追補1)』 附属書2「ISO-2022-JP-2004符号化表現」

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。