規格の「改正」においては、規格番号の末尾に「-1」が付いたり取れたりするなど「部編成が変わる」場合、形式的には前の規格を廃止し、新たな規格を制定したとして扱うことになっています。そのため、JIS X 0221の第2版や第3版は、形式的には前の規格の改正ではなく、新たな規格制定として扱われます。しかし、規格票の解説では、内容の変遷については「改正」として説明されています。
初版では附属書1で7種類を規定していましたが、第2版ではJIS X 0221がISO/IEC 10646|ISO_IEC 10646の国際一致規格であることとの整合性から、附属書1は規定から参考に格下げされました。第3版では、附属書1が附属書JAに変更され、基本日本文字集合と追加非漢字集合以外のレパートリは廃止され、代わりに以下の4つが追加されました。
JIS2004拡張漢字集合 (JIS2004 IDEOGRAPHICS EXTENSION):JIS X 0213で拡張された漢字。 補助漢字集合 (JAPANESE IDEOGRAPHICS SUPPLEMENT):JIS X 0212の漢字すべて(改正前の追加漢字集合と補助漢字集合を併合したもの)。 拡張非漢字集合 (JAPANESE NON IDEOGRAPHICS EXTENSION):JIS X 0213で拡張された非漢字。 通用日本文字集合 (COMMON JAPANESE):マイクロソフト標準キャラクタセットのUnicodeによる実装を事実上追認したもの。
BASIC JAPANESEに含まれるJIS X 0208漢字の数は、参考資料では6356文字とされていますが、JIS X 0208の漢字集合に合わせます。 COMMON JAPANESEの総文字数は、COMMON JAPANESEからBASIC JAPANESEの文字数を引いた数です。 JIS2004 IDEOGRAPHICS EXTENSIONとJAPANESE IDEOGRAPHICS SUPPLEMENTは2742文字を共有しています。 BASIC JAPANESEとCOMMON JAPANESEは、単独または他のレパートリと組み合わせて使用できます。 通用日本文字集合(COMMON JAPANESE)にのみ含まれる漢字は34文字です。 「仝」はJIS X 0208やJIS X 0213では記号として扱われていますが、Unicodeでは漢字として扱われます。 JIS X 0212とJIS X 0213では、UCS符号が一致しない文字があります。
しかし、ISO/IEC 10646|ISO_IEC 10646には欧州で使われる文字を集めた組はありますが、日本語でよく使われる文字を集めた組は規定されていませんでした。そのため、JIS X 0221では「日本文字部分レパートリ」という附属書を追加し、日本語でよく使われる文字を制限部分集合として独自に定めています。
まとめ
JIS X 0221は、ISO/IEC 10646|ISO_IEC 10646に準拠しながらも、日本語環境での文字利用に特化した規格です。その複雑な構造や歴史を理解することは、情報処理における文字化けなどの問題を解決する上で非常に重要です。JIS X 0221の各版やレパートリを理解することで、より正確な文字コードの取り扱いが可能になります。