マイクロソフト標準キャラクタセットは、Windowsオペレーティングシステムで日本語の
文字を表示する際に、特別なフォントを別途用意することなく、標準で使用できる
文字の集合です。このキャラクタセットは、Windowsの初期バージョンであるWindows 3.1から搭載され、日本語環境における
文字表示の基盤を担ってきました。
搭載された文字集合の変遷
初期のWindows 3.1では、『Windows-31J』に登録されている全ての
文字が
マイクロソフト標準キャラクタセットとして実装されていました。その後、Windowsのバージョンアップに伴い、扱える
文字の種類は大幅に拡張されていきます。
Windows 98やWindows NT 4.0(SP4以降)では、
マイクロソフト標準キャラクタセットに加えて、『
JIS X 0212』(補助漢字5801
文字)と『
JIS X 0221追加非漢字集合』(1913
文字)が実装されました。これにより、より多くの日本語
文字を扱えるようになり、表現の幅が広がりました。
さらに、Windows Vistaでは、『
JIS X 0213:2004』が実装され、より新しい規格に対応しました。
JIS X 0213:2004で例示字形が変更された
文字については、Windowsでも同様に変更され、規格に準拠した表示が実現されています。この変更はWindows Server 2008でも同様に行われました。
文字符号化方式
マイクロソフト標準キャラクタセットを表現するための
文字符号化方式としては、以下のものが利用できます。
Shift_JIS
拡張
EUC-JP
拡張ISO-2022-JP
これらの方式で符号化された文字集合には、それぞれコードページ番号が割り当てられています。
Shift_JIS → CP932
拡張EUC-JP → CP51932
拡張
ISO-2022-JP → CP50220
これらのコードページは、
コンピュータが
文字を正しく認識し、表示するために重要な役割を果たします。
通用日本文字集合
マイクロソフト標準キャラクタセットは、汎用的な日本語
文字を扱うために、いくつかの
文字集合を包含しています。その中でも、基本日本
文字集合以外の
文字は、より専門的な用途に使われることもあります。以下に、
JIS X 0213、
JIS X 0212に含まれない漢字のうち、通用日本
文字集合にのみ含まれる漢字の一部を示します。
(表は省略、表データは参考文献を参照ください)
これらの漢字は、JIS規格には含まれないものの、日本語の
文字として必要とされる場面が存在します。
まとめ
マイクロソフト標準キャラクタセットは、Windowsにおける日本語表示の歴史とともに進化してきた
文字集合です。当初は基本的な
文字のみを扱っていましたが、JIS規格の改正や技術の進歩に伴い、より多くの
文字を扱えるようになりました。これにより、多様な日本語表現を
コンピュータ上で実現できるようになり、私たちの情報伝達を円滑にする上で不可欠な存在となっています。
参考文献
Unicode による JIS X 0213 実装 ~情報システムにおける日本語処理~
漢字辞典wiki IBM拡張漢字
関連項目
Shift_JIS
Microsoftコードページ932
CJK互換漢字
IBM拡張[[文字]]