外字とは
外字とは、特定の文字集合、例えばJIS規格の
文字コードなどに含まれていない文字のことを指します。一般的には、
JIS X 0208に含まれない文字を指すことが多く、「表外字」や「拡張漢字」とも呼ばれます。また、
常用漢字に含まれない文字を外字と呼ぶこともあります。
外字の弊害
外字は、異なるシステム間で文字イメージが一致しないため、テキストデータの流通において問題を引き起こす可能性があります。そのため、文字情報基盤事業の成果として、
異体字セレクタを利用した
Unicode IVD/IVSで定義された文字への包括が進められています。文字情報基盤では、戸籍や住民票業務に必要な文字を整理し、文字セットを定義しており、これらの文字を中心に
Unicode IVD/IVSで扱えるように
文字コードが定義されています。
政府は、行政のIT化のために公文書で使える異体字を文字情報基盤で定義したものに限定していく方針です。MicrosoftもWindowsでの外字サポートを縮小し、
Unicode IVD/IVSによる異体字の利用を推進しています。
外字の種類と歴史
初期のコンピュータにおける外字
PC-98シリーズなどでは、
JIS X 0201の文字以外に独自の記号が定義され、「98文字」などと呼ばれ、外字の一種として扱われました。
1979年に
JIS X 0208に含まれない文字を使用するために、未定義領域に独自の文字を作成する手段が取られました。メーカーがあらかじめ組み込んだ外字を「システム外字」や「ベンダ定義文字」と呼び、ユーザーが作成した外字を「ユーザ外字」や「ユーザ定義文字」と呼びます。ワープロなどでも外字作成が可能な製品が多く存在し、
Microsoft Windowsでは外字エディタでユーザ外字を作成できました。Shift_JISの0xF000〜0xFFFCの領域がユーザ外字領域として広く使われ、外字領域の文字のみを含むフォントを外字フォントと呼びました。
1997年の
JIS X 0208の改訂で、未定義領域に外字を入れることは原則禁止されました。
2000年に規格化された
JIS X 0213では、Shift_JIS-2004(Shift_JISX0213)で実装水準3の場合に、0xF000〜0xFFFCの領域を外字領域として使用することが可能になりました。
Unicodeでは、「私用領域」としてU+E000〜U+F8FF、U+F0000〜U+FFFFD、U+100000〜U+10FFFDに外字領域が設けられています。Windowsのユーザ外字領域であるShift_JISの0xF040〜0xF9FCは、
UnicodeのU+E000〜U+E757に順番に対応付けられています。Windowsの外字エディタではU+E758〜U+F8FFにも外字を作成できますが、これはWindowsの
Unicode環境でのみ使用可能です。また、Windowsのシンボルフォント「
Wingdings」の一部のグリフは
Unicodeにマッピングされています。
DRCS外字
日本のデータ放送、文字放送、字幕放送などではDRCS外字が使われています。ARIBの
文字コードでは
JIS X 0208の文字や
ARIB外字などを使用できますが、これ以外に任意の外字も使用できます。
外字登録
ワープロや
オペレーティングシステムでは、ユーザーが自分で外字を登録できます。
その他の外字
常用漢字表に含まれない文字を表外字と呼びます。
国語審議会は、
常用漢字に含まれない漢字の字形のよりどころを規定しています。
人名・地名用外字
人名を扱うシステムでは、人名用外字が使われていました。住基ネット統一文字や
戸籍統一文字には人名に使われる文字がほぼ含まれており、これらの文字は
Unicodeに収録されています。また、中国や韓国の人名・地名を表記するためにも多くの外字が使われていましたが、
Unicodeや多言語フォントの普及により外字の使用は減少しています。
入管正字・入管外字
法務省は漢字圏の氏名の表記のために入管正字を定めていますが、かつては
Unicodeに含まれない文字も含まれていました。
Unicode 10.0で
CJK統合漢字拡張Fが追加され、入管正字の全ての文字が収録されました。しかし、入管正字に置き換える元の漢字(簡体字等)の一部は
Unicodeに収録されていないため入管外字として管理されています。
法務省の
登記統一文字は、
戸籍統一文字と
登記固有文字で構成されます。
登記統一文字番号は8桁で管理されます。
著名な外字集合
JIS X 0208の外字として使われた文字集合の中には、標準化されたり、デファクトスタンダードになったものが存在します。例えば、
ARIB外字、
レコード用文字符号、iモード絵文字、
EZweb絵文字、
SoftBank絵文字、歯科用外字、
ビブロス外字、K-JIS外字、共同通信外字、案内用図記号などがあります。
過去の外字集合
既に
Unicodeに含まれているものなど、IBM外字、NEC外字、Microsoft外字、JIS2004外字などがありました。
その他の外字
裁判所外字、エヌフォー外字集合、漫画用外字、医学用外字など、特定の分野や用途に特化した外字もあります。
関連項目
出典
- - 総務省|自治体クラウドポータルサイト|外字の実態調査に係る調査報告書等
- - 「市区町村が使用する外字の実態調査」 報告書 - 総務省
- - グループ:CDP外字 - GlyphWiki - グリフウィキ(CDP(Chinese Document Processing lab)の外字)