CJK統合漢字拡張C(CJK Unified Ideographs Extension C)は、
Unicode規格における文字コードのブロックの一つです。このブロックには、主に2002年から2006年の間にIdeographic Research Group(IRG)に提出された、
中国語、日本語、韓国語、
ベトナム語の歴史的な
漢字や、現代では使用頻度が低い
漢字が収録されています。
また、
CJK統合漢字拡張Cには、
Unicodeのバージョン14.0および15.0で緊急に追加された5つの
漢字も含まれています。これらの
漢字は、過去の
Unicode規格で誤って統合されたり、何らかの理由で不足していたりしたため、緊急に追加される必要がありました。
このブロックに収録されている
漢字の中には、
漢字異体字データベースに登録されている
異体字セレクタを持つものが数十個存在します。
異体字セレクタは、
漢字の字形を区別するための符号であり、同じ
漢字でも異なる字体で表現する必要がある場合に使用されます。
CJK統合漢字拡張Cに収録されている文字の一つであるU+2A708の字「𪜈」は、
漢字として登録されていますが、実際には合略仮名(複数の文字を組み合わせて1文字のように書く仮名)の一つであるため、使用する際には注意が必要です。この例のように、
CJK統合漢字拡張Cには、見た目だけでは
漢字と区別しにくい文字も含まれているため、文字コードの情報を確認することが重要です。
以下に、
CJK統合漢字拡張Cに収録されている文字の一覧を示します。(文字一覧は省略)
CJK統合漢字拡張Cは、文字の歴史や多様性を知る上で重要な情報を提供しますが、利用する際には、その特性を理解した上で、適切な文字を選択するように注意する必要があります。
脚注
- - このブロックに含まれる文字は、特殊な環境でのみ使用される場合や、歴史的な文献にしか現れない場合があります。
- - 文字化けを防ぐためには、フォントや文字コードの設定を適切に行う必要があります。
- - 文字の利用にあたっては、Unicodeの公式サイトで詳細な情報を確認することを推奨します。