CCCII(中文資訊交換碼、Chinese Character Code of Information Interchange)は、
台湾で用いられる
文字コードの一つです。
ISO/IEC 2022|ISO_IEC 2022規格に準拠しており、94×94×94のコード空間を持つ3バイトコードとして設計されています。具体的には、各文字は21212116から7E7E7E16の範囲内で表現され、これは3つの7
ビット値を組み合わせた形式です。
この
文字コードは、
1980年に行政院文化建設委員会によって制定されました。初期の収録文字数は5139字でしたが、その後、複数回の追加と改定を経て、1999年の時点では73,400字が収録されるまでになりました。ただし、改定の履歴が複雑であるため、文献によって収録されている字数に差異が見られることがあります。これは、
文字コードの管理における課題を示唆しています。
CCCIIのコード空間は、特定の範囲に用途が割り当てられています。例えば、212B2116から212F7816には、非
漢字が331字収録されており、これには
部首214字が含まれます。また、21302116から21633016には、常用国字標準字体表に含まれる4808字が収録されています。さらに、21642116から26254316には、それ以外の
漢字37615字が収録されています。これらの配置は、CCCIIの設計における文字の体系的な整理を示しています。
CCCIIでは、6面をまとめて「群」と呼ぶ独特の構造を採用しています。これは、
ISO/IEC 10646|ISO_IEC 10646における256面を「群」と呼ぶ定義とは異なります。前述の符号位置はすべて第1群に属しており、この群には伝統的な
漢字が収録されています。第2群は、第1群の伝統字に対応する
簡体字が収録されており、符号位置は伝統字の符号に06000016を加えることで算出されます。第3群から第16群には、その他の異体字が収録されていますが、これらの群の大部分は未定義の領域となっています。これは、CCCIIが伝統字を基本とし、
簡体字や異体字を補完的に収録していることを示しています。
CCCIIを用いた
文字符号化方式としては、EUCの一種であるEUC-CCCII-FT(CCCII-FT内碼)が挙げられます。この方式は、CCCIIの文字を効率的に表現するために用いられています。
重要な点として、CCCIIは、
台湾で広く使用されている他の
文字コードである
Big5や
CNS 11643との
互換性がありません。これは、異なる設計思想に基づいて開発された
文字コードであることを意味しており、異なる
文字コード間の変換には注意が必要です。CCCIIは、
台湾における
漢字情報処理の歴史と多様性を反映した、独自の
文字コード体系であると言えるでしょう。