第三漢字面

第三漢字面(TIP)とは



第三漢字面(Tertiary Ideographic Plane, TIP)は、文字コードの国際規格であるISO/IEC 10646|ISO_IEC 10646(およびそれに準拠するUnicode)において、第0群第3面に位置づけられる追加面の一つです。

計画と現状



当初のロードマップでは、甲骨文字金文、小篆といった、現在では一般的に使用されない古代の漢字を収録することが予定されていました。しかし、実際には、追加漢字面に収まりきらなかった現代で使用される漢字が先に収録されることになりました。

符号化方式



第三漢字面に含まれる文字は、2バイト固定長方式のUCS-2では表現できません。そのため、UTF-8UTF-16UTF-32といった符号化方式で4バイトとして符号化されます。特にUTF-16では、サロゲートペア(代用対)という仕組みを使って表現する必要があります。

歴史的経緯



第三漢字面の策定には、以下のような歴史的経緯があります。

1996年7月: Unicode 2.0でサロゲートペア(代用対)が導入され、追加面の使用が可能になりました。ただし、この時点では具体的な名称や用途は定められていませんでした。
2008年4月25日: Unicode 5.1.0において、この面への文字の仮割り当てが決定されました。
2014年6月20日: JIS X 0221:2014にて、この面の日本語名称が「第三漢字面」と正式に定められました。それ以前は「第3の漢字面」などと呼ばれていました。
2014年10月24日: Unicode 7.0.1において、小篆をこの面に割り当てる正式な提案がロードマップに記載されました。
2016年1月21日: Unicode 8.0.1において、甲骨文字をこの面に割り当てる正式な提案がロードマップに記載されました。
2017年11月22日: 次期ISO/IEC 10646|ISO_IEC 10646Unicode)の追加レパートリー草案において、CJK統合[[漢字]]拡張Gの5002字がこの面に追加されることになりました。
2020年3月10日: Unicode 13.0において、CJK統合[[漢字]]拡張Gの4939字が正式にこの面に追加されました。

関連情報



第三漢字面は、文字コードの規格における重要な概念です。関連する用語として以下のようなものがあります。

Unicode: 文字コードの国際規格。
ISO/IEC 10646|ISO_IEC 10646: 文字コードの国際規格であり、Unicodeと互換性があります。
基本多言語面(BMP): Unicodeにおける最初の面で、最も一般的な文字が収録されています。
追加面: 基本多言語面以外の面。
追加多言語面(SMP): 追加面の一つで、複数の言語の文字を収録しています。
追加漢字面(SIP): 追加面の一つで、漢字の異体字などを収録しています。
追加特殊用途面(SSP): 追加面の一つで、特殊用途の記号を収録しています。
私用面(PUA): 追加面の一つで、ユーザーが自由に文字を定義できる領域です。

参考資料



Michael Everson, Rick McGowan, Ken Whistler, V.S. Umamaheswaran ([2014年]]10月24日). [Roadmap to the TIP (English). Unicode Consortium. 2014年10月31日閲覧。

これらの情報から、第三漢字面が文字コードの進化において重要な役割を果たしていることがわかります。特に、古代文字や非常に特殊な漢字をデジタルで扱うためには、このような追加面の存在が不可欠です。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。