TRONコードとは
TRONコードは、TRONプロジェクトで使用される
文字コードです。
1987年に発表されたTRON多国語言語環境の初期論文に端を発し、主に
BTRONで利用されてきました。
特徴
TRONコードは、単一の
文字コードとして存在するのではなく、TRONの実身/仮身モデルをサポートするデータフォーマットであるTAD(TRON Application Databus)の一部として機能します。
TRONプロジェクトでは、独自の
文字収集も行っていますが、TRONコードの基本は、既存の
文字集合をそのまま取り込むフレームワークとして設計されています。特に漢字については、
Unicodeの
CJK統合漢字のような統合を行わず、JIS、
GB 2312、
KS X 1001、
CNS 11643といった各国の
文字コードをそのまま空間に割り当てている点が大きな特徴です。
また、
トンパ文字やSF作品に登場する架空
文字であるアーヴ
文字など、独特な
文字も収録されています。
仕様
TRONコードは2バイト単位を基本とし、0000~FFFFの空間を4つのゾーンに分割しています。1つのゾーンあたり48,400の
符号点を持ち、エスケープシーケンスによって面を切り替えることで、規格上はいくらでも
文字を割り当てることが可能です。
ゾーン構成
Aゾーン: 2121 - 7E7E
Bゾーン: 8021 - FD7E
Cゾーン: 2180 - 7EFD
Dゾーン: 8080 - FDFD
ISO/IEC 646|ISO_IEC 646などの8ビット系コードとの互換性も一部資料で言及されていますが、制御コード以外は実装されていません。
詳細
TRONコードの第2面2100 - 21FF番の領域には、
GT書体が収録されています。2100から2120までは制御用の未使用領域で、実際の
文字領域は2121から開始されます。2121から217Eまでは「」の部首に関連する
文字が収録され、2180からは「」を部首とする
文字群が続きます。
他の
文字コードでは、このような配列になることは少ないですが、TRONコードでは、第1バイトが同じでも、連続するコードがゾーンによって分断される現象が発生します。例えば、第2面217E番の「」に続く
文字は、第2面2221番の「」から再び続行されます。
スクリプト構成
標準では31面150万
文字の登録が可能ですが、2006年10月27日時点で割り当てられているのは9面18万
文字です。各スクリプトには、複数の
文字種が混在して収録されており、TRONコードに登録された
文字種は39種に及びます。
TRONコードに収録されている主な
文字種は以下の通りです。
漢字(JIS、GB、KS、CNSなど)
仮名
アルファベット
キリル
文字
ギリシャ
文字
ハングル
点字
トンパ文字
アーヴ
文字
その他
多言語と多文字
TRONコードの仕様により、多様な
文字種を含む文章をデータ化できます。しかし、表示には別の問題が存在します。
文字の綴り方は言語によって異なり、
漢字文化圏より複雑な規則を持つ言語も多いです。
BTRONでは、言語層、スクリプト層、
文字属層、フォント層というレイヤを想定していますが、現状では実装されていません。このため、インド系の
文字の結合処理、
アラビア語や
ヘブライ語の右から左への記述順など、正しく表示できない問題が残っています。
トンパ文字は収録されていますが、トンパは横に並べるだけでなく、
文字に色を加えて修飾する文法も持つため、必ずしもトンパを正しく表示できる環境とは言えません。これらの理由から、TRONコードは多言語ではなく、多
文字に対応しているに過ぎないという評価もあります。
歴史
TRONコードは、当初から多くの
文字コードを扱えるように設計されていましたが、
1999年に超漢字が発売されるまでは、第1面のみが使用される状況が続いていました。この第1面は「とりあえず多言語面」とも呼ばれていました。多言語と言っても、実際には
漢字文化圏の3か国(日本、中国、韓国)の
文字セットと点字をまとめたものでした。
また、当初は「言語指定コード」で言語を切り替える構想でしたが、実際には「スクリプト切り替えコード」が使用されています。
超漢字の登場により、
Big5や今昔
文字鏡が収録され、収録
文字数が大幅に増加しました。その後、2000年1月にTRON
文字収録センターが発足し、
トンパ文字やアーヴ
文字などの
文字種も収録されました。しかし、
GT書体との絡みやライセンスの問題で、今昔
文字鏡がTRONコードから削除される事態となり、第11面から第15面までの5面が欠番となっています。
関連項目
大漢和辞典
GT書体
住民基本台帳収録変体仮名
おとど()
TRONコード一覧 2-2100 - 2-21FF
TRONコード一覧 2-2200 - 2-22FF
TRONコード一覧 2-2300 - 2-23FF
TRONコード一覧 2-2400 - 2-24FF
外部リンク
BTRON3仕様書
TRON文字収録センター
超漢字
GT明朝
*
今昔文字鏡