TRONコード

TRONコードとは



TRONコードは、TRONプロジェクトで使用される文字コードです。1987年に発表されたTRON多国語言語環境の初期論文に端を発し、主にBTRONで利用されてきました。

特徴



TRONコードは、単一の文字コードとして存在するのではなく、TRONの実身/仮身モデルをサポートするデータフォーマットであるTAD(TRON Application Databus)の一部として機能します。

TRONプロジェクトでは、独自の文字収集も行っていますが、TRONコードの基本は、既存の文字集合をそのまま取り込むフレームワークとして設計されています。特に漢字については、UnicodeCJK統合漢字のような統合を行わず、JIS、GB 2312KS X 1001CNS 11643といった各国の文字コードをそのまま空間に割り当てている点が大きな特徴です。

また、トンパ文字やSF作品に登場する架空文字であるアーヴ文字など、独特な文字も収録されています。

仕様



TRONコードは2バイト単位を基本とし、0000~FFFFの空間を4つのゾーンに分割しています。1つのゾーンあたり48,400の符号点を持ち、エスケープシーケンスによって面を切り替えることで、規格上はいくらでも文字を割り当てることが可能です。

ゾーン構成

Aゾーン: 2121 - 7E7E
Bゾーン: 8021 - FD7E
Cゾーン: 2180 - 7EFD
Dゾーン: 8080 - FDFD

ISO/IEC 646|ISO_IEC 646などの8ビット系コードとの互換性も一部資料で言及されていますが、制御コード以外は実装されていません。

詳細



TRONコードの第2面2100 - 21FF番の領域には、GT書体が収録されています。2100から2120までは制御用の未使用領域で、実際の文字領域は2121から開始されます。2121から217Eまでは「」の部首に関連する文字が収録され、2180からは「」を部首とする文字群が続きます。

他の文字コードでは、このような配列になることは少ないですが、TRONコードでは、第1バイトが同じでも、連続するコードがゾーンによって分断される現象が発生します。例えば、第2面217E番の「」に続く文字は、第2面2221番の「」から再び続行されます。

スクリプト構成



標準では31面150万文字の登録が可能ですが、2006年10月27日時点で割り当てられているのは9面18万文字です。各スクリプトには、複数の文字種が混在して収録されており、TRONコードに登録された文字種は39種に及びます。

収録文字



TRONコードに収録されている主な文字種は以下の通りです。

漢字(JIS、GB、KS、CNSなど)
仮名
アルファベット
キリル文字
ギリシャ文字
ハングル
点字
トンパ文字
アーヴ文字
その他


多言語と多文字



TRONコードの仕様により、多様な文字種を含む文章をデータ化できます。しかし、表示には別の問題が存在します。文字の綴り方は言語によって異なり、漢字文化圏より複雑な規則を持つ言語も多いです。BTRONでは、言語層、スクリプト層、文字属層、フォント層というレイヤを想定していますが、現状では実装されていません。このため、インド系の文字の結合処理、アラビア語ヘブライ語の右から左への記述順など、正しく表示できない問題が残っています。

トンパ文字は収録されていますが、トンパは横に並べるだけでなく、文字に色を加えて修飾する文法も持つため、必ずしもトンパを正しく表示できる環境とは言えません。これらの理由から、TRONコードは多言語ではなく、多文字に対応しているに過ぎないという評価もあります。

歴史



TRONコードは、当初から多くの文字コードを扱えるように設計されていましたが、1999年に超漢字が発売されるまでは、第1面のみが使用される状況が続いていました。この第1面は「とりあえず多言語面」とも呼ばれていました。多言語と言っても、実際には漢字文化圏の3か国(日本、中国、韓国)の文字セットと点字をまとめたものでした。

また、当初は「言語指定コード」で言語を切り替える構想でしたが、実際には「スクリプト切り替えコード」が使用されています。

超漢字の登場により、Big5や今昔文字鏡が収録され、収録文字数が大幅に増加しました。その後、2000年1月にTRON文字収録センターが発足し、トンパ文字やアーヴ文字などの文字種も収録されました。しかし、GT書体との絡みやライセンスの問題で、今昔文字鏡がTRONコードから削除される事態となり、第11面から第15面までの5面が欠番となっています。

関連項目



大漢和辞典
GT書体
住民基本台帳収録変体仮名
おとど()
TRONコード一覧 2-2100 - 2-21FF
TRONコード一覧 2-2200 - 2-22FF
TRONコード一覧 2-2300 - 2-23FF
TRONコード一覧 2-2400 - 2-24FF

外部リンク



BTRON3仕様書
TRON文字収録センター
超漢字
GT明朝
* 今昔文字

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。