TSCII

TSCII(Tamil Script Code for Information Interchange、情報交換用タミル文字符号)は、タミル文字をコンピュータ上で表現するための符号化方式です。その特徴は、ASCIIとの互換性を持ちながら、タミル文字を独自の方式で符号化している点にあります。

具体的には、TSCIIは下位128個の符号位置にASCII文字を割り当て、上位128個の符号位置にタミル文字を割り当てることで、ASCIIと共存しながらタミル文字を表現することを可能にしています。この設計は、既存のシステムとの互換性を保ちながら、タミル文字をデジタル環境で利用できるようにすることを目的としています。

TSCIIのもう一つの重要な特徴は、タミル文字を「視覚的な順序」で符号化することです。これは、タミル文字タイプライターで文字が入力される順序と同じであり、実際に書かれる順序で文字を符号化します。この方式は、タイ文字の符号化で採用されていた方式と類似しています。一方で、Unicodeは「論理的な順序」で文字を符号化しており、TSCIIとは異なるアプローチを取っています。Unicodeは、ISCII(インド文字符号化標準)に従い、文字が持つ意味に基づいて符号化順序を決定します。

TSCIIは、インターネット上では長らく私的な合意に基づいて使用されていましたが、2007年にIANAに登録され、正式な符号化方式として認められました。しかし、タミル・ナードゥ州政府は独自のTAB/TAM規格を推進しており、TSCII以外にも複数の符号化方式がWWW上で見られます。

フリーな電子テキスト収集プロジェクトであるProject Maduraiは、以前はTSCII符号化を使用していましたが、現在ではUnicode版の提供を開始しています。これは、Unicodeがより広く普及し、標準的な符号化方式として認識されるようになったことを示しています。

TSCIIの文字コード表を見ると、80はUnicodeバージョン4.1で受理された「U+0BE6 TAMIL DIGIT ZERO」に対応し、A0は「NO-BREAK SPACE」に対応していることがわかります。一方で、符号ADとFFは未割り当てとなっています。

参考文献として、TSCIIのスタートページや、TSCIIからUnicodeへのテキスト変換に関するUnicode Technical Note、INFITT(タミル情報技術国際フォーラム)のページなどが挙げられます。また、TSCIIからUnicodeへのオンライン変換ツールや、Mozilla拡張機能のPadmaも有用なリソースです。

まとめると、TSCIIはタミル文字を表現するための符号化方式であり、ASCIIとの互換性、視覚的な順序での符号化、そしてIANAへの登録といった特徴があります。しかし、Unicodeの普及に伴い、TSCIIからUnicodeへの移行が進んでいる状況です。TSCIIは、タミル文字をデジタル化する初期段階において重要な役割を果たしましたが、より標準的なUnicodeへの移行は、タミル文字の普遍的な利用を促進すると考えられます。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。