TSCII(Tamil Script Code for Information Interchange、情報交換用
タミル文字符号)は、
タミル文字をコンピュータ上で表現するための符号化方式です。その特徴は、
ASCIIとの互換性を持ちながら、
タミル文字を独自の方式で符号化している点にあります。
具体的には、TSCIIは下位128個の符号位置に
ASCII文字を割り当て、上位128個の符号位置に
タミル文字を割り当てることで、
ASCIIと共存しながら
タミル文字を表現することを可能にしています。この設計は、既存のシステムとの互換性を保ちながら、
タミル文字をデジタル環境で利用できるようにすることを目的としています。
TSCIIのもう一つの重要な特徴は、
タミル文字を「視覚的な順序」で符号化することです。これは、
タミル文字タイプライターで文字が入力される順序と同じであり、実際に書かれる順序で文字を符号化します。この方式は、
タイ文字の符号化で採用されていた方式と類似しています。一方で、
Unicodeは「論理的な順序」で文字を符号化しており、TSCIIとは異なるアプローチを取っています。
Unicodeは、
ISCII(インド文字符号化標準)に従い、文字が持つ意味に基づいて符号化順序を決定します。
TSCIIは、インターネット上では長らく私的な合意に基づいて使用されていましたが、2007年にIANAに登録され、正式な符号化方式として認められました。しかし、
タミル・ナードゥ州政府は独自のTAB/TAM規格を推進しており、TSCII以外にも複数の符号化方式がWWW上で見られます。
フリーな電子テキスト収集プロジェクトであるProject Maduraiは、以前はTSCII符号化を使用していましたが、現在では
Unicode版の提供を開始しています。これは、
Unicodeがより広く普及し、標準的な符号化方式として認識されるようになったことを示しています。
TSCIIの文字コード表を見ると、80は
Unicodeバージョン4.1で受理された「U+0BE6 TAMIL DIGIT ZERO」に対応し、A0は「NO-BREAK SPACE」に対応していることがわかります。一方で、符号ADとFFは未割り当てとなっています。
参考文献として、TSCIIのスタートページや、TSCIIから
Unicodeへのテキスト変換に関する
Unicode Technical Note、INFITT(タミル情報技術国際フォーラム)のページなどが挙げられます。また、TSCIIから
Unicodeへのオンライン変換ツールや、Mozilla拡張機能のPadmaも有用なリソースです。
まとめると、TSCIIは
タミル文字を表現するための符号化方式であり、
ASCIIとの互換性、視覚的な順序での符号化、そしてIANAへの登録といった特徴があります。しかし、
Unicodeの普及に伴い、TSCIIから
Unicodeへの移行が進んでいる状況です。TSCIIは、
タミル文字をデジタル化する初期段階において重要な役割を果たしましたが、より標準的な
Unicodeへの移行は、
タミル文字の普遍的な利用を促進すると考えられます。