KOI-7(КОИ-7)は、「情報交換用符号、7ビット」(Код Обмена Информацией, 7 бит)を意味し、
ロシア語表記に用いられる
キリル文字を含む7ビットの
文字コードです。このコードは、情報交換を目的として設計され、特に
ロシア語環境におけるテキストデータの取り扱いに重要な役割を果たしました。
KOI-7の概要
KOI-7は、3つの異なる文字セット(набор)、すなわちН0、Н1、Н2を定義しています。
Н0: このセットはUS-ASCIIと完全に同一です。したがって、英語のアルファベット、数字、および一般的な記号が使用可能です。ASCIIベースのシステムとの互換性を保つための基本となるセットです。
Н1: Н1セットでは、すべての文字が
キリル文字に置き換えられています。これにより、
ロシア語のテキストを直接エンコードできるようになります。さらに、ドル記号($)が通貨記号(¤)に置き換えられている点も特徴です。このセットは、完全に
キリル文字で構成されたテキストを扱う際に使用されます。
Н2: Н2セットは、大文字はASCIIのままですが、小文字の位置に
キリル文字の大文字が割り当てられています。この結果、小文字の入力が必要ない環境で
キリル文字を表示する際に使用されます。また、ドル記号が通貨記号に置き換えられます。この構成は、1990年代初頭まで特に問題視されませんでした。当時、多くのプログラムは大文字で記述され、一部のプリンターは小文字を印刷できませんでした。そのため、大文字のみで表現するニーズに対応していました。
実際の運用
実際の運用では、通常、Н2のみを使用するか、Н0とН1を切り替えて使用します。文字セットの切り替えには、以下のコントロール文字が用いられます。
0x0E (SO, РУС): このコントロール文字は、
ロシア語モードに切り替えるために使用されます。この文字を受信すると、システムはН1文字セットに切り替わり、
キリル文字が表示されるようになります。
*
0x0F (SI, ЛАТ): このコントロール文字は、ラテン語モードに戻すために使用されます。この文字を受信すると、システムはН0文字セットに切り替わり、ASCII文字が表示されるようになります。
特徴と制限
KOI-7にはいくつかの制約があります。例えば、
キリル文字の「
Ё」および大文字の「Ъ」は含まれていません。これは、当初の
文字コード設計における制約によるものです。ただし、
キリル文字は発音の類似したラテン文字の位置に配置されているため、誤ったモードで表示された場合でも、ある程度内容を推測することが可能です。この特徴は、モードの誤りによる可読性の低下をある程度軽減する役割を果たします。
関連事項
KOI-7は、後のKOI8
文字コードの基礎となりました。KOI8は、より多くの
キリル文字に対応し、現代の
ロシア語環境で広く使用されています。KOI-7は、その歴史的な背景から、過去の
ロシア語環境における情報交換のあり方を理解するための重要な要素です。
まとめ
KOI-7は、
キリル文字を扱うための初期の7ビット
文字コードであり、その設計は後の
文字コードに大きな影響を与えました。3つの文字セット、モード切り替え機能、そして
キリル文字の配置方法が、このコードのユニークな特徴を形成しています。現代の
文字コードと比較すると制約もありますが、その歴史的な重要性は否定できません。