CJKV

CJKVとは



CJKVは、中国語(Chinese)、日本語(Japanese)、朝鮮語(Korean)、ベトナム語(Vietnamese)の頭文字をとった略語です。特に、これらの言語で共通して使われる、あるいは過去に使われていた文字体系である字(ベトナム語チュノムを含む)を指します。この用語は、ソフトウェアの国際化、特に文字コードに関する分野で頻繁に用いられます。

CJKVという用語は、東アジアの主要な書記体系を総称する際に使用されます。しかし、ベトナム語は比較的早くに字を廃止し、チュノムを含めるべきか議論があるため、中国語、日本語、朝鮮語の頭文字をとったCJKという用語が使われることもあります。ただし、CJKといいながら実際にはCJKVについて述べているケースも少なくありません。

CJKVの特徴



CJKVの最大の特徴は、マルチバイト[[文字]]を使用することです。中国語、日本語、朝鮮語コンピュータで扱う場合、英数字や記号に加えて、字、平仮名片仮名ハングルといった多様な文字が必要となります。これらの文字集合は、アルファベットを使用する多くの欧米言語とは異なり、1バイト(8ビット)で表現できる文字数を超えています。そのため、CJKV言語ではマルチバイト[[文字]]が用いられます。

文字の入力


字、平仮名片仮名ハングル(特に字)は文字数が多いため、全ての文字をキーボードに直接割り当てることは現実的ではありません。そこで、現在では英字キーボードにいくつかのキーを追加したキーボードと、ソフトウェアによるインプットメソッド(IME)を使用して文字を入力するのが一般的です。IMEは、使用しているソフトウェアと互換性がある必要があります。

日本語や中国語では、読みを入力してソフトウェアで変換し、目的の表記を得るタイプのIMEが一般的です。日本語IMEの例としては、Microsoft IMEGoogle 日本語入力ATOKSKKなどがあります。これらのIMEは、変換の区切りによって単字変換、連文節変換などに分けられます。中国語では、文字全体の形状や筆画に基づいて字を特定する五筆字型輸入法のようなIMEも使われています。

朝鮮語のIMEでは、ハングルを構成する要素であるチャモ(字母)単位で入力を行う方法が一般的です。

組版


CJKV言語では、欧米言語とは異なる組版方法が必要となります。その一つが縦書き(縦組み)です。コンピュータのテキスト表示や処理は元々横書きが基本でしたが、CJK/CJKVテキストは伝統的に縦書きであり、組版において縦書きへの対応が不可欠です。縦書きにする際は、単に縦に表示するだけでなく、文字の間隔や配置も縦書きに対応させる必要があります。

また、CJKVの組版では、縦組み、横組みのどちらの場合でも、文字を正方形の格子上に配置する機能が求められます。これは、字、平仮名片仮名ハングルなど、CJKV特有の文字の多くが正方形に合う字形を持つためです。ただし、一部の記号やラテン[[文字]]はそうではないため、これらの文字が混在する文書では、縦書き用の文字への置き換えなど、複雑な処理が必要になります。

CJKVに適用できる組版規則を定めた規格としては、JIS X 4051-1995(2004年に改正)があります。

文字コード規格



Unicode


UnicodeCJK統合[[漢字]]は、ベトナムの符号化文字集合規格であるTCVN 5773:1993とTCVN 6056:1995の字(チュニョとチュノム)も原規格として統合しており、実際にはCJKVです。例えば、「U+7551 畑」には、日本語の国字である「畑」と、チュノムの「畑」が統合されています。


参考資料



ケン・ランディ『CJKV日中韓越情報処理』
CJKV統合字 - IT用語辞典 e-Words
CJKとは - キーマンズネット

関連項目



FIGS(フランス語イタリア語・ドイツ語・スペイン語
インプットメソッド

朝鮮における[[漢字]]
日本における[[漢字]]
チュノム、チュニョ
縦書きと横書き
文字コード
CJK統合[[漢字]]
* マルチバイト[[文字]]

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。