GB 2312-80とは
GB 2312-80(またはGB 2312-1980)は、
中華人民共和国の国家規格として制定された
簡体字中国語の
文字コード規格です。
中国大陸を中心に広く利用されています。正式名称は「情報交換用漢字符号化
文字集合・基本集合」で、GB0とも呼ばれ、GBコードという場合は、多くの場合この規格を指します。日本の
JIS X 0208と構造が似ている点が多く、漢字を含む
文字集合の基本となっています。
概要
1981年5月1日に、当時の
中華人民共和国国家標準総局によって実施されました。GBは「国家標準」の略称で、日本のJIS規格に相当するものです。中国の標準化機関は何度か改称・改組を経て、
2001年に国家標準化管理委員会となりました。
GB 2312は、94×94の
文字集合で構成されており、漢字の他に、各種記号、
丸数字、
ローマ数字、英数字、仮名(ただし
長音符「ー」を除く)、
ギリシア文字、
キリル文字、
声調符号付き
拼音字母、
注音符号といった非漢字が682文字含まれています。漢字は一級漢字(3755字)と二級漢字(3008字)に分けられ、それぞれ読み順、部首順に配列されています。この点も
JIS X 0208と共通しています。
GB 2312をEUCで符号化したものを
簡体字中国語EUC (EUC-CN)と呼びます。また、
1990年代半ばには、インターネットメールやネットニュースなどで利用されていた非公式な符号化方式としてHZ(Hanziの略)がありましたが、現在ではEUC-CNが主流となっています。そのため、単にGB 2312と言えばEUC-CNを指すことが多くなっています。IANAの登録名もGB2312となっています。
派生・後継規格
GB/T 12345-90
「情報交換用漢字符号化
文字集合 第一補助集合」という規格名で、GB 2312の
繁体字版と見なすことができます。GB1とも呼ばれます。「T」は「推奨」を意味し、強制力がないことを示しています。GB 2312に収録された2112字の漢字を対応する
繁体字に置き換え、さらに62字を追加しています。GB 2312にあった41字は、
繁体字に対応させるため、追加領域へ移動しました。これは、
簡体字の中には複数の
繁体字・異体字を一つにまとめたものが存在するという漢字の簡略化の経緯によります。
「漢字内碼拡張規範」という正式名称を持ちます。「K」は「拡張」を意味します。国家技術監督局標準化司と電子工業部科技与質量監督司によって発布された「技術規範指導性文件」であり、正式な規格ではありません。
ISO/IEC 10646|ISO_IEC 10646.1:1993(UCS)=
Unicode 1.1の
中国語翻訳規格であるGB 13000.1-93(日本の
JIS X 0221-1995に相当)の
中国語サブセットであり、GB 2312 EUC-CNを拡張したものです。UCSからGB 2312にない漢字を追加し、漢字2万1003字(当時の
CJK統合漢字全2万0902字、追加漢字101字)を収録しました。
繁体字、日本漢字、韓国漢字に加え、「啰」(「囉」)や「镕」(「鎔」)のように、GB 2312制定後に簡略化された「規範漢字」も含まれています。
中国大陸向けの
Microsoft Windows 95簡体中文版に採用されたことで普及しました。マイクロソフトコードページ936としても知られています。
「情報技術 中文符号化
文字集合」という規格名を持ちます。
GBKをさらに拡張した、少数民族言語の文字なども含む大規模な文字セットであり、
GBKに代わる正式な国家規格です。
2000年3月17日に国家質量技術監督局によって「
GB 18030-2000 情報交換用漢字符号化
文字集合基本集合の拡張」として発布・実施されました。
2001年8月以降、
中国大陸で流通するコンピュータ製品は、原則としてこの規格を実装することが義務付けられています。
2005年11月8日に現行の新版に置き換えられ、
2006年5月1日に実施されました。これを用いた
文字符号化方式には、"GB18030"(IANA登録名)があります。
関連項目
Big5
CNS 11643
JIS X 0208
KS X 1001 (KS C 5601)
*
CJK統合漢字