EUC-JIS-2004は、日本の文字をコンピュータ上で扱うための文字コードであり、JIS X 0213規格の符号化方式の一つとして定められています。具体的には、JIS X 0213:2004の附属書3において、その詳細な仕様が規定されています。
この符号化方式の大きな特徴は、ASCII文字、JIS X 0213の第1面と第2面、そしてJIS X 0201で定められた片仮名を、一つの体系の中で混在させて使用できる点にあります。これにより、多種多様な文字を効率的に表現することが可能となります。
具体的なコード値の割り当ては以下のようになっています。
0x20から0x7F:ASCII文字(正確にはISO/IEC 646|ISO_IEC 646の国際基準版)が割り当てられています。これは、アルファベットや数字、記号など、基本的な文字を表現するのに用いられます。 0xA1から0xFE:2バイトを使用し、JIS X 0213の第1面の文字を表現します。この部分は、JIS X 0208の上位互換であり、既存のシステムとの親和性が高いです。 0x8Fに続く2バイト文字:JIS X 0213の第2面の文字を表現します。これにより、より多くの漢字や記号を扱うことができます。 0x8Eに続く1バイト文字:JIS X 0201の片仮名を表現します。これにより、カタカナも容易に扱うことができます。
この符号化方式は、ISO/IEC 2022|ISO_IEC 2022の概念に基づいており、各文字集合をG0からG3までの領域に割り当てています。具体的には、G0にASCII、G1にJIS X 0213第1面、G2にJIS X 0201片仮名、G3にJIS X 0213第2面を割り当てています。そして、GLにG0を、GRにG1を呼び出すことで、基本的な文字表現を行います。また、SS2とSS3という制御符号を使うことで、G2とG3の文字集合を呼び出すことができるようになっています。
なお、この符号化方式は、JIS X 0213の初版(2000年)では「EUC-JISX0213」という名称で呼ばれていました。2004年の改正では、UCS互換漢字10文字が追加されましたが、これはごくわずかな違いであるため、EUC-JISX0213とEUC-JIS-2004はほぼ同一のものとして扱われることが多いです。