字体とは何か?
字体とは、
文字の骨格となる抽象的な
概念です。ある図形を、特定の
文字体系における一字として視覚的に
認識する際の、その
文字の根本的な形を指します。例えば「刀」と「
刃」は、意味も異なる別の字ですが、それぞれ異なる字体を持っています。「
刃」は「刀」よりも一画多い点がその違いです。
さらに、
文字コードを策定する際には、
句読点や
括弧など、意味や音を持たない記号も、グリフという
概念を用いて抽象化されます。これらの記号も、それぞれの字体を持つと考えることができます。
字種、字体、字形の関係
文字は
言語と結びつき意味を持ちますが、その意味によって字種に分類されます。原則として、異なる字種は異なる字体を持ちます。しかし、稀に異なる字種が同一の字体を持つ場合があります。これを「同形異字」と呼びます。
また、一つの字種に複数の字体が共存することもあります。これらの字体は、異なる字源を持つ場合や、同じ字源から発生しながら歴史的・地理的に変化した結果固定された場合などがあります。字義・字音が同じで字体が異なる
文字を「異体字」と呼び、その中でも規範とされる字体を「正字体」と呼びます。
字体の
概念と似たものに「字形」があります。字形は、個別具体的な
文字の形の総称です。
文字の視覚的な差異は全て字形の違いとして捉えられますが、字体は抽象的な
概念であるため、字形はあくまで字体の表現の一つに過ぎません。しかし、字形は
書体の変遷によって大きく変化するため、あらゆる字形の違いを包括できる字体を想定するのは困難です。
文字コードにおいて、字種・字体・字形の区別は、
文字体系を共有する者同士の合意によって行われます。「異なる字体とみなすか、字形の違いにとどめるか」といった判断は、必ずしも一意に決まらないのです。
同形異字の例
同形異字とは、同じ字形でも意味や読みが異なる字のことです。
例1:芸(藝の略字)。「ゲイ」と「ウン」という異なる読みを持つ。
例2:灯(燈の略字)。複数の読みを持つ。
正字体
正字体とは、ある
文字において最も規範的な字体です。特に複数の字体を持つ
漢字で問題となります。正字体の選定基準は、その典拠と判断根拠によって異なり、歴史的に様々な体系が提唱されてきました。
中国(清代まで)
清代の『康熙字典』(
1716年)以前は、史籀篇、説文解字、釈名、顔氏字様、干禄字書、開成
石経などが正字体の規範として用いられてきました。特に説文解字で示された小篆は、正字の規範として重視されました。干禄字書は、
科挙受験生のために楷書の正字体を示した字書です。
康熙字典体
『康熙字典』の字形に基づく字体です。伝統的な楷書とは異なる字形が多く見られます。皇帝の名を避けるため、一部の字形には欠画が見られます。現在通用している康熙字典体は、実用性を考慮して修正されたものです。
1950年代に中国で制定された中国語の正字体系です。従来非公認だった俗字(略字)を正式な字体としています。中国、
シンガポール、
マレーシアで使用されています。
台湾、
香港、
マカオなどで使用される、簡略化されていない字体です。中国大陸では
繁体字と呼ばれますが、
台湾では標準字と呼ばれます。地域によって異体字の扱いや字体に細かい違いがあります。
新字形
1960年代に中国で制定された標準
印刷字体です。康熙字典体よりも
筆記体に近く、減画や異体字の整理が行われています。
簡体字と混同されることもありますが、
繁体字も含めた字体体系です。
日本
日本の
漢字の
新字体と
旧字体については、別途記事を参照ください。
韓国
韓国で使用される
漢字(ハンチャ)は、特別な簡略化を受けていません。おおむね
繁体字と一致するものの、学校教育で使用される字体は、康熙字典体や
台湾・
香港の
繁体字とは異なる点があります。
異体字
異体字とは、同一の
文字観念を持つ複数の字体のことです。文章中では相互に置換可能です。正字体と異なる字体を異体字と呼ぶのと同様に、正字体も別の字体にとっては異体字です。
漢字は字形の揺れが大きく、
書体の変遷により異なる字体を持つことが多いです。複数の字体が許容される場合もありますが、意味が分化すると別字となる場合もあります。
俗字・通字
俗字・通字は、正字として認められていないが通用している
文字です。正字規範の高まりとともに認知されるようになりました。
異体字の種類
異体字には、構成要素の配置が異なるもの、異なる音符や意符を使ったもの、略体・書き癖などによって生じたものなど、様々な種類があります。
異体字の認定
一般的に、字義・字音が同じで、同じ文脈で交換可能なものを異体字と認定できます。しかし、中国では字義・字音の歴史的変化により、認定が難しい場合もあります。古代の字音や本義が異なる場合などです。
文字集合と異体字
JIS X 0208などの
文字集合では、原則として異体字ごとにコードポイントを割り当てません。そのため、コンピュータで表示される
文字は、フォントによって異なる場合があります。フォントに依存しない異体字の切り替えには、フォント切り替え、CIDフォント、OpenTypeフォントなど様々な手法があります。
Unicodeでは、異体字タグの導入によって包括的な解決を目指していますが、課題も残されています。