字体とは何か?
字体とは、
文字の骨格となる抽象的な
概念です。ある図形を、特定の
文字体系における一字として視覚的に
認識する際の、その
文字の根本的な形を指します。例えば「刀」と「
刃」は、意味も異なる別の字ですが、それぞれ異なる字体を持っています。「
刃」は「刀」よりも一画多い点がその違いです。
さらに、
文字コードを策定する際には、
句読点や
括弧など、意味や音を持たない記号も、グリフという
概念を用いて抽象化されます。これらの記号も、それぞれの字体を持つと考えることができます。
字種、字体、字形の関係
文字は
言語と結びつき意味を持ちますが、その意味によって字種に分類されます。原則として、異なる字種は異なる字体を持ちます。しかし、稀に異なる字種が同一の字体を持つ場合があります。これを「同形異字」と呼びます。
また、一つの字種に複数の字体が共存することもあります。これらの字体は、異なる字源を持つ場合や、同じ字源から発生しながら歴史的・地理的に変化した結果固定された場合などがあります。字義・字音が同じで字体が異なる
文字を「異体字」と呼び、その中でも規範とされる字体を「正字体」と呼びます。
字体の
概念と似たものに「字形」があります。字形は、個別具体的な
文字の形の総称です。
文字の視覚的な差異は全て字形の違いとして捉えられますが、字体は抽象的な
概念であるため、字形はあくまで字体の表現の一つに過ぎません。しかし、字形は
書体の変遷によって大きく変化するため、あらゆる字形の違いを包括できる字体を想定するのは困難です。
文字コードにおいて、字種・字体・字形の区別は、
文字体系を共有する者同士の合意によって行われます。「異なる字体とみなすか、字形の違いにとどめるか」といった判断は、必ずしも一意に決まらないのです。
同形異字の例
同形異字とは、同じ字形でも意味や読みが異なる字のことです。
例1:芸(藝の
略字)。「ゲイ」と「ウン」という異なる読みを持つ。
例2:灯(燈の
略字)。複数の読みを持つ。
正字体
正字体とは、ある
文字において最も規範的な字体です。特に複数の字体を持つ
漢字で問題となります。正字体の選定基準は、その典拠と判断根拠によって異なり、歴史的に様々な体系が提唱されてきました。
中国(清代まで)
清代の『
康熙字典』(
1716年)以前は、史籀篇、
説文解字、釈名、顔氏字様、
干禄字書、開成
石経などが正字体の規範として用いられてきました。特に
説文解字で示された小篆は、正字の規範として重視されました。
干禄字書は、
科挙受験生のために楷書の正字体を示した字書です。
『
康熙字典』の字形に基づく字体です。伝統的な楷書とは異なる字形が多く見られます。皇帝の名を避けるため、一部の字形には欠画が見られます。現在通用している
康熙字典体は、実用性を考慮して修正されたものです。
1950年代に中国で制定された中国語の正字体系です。従来非公認だった俗字(
略字)を正式な字体としています。中国、
シンガポール、
マレーシアで使用されています。
台湾、
香港、
マカオなどで使用される、簡略化されていない字体です。中国大陸では
繁体字と呼ばれますが、
台湾では標準字と呼ばれます。地域によって異体字の扱いや字体に細かい違いがあります。
1960年代に中国で制定された標準
印刷字体です。
康熙字典体よりも
筆記体に近く、減画や異体字の整理が行われています。
簡体字と混同されることもありますが、
繁体字も含めた字体体系です。
日本
日本の
漢字の
新字体と
旧字体については、別途記事を参照ください。
韓国
韓国で使用される
漢字(ハンチャ)は、特別な簡略化を受けていません。おおむね
繁体字と一致するものの、学校教育で使用される字体は、
康熙字典体や
台湾・
香港の
繁体字とは異なる点があります。
異体字
異体字とは、同一の
文字観念を持つ複数の字体のことです。文章中では相互に置換可能です。正字体と異なる字体を異体字と呼ぶのと同様に、正字体も別の字体にとっては異体字です。
漢字は字形の揺れが大きく、
書体の変遷により異なる字体を持つことが多いです。複数の字体が許容される場合もありますが、意味が分化すると別字となる場合もあります。
俗字・通字
俗字・通字は、正字として認められていないが通用している
文字です。正字規範の高まりとともに認知されるようになりました。
異体字の種類
異体字には、構成要素の配置が異なるもの、異なる音符や意符を使ったもの、略体・書き癖などによって生じたものなど、様々な種類があります。
異体字の認定
一般的に、字義・字音が同じで、同じ文脈で交換可能なものを異体字と認定できます。しかし、中国では字義・字音の歴史的変化により、認定が難しい場合もあります。古代の字音や本義が異なる場合などです。
文字集合と異体字
JIS X 0208などの
文字集合では、原則として異体字ごとにコードポイントを割り当てません。そのため、コンピュータで表示される
文字は、フォントによって異なる場合があります。フォントに依存しない異体字の切り替えには、フォント切り替え、CIDフォント、
OpenTypeフォントなど様々な手法があります。
Unicodeでは、異体字タグの導入によって包括的な解決を目指していますが、課題も残されています。