文字参照について
文字参照(もじさんしょう)は、HTMLやSGML形式の文書において、特定の文字や記号を明示的に示すための手段です。この方法は、一般的に直接入力できない特殊文字や記号(例えば、マークアップで使用される不等号「<」や「>」)を扱う際に用いられます。文字参照はSGMLの構成要素の一つとして定義されており、文書中の文字を適切に参照するための重要な技術となっています。
数値文字参照と文字実体参照
文字参照には大きく分けて二つの種類が存在します。ひとつは「数値文字参照」、もうひとつは「文字実体参照」です。
数値文字参照
数値文字参照は、特定の文字に対してISO 10646の文字番号を使用し、10進数または16進数で指定する方法です。例えば、8分音符「♪」を示す数値文字参照には以下のような書き方があります。
- - 10進数による例: `♪`
- - 16進数による例: `♪`
なお、16進数表記に関しては、HTML 4.0にて規定されており、大文字と小文字の区別はありません。従って、同じ文字を異なる形式で表記しても、結果は同じです。
文字実体参照
一方、文字実体参照は、その文字の名前を使用して対象の文字を指定する方法です。この方式は、直感的に理解しやすいため、一般的に多く使用されています。ただし、一部の特殊文字に関しては文字実体参照として定義されていないため、数値文字参照を使用するしかない場合もあります。
以下は、HTML文書でよく使用される文字実体参照の例です。
- - `ä` (ä) - 小文字 a(ウムラウト付き)
- - `Ä` (Ä) - 大文字 A(ウムラウト付き)
このように、数値文字参照とは異なり、文字実体参照では大文字と小文字の区別があります。
XMLにおける実体参照
XMLの場合、文字参照の使用にあたっては、定義済みの実体として使用できる文字の種類が限られています。基本的に特定の実体参照を使用するためには、事前に指定されたDTD(Document Type Definition)に依存する必要があります。具体的に使用可能な実体参照の種類は、XMLの仕様で明示されています。
文字参照の一覧
文字参照には、ISO-8859-1やWindows標準コードページ1252などの文字集合が関係してきます。これらのコーディング規格に含まれるが、ISO-8859-1に定義されていない特別な文字もあります。数値や文字実体参照を駆使することで、これらの文字を効果的に文書中に組み込むことができます。
まとめ
文字参照は、Web文書を作成する上で非常に重要な手法です。数値文字参照と文字実体参照を上手に使い分けることで、特殊文字や記号を正確に表現し、文書の可読性を向上させることができます。これらの技法を習得することは、マークアップ言語を扱う際の基本であり、より高度な文書作成へと繋がります。