文字参照について
文字参照(もじさんしょう)は、HTMLやSGML形式の文書において、特定の
文字や
記号を明示的に示すための手段です。この方法は、一般的に直接入力できない特殊
文字や
記号(例えば、マークアップで使用される
不等号「<」や「>」)を扱う際に用いられます。
文字参照はSGMLの構成要素の一つとして定義されており、文書中の
文字を適切に参照するための重要な技術となっています。
数値文字参照と文字実体参照
文字参照には大きく分けて二つの種類が存在します。ひとつは「数値
文字参照」、もうひとつは「
文字実体参照」です。
数値
文字参照は、特定の
文字に対してISO 10646の
文字番号を使用し、10進数または16進数で指定する方法です。例えば、8分音符「♪」を示す数値
文字参照には以下のような書き方があります。
- - 10進数による例: `♪`
- - 16進数による例: `♪`
なお、16進数表記に関しては、HTML 4.0にて規定されており、
大文字と
小文字の区別はありません。従って、同じ
文字を異なる形式で表記しても、結果は同じです。
一方、
文字実体参照は、その
文字の名前を使用して対象の
文字を指定する方法です。この方式は、直感的に理解しやすいため、一般的に多く使用されています。ただし、一部の特殊
文字に関しては
文字実体参照として定義されていないため、数値
文字参照を使用するしかない場合もあります。
以下は、HTML文書でよく使用される
文字実体参照の例です。
このように、数値
文字参照とは異なり、
文字実体参照では
大文字と
小文字の区別があります。
XMLにおける実体参照
XMLの場合、
文字参照の使用にあたっては、定義済みの実体として使用できる
文字の種類が限られています。基本的に特定の実体参照を使用するためには、事前に指定されたDTD(
Document Type Definition)に依存する必要があります。具体的に使用可能な実体参照の種類は、XMLの仕様で明示されています。
文字参照の一覧
文字参照には、ISO-8859-1やWindows標準コードページ1252などの
文字集合が関係してきます。これらのコーディング規格に含まれるが、ISO-8859-1に定義されていない特別な
文字もあります。数値や
文字実体参照を駆使することで、これらの
文字を効果的に文書中に組み込むことができます。
まとめ
文字参照は、Web文書を作成する上で非常に重要な手法です。数値
文字参照と
文字実体参照を上手に使い分けることで、特殊
文字や
記号を正確に表現し、文書の可読性を向上させることができます。これらの技法を習得することは、
マークアップ言語を扱う際の基本であり、より高度な文書作成へと繋がります。