情報処理の世界で「特殊
文字」とは、
文字集合に属する
図形文字の中でも、伝統的な意味での「
文字」、つまり表音
文字や表意
文字とは異なる性格を持つものを指します。これらの
文字は、通常の
文字とは異なる特別な扱いを受けることが多く、
文字コード規格や情報処理の文脈において、その定義や範囲が定められています。
特殊文字の定義
多くの
文字コード規格では、特殊
文字は次のいずれかの方法、あるいはその両方を併用して定義されています。
1.
個々の文字の列挙: 特定の
文字コード規格において、特殊
文字として扱われる個々の
文字や、「
記号」といったグループを具体的に列挙します。
2.
除外による定義: ある
文字コード規格に定められた
図形文字の中から、特殊
文字にならないものを除外することで、残りを特殊
文字とします。
情報処理用語の規格では、より独立した定義がなされており、「
図形文字のうち、数字、表音
文字でなく、また概ね表意
文字でもない
文字」とされています。この「概ね」という言葉が使われているのは、例えば「
〆」のように、
漢字と非
漢字の両方に同じような形がありながら、表意
文字のように意味を持つ場合があるためです。
特殊文字に含まれるもの
特殊
文字には、様々な種類の
記号が含まれます。具体的には、以下のようなものがあります。
約物: 句読点などの文章を構成する
記号
学術記号: θ, π, Σ など数学や科学で使われる
記号
単位記号: ㎏, ㍑ など
単位を表す
記号
通貨記号: $, € など通貨を表す
記号
国際音声記号: θ, ǝ など発音を表す
記号
その他の記号: 矢印、
罫線素片、
トランプの
マーク(ハート、ダイヤなど)、絵
文字など
見解の分かれる特殊文字
特殊
文字の定義には、見解が分かれるものもあります。例えば、以下のようなものです。
空白: 空白は
制御文字として扱われることもありますが、
図形文字として特殊
文字に含めるかどうかは場合によって異なります。場合によっては、空白は特殊
文字とは別の独立したカテゴリーとして扱われることもあります。
その他の特殊文字
特定の
コンピュータ環境や
ソフトウェアにおいては、制御機能や
正規表現に関連して特別な機能を持つ
文字が「特殊
文字」と呼ばれることがあります。これらの
文字は、ファイルに存在していてもそのまま表示されず、特別な処理が必要になることがあります。例として、以下のような
文字があります。
コロン (:)
クエスチョン
マーク (?)
アスタリスク ()
バックスラッシュ (\)
また、一部の環境では、
ハードウェアの制約により
文字化けを起こすため、表示、入力、保存に特別な工夫が必要な
文字を「特殊
文字」と呼ぶことがあります。このような意味での特殊
文字は、
ウィキペディア内でもこの意味で使用されています。
コードセットに含まれない外字や機種依存文字
標準的な
JIS X 0208使用時におけるNEC特殊
文字、
IBM拡張文字
JIS X 0212や
JIS X 0213(第三水準、第四水準)に属する
文字
ユニコード使用時における
文字の一部
これらの特殊
文字は、
コンピュータの利用において、
文字コードやフォント、表示環境など様々な要因によって、その扱いが異なる場合があります。
まとめ
特殊
文字は、情報処理において、
文字コードや表示、入力、
ソフトウェアの機能など様々な側面で特別な扱いを受ける
文字の総称です。その種類は多岐にわたり、定義も一様ではありませんが、
コンピュータを利用する上で、これらの特殊
文字に関する知識は不可欠と言えるでしょう。