情報処理の世界で「特殊
文字」とは、
文字集合に属する
図形[[文字]]の中でも、伝統的な意味での「
文字」、つまり表音
文字や表意
文字とは異なる性格を持つものを指します。これらの
文字は、通常の
文字とは異なる特別な扱いを受けることが多く、
文字コード規格や情報処理の文脈において、その定義や範囲が定められています。
特殊文字の定義
多くの
文字コード規格では、特殊
文字は次のいずれかの方法、あるいはその両方を併用して定義されています。
1.
個々の文字の列挙: 特定の
文字コード規格において、特殊
文字として扱われる個々の
文字や、「
記号」といったグループを具体的に列挙します。
2.
除外による定義: ある
文字コード規格に定められた
図形[[文字]]の中から、特殊
文字にならないものを除外することで、残りを特殊
文字とします。
情報処理用語の規格では、より独立した定義がなされており、「
図形[[文字]]のうち、数字、表音
文字でなく、また概ね表意
文字でもない
文字」とされています。この「概ね」という言葉が使われているのは、例えば「
〆」のように、
漢字と非
漢字の両方に同じような形がありながら、表意
文字のように意味を持つ場合があるためです。
特殊文字に含まれるもの
特殊
文字には、様々な種類の
記号が含まれます。具体的には、以下のようなものがあります。
約物: 句読点などの文章を構成する記号
学術記号: θ, π, Σ など数学や科学で使われる
記号
単位記号: ㎏, ㍑ など単位を表す記号
通貨記号: $, € など通貨を表す
記号
国際音声[[記号]]: θ, ǝ など発音を表す記号
その他の記号: 矢印、罫線素片、
トランプの
マーク(ハート、ダイヤなど)、絵
文字など
見解の分かれる特殊文字
特殊
文字の定義には、見解が分かれるものもあります。例えば、以下のようなものです。
空白: 空白は制御[[文字]]として扱われることもありますが、図形[[文字]]として特殊文字に含めるかどうかは場合によって異なります。場合によっては、空白は特殊文字とは別の独立したカテゴリーとして扱われることもあります。
その他の特殊文字
特定のコンピュータ環境やソフトウェアにおいては、制御機能や正規表現に関連して特別な機能を持つ文字が「特殊文字」と呼ばれることがあります。これらの文字は、ファイルに存在していてもそのまま表示されず、特別な処理が必要になることがあります。例として、以下のような文字があります。
コロン (:)
クエスチョンマーク (?)
アスタリスク (
)
バックスラッシュ (\)
また、一部の環境では、
ハードウェアの制約により
文字化けを起こすため、表示、入力、保存に特別な工夫が必要な
文字を「特殊
文字」と呼ぶことがあります。このような意味での特殊
文字は、
ウィキペディア内でもこの意味で使用されています。
コードセットに含まれない外字や機種依存文字
標準的な
JIS X 0208使用時におけるNEC特殊
文字、
IBM拡張[[文字]]
JIS X 0212やJIS X 0213(第三水準、第四水準)に属する文字
ユニコード使用時における
文字の一部
これらの特殊
文字は、
コンピュータの利用において、
文字コードやフォント、表示環境など様々な要因によって、その扱いが異なる場合があります。
まとめ
特殊
文字は、情報処理において、
文字コードや表示、入力、
ソフトウェアの機能など様々な側面で特別な扱いを受ける
文字の総称です。その種類は多岐にわたり、定義も一様ではありませんが、
コンピュータを利用する上で、これらの特殊
文字に関する知識は不可欠と言えるでしょう。