特殊文字

特殊文字とは



情報処理の世界で「特殊文字」とは、文字集合に属する図形[[文字]]の中でも、伝統的な意味での「文字」、つまり表音文字や表意文字とは異なる性格を持つものを指します。これらの文字は、通常の文字とは異なる特別な扱いを受けることが多く、文字コード規格や情報処理の文脈において、その定義や範囲が定められています。

特殊文字の定義



多くの文字コード規格では、特殊文字は次のいずれかの方法、あるいはその両方を併用して定義されています。

1. 個々の文字の列挙: 特定の文字コード規格において、特殊文字として扱われる個々の文字や、「記号」といったグループを具体的に列挙します。
2. 除外による定義: ある文字コード規格に定められた図形[[文字]]の中から、特殊文字にならないものを除外することで、残りを特殊文字とします。

情報処理用語の規格では、より独立した定義がなされており、「図形[[文字]]のうち、数字、表音文字でなく、また概ね表意文字でもない文字」とされています。この「概ね」という言葉が使われているのは、例えば「」のように、漢字と非漢字の両方に同じような形がありながら、表意文字のように意味を持つ場合があるためです。

特殊文字に含まれるもの



特殊文字には、様々な種類の記号が含まれます。具体的には、以下のようなものがあります。

約物: 句読点などの文章を構成する記号
学術記号: θ, π, Σ など数学や科学で使われる記号
単位記号: ㎏, ㍑ など単位を表す記号
通貨記号: $, € など通貨を表す記号
国際音声[[記号]]: θ, ǝ など発音を表す記号
その他の記号: 矢印、罫線素片、トランプマーク(ハート、ダイヤなど)、絵文字など

見解の分かれる特殊文字



特殊文字の定義には、見解が分かれるものもあります。例えば、以下のようなものです。

空白: 空白は制御[[文字]]として扱われることもありますが、図形[[文字]]として特殊文字に含めるかどうかは場合によって異なります。場合によっては、空白は特殊文字とは別の独立したカテゴリーとして扱われることもあります。

その他の特殊文字



特定のコンピュータ環境やソフトウェアにおいては、制御機能や正規表現に関連して特別な機能を持つ文字が「特殊文字」と呼ばれることがあります。これらの文字は、ファイルに存在していてもそのまま表示されず、特別な処理が必要になることがあります。例として、以下のような文字があります。

コロン (:)
クエスチョンマーク (?)
アスタリスク ()
バックスラッシュ (\)

また、一部の環境では、ハードウェアの制約により文字化けを起こすため、表示、入力、保存に特別な工夫が必要な文字を「特殊文字」と呼ぶことがあります。このような意味での特殊文字は、ウィキペディア内でもこの意味で使用されています。

コードセットに含まれない外字や機種依存文字
標準的なJIS X 0208使用時におけるNEC特殊文字IBM拡張[[文字]]
JIS X 0212JIS X 0213(第三水準、第四水準)に属する文字
ユニコード使用時における文字の一部


これらの特殊文字は、コンピュータの利用において、文字コードやフォント、表示環境など様々な要因によって、その扱いが異なる場合があります。

まとめ



特殊文字は、情報処理において、文字コードや表示、入力、ソフトウェアの機能など様々な側面で特別な扱いを受ける文字の総称です。その種類は多岐にわたり、定義も一様ではありませんが、コンピュータを利用する上で、これらの特殊文字に関する知識は不可欠と言えるでしょう。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。