数学用英数字記号
Unicodeにおいて、「
数学用英数字記号」(Mathematical Alphanumeric Symbols)は、
数学の分野で特定の書体を用いて異なる概念を区別するために設けられた特別な文字群を収めたブロックの名称です。このブロックには、
ラテン文字、ギリシャ文字、そして数字について、多様な書体スタイルが用意されています。例えば、
数学では同じアルファベットであっても、立体、イタリック、ボールド、スクリプト(
筆記体)、
フラクトゥール(ドイツ文字)、黒板
太字といったスタイルによって、それぞれが持つ意味が区別されるのが一般的です。
このブロックが設立された背景には、このような
数学特有の厳密な表記規則に電子的に対応する必要がありました。一般的な英数字とは明確に区別される特殊な
数学文字をコンピュータ上で正確に表現し、処理できるようにするため、
Unicodeコンソーシアムはこれらの文字を体系的に収集し、符号化しました。当初、一部の
数学記号は「文字様記号」ブロックなどに分散して収録されていましたが、
Unicodeのバージョン3.1以降、
ラテン文字とギリシャ文字の主要な書体が一括してこの「
数学用英数字記号」ブロック(主にU+1D400からU+1D7FFの範囲)に収録されることで、
数学関連の文書処理における利便性が向上しました。
収録されている文字は、
数学で使用頻度の高い様々なスタイルを網羅していますが、一般的な文章で標準的に使われるセリフ体や
サンセリフ体の英数字は、オペレーティングシステムやアプリケーションのデフォルトフォントで表示されることを前提としているため、このブロックには含まれていません。表示に関しては注意が必要な点があり、例えば
サンセリフフォント環境では、このブロックに含まれる
サンセリフ体の記号は標準の文字と同じように見える一方、本来セリフ体で表示されるべき記号は適切に表示されない場合があります。また、ブラウザやシステムの標準フォント設定によって、画面上に表示される文字の見た目がセリフ体か
サンセリフ体かに影響を受けることもあります。
Unicodeコンソーシアムは、このブロックに収録されている文字を、
数学以外の一般的な文章における単なる装飾目的で使用しないことを推奨しています。これは、これらの文字が
数学的な文脈において意味的な区別を持つように設計されているためです。しかし残念ながら、現実にはソーシャルメディアなどでユーザー名に特殊なフォントとして使用される例が見られるほか、視覚的な類似性を悪用したフィッシングなどの
ホモグラフ攻撃に利用されるケースも報告されています。
歴史的な経緯から、「文字様記号」(Letterlike Symbols)ブロックに先に収録されていた文字の中には、この
数学用英数字記号ブロックの文字と意味的に重複するものがあります。例えば、
筆記体の大文字R(ℛ)は文字様記号ブロックのU+211Bに収録されており、
数学用英数字記号ブロックの対応するコードポイント(U+1D4AD)は重複を避けるために予約された状態になっています。約24文字がこのような形で文字様記号ブロックに存在し、
数学用英数字記号ブロックには収録されていません。
また、一部の文字については、
Unicodeの文字名が示す形状と、実際に収録されている文字の形状が異なる例も存在します。例えば、U+2113の`script small l`(ℓ)は、文字名としては
筆記体の小文字Lを指しますが、実際には
リットル記号として使われる
イタリック体の小文字Lを元にした文字が収録されています。U+2118の`script capital p`(℘)も同様に、文字名は大文字の
筆記体Pですが、実際にはヴァイエルシュトラスの楕円関数記号として使われる小文字のPが収録されています。これらの例外は、文字の実際の使用状況や歴史的な慣習に基づいて採用されています。
これらの特殊な
数学用英数字記号は、MathML(Mathematical Markup Language)のような
数学記述言語においても活用され、`mathvariant`のような属性を用いることで、数式の意味的な正確さに加えて視覚的な表現の豊かさも実現しています。