追加特殊用途面

追加特殊用途面(SSP)とは



追加特殊用途面(Supplementary Special-purpose Plane, SSP)は、ISO/IEC 10646|ISO_IEC 10646規格における第0群第14面、およびUnicodeにおける第14面として定義されています。この領域は、一般的な文字コードとは異なり、テキストの処理や表示を制御するための特殊なコードを格納するために使用されます。

概要



追加特殊用途面には、主に以下の2種類の制御コードが収録されています。

言語タグ:テキストにその言語情報を付与するためのコードです。これにより、テキストがどの言語で書かれているかを機械的に判別することが可能になり、多言語対応のアプリケーションやシステムで正確な処理を実現するために不可欠な要素となります。
異体字セレクタ:文字の字形をより詳細に指定するためのコードです。同じ文字でも、フォントや文化的な背景によって異なる字形が存在することがあります。異体字セレクタを使用することで、これらの微妙な字形の違いを明確に区別し、正確な表示を可能にします。特に、漢字などの複雑な文字体系において、異体字セレクタの役割は重要です。追加特殊用途面では、基本多[[言語面]]に収録されている異体字セレクタに加え、より多くの異体字セレクタを扱うことが可能です。

符号化



追加特殊用途面は、2バイト固定長のUCS-2では使用できません。これは、この面に収録されているコードが、UCS-2の表現範囲を超えているためです。UTF-8UTF-16UTF-32のいずれの符号化方式でも4バイトで符号化されます。UTF-16ではサロゲートペア(代用対)を使用する必要があります。サロゲートペアは、2つの16ビットコードユニットを組み合わせて、1つの文字を表現する方式です。これにより、UTF-16でも追加特殊用途面を含む、より広範な文字を扱うことが可能になります。

歴史



追加特殊用途面の歴史は、UnicodeISO/IEC 10646|ISO_IEC 10646規格の進化とともに歩んできました。

2001年:3月にUnicode 3.1が、11月にISO/IEC 10646|ISO_IEC 10646-2:2001が制定され、この面に対する文字の割り当てが開始されました。この時点で、追加特殊用途面の基本的な枠組みが確立しました。
2003年:4月にUnicode 4.0が、12月にISO/IEC 10646|ISO_IEC 10646:2003が制定され、異体字セレクタ240文字が両規格に収録されました。これにより、文字の字形をより詳細に制御するための機能が導入されました。
2006年:7月4日にISO/IEC 10646|ISO_IEC 10646:2003の追補2が、14日にUnicode 5.0が制定され、さらに異体字セレクタが追加されました。これは、文字表現の多様性をさらに広げるための重要な進展でした。

これらの更新を通じて、追加特殊用途面は、テキストの表現力と制御能力を向上させるための重要な役割を果たすようになりました。

関連事項



Unicode:世界中の文字を統一的に扱うことを目指した文字コード規格です。
ISO/IEC 10646|ISO_IEC 10646Unicodeと密接に関連する、国際標準化機構(ISO)と国際電気標準会議(IEC)が共同で策定した文字コード規格です。
基本多[[言語面]]Unicodeの最初の面で、基本的な文字や記号を収録しています。
追加面Unicodeの17ある面の総称であり、基本多[[言語面]]以外の面を指します。
追加多言語:追加面の一つで、歴史的な文字や少数言語の文字を収録しています。
追加漢字面:追加面の一つで、基本多[[言語面]]に収録しきれなかった漢字を収録しています。
第三漢字面:追加面の一つで、さらに多くの漢字を収録しています。
私用面:追加面の一つで、ユーザーが独自に文字を定義できる領域です。

外部リンク



Roadmap to the SSP (英語):追加特殊用途面の詳細な情報が掲載されています。

追加特殊用途面は、テキスト処理の高度化を支える重要な技術です。その役割を理解することは、国際的なコミュニケーションや情報処理において、非常に重要であると言えるでしょう。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。