U-PRESS

U-PRESS(ゆーぷれす)とは



U-PRESSは、共同通信社が独自に策定した文字コード文字符号化方式および文字セット)です。Unicode2.1をベースとし、基本多言語面(BMP)の私用領域に新聞独特の外字を配置している点が特徴です。総収録文字数は15,269文字に及びます。

背景



1990年代には、ワープロやパソコンなどの情報機器向けに「K-JIS」といった新聞社独自の文字コードが開発されました。しかし、これらの文字コードは運用の不統一や周知不足により、広く普及するには至りませんでした。そこで、共同通信社Unicodeを16ビット固定長(UTF-16)として扱い、その外字領域に新聞独自の外字を配置した規格を策定しました。この規格がU-PRESSであり、2002年から社内運用を開始し、2003年からは新聞各社への配信にも利用されています。

各種文字コードとの対応



U-PRESSは、以下のJIS規格の文字コードとの間で、文字の対応関係を持っています。

JIS X 0201: 全文字を収録しています。
JIS X 0208: 全文字を収録していますが、字体は印刷標準字体に準拠します。
JIS X 0212: 全文字を収録しています。
JIS X 0213: BMPに収録されている文字はそのまま収録し、それ以外の文字は私用領域に収録しています。ラテ欄記号、縦書き専用文字、連数字などの独自文字も私用領域に収録しています。符号化方式にはUTF-16が用いられているため、BMPの範囲内においてはUnicodeとの互換性があります。
UCSの一部非漢字: U-PRESSには、一般的に使われているIBM拡張文字や、古い新聞社用文字コードのK-JIS、ラテ欄(特にBSデジタル)で使われているARIB[[外字]]の一部が含まれていません。イワタは、これらの文字との互換性を持たせるために、独自の拡張文字セット(848文字)を規定しています。
Adobe-Japan1-6: Adobe-Japan1-6にはU-PRESSの独自文字が追加されています。しかし、モリサワのフォントでは、U-PRESSとAdobe-Japan1-6の間で字体に違いが見られる場合があります。

対応システム・フォント



U-PRESSに対応したシステムやフォントには、以下のようなものがあります。

入力用IME: ジャストシステムからは、ATOKの「for U-PRESS」バージョンが開発・販売されています。
対応フォント:
イワタの各種新聞書体(イワタ U-PRESS拡張文字セット対応)
モリサワの各種OTF Uprフォント
SCREENのヒラギノフォントのUpr版

問題点



U-PRESSは、JIS X 0213:2004が制定される前に策定された私的な規格であるため、サロゲートペア(代用対)に対応していないなど、Unicodeとの互換性が完全ではありません。そのため、今後、既存のコードと衝突する可能性も懸念されています。

関連項目



共同通信社
K-JIS
Adobe-Japan1
JIS X 4051
外字

U-PRESSは、新聞業界における文字コードの標準化を目指した取り組みの一つであり、現在でも新聞記事の配信などに広く利用されています。しかし、その規格の独自性から、今後のUnicodeの発展との間で課題を残しているとも言えます。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。