ARPABETについて
ARPABET(ARPAbetとも書かれる)は、アメリカの
国防高等研究計画局の前身である高等研究計画局(ARPA)が1971年から1976年にかけて開発した
発音記号システムです。このシステムは、一般的な
アメリカ英語の音素や
異音を、特別に定義された
ASCII文字の組み合わせで表現することを目的としています。
システムの特徴
ARPABETには2種類の記号化方式があります。1つは、大文字と小文字を混ぜた記号を用いるもので、各音ごとに1文字を割り当てる形式です。もう1つは、大文字・小文字を問わず、1音あたり2文字以上を用いる方式です。後者の方式はより広く普及しました。実際の運用では、この体系を用いて
アメリカ英語の音韻を分かりやすく記載し、
音声合成や言語処理に応用されています。
利用事例
ARPABETは、さまざまな
音声合成システムに利用されています。この中には、
コモドール64のSAM、
AmigaのSAY、
パーソナルコンピュータのTextAssistなどが含まれます。さらに、
カーネギーメロン大学が
パブリックドメインで提供している発音辞書「CMU Pronouncing Dictionary」にも、このシステムが用いられています。また、TIMITというコーパスでは、ARPABETの改良版が採用されています。
強勢と補助記号
ARPABETでは、強調される音節は母音の直後に数字を付加することで表現されます。補助記号に関しては、1文字方式と2文字方式の両方で共有されるため、ユーザーはそれぞれのニーズに応じた使い方が可能です。特に2文字方式では、各分節が必ずスペースで区切られるため、視認性が高くなっています。これにより、発音の理解が容易になります。
TIMITコーパスの追加記号
TIMITでは、ARPABETの基本符号に加えて、さらなる記号体系が導入されています。これらの記号は、さらに詳細な発音のニュアンスを伝えるために用いられ、特に音声解析や研究の場で重要な役割を果たしています。
関連技術
ARPABETのほかにも、
ASCII文字で発音を表す方法がいくつか存在します。例えば、特定の言語に特化したSAMPAや、
国際音声記号全体を
ASCII形式に変換した
X-SAMPA、さらには
ASCIIを使用したIPAやWorldBetの体系などがあります。これらは、特定の用途に応じて異なるアプローチを提供しています。
参考文献と外部リンク
ARPABETに関するより詳細な情報や利用できるリソースは、以下の外部リンクを参照することができます。
ARPABETは、音声処理や言語学、
音声合成の分野で広く活用されており、
アメリカ英語を学ぶ上で非常に役立つツールの一つです。