フォルマント:音声のスペクトルを彩る共鳴のピーク
フォルマントとは、
音声の
周波数スペクトル上に現れる、周囲よりも強度が強い
周波数帯域のことです。時間変化する
音声を一定区間で切り取って
周波数領域に変換すると、
スペクトル包絡に山と谷が現れます。この山の部分をフォルマントと呼び、
周波数の低い順に第一フォルマント(F1)、第二フォルマント(F2)と名付けられます。複数のフォルマントが存在することもあり、時間とともに変化することもあります。
声道の形状とフォルマント
フォルマントは、
声道の形状に大きく影響されます。
声帯から発せられた比較的平坦な
周波数スペクトルを持つ
音声が、口腔や
鼻腔といった
声道の中で共鳴することで、特定の
周波数が強調され、フォルマントが生じます。このため、個人の
声道の形状の違い、つまり個体差や性差は、フォルマントの
周波数に違いを生み出す原因となります。同じ
音価の
音声であれば、各フォルマントの
周波数は近い値を示します。しかし、親子や兄弟で
声が似ているのは、
骨格などの形態が類似していることだけが理由ではありません。
声帯の微妙な鳴らし方(
声種)の違いが
音色に影響し、これは習慣的な要素が大きく、遺伝的な影響は限定的です。似た
声になるのは、家族の
声を無意識に真似ることと、遺伝的な発
声方法が影響している可能性もありますが、発
声練習によって変えることも可能です。
母[[音]]の識別におけるフォルマントの重要性
フォルマントは、特に
母[[音]]の識別に重要な役割を果たします。
音声からフォルマントを除去すると、
母[[音]]として認識されなくなります。逆に、フォルマントを模したピークを追加すると、
母[[音]]を含む
音声が生成されます。
母[[音]]の弁別は、主に第一フォルマント(約500~1000Hz)と第二フォルマント(約1500~3000Hz)によって行われます。一方、摩擦
音などの阻害
音では、明確なフォルマントは観察されません。
フォルマントの観察方法
フォルマントは、以下の方法で観察できます。
サウンドスペクトログラムの目視: スペクトログラム上の黒い帯として大まかに定義されます。
ケプストラム分析: 周波数スペクトルをさらに変換することでフォルマントを抽出します。
線形予測符号(LPC): 音声信号をモデル化し、フォルマントを推定します。
数学的、[音]]声学的に厳密なフォルマントの定義は存在せず、客観的な記述には、ピーク[[周波数]、ピーク強度(LFn)、バンド幅(BFn)といったパラメータが用いられます。
フォルマントと発音の関係:母[[音]]
母[[音]]において、フォルマントの周波数は口の開き具合や舌の位置に影響されます。
F1(第一フォルマント): 口の開きの大きさに比例します。高
母[[音]]ほどF1は低く、低
母[[音]]ほどF1は高くなります。また、発
音器官の狭窄はF1を低くする効果があります。
F2(第二フォルマント): 舌の前後位置に影響され、前母[[音]]ほどF2は高く、後母[[音]]ほどF2は低くなります。これは、F2が舌の前方の空間で共鳴を起こすためです。後母[[音]]では唇の丸めが加わる場合が多く、共鳴空間が長くなることでF2がさらに下がります。
フォルマントの観察・生成のためのソフトウェアとハードウェア
サウンドスペクトログラム生成ソフトウェア:
Audacity (
Linux, FreeBSD, macOS, Windows)
Praat (Macintosh, Windows, Linux, FreeBSD, 他)
KTH WaveSurfer (
Linux, Macintosh, Windows)
フォルマントから音を生成するハードウェア:
* PLG100-SG: 第一~第六フォルマント、バズバー、ナザルフォルマントを組み合わせて
音を生成します。
フォルマントの理解は、
音声認識や
音声合成、
音声言語学といった分野において不可欠です。