ソース・フィルタモデルとは
ソース・フィルタモデルは、人間の
声が生成される過程を、音源と線形フィルタという2つの要素に分けて考える
数理モデルです。このモデルでは、まず
声帯などで作られる原音(ソース)が、
声道や口の形によって音色が変化する(フィルタ)というプロセスを捉えます。
モデルの概要
人間の音
声は、
声帯の振動によって生成された原音が、
声道(喉から口にかけての空間)の形状変化によって様々な音色に変化して生成されます。ソース・フィルタモデルでは、この過程を、原音を生成する「音源(ソース)」と、音色を変化させる「フィルタ」という2つの独立した要素に分解して考えます。
具体的には、
声帯の振動によって生成された周期的な音波や、摩擦音のような乱流音を「音源」とし、
声道、舌、唇などの動きによって形成される音響的な特性を「フィルタ」とします。
モデルの数学的表現
ソース・フィルタモデルは、音
声信号を数学的に表現するための基盤となります。音源は、有
声音の場合は周期的なインパルス列、無
声音の場合はホワイトノイズとしてモデル化されます。一方、
声道フィルタは、その周波数特性を全極フィルタで近似することが一般的です。全極フィルタの係数は、音
声信号の平均二乗誤差を最小にするように
線形予測法を用いて計算されます。そして、音源の信号とフィルタの伝達関数を畳み込むことで、合成音
声が得られます。
モデルの応用
ソース・フィルタモデルは、音
声合成や音
声分析において重要な役割を果たします。音
声合成では、このモデルに基づいて、音源の特性とフィルタの特性を制御することで、様々な音
声を生成することが可能になります。一方、音
声分析では、音
声信号から音源の特性とフィルタの特性を推定することで、音
声の構造や特徴を理解することができます。
モデルの前提と課題
ソース・フィルタモデルは、「ソースとフィルタの独立性」を仮定しています。この仮定は、音
声生成過程を単純化する上で非常に有効ですが、実際にはソースとフィルタが完全に独立ではない場合もあります。そのため、より精度の高い音
声合成や分析を行うためには、この仮定の限界を考慮する必要があります。特に、有
声摩擦音のように複数の音源が関与する場合、このモデルを拡張する必要があります。
モデルの歴史
ソース・フィルタモデルの基礎は、Gunnar Fantの研究によって築かれました。Fantの研究は、音
声の音響理論の発展に大きく貢献し、Ken Stevensなどの研究者によっても音
声分析や音
声合成の基礎理論が発展しました。このモデルは、音
声研究における重要なフレームワークとして、現在でも広く活用されています。
モデルの関連概念
ソース・フィルタモデルは、
線形予測法(LPC)と密接に関連しています。
線形予測法は、音
声信号を過去のサンプルから予測する手法であり、
声道フィルタの特性を推定するために使用されます。また、逆フィルタという概念も、ソース・フィルタモデルの理解を深める上で重要です。逆フィルタは、
声道フィルタの逆特性を持ち、音
声信号から音源信号を抽出するために使用されます。
まとめ
ソース・フィルタモデルは、音
声生成のメカニズムを単純かつ効果的にモデル化したものであり、音
声合成や音
声分析の分野で広く利用されています。音
声研究における基礎的なモデルとして、その重要性は今後も変わらないでしょう。
参考文献
Chiba, Tsutomu; Kajiyama, Masato (1941). The vowel: Its nature and structure. Tokyo, Japan: Kaiseikan
千葉, 勉; 梶山, 正登 (2003).
母音 - その性質と構造 -. 杉藤 美代子, 本多 清志 (訳).
岩波書店.
ISBN 9784000021074.
Fant, Garnner (1960). Acoustic theory of speech production. The Hague, The Netherlands: Mouton
関連項目
声
逆フィルタ (Inverse filter)
線形予測符号 (LPC)
調音
アーティキュレートリー・シンセシス (調音音
声合成)