平均オピニオン評点(MOS:Mean Opinion Score)は、音声、電話、動画などのマルチメディアにおいて、
コーデックを用いて
帯域幅を圧縮した際に、圧縮・転送後の受信側で知覚されるメディア品質を数値で評価する手法です。
MOSの評価
MOSは1から5までの数値で表され、1が最も品質が悪く、5が最も品質が良いと評価されます。この評価は主観的なものであり、人間の知覚に基づいています。具体的には、音声用のMOSテストはITU-T勧告P.800で規定されており、以下のような手順で実施されます。
1. 男性および女性の話者が、いくつかの定められた文章を読み上げる音声を録音します。
2. その録音された音声を、テスト対象となる媒体(
コーデックなど)を通して送信します。
3. 複数の被験者に送信後の音声を聞かせ、それぞれの品質を主観的に評価してもらいます。
4. 被験者による評価を平均し、その値をMOSとします。
被験者は、以下の様な格付け方式で品質を評価します。
5:非常に良い
4:良い
3:普通
2:悪い
1:非常に悪い
MOSは、これらの個々のスコアの算術平均として算出されます。
帯域幅と音質
音声通信では、一般的にコーデックシステムやデジタル信号処理を用いて、所定の帯域幅に調整されます。しかし、音質と帯域幅はトレードオフの関係にあり、帯域幅を小さくすれば音質は低下する傾向があります。優れたコーデックは、帯域幅を維持しつつ、音質劣化を最小限に抑えます。
帯域幅は物理的に測定可能ですが、音質の評価には人間の主観的な知覚が関わります。ただし、自動的なテストを用いて音質を推定する技術も存在します。
動画品質の評価
MOSと同様の手法は、動画の品質(画質など)を主観的に測定する場合にも利用可能です。動画の場合も、被験者による主観的な評価に基づいて、品質が数値化されます。
MOS値の例
以下は、様々なコーデック実装に対する平均オピニオン評点の一例です。これらの値は、コーデックの性能を比較する上で参考になります。
G.711: 約4.3
G.729: 約4.0
AMR: 約3.5
MOSの限界と代替手段
MOSの評価は、時間とコストがかかるため、専門家による推定で代替されることがあります。特に、開発中のシステムでは、
音質の推定を頻繁に行う必要があるため、迅速な推定方法が求められます。
評価に適した文章
ITU-T勧告 P.800 では、評価に適した
英語の文例がいくつか示されています。以下はその一部です。
You will have to be very quiet.
There was nothing to be seen.
They worshipped wooden idols.
I want a minute with the inspector.
Did he need any money?
これらの文章は、様々な音声の特徴を含むため、評価に適しています。
関連項目
音質
外部リンク
ITU-T Recommendation P.800 伝送品質の主観的評価法
Voice Quality