Common Voice:多様な音声データでAIを育む
Common Voiceは、
Mozillaが立ち上げた
クラウドソーシングプロジェクトで、音声認識ソフトウェア開発のための無料
データベース構築を目指しています。このプロジェクトは、世界中の
ボランティアの協力によって支えられています。参加者は、自身のマイクを使ってサンプル文を読み上げ、その音声を録音します。また、他のユーザーが録音した音声の正確性を検証する作業にも参加します。
録音された音声データは、
パブリックドメインライセンスであるCC0の下で公開され、自由に利用できる音声
データベースに集約されます。この
ライセンスのおかげで、開発者は音声認識アプリケーションを開発する際に、データの利用制限や使用料の心配なく活用できます。さらに、非公式ではありますが、Androidアプリも利用可能です。
プロジェクトの目的
Common Voiceの主な目的は、多様性に富む音声サンプルを提供することです。
Mozillaの発表によると、既存のプロジェクトの多くが、ラジオ番組から収集したデータセットに依存していました。ラジオの出演者は男性や標準的な発音をする人が多いため、女性の声や地域特有の発音、訛りのある音声データが不足するという偏りが見られました。Common Voiceは、このような偏りを是正し、より公平な音声認識技術の開発を目指しています。
Common Voiceの
英語版
データベースは、自由にアクセスできる音声
データベースとして、LibriSpeechに次ぐ規模を誇ります。2017年11月29日に最初のデータが公開された時点では、世界中の2万人以上のユーザーによって、40万件もの検証済み音声が登録され、その合計時間は500時間に及びました。
2019年2月には、最初のコーパスがリリースされました。このコーパスには、
英語、
フランス語、ドイツ語、
中国語といった主要
言語に加え、ウェールズ語や
カビル語など、少数
言語の音声データも含まれています。総計で、42,000人以上の貢献者による、約1,400時間分の録音データが提供されています。
2020年12月現在、
データベースには60
言語、9,283時間分の音声記録が蓄積されており、そのうち7,335時間分は
ボランティアによって検証済みです。このデータは、音声認識技術の開発に大きく貢献しています。
関連するプロジェクト
Common Voiceの他にも、音声データに関する以下のようなプロジェクトがあります。
Forvo: 発音に特化した辞書サイトで、世界中の様々な
言語の発音を聴くことができます。
Lingua Libre: フリーな音声
データベース構築プロジェクトで、様々な
言語の音声を収集しています。
クラウドソース (アプリ): Googleが提供する
クラウドソーシングアプリで、
言語に関するタスクを支援します。
外部リンク
Common Voice