世界初、NTTが人の声聞き分けるAI技術「スピーカービーム」を開発

NTTが開発したAIによる音声認識のデモンストレーション。同時に話す人がいても声を聞き分けられる=31日、京都府精華町
NTTが開発したAIによる音声認識のデモンストレーション。同時に話す人がいても声を聞き分けられる=31日、京都府精華町【拡大】

 NTTは、大勢が話す中で特定の人の声を聞き分ける人工知能(AI)技術を開発し31日、公開した。音声データから声の特徴を分析し、その人の声を抽出する世界初の技術。スマートフォンやAIスピーカーなどへの活用が期待される。

 開発した技術は「スピーカービーム」。約10秒の音声を入力してAIで特徴を分析し、多くの人が話したり音楽が流れたりしていても、特定の声を聞き分けられるという。ただし、声が似ていると誤認する可能性もあり、精度の向上を図る。

 今後は、スマートフォンやAIスピーカーの音声認識機能の誤動作防止、聞き取りやすい補聴器への応用などを目指す。

 同技術は、京都府精華町のNTT京阪奈ビルで31日に開幕した技術発表会「オープンハウス2018」で6月1日まで展示している。