【人工知能はいま 専門家に学ぶ】(11)音声認識研究の第一人者、河原達也氏が見るAIの世界 (1/6ページ)

2016.12.19 12:00

京都大学学術情報メディアセンター情報学研究科教授の河原達也氏

京都大学学術情報メディアセンター情報学研究科教授の河原達也氏【拡大】

 日本の国会審議の会議録は、長らく手書き速記によって逐語的な会議録が作成されてきたが、2011年から衆議院において自動音声認識システムが導入され、会議録の草稿作成はシステムが行っている。この音声認識主要モジュールを開発した京都大学教授である河原達也を訪ねた。

 まずはディープラーニングについての意見をきいてみた。

「私どもの研究室では、4年くらいディープラーニングをツールとして使っています。ディープラーニングの研究自体は世界的にみても5年くらい前までは辺境にありました。ヒントン先生でさえ、論文を出しても査読も通らないような状況だったようです。最近は、人工知能といえば機械学習、機械学習といえばディープラーニングみたいになっていますが、人工知能の中で機械学習が占める範囲は一部です」

 音声認識においてもディープラーニングが使われ出したのはここ数年のことだというが、それまでは何が主流であったのか?

「90年代初頭にニューラルネットワークがブームになりましたが、その後、音声認識の分野では隠れマルコフモデルが主流になりました。ニューラルネットワークよりも隠れマルコフモデルのほうが理論的にも綺麗でパフォーマンスも上だったからです。ですので、2010年くらいまではニューラルネットワークは使えないものという認識でした」」

【プロフィル】河原達也(かわはら・たつや)

河原達也(かわはら・たつや)工学博士
京都大学学術情報メディアセンター
情報学研究科教授
編著書、共著書に「音声認識システム」(オーム社)、「知のバリアフリー」(京都大学学術出版会)などがある

メディアの説明は正確ではない?