【クラウドWatch】NTTコム、音声認識APIの提供開始

 ■自然言語解析で新機能

 NTTコミュニケーションズ(NTTコム)は、自然言語解析を手軽に利用できるAPIサービス「Communication Engine “COTOHA API”」(COTOHA API)において、音声認識APIの提供を開始した。

 COTOHA APIは、NTTグループが長年にわたって培ってきた自然言語解析技術の研究成果を手軽に利用できるよう提供しているサービス。今回、新機能として追加される音声認識APIでは、日本語の発話内容(音声データ)を認識し、日本語のテキストデータに置き換えることができる。

 音声認識には、NTTグループの人工知能(AI)関連技術「corevo」の研究成果を活用し、人間の声を深層学習によって精緻に分析できるほか、雑音に強い独自の音響モデルと発話区間検出技術も備え、高い認識率を実現した。

 このAPIが処理した音声データ、認識結果のテキストデータとも、サーバー上には一切保存されないので、個人情報を含む通話記録、社内会議の音声など、機密性の高い情報も安心して取り扱える。

 さらに認識精度を高めるため、ユーザーの用途に合わせ、よく使う業界用語、専門用語、自社の商品やサービス名などを登録する機能も備える。なお、利用開始月を含む3カ月間の無料期間中は、精度向上のための単語登録に関するサポートを希望ユーザー向けに提供する。

 COTOHA APIの利用料金は、月額基本料13万円(税別)に加えて、APIコール数に応じた従量課金が加算される仕組み。音声認識の場合は、月に約5万分まで基本料金のみで利用できる。NTTコムでは、このAPIを活用したサービスの開発・提供も行っていく計画。(インプレスウオッチ)