|
はじめまして。2008年4月にYahoo! JAPAN研究所に入社しました音声認識研究者のTです。まだまだ研究者としては駆け出しで、音声認識技術をどうやってウエブサービスにつなげられるかを日々試行錯誤しています。 また研究員として積極的に社外に出て情報収集をしています。国際会議や国内研究会に参加したり、他のIT企業関係者や大学職員と交流したりすることで新しい研究の「種」を得ることも研究活動において重要です。 先日(2/13)、早稲田大学で開催された経済産業省の音声認識プロジェクト最終報告会に傍聴参加してきました。会場(小野記念講堂)が音声認識専門家で満席に近いほどの盛況ぶりでした。 本プロジェクトの趣旨は「情報家電のための音声認識技術の研究開発」です。業界を代表する企業が参加しているだけあり目に見える成果が出ていました。音声と雑音の判別、雑音除去、高速・高精度デコーダ、多言語対応、言語モデルの適応、認識システムの性能予測など、技術的な貢献が多々ありました。さらに会場では、カーナビ、音源分離、音声インタフェース、音声コマンドを使ったバーチャル世界における人間の制御などのデモもあり、大変有意義な報告会でした。 システム的な観点から興味深かったのは、音声インタフェースおよびアプリケーション開発過程の効率化を目的とした双方向型開発パラダイムです。音声アプリケーション開発者がユーザからフィードバックを収集し、それらを音声認識技術者に伝達することで、開発過程にユーザの視点を十分に盛り込むことができるようになりました。また、音声認識システムの構成要素と音声言語資源を共有し、蓄積したログデータを管理して規則的なシステム更新を行うことで、開発サイクルの短縮や性能改善効果も期待できそうです。 ユーザインタフェースの観点から興味深かったのは、リモコンマイクを用いた家電制御です。ハンズフリー音声認識は未だ困難な課題ですが、ユーザがテレビリモコンに似た装置を協力的に利用することで、一般家庭における音声インタフェースの可能性が広がります。また住所の音声入力も、ゲームコントローラを併用して使いやすく工夫されていました。これらの成果からもわかるように、音声インタフェースの利便性は着実に向上しています。 これからの音声認識技術は研究者だけのものではなく、一般消費者の日常生活をより便利で楽しくする、そのような道が開けていくのかもしれません。 みなさんのご意見、ご期待を大切にし、今後さらに便利な音声インタフェースの研究開発に取り組んで行きたいと思います。
|

- >
- Yahoo!サービス
- >
- Yahoo!ブログ
- >
- 練習用
