A03 音声インターフェイスによる インスタントメッセージング エージェントの開発 A03 音声インターフェイスによる インスタントメッセージング エージェントの開発 菊池研究室 木野誠大
背景 キーボードの使用が不慣れな人やキーボードの使用が困難な人がいる。 現在のキーボードを使用したチャット等の 情報交換は即応性がいるわりには、時間がかかり実用的とは言えない。
目的 音声インターフェースを使用しチャットをスムーズにすばやく行う 東海大学の佐上氏の開発したKiknエージェント[2007佐上]を土台に作成
目的 音声インターフェース 話した言葉を文字化する音声認識の利用 文字を音声化できる音声合成の利用 チャット 話した言葉を文字化する音声認識の利用 文字を音声化できる音声合成の利用 チャット チャットシステムにMSNメッセンジャーの機能を使用
エージェント機能 キーボードを使わず音声だけでの操作 →キーボード操作が困難、また不慣れな人でも簡単に操作できる。 →キーボード操作が困難、また不慣れな人でも簡単に操作できる。 音声によるメッセージの送信 →キーボードよりもすばやくメッセージを送信 受信メッセージを自動音声化 →文字を読まずともメッセージを理解
使用技術 SpeechSDK SpeechAPIを用いて音声認識・音声合成機能を使用(ドキュメントトーカの利用で日本語音声合成を利用) MSNメッセンジャー MSN Messenger APIを用いてチャット機能を利用
エージェントの使用方法(送信) Kikn エージェント 今日は雨だ 音声認識・・・ 今日は雨だ 相手 自分
入力 エージェントの使用方法(受信) 相手 自分 いいえ、 今日は晴れよ いいえ、 今日は晴れよ 音声合成・・・ いいえ、 Kikn
実験 研究室内で被験者3名により、本システムのチャット会議機能を用いて、しりとりを行った 入力速度と音声による誤認識率を測定 音声認識者と、キーボード使用者2人の 1対1で行う
実験 感想 音声認識に苦労した。 ・変換ミスで言葉は正しいのに、意味が分からないものになったりした 実験 感想 音声認識に苦労した。 ・変換ミスで言葉は正しいのに、意味が分からないものになったりした ・固有名詞などの特定のものは認識がよかった。 タイピングで予想外に、変換に時間がかかってしまった。
実験結果 1
実験結果 2 音声 キーボード 誤認識 変換ミス [回(50回中)] 11 4 平均入力時間[s] 0.98 7.50 全体入力時間[s] 実験結果 2 音声 キーボード 誤認識 変換ミス [回(50回中)] 11 4 平均入力時間[s] 0.98 7.50 全体入力時間[s] 1.37 5.78
おわりに 音声認識による入力は、タイピングによる入力より早く効果的であった 今後の課題 ・音声認識の精度 ・その他の人の使用への対応
ご静聴ありがとうございました
ご認識一例 「東京」のご認識 東証 同庁 同筋 当初 登場