AdaBoostを用いたシステムへの問い合わせと雑談の判別

AdaBoostを用いたシステムへの問い合わせと雑談の判別
神戸大学大学院自然科学研究科佐古淳，滝口哲也，有木康雄

背景・目的音声による機器の操作雑談に反応してシステムが誤動作ロボット・カーナビなどスイッチを用いた音声入力制御
使いにくい・音声を使うメリットが減少スイッチレスで自動的にシステム要求と雑談を判別

目的システム要求と雑談の判別（ケース１）雑談雑談「こっちに来て」 …… 了解

目的システム要求と雑談の判別（ケース２）「こっちに、えーと、来て」「どうやって動かすの？」「こっちに来て」って言うと動くよ
　えーと、来て」「どうやって　動かすの？」「こっちに来て」って言うと動くよ了解 …… ……

従来手法画像情報音響情報視線必ずしもシステムを見ないカーナビでは使用不能ピッチ・パワー距離一定の制約が必要
必ずしも判別可能でない

従来手法言語情報キーワードスポッティングキーワードのわき出しが問題音声プロジェクタ [石塚ら’98]
キーワードと競合する言語モデルを利用ネットワーク文法でコマンド受理

従来手法言語情報ネットワーク文法柔軟な表現を受理できない /こっちに来て/ 拒否わき出し /*こっちに来て*/ ふふふ、こっちに来て
こっちに来てよこっちに来てちょうだいこっちに、えーと、来て /こっちに来て/ 拒否こっちに来てとかこっちに来てって言うとわき出し /*こっちに来て*/

提案手法素性（単語）をベースに判別コーパスから素性を学習 AdaBoostにより学習ふふふ、こっちに来てシステム要求素性
こっちに来てよこっちに来てちょうだいこっちに、えーと、来てこっちに来てとかこっちに来てって言うと雑談素性コーパスから素性を学習 AdaBoostにより学習

コーパスシステム要求＋雑談コーパスロボットを例に収録カーナビを用いた収録は困難マイクカメラ車輪

コーパス収録環境規模２人とロボットが存在人同士で会話しながら任意にシステム要求マイクは発話者２人の胸元に設置コマンドは８種
異なり単語数：約700語規模１時間程度（実質発話時間は20分程度）切り出し後にラベル付与 330発話（うち49発話がシステム要求）

コーパス具体例ラベル発話内容 -1 こっち、こっちでよかったっけこっちに来て、とか言うと +1
+1：システム要求 -1：雑談具体例ラベル発話内容 -1 こっち、こっちでよかったっけこっちに来て、とか言うと +1 こっちに来てくださいふふふ来たこっちおいでーあと写真を撮ってがあるなあ写真を撮って

ブースティングによる素性の学習 AdaBoost 多数の弱識別器による重み付き投票弱識別器・重みを学習する手法：弱識別器：重み

ブースティングによる素性の学習弱識別器 AdaBoostによる学習方法 Decision Stumps [Schapire’98]
素性（単語・bi-gramなど）の有無で識別例）「ください」がある  システム要求　　「とか」がない  システム要求　　「とか」がある  雑談 AdaBoostによる学習方法最も精度のよい弱識別器を選択識別誤りデータの重みを増やす繰り返す

学習例初期状態ラベル発話内容重み -1 こっち、こっちでよかったっけ 0.14 こっちに来て、とか言うと
+1 こっちに来てくださいふふふ来たこっちおいでーあと写真を撮ってがあるなあ写真を撮って

学習例「ください」がある  +1 ラベル発話内容重み -1 こっち、こっちでよかったっけ 0.1
こっちに来て、とか言うと +1 こっちに来てくださいふふふ来たこっちおいでー 0.25 あと写真を撮ってがあるなあ写真を撮って

学習例「た」がない  +1 ラベル発話内容重み -1 こっち、こっちでよかったっけ 0.06
こっちに来て、とか言うと 0.25 +1 こっちに来てくださいふふふ来たこっちおいでー 0.16 あと写真を撮ってがあるなあ写真を撮って

学習例「おいでー」がある  +1 ラベル発話内容重み -1 こっち、こっちでよかったっけ 0.04
こっちに来て、とか言うと 0.16 +1 こっちに来てください 0.14 ふふふ来たこっちおいでー 0.1 あと写真を撮ってがあるなあ写真を撮って 0.36

学習例「とか」がない  +1 ラベル発話内容重み -1 こっち、こっちでよかったっけ 0.08
こっちに来て、とか言うと 0.11 +1 こっちに来てください 0.09 ふふふ来たこっちおいでー 0.07 あと写真を撮ってがあるなあ 0.33 写真を撮って 0.23

識別例識別関数素性語条件重みα h1(x) くださいある 0.46 h2(x) たない 0.69 h3(x) おいでー 0.64
とか 0.58 未知の入力：「来てくださいとか」 =-0.07

比較手法 Support Vector Machines (SVM) ネットワーク文法より柔軟文章ベースによる判別マージン最大化 +

実験クリーン（書き起こし）テキストの判別クリーン（書き起こし）テキストの判別音声認識結果に対する判別

クリーンテキストの判別 AdaBoost AdaBoostにより選択された素性弱識別器：uni-gramを素性語素性システム
要　　求ください　写真　来て　向こう　おいで　場所　止まっ　雑　　談で　たら　ん　って　が　ない　とか　の　あー　よ　ちょっと

クリーンテキストの判別 SVM カーネル：Gauss Kernel 特徴量：単語の頻度ベクトル例）「こっち、こっちに来て」
約70個のサポートベクターにより判別 … こっちに来て 2 1

クリーンテキストの判別実験結果 Leave-one-out 法により実験結果はF値が最大のケース適合率再現率 F値 Boosting
94.0% 95.9% 0.95 SVM 97.9% 0.97 適合率高い：わき出し少　再現率高い：未検出少

クリーンテキストの判別成功例失敗例こっちに来てって言ったら  -1 ふふふ、こっちに、えーと、来て  +1
ジェロームツー +1  -1（未知素性）ちょっと認識してない、止まって +1  -1 こっちに来てって言うと -1  +1 +1：システム要求 -1：雑談

ブースティングとSVMの比較性能はSVMが上？未知の表現に対する適合率は？ Boosting SVM 適合率 94.0% 97.9%

ブースティングとSVMの比較実験識別結果素性ベースの方が未知表現に対し柔軟な可能性 Boosting SVM 識別率 100.0%
学習：「こっちに来て、とか」未学習：「向こうに行って、とか」未学習：「写真を撮って、とか」未学習：「ついて来て、とか」　　　　　……など識別 Boosting SVM 識別率 100.0% 21.4% 結果素性ベースの方が未知表現に対し柔軟な可能性

ブースティングとSVMの比較ブースティング (Decision stumps) Support Vector Machines
素性が学習済みなら未知文章も判別可判別に有効な素性が明確 Support Vector Machines 既知表現では高精度未知表現の判別が苦手

実験クリーン（書き起こし）テキストの判別音声認識結果に対する判別音声認識結果に対する判別

音声認識結果の判別音響分析条件・HMM サンプリング周波数特徴パラメータフレーム長フレーム周期窓タイプ 16KHz
サンプリング周波数特徴パラメータフレーム長フレーム周期窓タイプ 16KHz MFCC(25次元) 20ms 10ms ハミング窓タイプ混合数 244音節 32混合母音(V) 子音＋母音(CV) 5状態3ループ 7状態5ループ音響分析条件 H M

音声認識結果の判別実験条件音響モデル: CSJベースにMLLR+MAP適応言語モデル: 書き起こしから学習 Open Close
未知語なし Open: 話者Aの認識に、話者Bのモデルを利用言語モデル Open Close 約30% - 約40% 約60% 音響モデル

音声認識結果の判別実験結果 Leave-one-out 法により実験結果はF値が最大のケース適合率再現率 F値 Boosting
91.8% 0.92 SVM 97.8% 0.95 クリーン (0.95) (0.97) 音声認識結果も高精度に判別可能

まとめシステム要求と雑談の判別音声認識結果（言語情報）を利用今後の課題単語認識精度：42.1%において
適合率：91.8% 再現率：91.8% F値：0.92 今後の課題タスクの規模・難易度の向上言語のみで判別不能なケースへの対応音響情報との統合

ネットワーク文法との比較受理できないケースふふふ、こっちに来てこっちに来てちょうだいこっちに来てよこっちに来て……あれ？
こっちに、えーと、来て素性ベースでは判別可能

ブースティングとSVMの比較識別関数 AdaBoost SVM 素性の有無で投票文章全体との類似度（内積）で投票くださいがある
とかがないとかがあるくださいがない素性の有無で投票：重み：ラベル：SVの特徴ベクトル文章全体との類似度（内積）で投票

ブースティングとSVMの比較 SVM 未知：「写真を撮ってとか」を識別したい学習：「こっちに来てとか」 雑談
学習：「写真を撮って」 システム要求 … こっちに来て写真を撮ってとか 1 類似度 1 … こっちに来て写真を撮ってとか 1 類似度 3 … こっちに来て写真を撮ってとか 1 システム要求と誤識別

ブースティングとSVMの比較素性ベースの場合学習：「こっちに来てとか」未知：「写真を撮ってとか」素性投票先重み来て
システム要求中とか 雑談大素性投票先重み写真 システム要求中とか 雑談大

AdaBoostを用いたシステムへの問い合わせと雑談の判別

Similar presentations

Presentation on theme: "AdaBoostを用いたシステムへの問い合わせと雑談の判別"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

AdaBoostを用いた システムへの問い合わせと雑談の判別

Similar presentations

Presentation on theme: "AdaBoostを用いた システムへの問い合わせと雑談の判別"— Presentation transcript:

Similar presentations

About project

フィードバック

AdaBoostを用いたシステムへの問い合わせと雑談の判別

Presentation on theme: "AdaBoostを用いたシステムへの問い合わせと雑談の判別"— Presentation transcript: