Download presentation
Presentation is loading. Please wait.
1
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
松田博義,滝口哲也,有木康雄(神戸大) 目的 提案手法 学習データ SVMと,弱識別器にCARTを用いたAdaBoost (CART-AdaBoost)の二つの識別器を連結する. 通常通り作成したSVMで,学習データの評価を行い,識別の正否によってAdaBoost規準の重みを与える. SVMから得られたデータ重みを用いてReal AdaBoostの学習を行う. SVMとReal AdaBoostの線形和をとることにより提案手法による識別機とする. 重み付き 学習 重み付き 学習 音声 データに 対する 重みの更新 テスト データ VAD CART- AdaBoost SVM ・識別境界の作成 ・学習データの評価及び重み付け ・学習データのノルム計算(スコアの2次平均) 音声特徴抽出 ・CART-AdaBoostを学習 ・ノルム及びβの計算 SVM CART- AdaBoost 識別機による信頼値計算 ∑ SVM学習終了時のデータに 対する重みの更新式 ≧θ < θ 平滑化及び閾値処理 1 -1 音声区間 非音声区間 学習 識別 実環境における問題点 目的音声に重畳する各種の雑音による認識性能の劣化 音声区間のみを検出(VAD:Voice Activity Detection)することが必要 ここでは識別機に関する提案を行った x1 x2 x1 x2 x1 x2 + SVMによる識別境界 CART-AdaBoostによる識別境界 提案手法による識別境界 識別器 実験条件 SVM (Support Vector Machine) AdaBoost 学習データ -非音声:CENSREC-1-Cより実験に使わなかった データの非音声部分を切り出したもの(約20分). -音声:AURORA-2Jの学習用クリーン音声に上記 の非音声を重畳させたものを用いた(8440発話). テストデータ ・CENSREC-1-Cより実環境データ -食堂(高SNR),食堂(低SNR), 道路(高SNR),道路(低SNR)の4環境. -男性4名,女性5名.各話者9~10発話のデータ ×4. 音声特徴量 ・MFCC -窓幅32 ms,シフト幅8 ms,ΔMFCC,32次元. 比較対象 ・SVM -RBFカーネル,γ=5. ・AdaBoost -最大繰り返し数100. ・提案手法 学習データのベクトル集合を, とする時,SVMの分離関数は次式で与えられる. SVMの分離平面は,カーネルトリックによる高次空間上で,サポートベクトル(最も他クラスに近い位置にあるベクトル)のマージン最大化により決定される. ここではカーネル関数にはRBFカーネルを用いた. CART (Classification And Regression Trees) 最もよくデータを分割できる次元から順に閾値を設定し分割を行なう. 続いて分割の結果生じた各サブグループを分割していく.このプロセスは,これ以上分割しても分割の正確性が改善されないところ,あるいは他の停止基準を満たすところまで繰り返される. data r1次元 r2次元 データ集合 弱学習機 ・・・ -1 1 テスト データ ∑ < θ ≧θ 重み付き 学習 データに 対する 重みの更新 重み付き 学習 弱学習機 弱学習機 ・・・ 精度に応じて 重みを決定 精度に応じて 重みを決定 評価尺度 評価実験 考察,及び今後の予定 性能評価はフレームベースで行い, FRR (False Rejection Rate)と, FAR (False Acceptance Rate), GER (Generalization Error Rate)を 用いる. 考察 提案手法が最も小さい識別誤差 SVMとCART-AdaBoostによって作られる領域の違い CART-AdaBoostによりSVMを補完することが可能 今後の予定 マルチクラスに拡張 異なる特徴量の使用 左図はFAR,FRRのROC (Receiver Operating Characteristic)曲線を表したもの. 右図の実験結果におけるBaselineとは,CENSREC-1-Cに付されているEnergy-based VADの実験結果.
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.