1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出

Slides:



Advertisements
Similar presentations
Building text features for object image classification
Advertisements

Learning Appearance in Virtual Scenarios for Pedestrian Detection
「わかりやすいパターン認識」 第1章:パターン認識とは
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
芦田尚美*,髙田雅美*,木目沢司†,城和貴* *奈良女子大学大学院 †国立国会図書館
3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討
雑音重み推定と音声 GMMを用いた雑音除去
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
ランダムプロジェクションを用いた 音声特徴量変換
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
サポートベクターマシン によるパターン認識
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
音素部分空間の統合による音声特徴量抽出の検討
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
第14章 モデルの結合 修士2年 山川佳洋.
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Data Clustering: A Review
複数特徴量の重み付け統合による一般物体認識
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6
部分的最小二乗回帰 Partial Least Squares Regression PLS
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
非負値行列因子分解に基づく唇動画像からの音声生成
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
サポートベクターマシン Support Vector Machine SVM
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
AdaBoostを用いた システムへの問い合わせと雑談の判別
ブースティングとキーワードフィルタリング によるシステム要求検出
HMM音声合成における 変分ベイズ法に基づく線形回帰
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ステレオカメラを用いた歩行者の行動解析.
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
パターン認識特論 ADA Boosting.
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
音響特徴量を用いた自閉症児と定型発達児の識別
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
パターン認識特論 ADA Boosting.
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
バイオインフォマティクスII 遺伝子発現データの AdaBoostによる判別
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出 松田博義,滝口哲也,有木康雄(神戸大) 目的 提案手法 学習データ SVMと,弱識別器にCARTを用いたAdaBoost (CART-AdaBoost)の二つの識別器を連結する. 通常通り作成したSVMで,学習データの評価を行い,識別の正否によってAdaBoost規準の重みを与える. SVMから得られたデータ重みを用いてReal AdaBoostの学習を行う. SVMとReal AdaBoostの線形和をとることにより提案手法による識別機とする. 重み付き 学習 重み付き 学習 音声 データに 対する 重みの更新 テスト データ VAD CART- AdaBoost SVM ・識別境界の作成 ・学習データの評価及び重み付け ・学習データのノルム計算(スコアの2次平均) 音声特徴抽出 ・CART-AdaBoostを学習 ・ノルム及びβの計算 SVM CART- AdaBoost 識別機による信頼値計算 ∑ SVM学習終了時のデータに 対する重みの更新式 ≧θ < θ 平滑化及び閾値処理 1 -1 音声区間 非音声区間 学習 識別 実環境における問題点 目的音声に重畳する各種の雑音による認識性能の劣化 音声区間のみを検出(VAD:Voice Activity Detection)することが必要 ここでは識別機に関する提案を行った x1 x2 x1 x2 x1 x2 + SVMによる識別境界 CART-AdaBoostによる識別境界 提案手法による識別境界 識別器 実験条件 SVM (Support Vector Machine) AdaBoost 学習データ  -非音声:CENSREC-1-Cより実験に使わなかった   データの非音声部分を切り出したもの(約20分).  -音声:AURORA-2Jの学習用クリーン音声に上記   の非音声を重畳させたものを用いた(8440発話). テストデータ  ・CENSREC-1-Cより実環境データ   -食堂(高SNR),食堂(低SNR),   道路(高SNR),道路(低SNR)の4環境.   -男性4名,女性5名.各話者9~10発話のデータ   ×4. 音声特徴量  ・MFCC   -窓幅32 ms,シフト幅8 ms,ΔMFCC,32次元. 比較対象  ・SVM   -RBFカーネル,γ=5.  ・AdaBoost   -最大繰り返し数100.  ・提案手法 学習データのベクトル集合を, とする時,SVMの分離関数は次式で与えられる.  SVMの分離平面は,カーネルトリックによる高次空間上で,サポートベクトル(最も他クラスに近い位置にあるベクトル)のマージン最大化により決定される. ここではカーネル関数にはRBFカーネルを用いた. CART (Classification And Regression Trees) 最もよくデータを分割できる次元から順に閾値を設定し分割を行なう. 続いて分割の結果生じた各サブグループを分割していく.このプロセスは,これ以上分割しても分割の正確性が改善されないところ,あるいは他の停止基準を満たすところまで繰り返される. data r1次元 r2次元 データ集合 弱学習機 ・・・ -1 1 テスト データ ∑ < θ ≧θ 重み付き 学習 データに 対する 重みの更新 重み付き 学習 弱学習機 弱学習機 ・・・ 精度に応じて 重みを決定 精度に応じて 重みを決定 評価尺度 評価実験 考察,及び今後の予定 性能評価はフレームベースで行い, FRR (False Rejection Rate)と, FAR (False Acceptance Rate), GER (Generalization Error Rate)を 用いる. 考察 提案手法が最も小さい識別誤差 SVMとCART-AdaBoostによって作られる領域の違い CART-AdaBoostによりSVMを補完することが可能 今後の予定 マルチクラスに拡張 異なる特徴量の使用 左図はFAR,FRRのROC (Receiver Operating Characteristic)曲線を表したもの. 右図の実験結果におけるBaselineとは,CENSREC-1-Cに付されているEnergy-based VADの実験結果.