HMM音声合成における変分ベイズ法に基づく線形回帰

HMM音声合成における変分ベイズ法に基づく線形回帰
◎橋本佳1, 山岸順一2, Peter Bell2, Simon King2, Steve Renals2, 徳田恵一1 1名古屋工業大学 2University of Edinburgh

HMM音声合成における変分ベイズ法に基づく線形回帰
背景線形回帰に基づく話者適応少量の適応データから変換パラメータを推定尤度最大化（ML）基準による推定 ⇒ MLLR [Gales; ’98] 過学習の問題ベイズ基準による推定事前分布の利用 ⇒ MAPLR [Chou; ’99] 事後分布に基づく期待値計算 ⇒ 変分ベイズ法に基づく線形回帰 [Yu et al.; ’07] HMM音声合成における変分ベイズ法に基づく線形回帰

線形回帰による話者適応線形回帰を用いたHMMの尤度関数線形回帰を表現遷移確率出力確率 1 : 適応データ : 状態遷移系列
: 変換パラメータ : モデルパラメータ

音声合成における話者適応尤度最大化（ML）基準による話者適応ベイズ基準による話者適応変換パラメータを点推定 ⇒ 過学習
変換パラメータを周辺化（期待値計算） : 適応データ : 変換パラメータ : モデルパラメータ : 合成データ

ベイズ基準における事後分布変換パラメータの事後分布事後確率最大化（MAP）基準による近似困難な積分計算 ⇒ 近似手法が必要
事前分布を利用変換パラメータを点推定 : 適応データ : 変換パラメータ : モデルパラメータ : 状態系列

変分ベイズ法（1/2）変分ベイズ法による近似事後分布の推定 [Attias; ’99] 対数周辺尤度の下限を定義
（Jensenの不等式） : 近似事後分布下限の最大化による近似事後分布の推定

変分ベイズ法（2/2）制約条件の導入変分法による近似事後分布の導出事後分布は相互に依存 ⇒ 繰返し推定による最適化

変換パラメータの事後分布変換パラメータの事後分布変換行列の各行が独立と仮定共役事前分布を使用各行の事前分布にガウス分布を設定

更新式の比較 MLLR MAPLR VBLR (Variational Bayesian method based Linear Regression) 統計量

状態遷移系列の事後分布変換パラメータに関する周辺化事後分布に依存したペナルティ項適応データ量が多量 ⇒ ペナルティ項の影響は小
遷移確率出力確率

実験条件（1/2）学習データ CMU ARCTIC 3628発話（4話者）適応データ 100発話テストデータ 50文
サンプリング周波数 48 kHz フレームシフト 5 ms 特徴量 49次 STRAIGHT メルケプストラム，対数基本周波数，非周期成分 + Δ + ΔΔ 音響モデル 5状態 left-to-right HSMM

実験条件（2/2）比較手法 MAPLR, VBLRにおける事前分布事前分布の利用変換パラメータの周辺化 MLLR MAPLR ✔
単位行列グローバル単一の回帰クラスの変換行列を利用構造的アプローチ回帰木の親ノードの変換行列を利用 ※ 調整パラメータ　　： 1, 10, 100, 1000, 10000

メルケプストラム歪み各適応データ量におけるメルケプストラム歪み回帰クラス数と調整パラメータは最適値を選択

事前分布の比較各適応データ量におけるメルケプストラム歪み回帰クラス数と調整パラメータは最適値を選択

むすび音声合成における変分ベイズ法に基づく線形回帰今後の課題適応パラメータの事後分布を推定
変換パラメータの周辺化を実現適応データが少量の時にMLLRから大きく改善 MAPLRと同程度の客観評価値変換パラメータの周辺化の効果は小さい事前分布の影響が大きい今後の課題事前分布の検討合成過程と変換パラメータの事後分布推定の統合回帰クラス数の自動選択

音声サンプル目標音声平均声適応データ量 2発話 10発話 100発話 MLLR MAPLR VBLR SVBLR

従来法との比較変換パラメータの周辺化事前分布の利用適応データ量が多量であるほどMAPLRに近づく
適応データ量が多量であるほどMLLRに近づく事前分布の利用変換パラメータの周辺化 MLLR MAPLR ✔ VBLR

メルケプストラム歪み適応データ量：100発話

メルケプストラム歪み適応データ量：10発話

メルケプストラム歪み各適応データ量におけるメルケプストラム歪み回帰クラス数と調整パラメータは最適値を選択

事前分布の比較各適応データ量におけるメルケプストラム歪み回帰クラス数と調整パラメータは最適値を選択

F0歪み各適応データ量におけるF0歪み回帰クラス数と調整パラメータは最適値を選択

HMM音声合成における変分ベイズ法に基づく線形回帰

Similar presentations

Presentation on theme: "HMM音声合成における変分ベイズ法に基づく線形回帰"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

HMM音声合成における 変分ベイズ法に基づく線形回帰

Similar presentations

Presentation on theme: "HMM音声合成における 変分ベイズ法に基づく線形回帰"— Presentation transcript:

Similar presentations

About project

フィードバック

HMM音声合成における変分ベイズ法に基づく線形回帰

Presentation on theme: "HMM音声合成における変分ベイズ法に基づく線形回帰"— Presentation transcript: