7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

Slides:

Advertisements

Similar presentations

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

Advertisements

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第四回　演習課題画像中からの物体抽出処理（背景情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/15.

音響モデルを利用したシングルチャネルによる音源方向推定

音響尤度を用いたマルチスピーカ音響エコーキャンセラの検討

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

大数の法則平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討

ベイズ的ロジスティックモデルに関する研究

雑音重み推定と音声ＧＭＭを用いた雑音除去

状況の制約を用いることにより認識誤りを改善同時に野球実況中継の構造化

PSOLA法を用いた極低ビットレート音声符号化に関する検討

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--

第12章　連続潜在変数修士 1年村下昇平.

ランダムプロジェクションを用いた音声特徴量変換

京都大学化学研究所バイオインフォマティクスセンター

最尤推定によるロジスティック回帰対数尤度関数の最大化.

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

亀岡弘和日本電信電話株式会社 NTTコミュニケーション科学基礎研究所

自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討

ガウス過程による回帰 Gaussian Process Regression GPR

パターン認識とニューラルネットワーク栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.

第9章　混合モデルとEM 修士２年北川直樹.

Mathematical Learning Theory

教師なしデータ学習データ　X1, X2, …, Xn 　真の情報源テストデータ　X 　.

正規分布確率密度関数.

第５章：特徴の評価とベイズ誤り確率５・３：ベイズ誤り確率とは

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

音素部分空間の統合による音声特徴量抽出の検討

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

第６章特徴空間の変換６．１特徴選択と特徴空間の変換６．２特徴量の正規化平成１５年５月２３日（金）発表者藤井丈明

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6

論文紹介: “Joint Embedding of Words and Labels for Text Classification”

Number of random matrices

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

第3章　線形回帰モデル修士1年山田　孝太郎.

ベイズ最適化 Bayesian Optimization BO

クロスバリデーションを用いたベイズ基準によるHMM音声合成

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

第9章学習アルゴリズムとベイズ決定側〔3〕最小2乗法とベイズ決定側発表：2003年7月4日時田陽一

HMM音声合成における変分ベイズ法に基づく線形回帰

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

人工知能特論II　第8回二宮　崇.

バイラテラルフィルタによる実雑音下音声認識のための音声特徴量抽出

ベイズ音声合成における事前分布とモデル構造の話者間共有

１ーQー１８音声特徴量抽出のための音素部分空間統合法の検討

尤度最大化基準を用いたエコー推定に基づく車室内音響エコーキャンセラの検討

音響伝達特性モデルを用いたシングルチャネル音源位置推定の検討 2-P-34 高島遼一，住田雄司，滝口哲也，有木康雄（神戸大）研究の背景

音響伝達特性を用いたシングルチャネル音源方向推定

制約付き非負行列因子分解を用いた音声特徴抽出の検討

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

音響伝達特性を用いた単一チャネル音源位置推定における特徴量選択の検討

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討

自己縮小画像と混合ガウス分布モデルを用いた超解像

Q状態イジング模型を用いた多値画像修復における周辺尤度最大化によるハイパパラメータ推定

ランダムプロジェクションを用いた音響モデルの線形変換

1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習

7.1 実際の音響モデル混合分布の学習各音素の特徴ベクトルは、一つの正規分布で近似できるほど単純ではない例）男女差、方言、... 各音素の特徴ベクトルは、一つの正規分布で近似できるほど単純ではない例）男女差、方言、... 複雑な確率密度関数を複数の正規分布の重み付き和で表現　→　混合分布重みはEMアルゴリズムで学習 Φi : i 番目の正規分布 wi : i 番目の正規分布の重み N : 混合数

7.1 実際の音響モデル話者適応不特定話者用音響モデルのパラメータを、少数の特定話者データを用いて調整 MLLR (Maximum Likelihood Linear Regression) 法学習済みHMMにおいて、平均ベクトルを以下の式で変換特定話者データの尤度が最大となるような行列Aと定数項b を推定

7.2 識別的学習学習データの尤度計算相互情報量最大化基準生成モデル：P(X|W) が大きくなるようにパラメータを求めた識別モデルの考え方：ΣW P(X|W)P(W) を小さくすればよい → 正解以外の単語列に対して P(X|W) が小さくなるように学習相互情報量最大化基準　 : 対立仮説 r : 学習データの　インデックス

7.3 深層学習 DNN-HMM法 HMMの各状態で特徴ベクトルを出力する確率 bi(x) を p(x|si) と書き換えベイズの定理 x はMFCCではなく、メルフィルタバンクの出力（またはもとの音声信号）で特徴抽出もDNNで学習 DNNで計算定数学習データから最尤推定

7.3 深層学習