構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究

Slides:

Advertisements

Similar presentations

第四章　情報源符号化の基礎４・１　情報量とエントロピー４・２　エントロピー符号化４・３　音声符号化４・４　画像符号化.

Advertisements

音響モデルを利用したシングルチャネルによる音源方向推定

音響尤度を用いたマルチスピーカ音響エコーキャンセラの検討

発声のしくみ－声道の共鳴と音源の生成－.

脳性まひをもつ子どもの発達肢体不自由児の動作改善を目指して障害児病理・保健学演習プレゼンテーション資料 2000年2月24日

クロストーク成分の相互相関に着目した音場再生システム

3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討

雑音重み推定と音声ＧＭＭを用いた雑音除去

状況の制約を用いることにより認識誤りを改善同時に野球実況中継の構造化

ランダムプロジェクションを用いた音声特徴量変換

神戸大学工学部松政宏典，滝口哲也，有木康雄追手門学院大学経済学部李義昭神戸大学発達科学部中林稔堯

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

3次キュムラントのバイスペクトラムと PCAによる音声区間検出

自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討

Buried Markov Modelを用いた構音障害者の音声認識の検討

非負値行列因子分解による構音障害者の声質変換

複数尤度を用いた３次元パーティクルフィルタによる選手の追跡 IS1-39

複数の言語情報を用いたCRFによる音声認識誤りの検出

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

Bottom-UpとTop-Down アプローチの統合による単眼画像からの人体3次元姿勢推定

5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて－スペクトル分析 5.4 もうひと工夫－ケプストラム分析 5.5 雑音の除去.

多重ベータ分布を用いた音色形状の数理モデリングによる

音素部分空間の統合による音声特徴量抽出の検討

雑音環境下における非負値行列因子分解を用いた声質変換

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

ディジタル信号処理 Digital Signal Processing

1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討

深層学習を用いた音声認識システム工学部　電気電子工学科　白井研究室 T213069　林健吉.

1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定

Specmurtを利用した調波構造行列による混合楽音解析の検討

Basis vectors generation

12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービスニューラルネットワークによる意味解析.

NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘･滝口哲也･有木康雄（神戸大）概要従来手法の問題点提案手法

5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3

交番における手話から日本語への変換システムの検討

1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出

バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6

メタモデルと音響モデルの統合による構音障害者の音声認識

非負値行列因子分解に基づく唇動画像からの音声生成

音声情報とベイジアンネットを用いた感性情報処理システム

Number of random matrices

Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション

Bottom-UpとTop-Down アプローチの組み合わせによる単眼画像からの人体3次元姿勢推定

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討

過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による顔・視線方向同時推定顔・視線同時推定研究背景

ブースティングとキーワードフィルタリングによるシステム要求検出

HMM音声合成における変分ベイズ法に基づく線形回帰

重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

バイラテラルフィルタによる実雑音下音声認識のための音声特徴量抽出

１ーQー１８音声特徴量抽出のための音素部分空間統合法の検討

尤度最大化基準を用いたエコー推定に基づく車室内音響エコーキャンセラの検討

音響伝達特性モデルを用いたシングルチャネル音源位置推定の検討 2-P-34 高島遼一，住田雄司，滝口哲也，有木康雄（神戸大）研究の背景

音響特徴量を用いた自閉症児と定型発達児の識別

音響伝達特性を用いたシングルチャネル音源方向推定

制約付き非負行列因子分解を用いた音声特徴抽出の検討

多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4

音響伝達特性を用いた単一チャネル音源位置推定における特徴量選択の検討

1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討

ソースフィルタモデル.

自己縮小画像と混合ガウス分布モデルを用いた超解像

CSP係数の識別に基づく話者の頭部方向の推定

グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識

Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in

ランダムプロジェクションを用いた音響モデルの線形変換

雑音環境下における Sparse Coding声質変換 3-P-49d

1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討

１．２言語処理の諸観点（１）言語処理の利用分野

Presentation transcript:

構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究 3-Q-31 構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究石井良,滝口哲也,有木康雄(神戸大学) 学習・変換過程学習ステップ変換ステップフレームごとに変動成分を算出研究背景・目的構音障害障害者聴覚・言語障害者は全国に約３４万人（平成１８年度厚生労働省）福祉分野における情報技術の発展の重要性　　　　構音障害者の講演の補助等手足の不自由などで音声に頼るしかない場合　　　　　構音障害者の声質変換が実現構音障害とは　　言葉を正しく明瞭に発音できない症状構音障害の原因の一つ：脳性麻痺　　出生前や出生時に受けた外傷のため筋肉の制御が難しい　　　　　アテトーゼ（不随意運動）が生じる特にアテトーゼの生じやすい状況　　－意図的動作時　　－緊張状態変換後のスペクトルを生成健常者各フレームに対して実行：障害者のスペクトル包絡：健常者の健常者構音障害者構音障害者の雇用機会の増加，社会的自立につながる音声に変換 Frequency Frequency 特徴量抽出・学習 STRAIGHT [H. Kawahara, 1997] Time Time DCT データ間のアラインメント処理 GMM スペクトル低次48次元を抽出 DCT ・混合正規分布健常者音声非周期成分ＧＭＭを学習基本周波数 DCT ：入力特徴量スペクトル：出力特徴量低次48次元を抽出 DCT 障害者音声非周期成分・変換式基本周波数実験条件・健常者，障害者の１０８単語のパラレルデータセットで学習　　　　　　　　　　　　　　　　　　　　（GMMの混合数は16～64）アラインメント・アラインメント処理は各単語の特徴量間のユークリッド距離に基　づくDPマッチング・アラインメント成功例（あかちゃん）・標本化周波数12kHz ・障害者音声１０単語を変換・静かな部屋でのヘッドホンによる両耳受聴・音声の聴き取りやすさを５段階で評価（１：非常に聴き取りづら　い～５；非常に聴き取りやすい）実験結果 5 構音障害者の音声は，子音部が存在しない場合が多々ある 4 ・アラインメント失敗例（こんにゃく） 3 MOS 2 1 健常者障害者 16 24 32 64 （混合数）問題点と今後の課題アラインメントの問題の検討明瞭度という点におけるGMMによる変換音声の問題