構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究

Slides:



Advertisements
Similar presentations
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
Advertisements

音響モデルを利用したシングルチャネルに よる音源方向推定
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
発声のしくみ -声道の共鳴と音源の生成-.
脳性まひをもつ 子どもの発達 肢体不自由児の動作改善を目指して 障害児病理・保健学演習 プレゼンテーション資料 2000年2月24日
クロストーク成分の相互相関に 着目した音場再生システム
3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討
雑音重み推定と音声 GMMを用いた雑音除去
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
ランダムプロジェクションを用いた 音声特徴量変換
神戸大学工学部 松政 宏典,滝口 哲也,有木 康雄 追手門学院大学経済学部 李 義昭 神戸大学発達科学部 中林 稔堯
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
Buried Markov Modelを用いた 構音障害者の音声認識の検討
非負値行列因子分解による 構音障害者の声質変換
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
複数の言語情報を用いたCRFによる音声認識誤りの検出
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて -スペクトル分析 5.4 もうひと工夫 -ケプストラム分析 5.5 雑音の除去.
多重ベータ分布を用いた音色形状の数理モデリングによる
音素部分空間の統合による音声特徴量抽出の検討
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
ディジタル信号処理 Digital Signal Processing
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
Basis vectors generation
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
交番における手話から日本語への 変換システムの検討
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6
メタモデルと音響モデルの 統合による構音障害者の音声認識
非負値行列因子分解に基づく唇動画像からの音声生成
音声情報とベイジアンネットを 用いた感性情報処理システム
Number of random matrices
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
ブースティングとキーワードフィルタリング によるシステム要求検出
HMM音声合成における 変分ベイズ法に基づく線形回帰
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
音響特徴量を用いた自閉症児と定型発達児の識別
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
ソースフィルタモデル.
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
1.2 言語処理の諸観点 (1)言語処理の利用分野
Presentation transcript:

構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究 3-Q-31 構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究 石井 良,滝口 哲也,有木 康雄(神戸大学) 学習・変換過程 学習ステップ 変換ステップ フレームごとに 変動成分を算出 研究背景・目的 構音障害 障害者 聴覚・言語障害者は全国に約34万人(平成18年度厚生労働省) 福祉分野における情報技術の発展の重要性     構音障害者の講演の補助等 手足の不自由などで音声に頼るしかない場合       構音障害者の声質変換が実現 構音障害とは   言葉を正しく明瞭に発音できない症状 構音障害の原因の一つ:脳性麻痺   出生前や出生時に受けた外傷のため筋肉の制御が難しい      アテトーゼ(不随意運動)が生じる 特にアテトーゼの生じやすい状況   -意図的動作時   -緊張状態 変換後の スペクトルを生成 健常者 各フレームに対して実行 :障害者の スペクトル包絡 :健常者の 健常者 構音障害者 構音障害者の雇用機会の増加,社会的自立につながる 音声に変換 Frequency Frequency 特徴量抽出・学習 STRAIGHT [H. Kawahara, 1997] Time Time DCT データ間のアラインメント処理 GMM スペクトル 低次48次元を抽出 DCT ・混合正規分布 健常者音声 非周期成分 GMMを学習 基本周波数 DCT :入力特徴量 スペクトル :出力特徴量 低次48次元を抽出 DCT 障害者音声 非周期成分 ・変換式 基本周波数 実験条件 ・健常者,障害者の108単語のパラレルデータセットで学習                     (GMMの混合数は16~64) アラインメント ・アラインメント処理は各単語の特徴量間のユークリッド距離に基  づくDPマッチング ・アラインメント成功例(あかちゃん) ・標本化周波数12kHz ・障害者音声10単語を変換 ・静かな部屋でのヘッドホンによる両耳受聴 ・音声の聴き取りやすさを5段階で評価(1:非常に聴き取りづら  い~5;非常に聴き取りやすい) 実験結果 5 構音障害者の音声は,子音部が存在しない場合が多々ある 4 ・アラインメント失敗例(こんにゃく) 3 MOS 2 1 健常者 障害者 16 24 32 64 (混合数) 問題点と今後の課題 アラインメントの問題の検討 明瞭度という点におけるGMMによる変換音声の問題