音響特徴量を用いた自閉症児と定型発達児の識別

Slides:



Advertisements
Similar presentations
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
Advertisements

特別支援教育につい て. 「今後の特別支援教育の在り方について(最終報告)」 ( 文 部科学省 答申) <特別支援教育の在り方の基本的考え方> 特別支援教育とは、従来の特殊教育の対象の障害だ けでなく、LD、ADHD、高機能自閉症を含めて 障害のある児童生徒の自立や社会参加に向けて、そ.
第 10 回:動物も考える? 学習心理学と比較認知心理学. 1 動物は「思考」するか? 大学生 107 人に聞きました ガは光があるとその方向に向かって飛ぶ 考えてる 考えてない その他
第5章 子どもは心をどのように 理解するか? 道案内 (5) 子供は人の心をどう認識するか 1 準備 (0) 授業を始める前に (1) 発達心理学とはどんな学問か? (2) なぜ発達心理学を学ぶのか? 2 知覚の発達 (3) 子供に世界はどう見えるか 3 認知の発達 (4) 子供はものごとをどう認識するか.
顔表情クラスタリングによる 映像コンテンツへのタギング
Building text features for object image classification
第5章 子どもは心をどのように理解するか?.
音響モデルを利用したシングルチャネルに よる音源方向推定
磁気治療機器が、線維筋痛症患者の痛みを抑制 できるかどうかを検討する。 同時に機器の安全性を検討する。
      特別支援学校 高等部学習指導要領 聴覚障害教育について.
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討
Web画像を用いた マルチモーダル情報による物体認識
雑音重み推定と音声 GMMを用いた雑音除去
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
ランダムプロジェクションを用いた 音声特徴量変換
神戸大学工学部 松政 宏典,滝口 哲也,有木 康雄 追手門学院大学経済学部 李 義昭 神戸大学発達科学部 中林 稔堯
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
軽度発達障害の理解 中枢神経系における脳の機能障害である。 → 脳の発達の遅れ
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
Buried Markov Modelを用いた 構音障害者の音声認識の検討
学習目標 1.急性期の意識障害患者の生命危機を回避するための看護がわかる. 2.慢性期の意識障害患者の回復に向けた看護がわかる. 3.片麻痺患者のADL獲得に向けた看護がわかる. 4.失行・失認の患者が生活に適応するための看護がわかる. 5.失語症の患者のコミュニケーション方法の確立に向けた看護がわかる.
非負値行列因子分解による 構音障害者の声質変換
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
視点移動カメラにおけるカメラキャリブレーション
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
音素部分空間の統合による音声特徴量抽出の検討
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
Specmurtを利用した調波構造行列による 混合楽音解析の検討
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
交番における手話から日本語への 変換システムの検討
複数特徴量の重み付け統合による一般物体認識
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
非負値行列因子分解に基づく唇動画像からの音声生成
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
ブースティングとキーワードフィルタリング によるシステム要求検出
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
第5回音声ドキュメント処理ワークショップ (2011/3/7)
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

音響特徴量を用いた自閉症児と定型発達児の識別 3-P-1 音響特徴量を用いた自閉症児と定型発達児の識別 ☆石井 良,高島 遼一,滝口 哲也,有木 康雄(神戸大), 中井 靖(川崎医療短期大),高田 哲(神戸大) 研究背景・目的 自閉症 自閉症患者は全国に約36万人以上 福祉分野における情報技術の発展の重要性 早期発見、早期治療が重要             自閉症児の早期鑑別が実現 自閉症とは 先天性の脳機能障害 社会性や他者とのコミュニケーション能力に困難が生じる発達障害の一種 主な症状や特徴 対人相互反応の質的障害 意思伝達の著しい異常またはその発達の障害 活動と興味の範囲の著しい限局性 早期治療により自閉症患者の 社会的自立へつながる 提案手法 openEAR Forward selection method 従来は感情音声認識に用いられていたToolkit 音声データから989次元の特徴量を抽出できる ⇨ 次元数が多すぎる 提案手法の流れ ①特徴量の次元ごとに個別にスコアを算出 ②最大のスコアの次元Aを取り込む ③ StepNのスコアがStepN-1のスコアより良ければ①に戻る ④スコアの増加が停止すると終了 Fig. 1 System overview 実験条件 実験結果 73.5 提案手法 実験データ      日常会話単語 61.3 被験者(学習)    自閉症児15名(1089単語),定型発達児16名(1046単語) 被験者(テスト)    自閉症児5名(471単語),定型発達児5名(480単語) 特徴量        openEARによって抽出し Forward selection したもの 比較対象 実験データ      日常会話単語 被験者(学習)     自閉症児15名(1089単語),定型発達児16名(1046単語) 被験者(テスト)     自閉症児5名(471単語),定型発達児5名(480単語) Fig. 2 Classification results 特徴量 MFCC+Δ+ΔΔ(36次元) ⇨ MFCC+Δ+ΔΔ(36次元)に比べ大きく改善(12.2%) 特徴量 mfcc_sma[1]_iqr2-3 mfcc_sma_de[1]_linregc2 mfcc_sma[3]_max mfcc_sma_de[6]_linregc2 mfcc_sma[8]_max mfcc_sma[8]_skewness mfcc_sma[11]_skewness pcm_zcr_sma_kurtosis pcm_loudness_sma_linregc2 voiceProb_sma_de_minPos まとめと今後の課題 比較対象であるMFCC+Δ+ΔΔに比べ結果が大きく改善された openEARで抽出された特徴量の有効な次元に関する考察