Specmurtを利用した調波構造行列による 混合楽音解析の検討

Slides:



Advertisements
Similar presentations
顔表情クラスタリングによる 映像コンテンツへのタギング
Advertisements

10.時系列データの解析 time-series data
本日の内容(10/30) (以下、前回資料と重複あり) 音響データの分析 音楽的な性質(調・調性、拍節構造) 音楽情報科学について(導入)
音響モデルを利用したシングルチャネルに よる音源方向推定
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討
デジタル信号処理①
車内状況アウェアネスのための 感情音データベースの設計と評価
雑音重み推定と音声 GMMを用いた雑音除去
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
ランダムプロジェクションを用いた 音声特徴量変換
音響的特徴に基づく 楽器の階層表現の獲得と それに基づくカテゴリーレベルの 楽器音認識の検討
†京都大学大学院情報学研究科知能情報学専攻
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
非負値行列因子分解による 構音障害者の声質変換
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
音高による音色変化に着目した 音源同定手法
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
複数の言語情報を用いたCRFによる音声認識誤りの検出
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
音高による音色変化と未知楽器の 問題を考慮した楽器音の音源同定
音高による音色変化に着目した音源同定に関する研究
多重ベータ分布を用いた音色形状の数理モデリングによる
音素部分空間の統合による音声特徴量抽出の検討
機械創造工学課程 西久保智昭 担当教員 小林泰秀 准教授
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
独立成分分析 (ICA:Independent Component Analysis )
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
非負値行列因子分解に基づく唇動画像からの音声生成
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
ディジタル信号処理 Digital Signal Processing
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
音響特徴量を用いた自閉症児と定型発達児の識別
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

Specmurtを利用した調波構造行列による 混合楽音解析の検討 日本音響学会2013年春季研究発表会 1-P-11 西村大樹 ・ 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 従来手法 概要 Specmurt法 和音情報u(x)と楽器情報h(x)の畳み込みで 観測情報v(x)を表現できる [S. Saito, 2008] 混合音解析とは 同時刻に様々な楽器が存在する信号の解析 より、 ・・・ と計算でき、     が既知であるならば     、   、   をフーリエ変換したものを     、    、    とすると . で和音情報は求められる Score Wav data Spectrum 研究背景 耳による楽曲の解析は非常に困難 楽音解析による解析結果の応用例 単一楽器の多重音のみ解析可能 人手でも不可能ではないが、かなりの経験、労力、時間を要する 同時刻に存在する各楽器に対応する 基本周波数分布を求められない 音楽検索、著作権違反の盗作楽曲検出 Wav data Score 提案手法 + + . . 観測スペクトル行列 . + 観測スペクトルを各楽器の観測スペクトルの和と表現 調波構造行列 基本周波数行列 各楽器はその基本周波数分布と調波構造の畳み込みで表現 ただし 両辺をフーリエ変換 疑似逆行列でRについて解いて 各楽器の基本周波数分布                  は全て未知 各楽器の基本周波数分布を得る 未知部分をまとめて行列表現 評価実験 今後の課題 実験結果 ピアノとバイオリンを同時に鳴らした約1.0秒の混合楽音 エンベロープの違いが原因と思われる誤り   (時間による変化を考慮した特徴量の導入) 調波構造が既知   (調波構造が未知でも対応できる解析手法の検討) (ピアノ、バイオリンの調波構造はそれぞれ既知) ピアノの基本周波数 (A3) バイオリンの基本周波数 (E4) A7 A7 A7 A6 A6 A6 A5 A5 A5 ① A4 A4 A4 Power ④ A3 A3 A3 ② ⑤ ③ ⑥ 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 Time [sec] (①: attack level, ②: attack time, ③: decay time, ④: sustain level, ⑤: sustain time, ⑥: release time) Time [sec] Time [sec] Time Analysis result (piano) Observed spectrum Analysis result (violin) Envelope 2013 Spring Meeting of ASJ. (C) CS17, Kobe University.