重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析

Slides:



Advertisements
Similar presentations
顔表情クラスタリングによる 映像コンテンツへのタギング
Advertisements

Building text features for object image classification
高精度画像マッチングを用いた SAR衛星画像からの地表変位推定
復習.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
集積回路工学研究室 岩淵 勇樹 秋田 純一 北川 章夫
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
3-Q-29 脳性麻痺構音障害者の音声認識による情報家電操作の検討
雑音重み推定と音声 GMMを用いた雑音除去
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
担当 : 山口 匡 伊藤 祐吾 (TA) 宮内 裕輔 (TA)
ディジタル信号処理 Digital Signal Processing
音響的特徴に基づく 楽器の階層表現の獲得と それに基づくカテゴリーレベルの 楽器音認識の検討
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
亀岡弘和 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
非負値行列因子分解による 構音障害者の声質変換
サポートベクターマシン によるパターン認識
音高による音色変化に着目した 音源同定手法
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
音高による音色変化に着目した音源同定に関する研究
多重ベータ分布を用いた音色形状の数理モデリングによる
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
部分的最小二乗回帰 Partial Least Squares Regression PLS
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
非負値行列因子分解に基づく唇動画像からの音声生成
Fourier 変換 Mellin変換 演習課題
Number of random matrices
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
VOCAL DYNAMICS CONTROLLER: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース
音色空間の音高依存性を考慮した 楽器音の音源同定
保守請負時を対象とした 労力見積のためのメトリクスの提案
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
実験計画法 Design of Experiments (DoE)
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
Webページタイプによるクラスタ リングを用いた検索支援システム
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
Fourier 変換 Mellin変換 演習課題
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
Presentation transcript:

重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析 日本音響学会2012年秋季研究発表会 1-P-24(e) 西村大樹 ・ 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 従来手法 概要 Specmurt法 和音情報u(x)と楽器情報h(x)の畳み込みで 観測情報v(x)を表現できる [S. Saito, 2008] 多重音解析とは 同時刻に様々な高さの音が存在する信号の解析 音量 スペクトル 周波数 時間 多重音解析 より、 と計算でき、     が既知であるならば     、   、   をフーリエ変換したものを     、    、    とすると 楽譜形式 時間 で和音情報は求められる wavデータ 短時間フーリエ変換 ウェーブレット変換 ピアノロール形式 研究背景 耳による楽曲の解析は非常に困難 解析結果はMIDIフォーマットによる可視化が容易 一般に楽器情報は未知である 和音情報を求めるには楽器情報が既知である必要がある いかに楽器情報をモデル化するかに焦点があった (非線形写像と最小二乗誤差に基づく方法) 人手でも不可能ではないが、かなりの経験、労力、時間を要する MIDI化できれば、カラオケ、音楽検索などの分野でも活躍が見込める 提案手法 基本周波数成分 2次高調波周波数成分 3次 4次 理想的な楽器情報 用意された解の候補と同数の 楽器情報をSpecmurtの式を利用して求める 得られた楽器情報から理想的な楽器情報に 最も近いものを見つける 楽器情報は音階によってわずかに形が異なる 楽器情報の形には拘る必要がないのではないか? 楽器情報のモデル化を行わない Step1 高調波周波数成分に大きな値を持ち、 それ以外にピークを持たない(スパース) 正しいピークの組み合わせ = 和音情報 :基本周波数 :高調波周波数     のうち、高調波周波数成分を 持たないものは棄却 理想的な楽器情報に最も近いもの     は 棄却されなかった    の中から 以下のようにスパース性に基づいて決定される ※αは重さ 観測情報のピークは基本周波数と高調波周波数であるため、 正しいピークの組み合わせが和音の情報になると考えられる Laは高調波成分を除く楽器情報のスパース性であり、以下のように計算される L1ノルムを用いる場合 L2ノルムを用いる場合 観測情報のピークを基に、 解の候補を数多く用意する Lbは高調波成分要素の和であり、以下のように計算される Step2 L1ノルムを用いる場合 L2ノルムを用いる場合 に対応する    が解として一意に決まる 観測情報をもとに考えられる解の候補 候補から得られた楽器情報 評価実験 今後の課題 実験結果 重みや式の選択の自動化   (楽器によって最適な重みや式が違うため) オクターブ違いの和音に対する改善   (提案手法ではオクターブ違いの和音に対応できない) ``RWC-MDB-C-2001 No.43: Sicilienne op.78”を解析 従来手法 提案手法 最大 提案手法 (平均) (重み, 式) (L1, L1) (L1, L2) (L2, L1) (L2, L2) 全 ピアノ 89.2% 92.7% (α=0.9, (L2, L1)) 87.3% 86.7% 90.8% 88.5% ギター 74.3% 79.7% (α=0.4, (L2, L1)) 77.4% 77.0% 78.6% 77.8% 77.7% バイオリン 65.0% 71.7% (α=0.1, (L1, L1)) 62.1% 63.0% 61.1% 62.8% 62.2% 歌声の多重音の解析 (提案手法を利用して歌声によるハーモニーの音高を解析できるか) 2012 Autumn Meeting of ASJ. (C) CS17, Kobe University.