音高による音色変化に着目した音源同定に関する研究

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Building text features for object image classification
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パネル型クエリ生成インタフェース画像検索システムの改良
「わかりやすいパターン認識」 第1章:パターン認識とは
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
1.
時空間データからのオブジェクトベース知識発見
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
クロストーク成分の相互相関に 着目した音場再生システム
雑音重み推定と音声 GMMを用いた雑音除去
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
高次数曲線を用いた音場 Acoustic Fields Having Higher Order Curvature
音響的特徴に基づく 楽器の階層表現の獲得と それに基づくカテゴリーレベルの 楽器音認識の検討
†京都大学大学院情報学研究科知能情報学専攻
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
音高による音色変化に着目した 音源同定手法
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
音高による音色変化と未知楽器の 問題を考慮した楽器音の音源同定
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
多重ベータ分布を用いた音色形状の数理モデリングによる
第14章 モデルの結合 修士2年 山川佳洋.
雑音環境下における 非負値行列因子分解を用いた声質変換
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
音色空間の音高依存性を考慮した 楽器音の音源同定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
Number of random matrices
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
ブースティングとキーワードフィルタリング によるシステム要求検出
VOCAL DYNAMICS CONTROLLER: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
音色空間の音高依存性を考慮した 楽器音の音源同定
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
ソースフィルタモデル.
CSP係数の識別に基づく話者の 頭部方向の推定
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
Presentation transcript:

音高による音色変化に着目した音源同定に関する研究 東京理科大学理工学部情報科学科 山田研究室 北原 鉄朗 平成13年度卒業研究

発表の流れ 音源同定とは 音高による音色変化に着目した音源同定 評価実験 まとめ

2.音源同定とは 楽器音の同定 ---入力された音は,piano? flute? … パターン認識の一分野 自動採譜・メディア検索などで有用だが, 従来研究は少ない. われわれは「音色変化の問題」 「未知楽器の問題」の2つの観点から研究 時間の制約から「未知楽器の問題」については省略

2.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出

あらかじめ用意された 各楽器の音響信号と比較 2.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 あらかじめ用意された 各楽器の音響信号と比較 x1

あらかじめ用意された 各楽器の音響信号と比較 2.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 piano あらかじめ用意された 各楽器の音響信号と比較 x1

あらかじめ用意された 各楽器の音響信号と比較 2.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 piano あらかじめ用意された 各楽器の音響信号と比較 flute x1

あらかじめ用意された 各楽器の音響信号と比較 2.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 piano あらかじめ用意された 各楽器の音響信号と比較 flute x1 入力された楽器音はpiano

特徴変動の要因として 音高に着目 様々な要因により特徴量が 変動するため,同定が困難 特徴抽出 2.音源同定とは 処理の概要 (実際には…) 2.音源同定とは 処理の概要 (実際には…) 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 様々な要因により特徴量が 変動するため,同定が困難 piano flute 特徴変動の要因として 音高に着目 x1

3.音高による音色変化に 着目した音源同定 同一楽器であっても,音高によって音色が変化 あらゆる音高に対して学習データを 十分に用意するのは困難. 有限の学習データから 様々な音高に対応できる手法が必要. 音色の変化の仕方は, 特徴量や楽器によって様々

3.音高による音色変化に着目した音源同定 課 題 3.音高による音色変化に着目した音源同定 課 題 課題1 特徴量によって音高による変化の仕方が異なることをどのように考慮するか. 課題2 有限の学習データから,さまざまな 音高の特徴量をどのように推定するか.

3.音高による音色変化に着目した音源同定 課 題 3.音高による音色変化に着目した音源同定 課 題 課題1 特徴量によって音高による変化の仕方が 異なることをどのように考慮するか. 音高による変化の仕方で特徴量を3つに分類. 課題2 有限の学習データから,さまざまな 音高の特徴量をどのように推定するか.

3.音高による音色変化に着目した音源同定 特徴量の3つの分類 無相関型特徴量 連続変化型特徴量 離散変化型特徴量

3.音高による音色変化に着目した音源同定 課 題 3.音高による音色変化に着目した音源同定 課 題 課題1 特徴量によって音高による変化の仕方が 異なることをどのように考慮するか. 音高による変化の仕方で特徴量を3つに分類 課題2 有限の学習データから,さまざまな 音高の特徴量をどのように推定するか. 特徴量の分布を表現する基本周波数の関数を 導入    (代表値関数・変動値関数)

3.音高による音色変化に着目した音源同定 代表値関数 各基本周波数で特徴量を代表する関数 (特徴量の分布の区分的線形近似) 無相関型特徴量 連続変化型特徴量 離散変化型特徴量

3.音高による音色変化に着目した音源同定 変動値関数 各基本周波数における代表値関数からの 散らばりの様子を表す関数 (標準偏差の定義に重みを導入) 変動値関数: 重み: xik : 特徴量 Fk : 学習データの基本周波数 i : 特徴量番号 μis(f) : 代表値関数 f : 入力データの基本周波数 s : カテゴリー k : 学習データ番号

3.音高による音色変化に着目」した音源同定 代表値関数・変動値関数の利用 各楽器に対する類似度: xik: 特徴量,μis(f) : 代表値関数,σis(f) : 変動値関数, f : 入力信号の基本周波数 各楽器の特徴空間上の重心や距離尺度を 入力信号の基本周波数に応じて変化させる手法

Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) 3.評価実験(実楽器使用) 実 験 方 法 Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) 3.評価実験(実楽器使用) 実 験 方 法 Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) 3.評価実験(実楽器使用) 実 験 方 法 Piano, violin, flute, trumpet を階層的に同定 実楽器の単音データベースを使用 (データ総数: 967個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

3.評価実験(実楽器使用) 実 験 結 果 すべての楽器で 認識率向上 最大では 約10%の向上

MIDI音源から作成した単音データベースを 使用 (データ総数: 858個) Piano, classical guitar, violin, viola, flute, piccolo, trumpet, trombone を階層的に同定 MIDI音源から作成した単音データベースを 使用  (データ総数: 858個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

MIDI音源から作成した単音データベースを 使用 (データ総数: 858個) Piano, classical guitar, violin, viola, flute, piccolo, trumpet, trombone を階層的に同定 MIDI音源から作成した単音データベースを 使用  (データ総数: 858個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

MIDI音源から作成した単音データベースを 使用 (データ総数: 858個) Piano, classical guitar, violin, viola, flute, piccolo, trumpet, trombone を階層的に同定 MIDI音源から作成した単音データベースを 使用  (データ総数: 858個) ランダムに2割のデータを学習データに 残りを入力データに割り当てる. 実験は比較実験とする. ・ 音高による変化を考慮しない場合/提案手法 実験を20回繰り返す. ・ 学習データにどれを割り当てるかが毎回変化.

3.評価実験(実楽器使用) 実 験 結 果

4.ま と め 音高による音色変化に着目 ⇒特徴量の分類と関数近似により, 音高による変化に応じて特徴空間を変化 ⇒性能向上に貢献 4.ま と め 音高による音色変化に着目 ⇒特徴量の分類と関数近似により,  音高による変化に応じて特徴空間を変化 ⇒性能向上に貢献 今後の課題 ‐特徴量の自動分類 ‐様々な奏法・楽器への対応 ‐混合音への適用