楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討

Slides:



Advertisements
Similar presentations
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Advertisements

●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Building text features for object image classification
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
「わかりやすいパターン認識」 第1章:パターン認識とは
Bassモデルにおける 最尤法を用いたパラメータ推定
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
雑音重み推定と音声 GMMを用いた雑音除去
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
高次数曲線を用いた音場 Acoustic Fields Having Higher Order Curvature
音響的特徴に基づく 楽器の階層表現の獲得と それに基づくカテゴリーレベルの 楽器音認識の検討
†京都大学大学院情報学研究科知能情報学専攻
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
音高による音色変化に着目した 音源同定手法
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
音高による音色変化と未知楽器の 問題を考慮した楽器音の音源同定
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
音高による音色変化に着目した音源同定に関する研究
多重ベータ分布を用いた音色形状の数理モデリングによる
音素部分空間の統合による音声特徴量抽出の検討
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
音色空間の音高依存性を考慮した 楽器音の音源同定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
独立成分分析 (ICA:Independent Component Analysis )
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
音色空間の音高依存性を考慮した 楽器音の音源同定
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ベイズ音声合成における 事前分布とモデル構造の話者間共有
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
パターン認識特論 カーネル主成分分析 和田俊和.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
CSP係数の識別に基づく話者の 頭部方向の推定
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討 北原 鉄朗† 後藤 真孝†† 奥乃 博† †京都大学大学院情報学研究科知能情報学専攻 ††科技団さきがけ21/産業技術総合研究所 7 July 2002

発表の流れ 音源同定とは 音高による音色変化に着目した音源同定 [北原, MUS-40-2, 2001] 本発表で提案する手法 処理の流れ 評価実験 まとめ

1.音源同定とは 楽器音の同定 ---入力された音は,piano? flute? … パターン認識の一分野 自動採譜・メディア検索などで有用 研究対象として,広く扱われるようになったのは最近(1990年代に入ってから)

あらかじめ用意された 各楽器の音響信号と比較 1.音源同定とは 処理の概要 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 piano あらかじめ用意された 各楽器の音響信号と比較 flute x1 入力された楽器音はpiano

様々な要因により特徴量が 変動するため,同定が困難 1.音源同定とは 処理の概要 (実際には…) 音響信号 x1:パワー包絡線の傾きの中央値 x2:周波数重心        など 特徴抽出 特徴空間 x2 様々な要因により特徴量が 変動するため,同定が困難 piano flute x1

楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか 1.音源同定とは 楽器音における特徴変動 楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか この問題を扱った従来研究は少ない たとえば, 楽器の個体差に着目 →「適応型混合テンプレート法」(柏野ら, ’98)など

楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか 1.音源同定とは 楽器音における特徴変動 楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか これらのうち,音高は物理量 (基本周波数)として抽出可能 この問題を扱った従来研究は少ない たとえば, 楽器の個体差に着目 →「適応型混合テンプレート法」(柏野ら, ’98)など

楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか 1.音源同定とは 楽器音における特徴変動 楽器音における特徴変動の要因: 音高・音の強さ・楽器の個体差・奏法など → これらの特徴変動をどのように考慮するか これらのうち,音高は物理量 (基本周波数)として抽出可能 ↓ 音高による特徴変動を 基本周波数の関数として近似 この問題を扱った従来研究は少ない たとえば, 楽器の個体差に着目 →「適応型混合テンプレート法」(柏野ら, ’98)など

2.音高による音色変化に着目した音源同定 [北原, 2001] 音高による変化の仕方で特徴量を3つに分類 (∵ 特徴量によって音高による変化の仕方は様々) 特徴量の分布を表現する基本周波数の関数を導入 代表値関数:各音高における分布の平均に相当 変動値関数:各音高における分布の分散に相当 これらの関数を用いて識別するため, 木下の識別関数(類似度)を拡張

2.音高による音色変化に着目した音源同定 [北原, 2001] 特徴量を手動で 分類する必要がある 音高による変化の仕方で特徴量を3つに分類 (∵ 特徴量によって音高による変化の仕方は様々) 特徴量の分布を表現する基本周波数の関数を導入 代表値関数:各音高における分布の平均に相当 変動値関数:各音高における分布の分散に相当 これらの関数を用いて識別するため, 木下の識別関数(類似度)を拡張 一般的な識別関数ではない

2.音高による音色変化に着目した音源同定 [北原, 2001] 特徴量を手動で 分類する必要がある 音高による変化の仕方で特徴量を3つに分類 (∵ 特徴量によって音高による変化の仕方は様々) 特徴量の分布を表現する基本周波数の関数を導入 代表値関数:各音高における分布の平均に相当 変動値関数:各音高における分布の分散に相当 これらの関数を用いて識別するため, 木下の識別関数(類似度)を拡張 ⇒ 音色変化をより高次の関数で近似 一般的な識別関数ではない ⇒ 多次元正規分布を拡張

3.本発表における提案手法 多次元正規分布の拡張 音高による音色変化を扱えるように 多次元正規分布を拡張

3.本発表における提案手法 多次元正規分布の拡張 音高による音色変化を扱えるように 多次元正規分布を拡張. 「音高ごとに学習すればよいのでは?」 (たとえば音高C4用の多次元正規分布をC4のデータだけで学習する)

3.本発表における提案手法 多次元正規分布の拡張 音高による音色変化を扱えるように 多次元正規分布を拡張 「音高ごとに学習すればよいのでは?」 (たとえば音高C4用の多次元正規分布をC4のデータだけで学習する) この方法では,より多くの学習データが必要 (88鍵のピアノであれば,学習データが1/88に減ったのと同じ)

3.本発表における提案手法 多次元正規分布の拡張 音高による音色変化を扱えるように 多次元正規分布を拡張 「音高ごとに学習すればよいのでは?」 (たとえば音高C4用の多次元正規分布をC4のデータだけで学習する) この方法では,より多くの学習データが必要 (88鍵のピアノであれば,学習データが1/88に減ったのと同じ) ⇒ 平均:音高によって連続的に変化すると仮定 共分散:音高に依存しないと仮定

3.本発表における提案手法 多次元正規分布の拡張 音高による音色変化を扱えるように 多次元正規分布を拡張 「音高ごとに学習すればよいのでは?」 (たとえば音高C4用の多次元正規分布をC4のデータだけで学習する) この方法では,より多くの学習データが必要 (88鍵のピアノであれば,学習データが1/88に減ったのと同じ) ⇒ 平均:音高によって連続的に変化すると仮定 共分散:音高に依存しないと仮定 F0依存多次元正規分布

音高によって変化する分布の平均を 関数近似(3次関数)により推定 3.本発表における提案手法 代表値関数 音高によって変化する分布の平均を 関数近似(3次関数)により推定

音高によって変化する分布の平均を 関数近似(3次関数)により推定 3.本発表における提案手法 代表値関数 音高によって変化する分布の平均を 関数近似(3次関数)により推定

3.本発表における提案手法 F0正規化共分散行列 代表値関数からのちらばりの程度を表す ↓ 音高による音色変化を表現

3.本発表における提案手法 F0正規化共分散行列 代表値関数からのちらばりの程度を表す ⇒音高以外の要因による音色変化を表す ↓ 音高による音色変化を表現

3.本発表における提案手法 F0正規化共分散行列 代表値関数からのちらばりの程度を表す ⇒音高以外の要因による音色変化を表す 音色空間を代表値関数で正規化してから, 共分散行列を求める ↓ 音高による音色変化を表現 音高による音色変化を除去

3.本発表における提案手法 ベイズ決定規則による識別 各楽器がF0依存多次元正規分布に従うと仮定 → 事後確率p(ωi|x)を最大にするωiを見つける このgを最大にするωiが同定結果 F0依存多次元正規分布の 確率密度関数 事前確率

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも (1) スペクトルに関する定常的特徴(40個) 周波数重心,etc (2) パワーの時間変化に関する特徴(35個) パワー包絡線の線形最小二乗法による 近似直線の傾き,etc (3) 各種変調の振幅/振動数(32個) 振幅変調,周波数変調, 周波数重心の時間変化,MFCCの時間変化 (4) 発音開始直後のピーク尖度に関する特徴(22個)

パワー包絡線の線形最小二乗法による近似直線 ピアノ フルート

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも (1) スペクトルに関する定常的特徴(40個) 周波数重心,etc (2) パワーの時間変化に関する特徴(35個) パワー包絡線の線形最小二乗法による 近似直線の傾き,etc (3) 各種変調の振幅/振動数(32個) 振幅変調,周波数変調, 周波数重心の時間変化,MFCCの時間変化 (4) 発音開始直後のピーク尖度に関する特徴(22個)

各周波数成分(11次倍音まで)を取り出し, 各ピークの尖度(とんがり度)を 4次モーメントから算出 発音開始直後のピーク尖度に関する特徴 各周波数成分(11次倍音まで)を取り出し, 各ピークの尖度(とんがり度)を 4次モーメントから算出

各周波数成分(11次倍音まで)を取り出し, 各ピークの尖度(とんがり度)を 4次モーメントから算出 発音開始直後のピーク尖度に関する特徴 ピーク周辺の非調波成分の多さを表す 各周波数成分(11次倍音まで)を取り出し, 各ピークの尖度(とんがり度)を 4次モーメントから算出

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) ピアノ ピアノ(PF) ギター クラシックギター(CG) ウクレレ(UK) アコースティック ギター(AG) 弦楽器 バイオリン(VN) ビオラ(VL) チェロ(VC) 金管楽器 トランペット(TR) トロンボーン(TB) サックス ソプラノサックス(SS) アルトサックス(AS) テナーサックス(TS) バリトンサックス(BS) 複簧楽器 オーボエ(OB) ファゴット(FG) クラリネット クラリネット(CL) 無簧楽器 ピッコロ(PC) フルート(FL) リコーダー(RC) 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも

4.処理の流れ 特徴抽出(129個) 主成分分析で次元圧縮 (累積寄与率99%で79次元に圧縮) 線形判別分析でさらに次元圧縮 (19楽器なので18次元に圧縮) F0依存多次元正規分布のパラメータ推定 ベイズ決定規則に基づいて楽器名を同定 出力は楽器名だけでなくカテゴリーも

上記のデータを無作為に10等分し, クロスバリデーション. 5.評価実験 実 験 方 法 使用データベース:RWC-MDB-I-2001 実楽器の単独発音を半音ごとに収録 今回は19種類の楽器を使用 各楽器に,3楽器個体,3種類の音の強さ 今回は,通常の奏法のみ使用 使用したデータ総数: 6247個 上記のデータを無作為に10等分し, クロスバリデーション.

上記のデータを無作為に10等分し, クロスバリデーション. 各グループχk(k=1,…,10)に対して, 5.評価実験 実 験 方 法 使用データベース:RWC-MDB-I-2001 実楽器の単独発音を半音ごとに収録 今回は19種類の楽器を使用 各楽器に,3楽器個体,3種類の音の強さ 今回は,通常の奏法のみ使用 使用したデータ総数: 6247個 上記のデータを無作為に10等分し, クロスバリデーション. 各グループχk(k=1,…,10)に対して, 「グループχk以外のデータで学習して グループχkのデータで評価」を繰り返す.

5.評価実験 実 験 結 果 個々の楽器レベルで約80%, カテゴリーレベルで約90%の 認識率を実現 5.評価実験 実 験 結 果 個々の楽器レベルで約80%, カテゴリーレベルで約90%の 認識率を実現 音高非依存に比べて, 個々の楽器レベルで4.00%, カテゴリーレベルで2.45%, 認識率向上 誤り削減率は, 個々の楽器レベルで16.48%, カテゴリーレベルで20.67% 個々の楽器レベル (19クラス) カテゴリーレベル (8クラス)

5.評価実験 実 験 結 果 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ファゴット(FG) 5.評価実験 実 験 結 果 (個々の楽器レベル) 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ソプラノサックス(SS) バリトンサックス(BS) ファゴット(FG) 認識率 3%以上向上 バイオリン(VN) チェロ(VC) アルトサックス(AS) ピッコロ(PC) フルート(FL) 認識率向上 アコースティックギター(AG)ビオラ(VL) テナーサックス(TS) オーボエ(OB) クラリネット(CL) 変化なし クラシックギター(CG) ウクレレ(UK) 認識率低下 リコーダー(RC)

・SS, BS, FGでも20%以上の認識誤りを削減 5.評価実験 実 験 結 果 認識率が7%以上改善された楽器(個々の楽器レベル) ・ピアノ:最も性能改善 (認識率9.06%改善,誤り削減35.13%) ・PF, TR, TBで約33~35%の認識誤りを削減 ・SS, BS, FGでも20%以上の認識誤りを削減

・SS, BS, FGでも20%以上の認識誤りを削減 5.評価実験 実 験 結 果 認識率が7%以上改善された楽器(個々の楽器レベル) 音域が広く, 音高による音色変化が顕著 ・ピアノ:最も性能改善 (認識率9.06%改善,誤り削減35.13%) ・PF, TR, TBで約33~35%の認識誤りを削減 ・SS, BS, FGでも20%以上の認識誤りを削減

・SS, BS, FGでも20%以上の認識誤りを削減 5.評価実験 実 験 結 果 認識率が7%以上改善された楽器(個々の楽器レベル) ・ピアノ:最も性能改善 (認識率9.06%改善,誤り削減35.13%) ・PF, TR, TBで約33~35%の認識誤りを削減 ・SS, BS, FGでも20%以上の認識誤りを削減

5.評価実験 実 験 結 果 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ファゴット(FG) 5.評価実験 実 験 結 果 (個々の楽器レベル) 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ソプラノサックス(SS) バリトンサックス(BS) ファゴット(FG) 認識率 3%以上向上 バイオリン(VN) チェロ(VC) アルトサックス(AS) ピッコロ(PC) フルート(FL) 認識率向上 アコースティックギター(AG)ビオラ(VL) テナーサックス(TS) オーボエ(OB) クラリネット(CL) 変化なし クラシックギター(CG) ウクレレ(UK) 認識率低下 リコーダー(RC)

「音高非依存」でも 90%以上の認識率 5.評価実験 実 験 結 果 認識率 7%以上向上 ピアノ(PF) トランペット(TR) 5.評価実験 実 験 結 果 (個々の楽器レベル) 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ソプラノサックス(SS) バリトンサックス(BS) ファゴット(FG) 認識率 3%以上向上 バイオリン(VN) チェロ(VC) アルトサックス(AS) ピッコロ(PC) フルート(FL) 認識率向上 アコースティックギター(AG)ビオラ(VL) テナーサックス(TS) オーボエ(OB) クラリネット(CL) 変化なし クラシックギター(CG) ウクレレ(UK) 認識率低下 リコーダー(RC) 「音高非依存」でも 90%以上の認識率

160個のデータのうち, 誤認識が1個増えたに過ぎない. 5.評価実験 実 験 結 果 (個々の楽器レベル) 認識率 7%以上向上 ピアノ(PF) トランペット(TR) トロンボーン(TB) ソプラノサックス(SS) バリトンサックス(BS) ファゴット(FG) 認識率 3%以上向上 バイオリン(VN) チェロ(VC) アルトサックス(AS) ピッコロ(PC) フルート(FL) 認識率向上 アコースティックギター(AG)ビオラ(VL) テナーサックス(TS) オーボエ(OB) クラリネット(CL) 変化なし クラシックギター(CG) ウクレレ(UK) 認識率低下 リコーダー(RC) 160個のデータのうち, 誤認識が1個増えたに過ぎない.

・ギター,弦楽器の認識率(提案手法):96.7% ・最も低いカテゴリーでも72%の認識率(提案手法) 5.評価実験 実 験 結 果 カテゴリーレベルの認識率 誤り削減 35% 8% 23% 33% 20% 13% 15% 8% ・すべてのカテゴリーで認識率改善 ・ギター,弦楽器の認識率(提案手法):96.7% ・最も低いカテゴリーでも72%の認識率(提案手法)

提案手法が最も認識率が高い 5.評価実験 k-NN法との比較 提案手法 ベイズ(LDA併用) ベイズ(PCAで18次元) ベイズ(PCAで79次元) k-NN(LDA併用) k-NN(PCAで18次元) k-NN(PCAで79次元) 提案手法が最も認識率が高い

79次元でのベイズ決定規則が最も認識率低い ∵ データ数に対して次元が高すぎる 5.評価実験 k-NN法との比較 提案手法 ベイズ(LDA併用) ベイズ(PCAで18次元) ベイズ(PCAで79次元) k-NN(LDA併用) k-NN(PCAで18次元) k-NN(PCAで79次元) 79次元でのベイズ決定規則が最も認識率低い ∵ データ数に対して次元が高すぎる

LDA併用により認識率向上 ∵ LDAはクラス間分離を考慮した次元圧縮法 5.評価実験 k-NN法との比較 提案手法 ベイズ(LDA併用) ベイズ(PCAで18次元) ベイズ(PCAで79次元) k-NN(LDA併用) k-NN(PCAで18次元) k-NN(PCAで79次元) LDA併用により認識率向上 ∵ LDAはクラス間分離を考慮した次元圧縮法

6.ま と め 音高による音色変化を考慮するため, F0依存多次元正規分布を提案 6.ま と め 音高による音色変化を考慮するため, F0依存多次元正規分布を提案 F0依存多次元正規分布のための 識別関数をベイズ決定規則から定式化 ⇒音源同定の性能向上に貢献 (個々の楽器で16.48%,  カテゴリーレベルで20.67%認識誤りを削減) 今後の課題 ベイズ決定規則以外への応用 より大規模な実験,混合音への適用など