重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析 日本音響学会2012年秋季研究発表会 1-P-24(e) 西村大樹 ・ 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 従来手法 概要 Specmurt法 和音情報u(x)と楽器情報h(x)の畳み込みで 観測情報v(x)を表現できる [S. Saito, 2008] 多重音解析とは 同時刻に様々な高さの音が存在する信号の解析 音量 スペクトル 周波数 時間 多重音解析 より、 と計算でき、 が既知であるならば 、 、 をフーリエ変換したものを 、 、 とすると 楽譜形式 時間 で和音情報は求められる wavデータ 短時間フーリエ変換 ウェーブレット変換 ピアノロール形式 研究背景 耳による楽曲の解析は非常に困難 解析結果はMIDIフォーマットによる可視化が容易 一般に楽器情報は未知である 和音情報を求めるには楽器情報が既知である必要がある いかに楽器情報をモデル化するかに焦点があった (非線形写像と最小二乗誤差に基づく方法) 人手でも不可能ではないが、かなりの経験、労力、時間を要する MIDI化できれば、カラオケ、音楽検索などの分野でも活躍が見込める 提案手法 基本周波数成分 2次高調波周波数成分 3次 4次 理想的な楽器情報 用意された解の候補と同数の 楽器情報をSpecmurtの式を利用して求める 得られた楽器情報から理想的な楽器情報に 最も近いものを見つける 楽器情報は音階によってわずかに形が異なる 楽器情報の形には拘る必要がないのではないか? 楽器情報のモデル化を行わない Step1 高調波周波数成分に大きな値を持ち、 それ以外にピークを持たない(スパース) 正しいピークの組み合わせ = 和音情報 :基本周波数 :高調波周波数 のうち、高調波周波数成分を 持たないものは棄却 理想的な楽器情報に最も近いもの は 棄却されなかった の中から 以下のようにスパース性に基づいて決定される ※αは重さ 観測情報のピークは基本周波数と高調波周波数であるため、 正しいピークの組み合わせが和音の情報になると考えられる Laは高調波成分を除く楽器情報のスパース性であり、以下のように計算される L1ノルムを用いる場合 L2ノルムを用いる場合 観測情報のピークを基に、 解の候補を数多く用意する Lbは高調波成分要素の和であり、以下のように計算される Step2 L1ノルムを用いる場合 L2ノルムを用いる場合 に対応する が解として一意に決まる 観測情報をもとに考えられる解の候補 候補から得られた楽器情報 評価実験 今後の課題 実験結果 重みや式の選択の自動化 (楽器によって最適な重みや式が違うため) オクターブ違いの和音に対する改善 (提案手法ではオクターブ違いの和音に対応できない) ``RWC-MDB-C-2001 No.43: Sicilienne op.78”を解析 従来手法 提案手法 最大 提案手法 (平均) (重み, 式) (L1, L1) (L1, L2) (L2, L1) (L2, L2) 全 ピアノ 89.2% 92.7% (α=0.9, (L2, L1)) 87.3% 86.7% 90.8% 88.5% ギター 74.3% 79.7% (α=0.4, (L2, L1)) 77.4% 77.0% 78.6% 77.8% 77.7% バイオリン 65.0% 71.7% (α=0.1, (L1, L1)) 62.1% 63.0% 61.1% 62.8% 62.2% 歌声の多重音の解析 (提案手法を利用して歌声によるハーモニーの音高を解析できるか) 2012 Autumn Meeting of ASJ. (C) CS17, Kobe University.