動機 目的 音声特徴比較システムの開発 結果を考察 サンプルデータ の収集及び統計 班員全員が音楽好き 歌の上手さを科学的に理解 フーリエ変換 を活かせる 数値解析のコーディングをしたい 歌の上手さを科学的に理解する 結果を考察 音声特徴比較システムの開発 サンプルデータ の収集及び統計 歌の上手さを科学的に理解 (最終目標)
ボーカルが中央に定位していることを利用、ボーカル音声を除去! ボーカルキャンセリング L-R=LV+LB-(RV+RB) =LV-RV+LB-RB =LV-LV+LB-RB =LB-RB 定義 ボーカルが中央に定位していることを利用、ボーカル音声を除去! L=LV+LB R=RV+RB LV=RV 伴奏だけ 取り出せる!
フーリエ変換 フーリエ変換 ↓デジタル化 離散フーリエ変換 ↓バタフライ演算を組み込む 高速フーリエ変換 …cos波の各振幅 フーリエ変換 ↓デジタル化 離散フーリエ変換 ↓バタフライ演算を組み込む 高速フーリエ変換 …cos波の各振幅 …sin波の各振幅 …基本周波数1に対する倍音周波数 τはサンプリング間隔 Nはデータ点数
バタフライ演算 データ点数を2のN乗個とする →PCの仕様に合わせるため,周期を崩さないため ・データ点数が64個の場合 1 2 3 4 5 6 7 8 2 4 6 8 1 3 5 7
窓関数…初めと終りが最小,終始2点の中間が最大 窓処理 フーリエを利用する大前提は周期性 窓関数…初めと終りが最小,終始2点の中間が最大 →窓処理・・・波形f ( t )に窓関数をかけること
比較アルゴリズム概要 音階判定 音階変化判定 得点を算出 声量判定 抑揚判定 スペクトルを用いて比較 標準偏差、偏差値 を利用 精度向上のために フィルタリング
音階判定 録音音声スペクトル ボーカル音声スペクトル 音階 取得 音階 取得 音程比較 この音は「ド」だ! この音は「ド」だ! 音程合致!
音程比較! t秒時のスペクトル t+1秒時のスペクトル 1秒 経過 音階 取得 音階 取得 この音は「ド」だ! この音は「ラ」だ! 「ラ」-「ド」は正、このことを利用して…
声量判定 抑揚判定 マイク入力時のパワーの平均値で比較する手法 マイク入力時のパワーの変化の度合いで比較する手法 変 換 平均値で比 較
結果と考察 結果 考察 メンバーが採点 システムで採点 上位、下位 ほぼ一致 ボーカル音声を綺麗に消せる曲は高得点になる傾向がある Rank Human System 1 test23 2 test21 test04 3 test01 test00 4 5 test13 test15 6 test20 7 test07 8 test09 test22 9 test12 test17 10 test06 test08 11 test16 12 test18 test03 13 test11 14 test02 15 test10 16 test14 17 test05 18 19 test19 20 21 22 23 24 結果と考察 結果 メンバーが採点 システムで採点 比較 上位、下位 ほぼ一致 考察 ボーカル音声を綺麗に消せる曲は高得点になる傾向がある 解決策 原因 中央音源に楽器音が含まれている ボーカルキャンセリングアルゴリズムを改善する 比較アルゴリズムを改善する