音声特徴比較システムの開発 Development of Voice Feature Comparison System.

Slides:



Advertisements
Similar presentations
情報通信システム( 2 ) 年 4 月 26 日 火曜日 午後 4 時 10 分~ 5 時 40 分 NTT-IT Corp. 加藤 洋一.
Advertisements

新設科目:応用数学 イントロダクション 情報工学科 2 年前期 専門科目 担当:准教授 青木義満.
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
小学校におけるICTを使った 音楽科教材開発
卒研のようなもの 圧縮ちーむ 2008.4.22 鴫原、山本、齋藤.
音声情報処理 第9回 1.フーリエ級数展開 2.冬休みの宿題.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
データ取得・解析ソフトウェア CRD分光法用プログラム 各¥600,000より (A/D変換ボード付の選択可)
情報通信システム(3) plala. or 情報通信システム(3) 年5月10日 火曜日  午後4時10分~5時40分 NTT-IT Corp. 加藤 洋一.
復習.
10.時系列データの解析 time-series data
本日の内容(10/30) (以下、前回資料と重複あり) 音響データの分析 音楽的な性質(調・調性、拍節構造) 音楽情報科学について(導入)
動機 目的 音声特徴比較システムの開発 結果を考察 サンプルデータ の収集及び統計 班員全員が音楽好き 歌の上手さを科学的に理解
インターネットにおける オーケストラ演奏同期機構の 設計と実装
GRAPESで学ぶフーリエ級数 GRAPESで学ぶ フーリエ級数 立命館高等学校 早苗雅史.
クロストーク成分の相互相関に 着目した音場再生システム
デジタル信号処理①
デジタル信号処理③
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
担当 : 山口 匡 伊藤 祐吾 (TA) 宮内 裕輔 (TA)
首都大学東京 都市教養学部数理科学コース 関谷博之
ディジタル信号処理 Digital Signal Processing
USB2.0対応PICを用いたデータロガーの製作
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
音声処理ソフトPraatの使い方.
デジタル信号処理④
ガウス誤差関数を利用した 収束の速いヒルベルト変換ディジタルフィルタ
表紙 MATLAB 応用講習会(A) 情報アシスタント M1 山本幸司.
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
プログラム実行履歴を用いたトランザクションファンクション抽出手法
Astro-E2衛星搭載 XISの データ処理方法の最適化
第7回 フィルタとは.
情報機器の発達とディジタル化 第2節 情報のディジタル化②
音信号表現 音声波形のデジタル化(PCM) サンプリング、標本化定理、量子化 ソースフィルタモデル
画像処理 基礎.
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて -スペクトル分析 5.4 もうひと工夫 -ケプストラム分析 5.5 雑音の除去.
デザイン情報学科 メディア情報設計 河原英紀
音高による音色変化に着目した音源同定に関する研究
機械創造工学課程 西久保智昭 担当教員 小林泰秀 准教授
雑音環境下における 非負値行列因子分解を用いた声質変換
相関.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 第六回 最終課題 画像処理による動物体自動抽出、モーションキャプチャ
Basis vectors generation
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
音・音楽の設計と表現Ⅱ キーワード : サンプリング(標本化)、周波数、量子化 音は空気を伝わる波 → 音をデジタル(0と1の数値)にする。
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
ー 第3日目 ー ねじれ型振動子のブラウン運動の測定
2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るか ー調音音声学 2.3 声の正体とは ー音響音声学 2.4 どうやって声を聴き取るか ー聴覚音声学.
音声分析 フーリエ解析の定性的理解のために.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
7.一次元ダクトの消音制御系における低コスト化
音声情報とベイジアンネットを 用いた感性情報処理システム
ノイズ.
ディジタル信号処理 Digital Signal Processing
情報A 第15回授業 04情報のディジタル化 対応ファイル:12exp15.xls
正弦波.
創作授業 ③.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
川崎浩司:沿岸域工学,コロナ社 第4章(pp.58-68)
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
ソースフィルタモデル.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
6.2 高速フーリエ変換 (1)FFT(fast Fourier transform)とは
コンピュータと音 B3 入野仁志(irino).
Presentation transcript:

音声特徴比較システムの開発 Development of Voice Feature Comparison System

動機 班員全員が 音楽好き 数値解析 のコーディン グ をしたい フーリエ変換 を 活か せる 活か せる 歌 の 歌 の 上手さを科学 的に理解した い 4 つの動機

目的 音声特徴比較 システムの開発 サンプルデータ の 収集及び統計 結果を考 察 歌の上手さを 科学的に理解

開発環境 MCI とは? Media Control Interface の略 音楽や動画を再 するための命令 群 Microsoft Visual C Express Edition

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

ボーカルキャンセリング L-R=L V +L B -(R V +R B ) =L V -R V +L B -R B =L V -L V +L B -R B =L B -R B L=L V +L B R=R V +R B L V =R V 定義 伴奏だけ 取り出せる! ボーカルが中央に定位 していることを利用、 ボーカル音声を除去!

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

f ( t )=? 波の分解

f ( t )=sinωt+sin2ωt+sin3ωt 波の分解

フーリエ理論…全ての周期関数は単純なsin波cos波に分解可能 3つの定数が分かることによって波の特徴を解析できる 波形を周波数分布へ変換できる! 波形グラフを G( f ) ,周波数グラフを f ( t ) とすると …cos 波の各振幅 …sin 波の各振幅 … 基本周波数 1 に対する倍音周波数 フーリエ変換

f ( t ) 時間 スペクトル G( f ) 周波数 FT

DFT(離散フーリエ変換) …PC用のデジタルフーリエ変換 τ はサンプリング間隔 Nはデータ点数 フーリエ変換 ↓ デジタル化 離散フーリエ変換 ↓ 高速化 高速フーリエ変換

バタフライ演算 データ点数を2のN乗個とする →PCの仕様に合わせるため,周期を崩さないため。 ・データ点数が64個の場合

→ 窓処理・・・波形 f ( t ) に窓関数をかけるこ と。 フーリエを利用する大前提は周期性 窓関数 … 初めと終りが最小,終始2点の中間が最大 窓処理

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

音声比較以前 ボーカル音声波形データの抽出 失敗 ボーカル音声スペクトルの抽出 ボーカル音声以外の 中央音源が少ないデータでは成功

音階判定 音階変化判定 声量判定 抑揚判定 得点を算出 標準偏差、偏差値 を利用 精度向上のために フィルタリング 比較アルゴリズム概要

標準偏差 標準偏差 散らばり具合を表す数 偏差値の計算に用いられる

平均 値を 変更 偏差値 母集団の平均か らどれだけ離れ ているかを示し た値

フィルタリングフィルタリング 解析したい周波数帯域の特定ができる 音声周波数帯 [Hz] を通過させるフィルタを使用

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

システムの説明手順 ボーカルキャンセリン グ フーリエ変換 比較手法以前 比較手法

音程比較 音階判定 音階 取得 音階 取得 この音は「ド」だ! 音程合致! 録音音声スペクトルボーカル音声スペクトル

1秒 経過 音階差分判定 音階 取得 音階 取得 この音は「ド」だ!この音は「ラ」だ! t秒時のスペクトルt+1秒時のスペクトル 「 ラ」-「ド」は正、このことを利用して… 音程比較!

声量判定 平均値で比較 マイク入力時のパワーの平均値で比 較する手法

変換 マイク入力時のパワーの変化の度合 いで比較する手法 抑揚判定

比較 結果 システム で採点 メンバー が採点 上位、下位 ほぼ一致 RankHumanSystem 1test23 2test21test04 3test01test00 4test04test21 5test13test15 6test00test20 7test07test13 8test09test22 9test12test17 10test06test08 11test16test12 12test18test03 13test03test11 14test11test02 15test08test10 16test14test07 17test05test01 18test17test09 19test19test06 20test22test18 21test02test14 22test10test19 23test15test05 24test20test16

考察 ボーカル音声を綺麗に消せる曲 は高得点になる傾向がある 中央音源に楽器音が含まれてい る ボーカルキャンセリングアルゴ リズムを改善する 比較アルゴリズムを改善する 解決策 原因

参考文献 C 言語ではじめる音のプログラミン グ WAV プログラミング C 言語で学ぶ音響処理 Windows サウンドプログラミング フーリエ変換

ご清聴ありがとうございました

VFCS Project 指導教員 仲道 嘉夫 先生 班長 本多 隼也 監督 桑原 悠太 フーリエ変換指導 西田 侑央 GUI コーディング 本多 隼也 システムコーディング 桑原 悠太 グラフィックス 木立 寛也 データ比較 浅子 卓亨 木立 寛也 西田 侑央 本多 隼也 資料作成 浅子 卓亨 桑原 悠太 木立 寛也 西田 侑央 本多 隼也 スペシャルサンクス フーリエ変換指導協力 石川 幸治 先生 比較手法検討協力 石川 幸治 先生 GUI 開発協力 菱沼 和弘 データ収集協力 安藤 駿 河野 杏那 西松 大輝 ・・・等他多数の方々 協力ありがとうございましたご清聴ありがとうございました

VFCS Project Wiki 質疑応答のじかん

ここから先は予備

DFTとFFT NDFTFFT

スコアブック と照らし合わ せて成功して いるか確認し た 原曲スペクトル-伴奏スペクトル ⇒ボーカル音声スペクトル ボーカル音声スペクトル抽出

ビブラート判定 New! リズム判定 New! 音階判定 音階変化判定 声量判定 抑揚判定 + 比較アルゴリズム改善

波形データ同士で比較 失敗 ビブラートは波形で検出するもの だが,波形の抽出ができていない ため,現状ではビブラートを扱う ことができない ビブラートに関して

原曲 ( 波形データ ) 周波数スペクトル 原曲波形と周波数スペクトルの両 方のアプローチにより精度向上 FFT ,ハートレー変換 を利用 ボーカルキャンセリグ改善

L B -R B ⇒伴奏 L=L V +L B R=R V +R B L V =R V 定義 L-(L B -R B )=L V +L B -L B +R B =L V +R B ⇒ 伴奏が残ってしまう ボーカル音声波形抽出失敗理由

データ形式 : 1 (1 = PCM) チャンネル数 : 1 ( モノラル ) サンプリング周波数 : [Hz] バイト数 / 秒 : [bytes/sec] バイト数 × チャンネル数 : 2 [bytes] ビット数 / サンプル : 16 [bits/sample] WAVEファイル仕様

声域とBPFの閾値 歌声の声域 : 約 70 ~ 1500 [Hz] 声域 BPF の閾値 : 150 ~ 2000 [Hz] BPF の閾値