徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司

Slides:



Advertisements
Similar presentations
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
Advertisements

量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
情253 「ディジタルシステム設計 」 (5)Noise5
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
補章 時系列モデル入門 ー 計量経済学 ー.
10.時系列データの解析 time-series data
動機 目的 音声特徴比較システムの開発 結果を考察 サンプルデータ の収集及び統計 班員全員が音楽好き 歌の上手さを科学的に理解
音響尤度を用いた マルチスピーカ音響エコーキャンセラの検討
情253 「ディジタルシステム設計 」 (2)modem2
神奈川大学大学院工学研究科 電気電子情報工学専攻
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
クロストーク成分の相互相関に 着目した音場再生システム
デジタル信号処理①
プロセス制御工学 6.PID制御 京都大学  加納 学.
雑音重み推定と音声 GMMを用いた雑音除去
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
担当 : 山口 匡 伊藤 祐吾 (TA) 宮内 裕輔 (TA)
無線LANにおけるスループット低下の要因の分析
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
亀岡弘和 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
補章 時系列モデル入門 ー 計量経済学 ー.
第7回 フィルタとは.
5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて -スペクトル分析 5.4 もうひと工夫 -ケプストラム分析 5.5 雑音の除去.
デザイン情報学科 メディア情報設計 河原英紀
音高による音色変化に着目した音源同定に関する研究
多重ベータ分布を用いた音色形状の数理モデリングによる
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-P-6 パラボラ反射板を用いたアクティブマイクロフォンによる方向推定
Specmurtを利用した調波構造行列による 混合楽音解析の検討
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
Data Clustering: A Review
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
バイラテラルフィルタを用いた音声特徴量抽出 2-Q-6
部分的最小二乗回帰 Partial Least Squares Regression PLS
音声情報とベイジアンネットを 用いた感性情報処理システム
Fourier 変換 Mellin変換 演習課題
不完全な定点観測から 真の不正ホストの分布が分かるか?
音声合成.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
HMM音声合成における 変分ベイズ法に基づく線形回帰
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
保守請負時を対象とした 労力見積のためのメトリクスの提案
落下水膜の振動特性に関する実験的研究 3m 理工学研究科   中村 亮.
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
尤度最大化基準を用いたエコー推定に基づく 車室内音響エコーキャンセラの検討
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
DECIGOの光学設計の検討 第17回DECIGOワークショップ 2018.11.1 川村静児(名古屋大学)
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
回帰分析入門 経済データ解析 2011年度.
ソースフィルタモデル.
CSP係数の識別に基づく話者の 頭部方向の推定
AAMと回帰分析による視線、顔方向同時推定
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Fourier 変換 Mellin変換 演習課題
ランダムプロジェクションを用いた音響モデルの線形変換
雑音環境下における Sparse Coding声質変換 3-P-49d
Presentation transcript:

徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司 風雑音除去アルゴリズム 徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司

研究の背景と目的 ホームビデオ等野外撮影機器の普及 野外録音における問題 ⇒ 野外での録音機会の増加 ⇒ 風雑音の影響 ⇒ 野外での録音機会の増加 野外録音における問題 ⇒ 風雑音の影響 観測信号から風雑音の除去を行う

従来手法 ハードウェアによる雑音混入の防止 問題点 風防,マイクの形状 風雑音の混入を防ぐのみ 雑音混入の防止をしているものの,風雑音の影響を受けてしまう

提案手法 ソフトウェアによる風雑音除去 ⇒観測信号に風雑音が混入しても,  風雑音を除去し,希望信号を取り出すことが可能

風雑音について 風雑音のパワースペクトル

雑音除去手法 雑音特性により,最適な手法は異なる 風雑音はその形状特徴より,   SS(Spectral Subtraction)法を用いる

Spectral Subtraction 観測信号は雑音と信号の和と考える

Spectral Subtraction 観測信号のSTFT(short-time Fourier transform)を以下のように定義する

Spectral Subtraction フーリエ空間上で雑音の   振幅スペクトルの減算としてSSを定義

Spectral Subtractionの問題点 雑音の減算を行う際に雑音の平均を   用いている ⇒雑音の引きすぎ,消し残りが起こる この問題を解決するための研究が   現在もさかんに行われている

提案手法1 フレーム毎に雑音レベルの推定を行い,   推定レベルに応じて雑音を引き去る ⇒雑音の引き過ぎ,消し残りを防ぐ

α(k)の導出 観測信号において音声の影響の少ない   低域を利用しα(k)を導出する

予備実験1 観測信号から単に雑音の平均スペクトル   を引き去る ⇒(通常のSS) 音声認識を用いて評価

予備実験1 実験結果 雑音除去後も雑音が残っていた 認識率の大きな低下の理由 ⇒通常の音響モデルを使用 data Accuracy(%) 予備実験1 実験結果 雑音除去後も雑音が残っていた 認識率の大きな低下の理由 ⇒通常の音響モデルを使用  data Accuracy(%) 原音声 87.56 原音声+雑音 71.95 雑音除去後 24.13

予備実験2 観測信号から既知の雑音を   フーリエ空間で引き去る ⇒(SSの上限)

予備実験2 実験結果 雑音除去後も少量の雑音が残っていた 認識率は多少低下 ⇒SSを行う際の位相のずれが原因? data 予備実験2 実験結果 雑音除去後も少量の雑音が残っていた ⇒SSを行う際の位相のずれが原因? 認識率は多少低下 data Accuracy(%) 現音声 87.56 雑音除去後 81.88

提案手法1 実験結果 予備実験1よりも原音声に近いものの, 雑音除去後も雑音が消し残っていた フレーム毎の雑音の振幅スペクトルを 提案手法1 実験結果 予備実験1よりも原音声に近いものの,    雑音除去後も雑音が消し残っていた フレーム毎の雑音の振幅スペクトルを    雑音の平均の振幅スペクトルで    近似できない

形状の異なる振幅スペクトル 26.28dB 33.10dB

提案手法2 風雑音のパワー毎に振幅スペクトルの 形状が異なると仮定 ⇒仮定に基づき提案手法2を考案 風雑音のパワー毎に振幅スペクトルの   形状が異なると仮定 ⇒仮定に基づき提案手法2を考案 提案手法1と異なり,複数の雑音モデル    を用意

提案手法2 風雑音をパワーにより4状態(小,中,大,特大)に 大別する 各状態毎に平均の振幅スペクトルを算出し 雑音モデルを作成 風雑音をパワーにより4状態(小,中,大,特大)に   大別する 各状態毎に平均の振幅スペクトルを算出し       雑音モデルを作成 観測信号より風雑音のパワー推定 パワーの推定値より雑音モデルを選択 α(k)を算出し,SS法を用いて雑音除去 

風雑音パワー推定 観測信号において音声の影響が少ない低域のパワースペクトルの和を算出 P.a.bとPの回帰直線を導出し観測信号から風雑音のパワーを推定

回帰直線導出過程 相関係数  ⇒

回帰直線導出過程 P.a.bとPの相関係数 Data Noise Noise+Signal P0.2 0.995322 0.991081 0.999707 0.992129 P1.2 0.987963 0.967047 P1.3 0.991269 0.966876

回帰直線導出過程 回帰直線  ⇒

回帰直線導出 導出した回帰直線 この二つの回帰直線を利用し,   観測信号から風雑音のパワーを推定

提案手法2の実験結果 雑音除去後の音声データを比較すると 提案手法1の実験結果とあまり差は なかった 風雑音のスペクトル形状はパワーに依存   提案手法1の実験結果とあまり差は   なかった 風雑音のスペクトル形状はパワーに依存   しないことが分かった

現状,今後の予定 風雑音の分析を詳しく行っている 客観的評価の導入 風雑音の調査のためのVQの プログラムを作成 風雑音のみのデータに対し, 板倉,斉藤距離 風雑音の調査のためのVQの   プログラムを作成 風雑音のみのデータに対し,   風雑音除去手法の確立を目指す