ソースフィルタモデル.

Slides:



Advertisements
Similar presentations
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
Advertisements

第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
コンソールの利用 零点・極と時間応答の関係 安定性 過渡応答の特性
復習.
音響信号処理特論 音声信号処理の基礎(その2)
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
プロセス制御工学 3.伝達関数と過渡応答 京都大学  加納 学.
集積回路工学研究室 岩淵 勇樹 秋田 純一 北川 章夫
情253 「ディジタルシステム設計 」 (2)modem2
発声のしくみ -声道の共鳴と音源の生成-.
クロストーク成分の相互相関に 着目した音場再生システム
東京工業大学 機械制御システム専攻 山北 昌毅
デジタル信号処理①
デジタル信号処理③
ブロック線図によるシミュレーション ブロック線図の作成と編集 ブロック線図の保存と読込み ブロック線図の印刷 グラフの印刷
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
PSOLA法を用いた極低ビットレート音声符号化に関する検討
文字から声をつくる仕組み.
担当 : 山口 匡 伊藤 祐吾 (TA) 宮内 裕輔 (TA)
ディジタル信号処理 Digital Signal Processing
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
音声処理ソフトPraatの使い方.
実時間動画像マルチキャストのための フィルタリング手法の実装と評価
デジタル信号処理④
ガウス誤差関数を利用した 収束の速いヒルベルト変換ディジタルフィルタ
羽佐田葉子 2007年3月24日 アクロス研究会@静岡大学
(ラプラス変換の復習) 教科書には相当する章はない
亀岡弘和 日本電信電話株式会社 NTTコミュニケーション科学基礎研究所
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
電気回路学Ⅱ エネルギーインテリジェンスコース 5セメ 山田 博仁.
電子回路Ⅰ 第11回(2009/1/19) 電力増幅.
システムモデルと伝達関数 1. インパルス応答と伝達関数 キーワード : 伝達関数、インパルス応答、 ステップ応答、ランプ応答
大阪大学 大学院工学研究科 極限光通信工学領域 井上研究室 欅田 直也・橘 遼太郎・隅田 拓也・高 祥史
第7回 フィルタとは.
音信号表現 音声波形のデジタル化(PCM) サンプリング、標本化定理、量子化 ソースフィルタモデル
電気回路学Ⅱ エネルギーインテリジェンスコース 5セメ 山田 博仁.
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
5. 音声からの特徴抽出 5.1 特徴抽出の手順 5.2 音声信号のディジタル化 5.3 人の聴覚をまねて -スペクトル分析 5.4 もうひと工夫 -ケプストラム分析 5.5 雑音の除去.
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
デザイン情報学科 メディア情報設計 河原英紀
 1オーム系 Z0 = 1Ω (1)  オームの法則 (V:電圧,I:電流,R:抵抗orインピーダンス) V = IR (2)   1オーム系では,
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
6. ラプラス変換.
ディジタル信号処理 Digital Signal Processing
ディジタルフィルタの設計.
音・音楽の設計と表現Ⅱ キーワード : サンプリング(標本化)、周波数、量子化 音は空気を伝わる波 → 音をデジタル(0と1の数値)にする。
2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るか ー調音音声学 2.3 声の正体とは ー音響音声学 2.4 どうやって声を聴き取るか ー聴覚音声学.
第 6 章 :フィードバック制御系の安定性 6.1 フィードバック系の内部安定性 6.2 ナイキストの安定定理
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
                                                                   平成20年10月                       工学科   年生 学籍番号(          ) 氏名(                 ) □ フーリエ級数 □ フーリエ変換 □ SN比 □ 波長
電機制御工学 定量的制御編 清弘 智昭.
電子回路Ⅰ 第10回(2008/1/7) 電力増幅.
シミュレーションパラメータの設定 一次系の時間応答 二次系の時間応答
情報A 第15回授業 04情報のディジタル化 対応ファイル:12exp15.xls
音声合成.
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
第2回 標本化と量子化.
音声のディジタル化 Copyright(C)2004 Tsutomu Ohara All rights reserved.
VOCAL DYNAMICS CONTROLLER: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース
ディジタル信号処理 Digital Signal Processing
HMM音声合成における 変分ベイズ法に基づく線形回帰
電気回路学Ⅱ エネルギーインテリジェンスコース 5セメ 山田 博仁.
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
第 5 章 :周波数応答 5.1 周波数応答と伝達関数 周波数伝達関数,ゲイン,位相 キーワード : 5.2 ベクトル軌跡 ベクトル軌跡
音響伝達特性を用いたシングルチャネル音源方向推定
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
第8回 ステップ応答によるシステム同定.
CSP係数の識別に基づく話者の 頭部方向の推定
Presentation transcript:

ソースフィルタモデル

ソースフィルタモデル 線形システム (フィルタ) 音源信号 (ソース) 音声信号 線形予測モデル

連続信号と離散信号のフーリエ変換

Z変換

フィルタ

たたみこみ演算

インパルス応答 例2 例1

有理関数形式のZ変換 収束 発散

デジタルフィルタの入出力関係

デジタルフィルタのタイプ 線形予測フィルタ

デジタルフィルタの極と零点 を零点(下図の )といい、 を極(下図の )という Z平面 Im 共役複素根 単位円 Re 実根 を零点(下図の )といい、  を極(下図の )という Z平面 Im 共役複素根 単位円 1 Re 実根 フィルタが安定であるための条件は   

デジタルフィルタの周波数特性

フィルタの周波数特性と極の関係 Z平面 Im 共役複素根 単位円 Freq. 1 Re 正の実根 負の実根 Freq. Freq.

線形予測フィルタのスペクトル 周波数領域 時間領域 、 P次の線形予測フィルタのスペクトルは高々p/2個の極(スペクトルピーク)をもつ

スペクトル包絡と微細構造 = + T T: ピッチ周期 音声 スペクトル フィルタ スペクトル包絡 Fi: 極周波数 f0 : ピッチ周波数 f0=1/T スペクトル スペクトル包絡 微細構造 (調波構造) F1 F2 F3 F4 T: ピッチ周期 Fi: 極周波数 f0 : ピッチ周波数 + = 音声 フィルタ 音源

有声音と無声音のスペクトル 有声音 無声音 周期性なし 周期性あり 調波構造あり 調波構造なし

音声信号モデル スペクトル包絡 音声スペクトル パルス音源スペクトル  音声合成 フィルタ T ノイズ音源スペクトル 音源パラメータ

音声の基本パラメータ

音声合成デジタルフィルタ 線形予測係数 (スペクトルパラメータ) 音声信号 音源信号

音声合成の特徴 少ない数の音声パラメータから自然な音声を合成 音韻(声の音色)と韻律(声の高さ)を別の音声パ ラメータで制御できる 人間の音声生成過程に対応した合成 音声波形を再現するのではなく、音声スペクトルを 再現(人間の聴覚特性を利用)

原音声と合成音声の波形 音声波形 合成音声波形

線形予測分析(1) A z ( ) 周波数領域 時間領域 定式化 、 予測残差電力 が最小 予測残差のスペクトルが平坦 解法 予測残差電力   が最小 予測残差のスペクトルが平坦 A z ( ) 解法 ただし、自己相関関数 周波数

最尤スペクトル推定

線形予測分析(2)

線形予測分析(3)

線形予測分析(計算例)

スペクトル分析の特徴

音源分析 スペクトル 波形 自己相関係数 音声 T T 予測残差 ピーク値が大きい時 は有声、小さい時は 無声 ピッチ周期 予測残差の 平均振幅

音声分析合成系 7bit 40bit 5bit 1bit 分析フレームを20msとすると、ビットレートは (40+5+1+7)×50フレーム=2650bit/sec

音声分析合成法の利点と問題点 少ない情報量で音声を伝達できる  音声波形をそのまま送る(PCM方式)と毎秒64000ビット の情報量が必要になるのに対して、音声のパラメータだけ を送る音声合成法では毎秒2650ビットの情報量ですむ      同じ通信回線で20人が話すことができる 音声に特化しすぎている   声以外の音を伝えることができない、   周囲騒音があると音声の品質が劣化する   人によって音声の品質がばらつく      通信用途にはそのまま使えない