Download presentation
Presentation is loading. Please wait.
1
音声情報処理 第9回 1.フーリエ級数展開 2.冬休みの宿題
2
8.2 フーリエ級数展開 フーリエ級数展開 展開したい元の周期信号の周期
3
8.2 フーリエ級数展開 フーリエ級数展開の係数
4
フーリエ級数展開プログラミング における注意点
フーリエ級数展開プログラミング における注意点 ディジタルでフーリエ級数展開を行う場合は、f = n*w/(2.0*PI) がナイキスト周波数(サンプリング周波数の半分)以下の n までやれば良い。 (それ以上の an や bn を求めるとゴーストを観測してしまうので、やってはいけない!!)
5
鋸波のフーリエ級数展開:1次まで
6
鋸波のフーリエ級数展開:2次まで
7
鋸波のフーリエ級数展開:3次まで
8
鋸波のフーリエ級数展開:4次まで
9
鋸波のフーリエ級数展開:5次まで
10
鋸波のフーリエ級数展開:6次まで
11
8.1 周期波形とその周波数成分 スペクトル図(正規化振幅スペクトル)
12
スペクトル図 TIPS n=0には直流成分を書く 縦軸はA1で正規化しないのが一般的 横軸はnでなく周波数とするのが一般的
8.1 周期波形とその周波数成分 スペクトル図 TIPS n=0には直流成分を書く 縦軸はA1で正規化しないのが一般的 横軸はnでなく周波数とするのが一般的 縦軸は対数パワーを用いるのが一般的
13
アナログ信号の定積分 この部分の面積が a になる. f(t) T
14
ディジタル信号の定積分(1/3) f(t) T
15
ディジタル信号の定積分(2/3) f(t) T
16
ディジタル信号の定積分(3/3)
17
課題:フーリエ級数プログラミング 提出物:印刷して提出 レポート(波形図や考察) プログラム 締め切り:12月22日(火)の授業の時に提出
18
1.Wavesurferで録音 「おー」を1秒程度録音する。 サンプリング周波数: 16kHz 量子化ビット数: 16bit
チャネル: モノラル(=1ch) [Transform]⇒[Normalize…]⇒100% 振幅の最大値が32767になるよう拡大される。 保存形式: MS-Wav ファイル名: 08O.wav
19
2. 1ピッチ分のデータを切り出す 似た形をした波形が繰り返しているので、一つ分を選択し、Save Selection… する
ファイル名: “08O1.wav”
20
3.SOXでテキストファイルに変換 sox 08O1.wav 08O1.dat 1行目を削除
21
4.GUNUPLOTで描画 ちょっとデータが多すぎるのでエディタで削る
22
4.GUNUPLOTで描画 ちょっとデータが多すぎるのでエディタで削る
23
5.ピッチ周期・ピッチ周波数 周期 : 5.625ms 周波数: 177.8Hz プログラムには角周波数 が必要です!! 0.0 0.1
0.2 0.3
24
6.同じ周期の正弦波をつくる Cでプログラムを書きましょう!! GNUPLOT用のフォーマットは、
“08O1.dat” と同じようにすればよい。
25
7.GUNPLOTで描画
26
8.同じ周期の正弦波をつくる Cでプログラムを作成 SOXを用いてMS-Wavファイルに変換
振幅は32000程度 SOXを用いてMS-Wavファイルに変換 Wavesurferで再生し、音の高さに着目し、元の音声と聞き比べる
27
10.フーリエ級数プログラミング 自分で録音した「おー」のディジタル信号 から1周期分を切り出しフーリエ級数展開し,対数パワースペクトル図を作成せよ. 横軸:周波数 縦軸:対数パワー レポートには,必要に応じてプログラムの核となる部分を 添付してください.(以下同様)
28
11.フーリエ合成 n=2, 3, ・・・ と,nを順に大きくしていった場合のグラフを描画し,元の波形に近づく(もしくはずれていく)様子を,①の結果とあわせ考察せよ(レポートには,最低限 n=2, ほとんど一緒になった n,n=N/2, n=N, n=2Nのグラフを添付すること) nが?より大きくなると,元の波形とずれが大きくなる.この点についてナイキスト周波数を踏まえ考察せよ.
29
12.フーリエ合成(発展) t を1周期分だけでなく、2秒の音声合成し,wavesurferで聞いてみよう
⑤の方法を利用して,より自然な音声を合成してみよう. 注)⑤⑥についてはレポート中でプログラムの修正部分を示してください.
30
冬休みの宿題(1/2) JULIUS(ディクテーションキット)をダウンロードして,ディクテーションを実行してみよう
レポート課題: 立ち上げ時に,出てくるメッセージの意味を調査しなさい。 新聞やWebニュースから適当な10文を選んで入力(発声)して,単語を単位とした場合の,置換誤り率,挿入誤り率,脱落誤り率を求めよ。 30
31
~~ この間にもさまざまなメッセージが表示される ~~~~
C:\Users\kuroiwa\Desktop\dictation-kit-v3.0-win>.\bin\julius.exe -C fast.jconf include config: fast.jconf Warning: thread not supported, input may be corrupted on slow machines Reading in HMM definition...(binary)...finished defined HMMs: 7946 logical names: in HMMList done Making pseudo bi/mono-phone for IW-triphone...10 added as logical...done Reading in dictionary... 60250 words...done Reading in word n-gram...1-gram gram gram..indexing...done Mapping dictonary words to n-gram entries...done Building HMM lexicon tree = nodes 1-gram factoring values has been pre-computed Generating addlog table kb...done System Info begin Julius rev win32 (fast) Files: hmmfilename=model/phone_m/hmmdefs_ptm_gid.binhmm hmmmapfilename=model/phone_m/logicalTri progout interval = 300 msec ~~ この間にもさまざまなメッセージが表示される ~~~~ System Info end ************************************************************ * NOTICE: The first input may not be correctly recoginized * * since no CMN parameter is available on startup. *
32
冬休みの宿題(2/2) JULIAN(文法認識キット)をダウンロードして, 正規文法による認識システムを作成しなさい レポート課題:
単語数100単語以上、3単語以上の文も受理できること レポート課題: 単語辞書ファイル、文法ファイルを印刷したもの 文法が受理できる、適当な10文を入力して認識率を求めると共に、結果に関する考察をせよ。 文法が受理できない、適当な5文を入力した場合の入力音声及び認識結果を示すと共に、結果に関する考察をせよ。 32
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.