卒研のようなもの 圧縮ちーむ 2008.4.22 鴫原、山本、齋藤
・前回のおさらい ・音声録聞見 ・ピッチとは ・今後の方針 今日やること ・前回のおさらい ・音声録聞見 ・ピッチとは ・今後の方針
前回のおさらい フォルマント周波数 音声パワースペクトルがピークに達している周波数を指す。周波数の低いほうから順に第1フォルマント(F1)、第2フォルマント(F2)…というように呼ぶ。 色の濃さ:音量 F4 F3 周波数 F2 F1 F0(ピッチ) 基本周波数 (声帯の振動数) 時間 NHKのアナウンサーが「あ」を発音
音声録聞見 for Windows フリー版 ■できること ・音声の録音、再生 ・音声波形の編集 ・基本周波数計測(ピッチ抽出) ・音声パワー計測 ・フォルマント周波数計測 ・サウンドスペクトログラフ表示 ←これが重要(多分) ■小ネタ ・東京大学大学院医学系研究科 認知・言語医学講座で開発される ・MS-DOS時代から音声解析の定番 ・MS-DOS時代は専用の機材が別途必要だったが、Windowsではそれが不要に
ピッチとは 基本周波数(F0) 音声解析においては、声帯の振動数を指す。 ・基本周波数は性差、個人差によって変わる 基本周波数(英: Fundamental frequency)とは、信号を正弦波の合成(例えばフーリエ級数)で表したときの最も低い周波数成分の周波数を意味する。(by wikipedia) ・基本周波数は性差、個人差によって変わる ・基本周波数は声帯が長いほど低くなる ・声帯が振動するのは母音の発音時 ・平均的には 男性:125Hz 女性:200Hz 子供:300Hz
ピッチを抽出してみた あ か ピッチ
ピッチを抽出してみた2 ピッチ抽出の結果を以下のような形式でファイル出力できる。研究ではこのデータを利用していくのではないかと予想してみた。
今後の予定 ■来週 クラスタリング、圧縮の勉強を進める ■前期中 クラスタリング、圧縮は3人で手分け 木の勉強 コルモゴルフ記述量関係は先生の講義を聞きながら進める ■夏休みが終わるころ 基礎的な内容の習得を終わらせる ■卒業までに 単位をとる
そんな感じでがんばります END