音声合成
音声合成技術の用途 PHSや携帯電話での音声通信 電話応答サービスの音声 しゃべる玩具
音声合成の原理 音声合成の仕組みと人の発声の仕組み DudleyのVocoder(1931) 音源の生成 音声合成フィルタ
音声信号モデル スペクトル包絡 音声スペクトル パルス音源スペクトル 音声合成 フィルタ T ノイズ音源スペクトル 音源パラメータ
音声の基本パラメータ
音声合成デジタルフィルタ 線形予測係数 (スペクトルパラメータ) 音声信号 音源信号
音声合成の特徴 少ない数の音声パラメータから自然な音声を合成 音韻(声の音色)と韻律(声の高さ)を別の音声パ ラメータで制御できる 人間の音声生成過程に対応した合成 音声波形を再現するのではなく、音声スペクトルを 再現(人間の聴覚特性を利用)
原音声と合成音声の波形 音声波形 合成音声波形
音声分析合成法の利点と問題点 少ない情報量で音声を伝達できる 音声波形をそのまま送る(PCM方式)と毎秒64000ビット の情報量が必要になるのに対して、音声のパラメータだけ を送る音声合成法では毎秒2650ビットの情報量ですむ 同じ通信回線で20人が話すことができる 音声に特化しすぎている 声以外の音を伝えることができない、 周囲騒音があると音声の品質が劣化する 人によって音声の品質がばらつく 通信用途にはそのまま使えない
分析合成系と波形符号化 ISDN PHS 携帯電話
分析合成系と波形符号化 分析合成系 合成フィルタ PCM 4bit/sample 量子化 2bit/sample パルス・ノイズ音源信号 合成フィルタ 音声信号 PCM 音声信号 4bit/sample 音声信号 量子化 2bit/sample 16,12,8,6,4,2,1 bit/sample 1bit/sample 予測符号化(ADPCM) 合成フィルタ 音声信号 予測残差信号 量子化
携帯電話の音声通信方法 パルス、雑音音源の 代わりに、予測残差 信号を音源に用いる 音源信号生成 音声合成 フィルタ