文字から声をつくる仕組み
音声のもつ情報 言語情報 個人性情報 感性情報 単位の数 大 ∞ 文 2千~1万 単語 101 27 音節 言語的に区別できる 音素 小 ∞ 2千~1万 101 27 言語的に区別できる 最小の音声の単位
日本語の音素 日本語の母音は5つ 日本語の子音は約22 [fu] [ u]
音素以外の音韻表記 長母音では、「e:ga」(映画)ように、母音の時間長が長くなる 促音/Q/(日本語表記で「行った」の「っ」)は、2音素の間に 無音区間が挿入される 撥音/N/(日本語表記の「ん」は、後続する音素によって 異なる音素として発音される p,b,m の前では[m] kaNpai kampai /N/ t,d,n の前では[n] kaNtai kantai k,g,N の前では[N] kaNkaku kaNkaku
日本語の音節 日本語の音節は、CV(子音+ 母音)からなる. 右表の下線付きを除いて 100音節ある.
音声合成技術 録音編集方式と規則合成方式 録音編集方式は、音声品質は高いが語彙が限定 規則合成方式は、任意語彙を対象とするが、音声 品質は劣る
録音編集方式と規則合成方式
規則音声合成
テキスト解析部
音韻、韻律生成部
文から文節への分解
規則音声合成
音韻変形規則 助詞 「は」 ⇒ wa 「へ」 ⇒ he 長母音化 長母音化 /o/に/u/が続くと/o:/になる <例> 東京 toukyou ⇒ to:kyo: 氷 koori ⇒ ko:ri 小売 kouri 公理 kouri ⇒ ko:ri /ei/が/e:/になる 映画 eiga ⇒ e:ga 無声子音にはさまれた/i/と/u/は無声化する <例> 少し sukoshi 鹿 shika 語尾の「です」「ます」の/u/は無声化する 語頭以外の/g/は鼻音化する. <例> メガネ megane 芸術 geijyutsu 撥音/N/の発音は後続子音によって変化する <例> kaNpai ⇒ kampai kaNtai ⇒ kantai
音声単位 複合単位
VCV単位の音声パラメータ スペクトル パラメータ
規則音声合成
アクセントパタン
アクセント規則(1)
アクセント規則(2)
ピッチ周波数パタンの生成
規則合成方式
音声合成のパラメータ