文字から声をつくる仕組み.

Slides:



Advertisements
Similar presentations
伝統的な日本語研究と西欧言語学 音声・音韻研究は、西欧言語学に基盤を置いてい る。 一方、伝統的な日本語の研究は、江戸時代以前か ら五十音図に基づいて行われている。
Advertisements

情報科学部 ディジタルメディア学科 佐々木研究室 n02k1118 流石 寛子
日本人学習者による英語音声の 韻律に関する研究
卒研のようなもの 圧縮ちーむ 2008.4.22 鴫原、山本、齋藤.
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
連続音声の音響的性質.
英語音声学(8) 音変化.
日本語教育における 発音指導の到達目標を考える
音声の個人性 発声器官のサイズの違いによるもの 口の大きさと声帯の大きさ 発話の仕方の違いによりもの アクセント 口の動かし方
英語の母音の長さを測定する(2).
言語の統計 統計の対象量 単語 NグラムとKWIC HMMと形態素解析への応用.
日本語を考える Introduction to Japanese Linguistics
発声のしくみ -声道の共鳴と音源の生成-.
日本語統語論:構造構築と意味 No.1 統語論とは
テキストマイニング, データマイニングと 社会活動のトレース
第5回 日本語教育と音声研究会 談話と音声 ー音声教育との接点ー 早稲田大学 戸田貴子 2006年7月8日.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
Problem C: Princess' Japanese
文字の機能 1)文字:言語を記録する手段、言語。 文字は言語を記録する手段であって、言語そのものではない。
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
音声処理ソフトPraatの使い方.
TTS技術の概要 1. TTSとは 2. TTS技術の応用 3. TTSシステムの流れ 4. 基本概念 5. F0モデル 6. 韻律記号
Microsoft Office クイックガイド ~OneNote 2013~
1月19日 辞書 自然言語処理における辞書の役割 機械辞書設計の要点 辞書の種類と用途.
音韻論⑤ ----.
音韻論② pp
言語学 語のかたち① pp
自然言語処理及び実習 第11回 形態素解析.
音のすがた pp
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
英語の母音の継続時間を測る Nov. 4, 2016.
英語の母音の長さを測る(1).
雑音環境下における 非負値行列因子分解を用いた声質変換
追加参考文献 Nielsen, Kuniko, Y Continuous versus categorical aspects of Japanese consecutive devoicing. Journal of phonetics 52, Oberly, Stancy.
2章 暗号技術 FM15002 友池 絲子.
Basis vectors generation
複数対象への音声入力による行動指示 ~個別行動から共同行動への研究~
言語学 語のかたち② p.p
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
2. 音声とは 2.1 音声の科学 2.2 どうやって声を作るか ー調音音声学 2.3 声の正体とは ー音響音声学 2.4 どうやって声を聴き取るか ー聴覚音声学.
テキストマイニング, データマイニングと 社会活動のトレース
発話動作のしくみ.
音声情報とベイジアンネットを 用いた感性情報処理システム
音声合成.
歌姫調教のすべて 2009年03月14日 初音 玲.
VOCALOID 2 初音ミク 初音 玲.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
国際言語文化研究科日本言語文化専攻 第26回日本語教育学講座講演会
英語音声学(8) 音変化.
AdaBoostを用いた システムへの問い合わせと雑談の判別
ブースティングとキーワードフィルタリング によるシステム要求検出
VOCAL DYNAMICS CONTROLLER: 歌声のF0動特性をノート単位で編集し, 合成できるインタフェース
英語音声学(6) イントネーション.
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
母音が「あ」「い」「う」「え」「お」の5つ
Excel 2002,2003基本8 並び替え、フィルタ.
「Speaking教材」 ◆ 2001年前期 商学英語入門教材.
狭帯域包絡線間相関を用いた 話者識別における帯域と識別率の検討
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
ソースフィルタモデル.
(Articulatory Speech Synthesis)
歌姫調教のすべて 2009年03月14日 初音 玲.
VOCALOID 2 初音ミク 初音 玲.
英語音声学 前期・木1・CALL1 担当:福田 薫
Presentation transcript:

文字から声をつくる仕組み

音声のもつ情報 言語情報 個人性情報 感性情報 単位の数 大 ∞ 文 2千~1万 単語 101 27 音節 言語的に区別できる 音素 小   ∞ 2千~1万  101   27 言語的に区別できる 最小の音声の単位

日本語の音素 日本語の母音は5つ 日本語の子音は約22 [fu] [ u]

音素以外の音韻表記 長母音では、「e:ga」(映画)ように、母音の時間長が長くなる  促音/Q/(日本語表記で「行った」の「っ」)は、2音素の間に   無音区間が挿入される  撥音/N/(日本語表記の「ん」は、後続する音素によって   異なる音素として発音される    p,b,m の前では[m] kaNpai kampai   /N/ t,d,n の前では[n] kaNtai kantai     k,g,N の前では[N] kaNkaku kaNkaku

日本語の音節 日本語の音節は、CV(子音+  母音)からなる. 右表の下線付きを除いて  100音節ある.

音声合成技術 録音編集方式と規則合成方式 録音編集方式は、音声品質は高いが語彙が限定 規則合成方式は、任意語彙を対象とするが、音声  品質は劣る

録音編集方式と規則合成方式

規則音声合成

テキスト解析部

音韻、韻律生成部

文から文節への分解

規則音声合成

音韻変形規則 助詞 「は」 ⇒ wa 「へ」 ⇒ he 長母音化 長母音化   /o/に/u/が続くと/o:/になる  <例> 東京 toukyou ⇒ to:kyo: 氷  koori    ⇒ ko:ri 小売 kouri 公理 kouri ⇒ ko:ri /ei/が/e:/になる            映画 eiga ⇒ e:ga 無声子音にはさまれた/i/と/u/は無声化する <例> 少し sukoshi 鹿  shika 語尾の「です」「ます」の/u/は無声化する 語頭以外の/g/は鼻音化する.     <例> メガネ megane 芸術  geijyutsu 撥音/N/の発音は後続子音によって変化する <例> kaNpai ⇒ kampai kaNtai ⇒ kantai

音声単位 複合単位

VCV単位の音声パラメータ スペクトル パラメータ

規則音声合成

アクセントパタン

アクセント規則(1)

アクセント規則(2)

ピッチ周波数パタンの生成

規則合成方式

音声合成のパラメータ