広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用

Slides:



Advertisements
Similar presentations
音声イメージの 製品開発への応用 2000/11/8 オムロン ( 株 ) IT 研究所 大本浩司 日本心理学会第 64 回大会.
Advertisements

音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
黒岩・堀内 研究室 音と画像(視聴覚)によるコミュニケーション ・ AI (Artificial Intelligence) ・ HCI (Human Computer Interaction) 黒岩 眞吾 ・話者認識・音声認識・音信号処理 ・会話ロボット(失語症者支援) ・機械学習・多メディア情報検索.
システム開発におけるユーザ要求の 明示的表現に関する一検討
日本人学習者による英語音声の 韻律に関する研究
日本の高校における英語の授業は 英語で行うのがベストか? 日本語の介在の意義
連続音声の音響的性質.
OJT研修 「テスト実施、テスト設計の技術習得」 日時: 8月22日(月)  場所: 本社5階.
日本語教育における 発音指導の到達目標を考える
      特別支援学校 高等部学習指導要領 聴覚障害教育について.
音声からの心的状態の推定における 生理心理学的アプローチの導入
明示的知識とコミュニケーション能力: 文法指導の意義と位置づけに関する提案
3-Q-28 話者交替を考慮したシステムへの問い合わせと雑談の判別
クロストーク成分の相互相関に 着目した音場再生システム
雑音重み推定と音声 GMMを用いた雑音除去
通訳の原理 理解→転換→表出のプロセスについて.
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
PSOLA法を用いた極低ビットレート音声符号化に関する検討
文字から声をつくる仕組み.
形態素解析および係り受け解析・主語を判別
聴き比べに特化した 音楽の鑑賞と知識学習のための Webアプリケーション
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
TTS技術の概要 1. TTSとは 2. TTS技術の応用 3. TTSシステムの流れ 4. 基本概念 5. F0モデル 6. 韻律記号
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
Buried Markov Modelを用いた 構音障害者の音声認識の検討
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
ソフトウェア情報学総論 基盤ソフトウェア学講座
創成シミュレーション工学専攻 計算システム工学分野 徳田・李研究室 橋本 佳
高校における英語の授業は英語でがベストか
音高による音色変化に着目した音源同定に関する研究
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
1-R-19 発話に不自由のある聴覚障害者の発話音声認識の検討
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
音声認識・翻訳 Android アプリケーション制作
千葉大学とJSPS北京研究連絡センターとの共同シンポジウム
発話動作のしくみ.
日本の高校における英語の授業は 英語がベストか?
ニューロマーケティング H 経営学科3年 李 ミヌ.
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
音声情報とベイジアンネットを 用いた感性情報処理システム
Number of random matrices
NetMeeting ~ドイツ語授業形態としての提案
音声合成.
各会話シーン毎に、発話(音源)方向を推定
理論研究:言語文化研究 担当:細川英雄.
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
ブースティングとキーワードフィルタリング によるシステム要求検出
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
峯松信明研究室 (1/4) 四つの柱 〜基礎理論から応用システムまで〜 1. 基礎理論の構築,2. 要素技術の構築,3. 応用システムの構築
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
自然言語処理2015 Natural Language Processing 2015
音響伝達特性モデルを用いた シングルチャネル音源位置推定の検討 2-P-34 高島遼一,住田雄司,滝口哲也,有木康雄 (神戸大) 研究の背景
音響特徴量を用いた自閉症児と定型発達児の識別
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
ソースフィルタモデル.
CSP係数の識別に基づく話者の 頭部方向の推定
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
1.2 言語処理の諸観点 (1)言語処理の利用分野
Chapter 5-2 ステートチャート図 FM12011 バユウユウ 山内研
Presentation transcript:

広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用 工学部2号館10階 hirose@gavo.t.u-tokyo.ac.jp http://www.gavo.t.u-tokyo.ac.jp/ 広瀬啓吉 研究室  広瀬研究室では、音声による機械と人間の対話に焦点を当てて、音声情報処理に関する研究を峯松研究室と共同で進めています。特に、音声言語の顕著な特徴である韻律に着目した研究を数多く行なっています。 4.音声認識における適応手法の開発  音声認識は統計的な音響モデルと言語モデルを用いることによって飛躍的な進歩を遂げ、研究室内などの整った条件下では高い認識率が達成されています。しかしながら、これを実際に利用しようとすると、周囲雑音、発生条件の違い、未知語彙などによって認識率の大きな低下が問題となります。ここでは、このような問題に対処する適応手法を、音響モデル、言語モデルの双方について開発しています。 1.劣条件下での複数音源分離  複数音源を、音源数に満たないマイクロフォンで受け、それを分離する技術は、音声認識をはじめ、音楽情景分析など種々の分野で重要となっています。事前に音源の特徴が分からない場合は、特に困難な課題となっていますが、その有用性は大きいものがあります。ここでは、研究室で開発している周波数と時間軸での連続性に着目した手法を発展させています。音声認識への利用も視野に入れて研究を進めています。 5.音声認識のための韻律的特徴の利用  音声認識の問題点として、音声の韻律が充分に利用されていないことが挙げられます。音声言語という観点から、発話の構造を表現する韻律の利用について考察しています。具体的には、文節やアクセント句の境界を考慮した新しいモデル化を行ない、音声認識に適用します。この他、韻律を音声認識に利用する方策を研究しています。例えば、自発発話におけるフィラーや言い直しの検出、等が考えられます。なお、興味があれば、中国語声調の認識の研究も可能です。 えーと、 あのー 考え中なんだな この人・・・ 2.高品質音声の合成  表層文章から高品質音声を合成する手法を開発しています。音声の特徴は、個々の音の特徴と全体の抑揚とに大別されますが、個々の音が聞きやすく、自然な韻律を有する高品質音声を合成するためには、両者の品質向上が必要です。前者については、HMM合成方式等を中心に研究を行ない、後者については、構文や焦点との関係に着目した研究を行なっています。朗読調のみならず対話調など種々の音声の合成についても研究しています。なお、興味があれば、中国語音声合成についての研究も可能です。 6.音声対話システムの高度化  ユーザにとって聞きやすく理解しやすい応答音声を生成することの可能な音声対話システムを開発しています。このために、言いたい内容を文書化して音声化するいわゆる概念音声合成を実現しています。すでに、道案内システムをはじめ幾つかのシステムを開発していて、それを参考に研究を進めています。また、ユーザの状況・状態を音声から自動的に検出する技術の開発を進めています。この成果をもとに、ユーザに対応した対話システムの構築を検討します。 Speech Output Language Processing 音声認識 Speech Synthesizer TEXT Prosody Prediction 音声合成 Speech Library Lexicon/Rule Text Analysis Speech Synthesis 7.音声分析・認識を利用した外国語習得 システム 3.音声における意図・感情の合成・認識  現在の外国語の習得は、教師の発生をまねることによって行なうことが一般的であり、自分の会話能力がどの程度であり、発音等をどのように矯正すればよいかを、特に独力で知ることは困難でした。そこで、音声分析・認識により学習者の発音が教師のそれとどのように異なるかを検出して矯正の必要性を判定し、適切な矯正指針を与えることを自動的に行なう技術を開発しています。特に、アクセント、イントネーションの発音教育について研究を進めています。認識・合成とも関係してきます。  話者の意図・感情は音声の主として韻律的特長に表れます。意図・感情の伝達は将来のインタフェースシステムで重要な課題となってきます。ここでは、意図・感情をつけて発声した音声の分析からその特徴を定量的に捉え、音声合成、音声認識に組み入れる方策を検討しています。 “平静” “怒り” “喜び” 感情音声の分析・合成 “悲しみ”