音声イメージの 製品開発への応用 2000/11/8 オムロン ( 株 ) IT 研究所 大本浩司 日本心理学会第 64 回大会.

Slides:



Advertisements
Similar presentations
TCP/IP によるチャットプログラ ム 薄井 秀晃. 基礎知識編 TCP/IP とは? IP とは・・・ Internet Protocol の略称であり通信方法の技術的なルールで あり、実際にデータを送受信する前にデータを小さなデータ に分割し、それに発信元と受信先の IP アドレスを付加させて.
Advertisements

静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
身の回りの IT 情報科教育法 後期 10 回 2004/12/18 太田 剛. 目次 1. 最終提出の確認 2. ルータの説明 ( 先週の続き ) 3. 身の回りの IT 1/8 の授業は情報科教員の試験対策です。
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
ユーザーイメージ収集 インターフェイスの開発
日本人学習者による英語音声の 韻律に関する研究
心理的ストレスに対する心臓血管反応 ー認知的評価の導入ー 社会精神生理学への招待 日本大学大学院理工学研究科 山田クリス孝介
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
アドホックCUG I-3. ユビキタスネットワーク制御・管理技術 (Ubilaプロジェクト) ウ.ネットワークサービス制御技術
人間中心設計の 開発プロセスにおける ユーザビリティ評価の実践とその課題
「お客様の応対」をスムーズにし、「お客様の声」を活かす!
「お客様の応対」をスムーズにし、「お客様の声」を活かす!
PacSec Nov 6, ISMSおよびその重要性 Richard Keirstead CISSP, BS7799 主任監査員
『どこでも運用システム』の開発状況 (第二報) iPad版衛星状態監視システム (プロトタイプ) どこでも運用システムと他システムとの接続
「絵葉書を通じてのハルビンの 街の印象調査」システムUIの iPadアプリ化 谷研究室  飯 祐貴.
音声からの心的状態の推定における 生理心理学的アプローチの導入
米山研究室紹介 -システム制御工学研究室-
ビジネスパターンに基づく クラウドシステムのサービスレベル設計
研修1 組織の規範について 東京コンサル株式会社 担当:事変.
車内状況アウェアネスのための 感情音データベースの設計と評価
PSOLA法を用いた極低ビットレート音声符号化に関する検討
論文名 海外で活動する日本人日本語教師に望まれる資質 -グラウンデッド・セォリーによる分析から- 著者 平畑 奈美 書誌情報
情報へのアクセシビリティを 向上させるためのデザインと評価 日本電気㈱ 北風 晴司 日本ファジィ学会 第17回評価問題研究会
要員管理 要員の質、量、配置、作業状況を管理する 一般的な注意点を下記に示す (1)組織 ・組織構成を明快にする -指示命令系統
アンビエント情報社会基盤創成拠点 -アンビエントインタフェース領域-
生産本部 生産革新部 改善テーマ活動計画書 須藤 正美 X-Session2次問い合わせ対応率向上 活動ステップ
ヒューマンインタフェース 電子機械工学専攻 第2学年 後期 開講
「コスト削減」「CS向上」「他部門貢献」を支援
2010年度春季 成果発表 2010年5月7日 大阪開発センター 技術3部 中村 光秀 年度春季成果発表会.
クラウド対応 生産管理システム 【第1回】2013年5月28日(火) 14:00 ~ 16:00 【第2回】2013年6月5日(水)
ラズパイ・オーディオの製作 中間報告1 14EC004 飯田 頌平.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Chat Botを活用した ヘルプデスク業務の作業効率化
米山研究室紹介 -システム制御工学研究室-
APC RS シリーズ / APC ES シリーズ 新旧モデル比較
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
Authoring Environment for Story-based Digital Educational Games
付属書Ⅰ.5 ハザード分析と 重要管理点 (HACCP).
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
SOA基盤製品 「見る、聞く、体験する SOAノウハウツアー」
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
ソフトウェア設計検証 研究室の紹介 知能情報学部 准教授 新田直也.
高汐 一紀 慶應義塾大学 新しい空間の創出:uPlatea 新しい道具の創出: u-Photo 思考する家具・部材: u-Texture
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
~ 情シスが仕掛ける業務改革:BPMの手順とポイント~
東京工業大学 情報理工学研究科 数理・計算科学専攻 千葉研究室 栗田 亮
5母音の認識率(wの本数5) フレーム幅5、シフト幅2 全音素の認識率(wの本数5) フレーム幅5、シフト幅3
本フォーマットに従い、提案する研究開発の説明資料を作成してください。
A03 音声インターフェイスによる インスタントメッセージング エージェントの開発
デザインの認知科学 片桐恭弘 ATRメディア情報科学研究所 日本認知科学会第22回大会ワークショップ 認知工学:設計のための認知科学
音声情報とベイジアンネットを 用いた感性情報処理システム
Number of random matrices
電話ロボット SUPER ■ 機能紹介 Auto Call システム 不在のときは一巡後、指定回数まで再コールします
音声合成.
UMLの概要とオブジェクト指向の基本概念
見積もり業務を迅速化する Massive Quotation
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
All Rights Reserved, Copyright © 2004, Kobayashi
社会理論と調査法 自分のなぞ? 「どんななぞ」に対して、 「どのような実験・調査」をして 「どのような分析」をすればいいのか?
峯松信明研究室 (1/4) 四つの柱 〜基礎理論から応用システムまで〜 1. 基礎理論の構築,2. 要素技術の構築,3. 応用システムの構築
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ベイズ音声合成における 事前分布とモデル構造の話者間共有
経営情報システム工学専攻1年 相模 英太郎 佐藤 茂
一問一答式クイズAQuAsにおける学習支援の方法
1-P-2 フィッシャー重みマップに基づく不特定話者音素認識の検討
【添付資料】 サイバーコンタクトセンター機能図
Presentation transcript:

音声イメージの 製品開発への応用 2000/11/8 オムロン ( 株 ) IT 研究所 大本浩司 日本心理学会第 64 回大会

発表内容 1) オムロンにおける音声関連事業 2) 心理学的知見の応用 3) Media Equation 4) Voice User Interface 5) 音声対話システムの開発プロセス 6) 音声対話システムにおけるユーザ評 価 7) オムロンの音声合成技術 8) まとめ

オムロンにおける音声関連事業 電話音声自動応答装置 ( 1)チケット予約 2)資料請求受付 3)株価照会(野村證券さま) 4)電話の自動振り分け( SONY さ ま) 5)生産状況と納期の回答( DELL さ ま)

オムロンの音声関連事業と技術開発 音声対話研究室 ・ Voice User Interface の設計 / 評価技術 ・音声合成技術 ・対話制御技術 ・音声認識技術 【事業】 オムロン株式会社 事業開発本部 CMA プロジェクト 【技術】 オムロン株式会社 技術本部 IT 研究所

心理学的知見の応用 1.デザイン指針(心理学的理論) 設計者は、どのように音声対話システ ムをデザインすればよいのか 2.印象評価(心理学的実験手法) ユーザは、音声対話システムを使った 時、どのような印象を受けているのか

Media Equation 「人間とテクノロジー(メディア)のインタラクション は、人間同士のインタラクションと基本的に同じ である」 Stanford Univ. Byron Reeves & Clifford Nass メディアの設計に社会的ルール (パーソナリティ、礼儀、お世辞など) を適用することが重要であると主張

Voice User Interface (VUI) ・ Voice User Interface は、 Graphical User Interface と同様に重要である 音声認識 対話制御 音声合成 VUI Main Speech TechnologyUser

スクリプト ボイス 対話フロー Voice User Interface 対話の進め方 文言、言い回し 声質、イントネーション、話速など Voice User Interface の構成要素

Voice User Interface の設計手法 パーソナリティデザイン ボイス (録音音声・合成音声) スクリプト 対話フロー ・ブランドイメージ ・ターゲットユーザ ・アプリケーション

音声対話システムの開発プロセス

パーソナリティマップ

パーソナリティシナリオの例 [ 設定されたパーソナリティの背景情報 ] ・彼女の名前は中谷よしこ、勤めて1年目のオペレータで、21歳である。 [ システムの目標 ] ・彼女の業務は、電話応対であり、資料の発送を行うことである。 [ システムの振る舞い方 ] ・応対は、丁寧で印象が良く、いい加減な対応はしない。 ・自分の仕事には責任を持ち、他人に頼ることは少なく、自分で最後までやり終える。 ・電話はよくかかってくるので、できるだけ短時間で応対しようと努力している。 ・お客様の要求が理解できない場合は、よりスキルのある人に応対を任せる。 [ 対象ユーザ ] ・お客様の年齢層は広く、はじめて電話する人が多い。 [ 具体的なユーザとシステムのインタラクション ] システム:お電話ありがとうございます。資料発送です。資料番号をおっしゃって下さい。 ユーザ: システム:お名前をお願いします。 ユーザ:山田たろう システム:次に、住所をお願いします。 ユーザ:京都府長岡京市伊賀寺...

ボイスサンプル ナレーション調の録音音声 パーソナリティデザインを行った録音 音声

音声イメージのデザインへの効用 設計者に インタフェース設計の判断基準 音声対話システムに 一貫性と良い印象

音声対話システムにおけるユーザ評価 ボイス (録音音声・合成音声) スクリプト 対話フロー ユーザの視点からの評価技法 1) 主観評価 2) パフォーマンス評価 3) インタラクション評価

オムロンの音声合成技術 1)録音音声の話者らしい個性的な音声を再 現 できる 2)パーソナリティデザインに合った特定の 音声 を設定できる(規則合成方式では困難) ・波形接続型音声合成 [ 特徴 ]

・住所認識の自動応答対話 システム:「お客様のご住所をお願いしま す。」 ユーザ :「東京都練馬区中村1-2-3。」 システム:「ご住所は『東京都練馬区 中村 1 -2-3』 でよろしいですか? ユーザ :「はい。」 合成音声の利用例 合成音声

オムロンにおける合成音声の評価 目的: 1) 現状の技術レベルを把握 2) 不具合個所の特定 3) 改善効果の検証 4) 改善方法の明確化 5) パーソナリティデザインとの適合 性

合成音声 録音 ラベリング 音声 DB バランス文音声 音素 選択 音素 選択 韻律 予測 韻律 予測 目標値韻律モデル 各音素の 特徴量学習 各音素の 特徴量学習 波形接続型音声合成の方法 =チューニングポイント

各刺激音声における「親しみやすさ」の 程度 ・ C01( 基準合成音声 ) は、① C02( 録音音声 ) 、 ② C04( 音素接合無視 ) 、 ③ C08( 音声 DB1/5) 、④ C09( 音声 DB1/10) との間に有意差が認めれた。

まとめ 1)心理学的知見は、音声対話システムの開 発において、設計指針および評価で役立っ ている 2)音声から伝わるパーソナリティの印象を 考慮して設計すれば、より印象の良い音声 対話システムが実現できる 3)評価に実験心理学的な手法を適用するこ とで、音声合成のチューニングパラメータ が「親しみやすさ」に与える影響を明確に できる

今後の音声研究の応用展開 心理学的な実験研究により、「音声から伝わる パーソナリティの印象」と「物理的な音響的な特 徴」の関係を明確にすれば、下記のようなところ で音声対話システムの開発に役立てられる a) ボイスタレントの選定 b) 音声録音時のディレクション c) 音声合成の「間」、「高さ」、「話速」等の 制御方法