統語構造に基づく入力文分割と そのハイブリッド音声翻訳への応用

Slides:



Advertisements
Similar presentations
人間とコンピュータ インターネット検索 11 月 10 日, 11 月 17 日, 11 月 24 日.
Advertisements

音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
情報科学部 ディジタルメディア学科 佐々木研究室 n02k1118 流石 寛子
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
「わかりやすいパターン認識」 第1章:パターン認識とは
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
東京工科大学 コンピュータサイエンス 亀田弘之
PROVERB ことわざ.
Java I 第2回 (4/18)
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
All Rights Reserved, Copyright (C) Donovan School of English
高速基礎マスター英語 「導入」「トレーニング」 活用マニュアル VOL.1
演習3 最終発表 情報科学科4年 山崎孝裕.
情報とコンピュータ 静岡大学工学部 安藤和敏
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
時空間データからのオブジェクトベース知識発見
Word2007でWeb作成方法紹介ページ ~Word初心者でもわかりやすく~
PSOLA法を用いた極低ビットレート音声符号化に関する検討
関係代名詞の導入 Program 7-2~8-1.
形態素解析および係り受け解析・主語を判別
言語処理系(8) 金子敬一.
セマンティクスを利用した 図書検索システム
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
メソッド名とその周辺の識別子の 相関ルールに基づくメソッド名変更支援手法
整合性尺度を用いた 構造的対訳文アラインメント
大気レーダーのアダプティブクラッタ 抑圧法の開発
チューリング機械 状態の有限集合 ヘッドの方向を表す。 L:1コマ左へ R:1コマ右へ テープ記号の有限集合 入力記号の有限集合 動作関数
非負値行列因子分解による 構音障害者の声質変換
共通言語アイコンを用いたネットワーク コミュニケーション
IIR輪講復習 #1 Boolean retrieval
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
インターネットと遠隔講義/講座 大阪市立大学 学術情報総合センター 中野秀男
画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1
大岩 元 慶応大学環境情報学部 数式の表現と日本語 大岩 元 慶応大学環境情報学部
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
構文解析を用いた文分類の手法 ー自動二輪に関する評価表現についてー
コンピュータの基本構成について 1E16M001-1 秋田梨紗 1E16M010-2 梅山桃香 1E16M013-3 大津智紗子
岩村雅一 知能情報工学演習I 第13回(後半第7回) 岩村雅一
複数対象への音声入力による行動指示 ~個別行動から共同行動への研究~
ておく.
MEMSセンサを用いたINS/GPS複合航法システム
ルーブリック・チャート(評価) の活用と課題
音声認識・翻訳 Android アプリケーション制作
シナリオのアニメーション表示による 妥当性確認支援
不確実データベースからの 負の相関ルールの抽出
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
第5章 計算とプログラム 本章で説明すること ・計算の概観と記述法 ・代表的な計算モデル ・プログラムとプログラム言語.
ユーザーコードに記述する事項の概要 2009年7月30日 KEK 波戸芳仁.
Number of random matrices
『組織の限界』 第1章 個人的合理性と社会的合理性 前半
チューリングマシン 0n1nを受理するチューリングマシン 入力テープ b b b b 状態遷移機械.
ブースティングとキーワードフィルタリング によるシステム要求検出
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
HMM音声合成における 変分ベイズ法に基づく線形回帰
自然言語処理2015 Natural Language Processing 2015
あいさつ.
ビデオデータベースを用いた 流体画像に基づくアニメーション生成
ICML読む会資料 (鹿島担当) 教師ナシ の 構造→構造 マッピング 読んだ論文: Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015.
情報とコンピュータ 静岡大学工学部 安藤和敏
英語4技能指導のための 帯活動素材・2 図形再現アクティビティ.
自然言語処理2016 Natural Language Processing 2016
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
雑音環境下における Sparse Coding声質変換 3-P-49d
1.2 言語処理の諸観点 (1)言語処理の利用分野
オブジェクト指向言語論 第六回 知能情報学部 新田直也.
Presentation transcript:

統語構造に基づく入力文分割と そのハイブリッド音声翻訳への応用 (株)東芝 研究開発センター 釜谷聡史

背景 実用的な音声翻訳への要求 既存の翻訳手法 (1)と(2)とを融合して、両者の長所を引き出す (a) 任意の表現を、正しく翻訳 (b) 正確で自然な表現で、翻訳 既存の翻訳手法 (1) 抽象化された規則に基づく手法      (e.g. RBMT) 長所:広カバレージ、短所:機械的な訳文  →(a)の解決に有利 (2) 具体的な用例に基づく手法  (e.g. TM,EBMT) 長所:自然な訳文、短所:狭カバレージ  →(b)の解決に有利 (1)と(2)とを融合して、両者の長所を引き出す RBMTとEBMTとのハイブリッド翻訳→(a),(b)を同時に実現

文分割に基づくハイブリッド翻訳方式 入力文: 最適セグメント割当: ハイブリッド翻訳結果: [ 私はサイズが大きいのが気に入ったけどやめます] 最適セグメント割当: [ サイズ/が/大きい/のが ] + [ 気に入っ/た/けど ] + [ 私/は/やめ/ます ] ハイブリッド翻訳結果: [ It's so big ]EBMT + [ I like it but ]RBMT + [ I just can't buy it. ]EBMT

評価 Hybrid 方式での性能改善を確認 翻訳方向 = 日本語→英語 旅行ドメイン 用例翻訳 = 用例数:123,819対 旅行ドメイン 翻訳方向 = 日本語→英語  旅行ドメイン 用例翻訳 = 用例数:123,819対 旅行ドメイン 評価指標 = NIST/BLEU 正解訳=各1文 ○評価セットA (open)   1000文、平均13.4文字/文 ○評価セットB (open)   200文、平均20.5文字/文 Hybrid 方式での性能改善を確認