機械翻訳勉強会　論文紹介 mamoru-k 小町守 2018/11/9.

Slides:

Advertisements

Similar presentations

の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。（測定回数 n が増せばこの可能性は増す。）平均値偶然誤差によるばらつき v i は測定値と平均値の差で残差、また、 σ は、標準誤差（ Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.

Advertisements

音声翻訳における機械翻訳・音声合成の性能評価および分析 ☆橋本佳，山岸順一， William Byrne ， Simon King ，徳田恵一名工大 University of Edinburgh Cambridge University

大規模コーパスから獲得した名詞の出現パターンを用いた事態名詞の項構造解析

区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム

寺尾敦青山学院大学社会情報学部 Fisher の直接確率法寺尾　敦青山学院大学社会情報学部

Building text features for object image classification

最大エントロピーモデルに基づく形態素解析と辞書による影響

整数計画法を用いたフレーズ対応最適化による翻訳システムの改良

ラベル付き区間グラフを列挙するBDDとその応用

コンパイラ 2011年10月17日

国内線で新千歳空港を利用している航空会社はどこですか？

知識情報演習Ⅲ（後半第1回）辻慶太（水）

実証分析の手順経済データ解析　2011年度.

Pattern Recognition and Machine Learning 1.5 決定理論

On the Enumeration of Colored Trees

アルゴリズムイントロダクション第５章( ) 確率論的解析

分子生物情報学動的計画法に基づく配列比較法 (ペアワイズアライメント法)

実験関数・記号付き文型パターンを用いた機械翻訳の試作と評価石上真理子水田理夫徳久雅人村上仁一池原悟（鳥取大） ◎評価方法１

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

述語項構造に基づいた統計翻訳における語句の並べ替え

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

統計学第３回　10/11 担当：鈴木智也.

CV輪講姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡

コンパイラ 2012年10月15日

最短路問題のための LMS(Levelwise Mesh Sparsification)

Semi-Supervised QA with Generative Domain-Adaptive Nets

動詞の共起パターンを用いた動作性名詞の述語項構造解析

IPｖ６アドレスによる RFIDシステム利用方式

スペクトル・時系列データの前処理方法～平滑化 (スムージング) と微分～

Phrase-base Statistical Machine Translation

大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

決定木とランダムフォレスト和田　俊和.

定兼邦彦今井浩東京大学理学系研究科情報科学専攻

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

人工知能特論９．パーセプトロン北陸先端科学技術大学院大学　鶴岡慶雅.

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

P3-12 教師が真の教師のまわりをまわる場合のオンライン学習三好誠司(P)（神戸高専）岡田真人（東大，理研，さきがけ）

卒論の書き方：参考文献について 2017年9月27日小尻智子.

第14章　モデルの結合修士２年山川佳洋.

雑音環境下における非負値行列因子分解を用いた声質変換

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

深層学習を用いた音声認識システム工学部　電気電子工学科　白井研究室 T213069　林健吉.

2018/9/10 ACL読み会名古屋大学大学院　M２佐藤・松崎研土居裕典.

分子生物情報学(2) 配列のマルチプルアライメント法

変換されても変換されない頑固ベクトルどうしたら頑固になれるか頑固なベクトルは何に使える？

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

バイトコードを単位とするJavaスライスシステムの試作

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

論文紹介: “Joint Embedding of Words and Labels for Text Classification”

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

第3章　線形回帰モデル修士1年山田　孝太郎.

Data Clustering: A Review

第16章　動的計画法アルゴリズムイントロダクション.

プログラミング入門電卓を作ろう・パートI!!.

人工知能特論II　第8回二宮　崇.

ベイズ音声合成における事前分布とモデル構造の話者間共有

ポッツスピン型隠れ変数による画像領域分割

メソッドの同時更新履歴を用いたクラスの機能別分類法

パターン認識特論 ADA Boosting.

４．プッシュダウンオートマトンと文脈自由文法の等価性

パターン認識特論 ADA Boosting.

バイオインフォマティクスII 遺伝子発現データの AdaBoostによる判別

エイリアス関係を考慮した Javaプログラム用静的スライシングツール

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

機械翻訳勉強会　論文紹介 mamoru-k 小町守 2018/11/9

今日読む論文 Statistical Phrase-Based Translation Philipp Koehn, Franz Josef Och, Daniel March HLT-NAACL(2003) 2018/11/9

この論文に書いてあること句ベースのモデルが単語ベースのモデルより性能がよいという実験結果ヒューリスティックな句翻訳と句翻訳にかける語彙の重みで性能が上がる統語的な関係しか見ない句だけを使うとむしろ性能が下がる? 2018/11/9

イントロダクション句翻訳を使うことで統計翻訳の質は向上してきた(1999-2002) 句翻訳対を抽出するためいちばんいい方法はなにか? この論文では句翻訳の表を作る評価フレームワークを提案 2018/11/9

高い性能を得るためには比較的単純な方法で十分単語のアライメントからヒューリスティックに獲得した句翻訳表を使うツールも資源も研究者はフリーで入手可能統語的情報を使っても性能はよくならない 3単語までの小さな句を使うだけで高い精度を得るには十分単語のアライメントからヒューリスティックに獲得した句翻訳表を使うヒューリスティックは言語対・訓練コーパスによって異なる 2018/11/9

評価フレームワークまず句抽出方法の比較のために評価フレームワークを作成句翻訳モデルと、どんな句翻訳表でも使えるデコーダの提案 2018/11/9

句翻訳モデル雑音チャネルモデルデコードの際には文　は I 個の句　に分割される 2018/11/9

英語 e の最適出力トライグラム長い出力ほどよい 2018/11/9

句ベース翻訳モデル英語の句が外国語に訳される確率分布 distortion の確率分布(どれくらい翻訳された句が離れているか) Ai: i番目の英語の句に訳された外国語の句の位置 Bi-1: I-1 番目の英語の句に訳された外国語の句の位置 2018/11/9

デコーダビームサーチアルゴリズム(Jelinek [1998]) 英語の文は部分的翻訳(仮説)の形で左から右に生成される 2018/11/9

デコードのアルゴリズム空仮説から始める以下の手順で既存の仮説から新しい仮説を作る未翻訳の外国語単語列に対し、英語の句による翻訳が可能であればそれを選択英語の句はそれまでの翻訳につけ足す翻訳した外国語を翻訳済みとマークし、仮説の確率コストを更新未翻訳の単語がない最終仮説で一番コストが低いものが探索の出力 2018/11/9

仮説生成の問題点仮説はスタックに積まれるので、スタックの大きさは入力の文の長さに指数関数的に増大それまでの発生コストとそれからの予測コストで弱仮説の枝刈りをする発生コストは n-best 予測コストは句翻訳コストだけ考慮 2018/11/9

句翻訳コストの計算文内で句翻訳可能なところ(翻訳選択肢と呼ぶ)では、予測コストは句翻訳確率と言語モデルの確率をかけたもの翻訳選択肢のコストが分かれば連接する外国語の句翻訳予測コストは事前に計算可能 2018/11/9

弱仮説の枝刈り distortion コストは無視句翻訳コストは動的計画法により計算長さ n の入力文だと n(n+1)/2 個の連接する2単語があるので、それらについて事前に計算して表に入れておく翻訳の際には未翻訳の単語のコスト見積もりは表を見るだけでよい 2018/11/9

ビームサーチの計算量ビームの大きさは定数翻訳選択肢の数は入力文の長さに比例ビームサーチの時間計算量は入力文の長さの二乗に比例ビームの大きさに比例 2018/11/9

句翻訳の学習方法単語単位でアライメントのついたコーパスから学習(Och et al. [1999]) 構文解析結果のアノテーションがついた単語アライメントつきコーパスから学習(Yamada and Knight [2001], Imamura [2002]) パラレルコーパスから直接句レベルのアライメントを学習(Marcu and Wond [2002]) 2018/11/9

単語のアライメントから学習 Giza++ ツールキット(Och and Ney [2000]) を使う単語アライメントと矛盾しないアライメントのついた句の対を集める句翻訳確率分布は以下で計算: 2018/11/9

統語的句の学習 (発想)単語アライメントと矛盾しない句全部取ってきたら、“house the” のような変な句まで取ってくるのでは? 統語的句だけしか取らなければそういう変な句は除くことができるのではないか 2018/11/9

統語的句の集め方統語的句 = 構文解析木のひとつのサブツリーに入る単語列(Imamura [2002]) 前節と同じく単語アライメントつきパラレルコーパスを使用いずれのコーパスもその言語の構文解析器で解析し、単語アライメントのある句の対に関して解析木のサブツリーに入っているかどうかチェック 2018/11/9

位置iの句が位置jの句に訳される同時分布句アライメントによる学習翻訳元の言語と翻訳対象言語の文をパラレルコーパスから同時に生成する句ベースの同時確率モデルを EM により学習句レベルの対応を学習(Marcu and Wong [2002]) 句e’と句f’が翻訳関係にある確率分布位置iの句が位置jの句に訳される同時分布 2018/11/9

実験 Europal コーパス英語とドイツ語で実験 BLEU スコアで評価フリーで使えるヨーロッパ議会の議事録(1996-2001) 長さ5-15の1,755文をテストに確保英語とドイツ語で実験 BLEU スコアで評価 2018/11/9

3手法の比較図1参照単語アライメントに矛盾しない句を全部学習するモデルがいちばん高性能統語的句しか使わないモデルはむしろ性能が悪いどのシステムもデータが増えれば性能は上がる 2018/11/9

統語的句の重みづけ統語的に正しい句は信頼度が高い翻訳句対ではないか? 統語的句に重みをつけて性能がよくなるかどうか実験→よくならないいい性能を得るためには文の断片からも学習する必要ドイツ語の “es gibt” と英語の “there is” 英語の “with regard to” と “note that” 2018/11/9

最大句長図2参照 3単語までの句しか取らないでもいちばんよい性能になる増やしても性能があまり上がらないか、もしくは悪くなることすらある 2単語の句だけだと明らかに悪い 2018/11/9

語彙重みづけ句翻訳対の質をたしかめるにはお互いに訳せるかどうか試すのも一つの手 2018/11/9

語彙重みづけの計算式英語の句が外国語の句にアライメントaで対応するときの重み英語と外国語でアライメントがついたもののうち、英語の句の単語数アライメントaで対応する英語と外国語の単語の相対頻度の和 2018/11/9

語彙重みづけした翻訳モデル語彙重みづけの強さ 2.1節(p.3)の翻訳モデル参照語彙重みづけ 2018/11/9

句抽出とアライメント Giza++ では英語1単語を外国語1単語にアラインすることができない→ヒューリスティックに解決パラレルコーパスを双方向にアライメント両方のアライメントの共通部分は高精度両方のアライメントの和集合は高再現率この両者の間のどこか適当なところに落ち着きたい 2018/11/9

句抽出のヒューリスティックアライメントの共通部分から始める 2つのアライメントのうちの和集合にあるもののみ新たに加えるアライメントがなかった語を加えるような点しか加えない詳しくは [Och et al. 1999] 2018/11/9

ヒューリスティックの結果図5参照ヒューリスティックを使ったものが、片方のアライメントしか使わなかったもの・和集合を使ったものより性能がよい 2018/11/9

単語ベースのモデル図6参照 IBMモデルの特徴単純で高速なモデル2で複雑なモデル4と同等の性能が得られる 2018/11/9

英語・ドイツ語以外の言語対表3参照英語・ドイツ語・フランス語・フィンランド語・スウェーデン語・中国語いずれもモデル4より句翻訳モデル(+語彙重みづけ)の方が BLEU スコアは高いフィンランド語と中国語はインド・ヨーロッパ語族ではない 2018/11/9

まとめ 3単語までの小さい句でもいい結果句翻訳に対する語彙的重みづけも有効単純に統語モデルを使ってもうまく行かない最初の単語アライメントを作成するために使うアルゴリズムより正しいアライメントのヒューリスティックを選択することの方が重要 2018/11/9