日英ニュース記事を用いた 用例ベース翻訳システム

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

Essay writing rules for Japanese!!. * First ・ There are two directions you can write. ・よこがき / 横書き (same as we write English) ・たてがき / 縦書き (from right to.
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
最大エントロピーモデルに基づく形態素解析と辞書による影響
米国セキュリティ調査 (2002 CSI/FBI調査 攻撃場所)
Classes on saturday Yuji Kawada.
構造的類似文検索アルゴリズムを応用した日本語文型パターン抽出法
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
意味属性の共起による 「AのB」型名詞句の翻訳規則
用例ベース翻訳における用言句の 簡潔な翻訳の実現
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
All Rights Reserved, Copyright (C) Donovan School of English
英語勉強会.
SPECIAL ASSIGNMENT What is the leadership and how can you be a good leader? I am going to give you the clues in the lecture, but please find the answer.
STEP 2 ノート・テイキングのサンプル.
AP/5 2013年2月7日.
Chapter 8.3, Order Breaks Down
参考資料5 世界保健機関憲章前文 (日本WHO協会仮訳)
CSWパラレルイベント報告 ヒューマンライツ・ナウ        後藤 弘子.
Admissions data (2015) Applied 294 Interviewed 88 Offered admission 53
この研究発表の内容に関する利益相反事項は, ☑ あります
ひな祭り.
関係代名詞 目的格の関係代名詞.
関係代名詞 目的格の関係代名詞.
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
じょし Particles.
What did you do, mate? Plain-Past
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
Only One Flower in the World
Noun の 間(に) + Adjective Verb てform + いる間(に) during/while.
There are 5 wearing verbs in Japanese depending on the part of body or the item being worn.
トピック10 患者安全と侵襲的処置 When Rabia first mentioned this conference to me in September 2007 I was impressed with her commitment, vision and energy for this international.
Example-based Machine Translation without Saying Inferable Predicate
President, Japan Council on Energy & Security
Estimating Position Information by Detecting Network-Connection
Who Is Ready to Survive the Next Big Earthquake?
On / in / at Honoka Tanno.
know / knows(s) / ___________
整合性尺度を用いた 構造的対訳文アラインメント
Chapter 1 Hamburger History
Tarou JETRO ★参加者情報 Sample
Air Pen -- an introduction of my recent result --
Peacebuilding: Voices from the Field
Topics on Japan これらは、過去のインターンが作成したパワポの写真です。毎回、同じような題材が多いため、皆さんの出身地等、ここにない題材も取り上げるようにしてください。
2018/11/19 The Recent Results of (Pseudo-)Scalar Mesons/Glueballs at BES2 XU Guofa J/ Group IHEP,Beijing 2018/11/19 《全国第七届高能物理年会》 《全国第七届高能物理年会》
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1
HHIHi.
I’m Eiji Aramaki from university of Tokyo and ATR
Effective methods for multiplying hypericum oliganthum
WELCOME TO THE WORLD OF DRAGON BALL
Disclosure of conflict of interest
豊田正史(Masashi Toyoda) 福地健太郎(Kentarou Fukuchi)
My Favorite Japanese Rock
日本政府は、第二次世界大戦中に亡くなられた
Michael Jeffrey Jordan
受け身を練習しよう.
My Dance Circle December 13, 2018  表紙 my dance circle.
半構造化テキストに対する 文字列照合アルゴリズム
超大規模ウェブコーパスを用いた 分布類似度計算
Suzaku and the Results ~1 years after launch Suzaku (朱雀)
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
第76回エコトピア科学講演会  イギリスからの客員教授の講演
資料 2-6 世界保健機関憲章前文 (日本WHO協会仮訳)
Number of random matrices
この研究発表の内容に関する利益相反事項は, ☑ ありません
現在完了形 特別な完了形.
One Day Tour Date: August 16 (Sightseeing Spots) Matsue Castle
地球環境気候学研究室 谷口 佳於里 指導教員:立花義裕 教授
Presentation transcript:

日英ニュース記事を用いた 用例ベース翻訳システム 荒牧英治 (東大・ATR) 黒橋禎夫 (東大・ATR) 柏岡 秀紀 (ATR) 田中 英輝 (ATR)

用例ベース翻訳実現の過程 高精度な統語解析 大規模な対訳コーパス コンテント アライン 入力文 コーパス アライメント パラレル 用例 (対応付け) EBMT 翻訳文 高精度な統語解析 大規模な対訳コーパス

発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

用例 (Translation Memory; TM) TM=対訳文ペア 構造が解析されている 対応関係が推定されている 苗は The rice seedlings 去年の are grown 秋, from grain 天皇陛下が harvested 皇居で by the Emperor 収穫された at the Imperial Palace 稲籾から in Tokyo 育てられたものです. last Autumn.

NHKニュースの原稿(4万記事ペア) 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

コンテントアラインコーパス 赤線部:相手側記事で表現されていない内容 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

文アライメント 翻訳辞書を用いたDPマッチングによる手法 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting. Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

1:1文対応のみを抽出 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

句を単位とした依存構造 統語解析 内容語中心に語をまとめる 苗は The rice seedlings 去年の are grown 秋, from grain 天皇陛下が harvested 皇居で by the Emperor 収穫された at the Imperial Palace 稲籾から in Tokyo 育てられたものです. last Autumn.

翻訳辞書を用いた句アライメント 翻訳辞書を用いた句対応推定 苗は 苗は The rice seedlings 去年の 去年の are grown are grown 秋, 秋, from grain from grain 天皇陛下が 天皇陛下が harvested harvested 皇居で 皇居で by the Emperor by the Emperor 収穫された 収穫された at the Imperial Palace at the Imperial Palace 稲籾から 稲籾から in Tokyo in Tokyo 育てられたものです. 育てられたものです. last last Autumn. Autumn.

構造による句アライメント 構造を手がかりに句対応を推定 [Aramaki, 2001] 苗は 苗は 苗は The rice seedlings The rice seedlings The rice seedlings 去年の 去年の 去年の are grown are grown are grown 秋, 秋, 秋, from grain from grain from grain 天皇陛下が 天皇陛下が 天皇陛下が harvested harvested harvested 皇居で 皇居で 皇居で by the Emperor by the Emperor by the Emperor 収穫された 収穫された 収穫された at the Imperial Palace at the Imperial Palace at the Imperial Palace 稲籾から 稲籾から 稲籾から in Tokyo in Tokyo in Tokyo 育てられたものです. 育てられたものです. 育てられたものです. last last last Autumn. Autumn. Autumn.

句アライメント精度 評価実験 フィルタリング 96記事にてアライメント 1:1対訳文・・・145ペア 句単位での精度・・・50% 内容語対応率(WCR)を 手がかり # of 辞書で対応がつく内容語 WCR= # of 内容語

WCRと句対応精度 すべての対訳文をTMとする場合 WCR>0.3以上の対訳文をTMとする場合 精度=50% 7万TM 精度=66% 3万TM

発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

EBMTの基本アイデア どのTM(用例)を使って翻訳すべきか? 類似した用例をもとに翻訳を行なう 入力文 TM 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. どのTM(用例)を使って翻訳すべきか?

用例(TM)選択の考え方 TM 入力文 TM日本語側 TM英語側 類似度 一致度 確信度 翻訳に使用する部分

一致度 ΣSIM 一致:=内容語の原型が一致 内容語の活用が一致 ・・・1.1 内容語の原型が一致 ・・・1.0 機能語の一致 ・・・0.2 入力文 TM 議会は アメリカは, アメリカは, The United States The United States 関係各国に対して ロシアが ロシアが has issued 大量破壊兵器の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 内容語の活用が一致 ・・・1.1 内容語の原型が一致 ・・・1.0 機能語の一致 ・・・0.2 ΣSIM

周辺の類似度 ΣSIM ΣSIM 一致部分と隣接している句について類似度を計算 シソーラスでの類似 ・・・0.3-0.8 入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. シソーラスでの類似 ・・・0.3-0.8 品詞の一致 ・・・0.3 機能語の一致 ・・・0.2 ΣSIM + ΣSIM

類似部分と一致部分の関係 ΣSIM ΣSIM ×CONNECT は は の の 関係が一致する ・・・1 関係が一致しない・・・0.5 + 入力文 TM は は 議会は 議会 アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued の の 大量破壊兵器の 大量破壊兵器 原子力技術 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 関係が一致する ・・・1 関係が一致しない・・・0.5 ΣSIM + ΣSIM ×CONNECT

} { 日英アライメントの確信度 ΣSIM ΣSIM ×CONNECT ΣCONF 翻訳辞書で完全に対応する ・・・1 入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 翻訳辞書で完全に対応する ・・・1 翻訳辞書で一部の語が対応する ・・・0.9 推定された対応 ・・・0.5 } { ΣSIM + ΣSIM ×CONNECT × ΣCONF

} { TM自体の確信度 ΣSIM ΣSIM ×CONNECT ΣCONF ×WCR # of 辞書で対応がつく内容語 WCR= 入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued WCR 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. # of 辞書で対応がつく内容語 WCR= # of 内容語 } { ΣSIM + ΣSIM ×CONNECT × ΣCONF ×WCR

} { 考慮すべき3つの要素 一致度 類似度 確信度 ΣSIM ΣSIM ×CONNECT ΣCONF ×WCR TM 入力文 TM日本語側 + ΣSIM ×CONNECT × ΣCONF ×WCR

TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ

TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ

TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued WCR 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ 入力文の各文節に 対して(1) ~ (3)を 行なう

4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 6: オーダリングし,表層文を得る

4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 6: オーダリングし,表層文を得る

発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

30文をTMデータベースから取り出し,句単位で評価 入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 30文をTMデータベースから取り出し,句単位で評価 正解 不正解 正解率 提案手法 (一致度 類似度 確信度) 134 28 82.7% 手法A (一致度 確信度) 132 30 81.4% 手法B (一致度 類似度) 112 50 69.1% 翻訳辞書+頻度 117 45 72.2%

入力文と選択されたTM例 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

正解例 類似度 (高) アライメント確信度 (高) 翻訳辞書を使用した場合 入力: (11月にフィリピンで) 開かれる(APECの) 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の 類似度 (高) 入力: (11月にフィリピンで) 開かれる(APECの) TM: (12月にシンガポールで) 開かれる(WTO・・・の) アライメント確信度 (高) 開かれる ⇔ to be held 翻訳辞書を使用した場合 開かれる ⇔ have キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

正解例2 類似度 (高) アライメント確信度 (低) 翻訳辞書を使用した場合 入力: (キムデジュン大統領は…晩餐会に)臨んでいます. 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony 類似度 (高) 入力: (キムデジュン大統領は…晩餐会に)臨んでいます. TM: (天皇皇后両陛下は… ….式典に)臨まれました. アライメント確信度 (低) 臨まれました ⇔ have been welcomed 翻訳辞書を使用した場合 臨まれました ⇔ face アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

不正解例 類似度 (低) アライメント確信度 (中) 翻訳辞書を使用した場合 入力: (わずかな) 気温の(変化にも) 入力: (わずかな) 気温の(変化にも) TM: 気温の(低下を発表しています) アライメント確信度 (中) 気温の⇔temperature forecast chart 翻訳辞書を使用した場合 気温の⇔ temperature 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 低下を temperature forecast chart 変化にも 発表しています.

まとめ EBMTの一連の過程を実現した 今後の課題 コンテントアラインコーパスを用いた用例の構築手法 自動構築した用例の選択手法 日英アライメントの精度の向上 翻訳システムとして完成度の向上