Presentation is loading. Please wait.

Presentation is loading. Please wait.

日英ニュース記事を用いた 用例ベース翻訳システム

Similar presentations


Presentation on theme: "日英ニュース記事を用いた 用例ベース翻訳システム"— Presentation transcript:

1 日英ニュース記事を用いた 用例ベース翻訳システム
荒牧英治 (東大・ATR) 黒橋禎夫 (東大・ATR) 柏岡 秀紀 (ATR) 田中 英輝 (ATR)

2 用例ベース翻訳実現の過程 高精度な統語解析 大規模な対訳コーパス コンテント アライン 入力文 コーパス アライメント パラレル 用例
(対応付け) EBMT 翻訳文 高精度な統語解析 大規模な対訳コーパス

3 発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント
パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

4 用例 (Translation Memory; TM)
TM=対訳文ペア 構造が解析されている 対応関係が推定されている 苗は The rice seedlings 去年の are grown 秋, from grain 天皇陛下が harvested 皇居で by the Emperor 収穫された at the Imperial Palace 稲籾から in Tokyo 育てられたものです. last Autumn.

5 NHKニュースの原稿(4万記事ペア) 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

6 コンテントアラインコーパス 赤線部:相手側記事で表現されていない内容
田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

7 文アライメント 翻訳辞書を用いたDPマッチングによる手法
田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting. Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

8 1:1文対応のみを抽出 田植えフェスティバル石川県輪島市で外国の大使や一般の参加者など千人あまりが急な斜面の棚田で田植えを体験する催しが行われました。 輪島市白米町には(しろよねまち)千枚田と呼ばれる(せんまいだ)大小二千百枚の棚田が急な斜面から海に向かって拡がっています。 田植え体験は農作業を通して米作りの意義などを考えていこうという地球環境平和財団の呼び掛けで開かれたもので、海外三十四ヵ国の大使や書記官、それに一般の参加者ら合わせておよそ千人が集まりました。 田植えに使われた苗は去年の秋、天皇陛下が皇居で収穫された稲籾から育てたものです。 参加者たちは裸足になって水田に足を踏み入れ地元に伝わる田植え歌に合わせて慣れない手つきで苗を植えていました。 きょうの輪島市は雲が広がったもののまずまずの天気となり、出席された高円宮さまも海からの風に吹かれながら田植えに加わっていました。 地球環境平和財団では今年の夏休みに全国の子どもたちを対象に草刈りや生きものの観察会を開く他、秋には稲刈体験を行なう予定にしています。 Ambassadors and diplomats from 37 countries took part in a rice planting festival on Sunday in small paddies on steep hillsides in Wajima, central Japan. About one-thousand people gathered at the hill, where some two-thousand 100 miniature paddies, called Senmaida, stretch toward the Sea of Japan. The event was organized by the private Foundation for Global Peace and Environment. The rice seedlings are grown from grain harvested by the Emperor at the Imperial Palace in Tokyo last autumn. Barefoot participants waded into the paddies to plant the seedlings by hand while singing a local folk song about the practice of rice planting.

9 句を単位とした依存構造 統語解析 内容語中心に語をまとめる 苗は The rice seedlings 去年の are grown 秋,
from grain 天皇陛下が harvested 皇居で by the Emperor 収穫された at the Imperial Palace 稲籾から in Tokyo 育てられたものです. last Autumn.

10 翻訳辞書を用いた句アライメント 翻訳辞書を用いた句対応推定 苗は 苗は The rice seedlings
去年の 去年の are grown are grown 秋, 秋, from grain from grain 天皇陛下が 天皇陛下が harvested harvested 皇居で 皇居で by the Emperor by the Emperor 収穫された 収穫された at the Imperial Palace at the Imperial Palace 稲籾から 稲籾から in Tokyo in Tokyo 育てられたものです. 育てられたものです. last last Autumn. Autumn.

11 構造による句アライメント 構造を手がかりに句対応を推定 [Aramaki, 2001] 苗は 苗は 苗は
The rice seedlings The rice seedlings The rice seedlings 去年の 去年の 去年の are grown are grown are grown 秋, 秋, 秋, from grain from grain from grain 天皇陛下が 天皇陛下が 天皇陛下が harvested harvested harvested 皇居で 皇居で 皇居で by the Emperor by the Emperor by the Emperor 収穫された 収穫された 収穫された at the Imperial Palace at the Imperial Palace at the Imperial Palace 稲籾から 稲籾から 稲籾から in Tokyo in Tokyo in Tokyo 育てられたものです. 育てられたものです. 育てられたものです. last last last Autumn. Autumn. Autumn.

12 句アライメント精度 評価実験 フィルタリング 96記事にてアライメント 1:1対訳文・・・145ペア 句単位での精度・・・50%
内容語対応率(WCR)を 手がかり # of 辞書で対応がつく内容語 WCR= # of 内容語

13 WCRと句対応精度 すべての対訳文をTMとする場合 WCR>0.3以上の対訳文をTMとする場合 精度=50% 7万TM 精度=66%
3万TM

14 発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント
パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

15 EBMTの基本アイデア どのTM(用例)を使って翻訳すべきか? 類似した用例をもとに翻訳を行なう 入力文 TM 議会は アメリカは,
The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. どのTM(用例)を使って翻訳すべきか?

16 用例(TM)選択の考え方 TM 入力文 TM日本語側 TM英語側 類似度 一致度 確信度 翻訳に使用する部分

17 一致度 ΣSIM 一致:=内容語の原型が一致 内容語の活用が一致 ・・・1.1 内容語の原型が一致 ・・・1.0 機能語の一致 ・・・0.2
入力文 TM 議会は アメリカは, アメリカは, The United States The United States 関係各国に対して ロシアが ロシアが has issued 大量破壊兵器の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 内容語の活用が一致 ・・・1.1 内容語の原型が一致 ・・・1.0 機能語の一致 ・・・0.2 ΣSIM

18 周辺の類似度 ΣSIM ΣSIM 一致部分と隣接している句について類似度を計算 シソーラスでの類似 ・・・0.3-0.8
入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. シソーラスでの類似 ・・・ 品詞の一致 ・・・0.3 機能語の一致 ・・・0.2 ΣSIM + ΣSIM

19 類似部分と一致部分の関係 ΣSIM ΣSIM ×CONNECT は は の の 関係が一致する ・・・1 関係が一致しない・・・0.5 +
入力文 TM 議会は 議会 アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued 大量破壊兵器の 大量破壊兵器 原子力技術 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 関係が一致する ・・・1 関係が一致しない・・・0.5 ΣSIM + ΣSIM ×CONNECT

20 } { 日英アライメントの確信度 ΣSIM ΣSIM ×CONNECT ΣCONF 翻訳辞書で完全に対応する ・・・1
入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 翻訳辞書で完全に対応する ・・・1 翻訳辞書で一部の語が対応する ・・・0.9 推定された対応 ・・・0.5 } { ΣSIM + ΣSIM ×CONNECT × ΣCONF

21 } { TM自体の確信度 ΣSIM ΣSIM ×CONNECT ΣCONF ×WCR # of 辞書で対応がつく内容語 WCR=
入力文 TM 議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued WCR 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. # of 辞書で対応がつく内容語 WCR= # of 内容語 } { ΣSIM + ΣSIM ×CONNECT × ΣCONF ×WCR

22 } { 考慮すべき3つの要素 一致度 類似度 確信度 ΣSIM ΣSIM ×CONNECT ΣCONF ×WCR TM 入力文 TM日本語側
+ ΣSIM ×CONNECT × ΣCONF ×WCR

23 TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ
議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ

24 TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ
議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ

25 TM選択のアルゴリズム 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 3: 最高スコアのTMを選ぶ
議会は 議会は アメリカは, アメリカは, アメリカは, The United States The United States 関係各国に対して 関係各国に対して 関係各国に対して ロシアが ロシアが ロシアが ロシアが has issued has issued WCR 大量破壊兵器の 大量破壊兵器の 原子力技術の 原子力技術の 原子力技術の strong strong 輸出を 輸出を 輸出を 輸出を 輸出を (a) request (a) request 制限するよう 制限するよう 制限するよう 制限するよう 制限するよう Russia Russia 強く 強く 強く 強く 強く (that) restricts (that) restricts 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. 働き掛けてきました. exports exports of technology of technology to Iran. 1: 入力文の任意の文節に注目する 2: 一致部分を可能な限り広げる 制約1: 日英アライメントが推定されている 制約2: 一致部分が,TM両言語側で連続している 3: 最高スコアのTMを選ぶ 入力文の各文節に 対して(1) ~ (3)を 行なう

26 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る
入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 6: オーダリングし,表層文を得る

27 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る
入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 4: TM同士がオーバーラップした場合は,スコアの高いTMを用いる 5: TMの一致部分同士を結合して翻訳文の構造を得る 6: オーダリングし,表層文を得る

28 発表内容 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ コンテント アライン 入力文 コーパス アライメント
パラレル コーパス アライメント (対応付け) EBMT 翻訳文 1:用例の自動構築手法 2:用例の選択手法 3:訳語選択の実験 4:まとめ

29 30文をTMデータベースから取り出し,句単位で評価
入力文 TMの対応先 TM 翻訳文 congress 議会は 議会は 議会の officials from issue 関係各国に対して 働き掛けてきました. 関係者などに Congress strong 大量破壊兵器の 関係各国に対して 関係各国が is agreed request 輸出を 働き掛けてきました. 合意するのであれば, upon by the countries country 制限するよう concerned. concern 強く restrict 働き掛けてきました. 大量破壊兵器の 国連による with Mr. Obuchi on export 輸出を 大量破壊兵器の of mass destruction. mass destruction 査察問題などについて 議会は アメリカは, The United States 関係各国に対して ロシアが has issued 大量破壊兵器の 原子力技術の strong 輸出を 輸出を (a) request 制限するよう 制限するよう Russia 強く 強く (that) restricts 働き掛けてきました. 働き掛けてきました. exports of technology to Iran. 30文をTMデータベースから取り出し,句単位で評価 正解 不正解 正解率 提案手法 (一致度 類似度 確信度) 134 28 82.7% 手法A (一致度 確信度) 132 30 81.4% 手法B (一致度 類似度) 112 50 69.1% 翻訳辞書+頻度 117 45 72.2%

30 入力文と選択されたTM例 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる
in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

31 正解例 類似度 (高) アライメント確信度 (高) 翻訳辞書を使用した場合 入力: (11月にフィリピンで) 開かれる(APECの)
11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の 類似度 (高) 入力: (11月にフィリピンで) 開かれる(APECの) TM: (12月にシンガポールで) 開かれる(WTO・・・の) アライメント確信度 (高) 開かれる ⇔ to be held 翻訳辞書を使用した場合 開かれる ⇔ have キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

32 正解例2 類似度 (高) アライメント確信度 (低) 翻訳辞書を使用した場合 入力: (キムデジュン大統領は…晩餐会に)臨んでいます.
11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony 類似度 (高) 入力: (キムデジュン大統領は…晩餐会に)臨んでいます. TM: (天皇皇后両陛下は… ….式典に)臨まれました. アライメント確信度 (低) 臨まれました ⇔ have been welcomed 翻訳辞書を使用した場合 臨まれました ⇔ face アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 変化を temperature forecast chart 変化にも 発表しています.

33 不正解例 類似度 (低) アライメント確信度 (中) 翻訳辞書を使用した場合 入力: (わずかな) 気温の(変化にも)
入力: (わずかな) 気温の(変化にも) TM: 気温の(低下を発表しています) アライメント確信度 (中) 気温の⇔temperature forecast chart 翻訳辞書を使用した場合 気温の⇔ temperature 11月に 12月に to be held フィリピンで シンガポールで in Singapore 開かれる 開かれる in December APECの WTO・世界貿易機関の キム・デジュン大統領は, 天皇皇后両陛下は The Japanese Emperor 現在 昨夜 Empress 歓迎晩餐会に 歓迎式典に have been welcomed 臨んでいます. 臨まれました. at a ceremony アメリカと アメリカと The United States Britain イギリスは イギリスは, are carrying out 4日目の 3日目の continuous 攻撃を 攻撃を third a _ night 始めました. 始めました. of air attacks わずかな 気温の will release 気温の 低下を temperature forecast chart 変化にも 発表しています.

34 まとめ EBMTの一連の過程を実現した 今後の課題 コンテントアラインコーパスを用いた用例の構築手法 自動構築した用例の選択手法
日英アライメントの精度の向上 翻訳システムとして完成度の向上

35


Download ppt "日英ニュース記事を用いた 用例ベース翻訳システム"

Similar presentations


Ads by Google