Kyoto-U: Syntactical EBMT System for NTCIR-7 Patent Translation Task

Slides:



Advertisements
Similar presentations
R Basics 2013/12/09 Yamada. 今日の方針 Today’s plan テキスト・文字列を扱うにあたっての用 語の理解をすることの方が、 R での操作を 見るより有意義と思われるので、そちら を優先 Learning terms on text/strings is more.
Advertisements

だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
第 5 章 2 次元モデル Chapter 5 2-dimensional model. Contents 1.2 次元モデル 2-dimensional model 2. 弱形式 Weak form 3.FEM 近似 FEM approximation 4. まとめ Summary.
Essay writing rules for Japanese!!. * First ・ There are two directions you can write. ・よこがき / 横書き (same as we write English) ・たてがき / 縦書き (from right to.
Constructing a Chinese-Japanese Parallel Corpus from Wikipedia Chenhui Chu, Toshiaki Nakazawa, Sadao Kurohashi (Graduate School of Informatics, Kyoto.
第十七か ぐちとうわさ話.
五段動詞の歌 ごだんどうしのうた.
第1回レポートの課題 6月15日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
 辞書系(じしょけい).
Chapter 11 Queues 行列.
3月6日(金曜日) 漢字 #6-10 Verbs! (continued) Particles Time References
Bellwork: English meaning? 1)はじめまして 2)どうぞ 3)すみません 4)おはようございます 5)しゅくだい
今しましょう Translate the story on the next slide. せんせいは しゅくだいを みます。
2009年 3月 17日 法政大学 常盤祐司、児玉靖司、八名和夫、Ivan Ho、Billy Pham
Location nouns.
Chris Burgess (1号館1308研究室、内線164)
Super-Functionに基づく日英機械翻訳
What did you do, mate? Plain-Past
Training on Planning & Setting Goals
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
Noun の 間(に) + Adjective Verb てform + いる間(に) during/while.
There are 5 wearing verbs in Japanese depending on the part of body or the item being worn.
Goal: I can present how to make a food item I like in Japanese.
にほんご 111 (11/09/2006) Chapter 4 Quiz #1 〜は…です。 は vs. が えいが.
形容詞(2) けいようし.
Tohoku University Kyo Tsukada
V 03 I do NOT eat sushi. I do NOT do sumo.
Estimating Position Information by Detecting Network-Connection
著者:外岡秀行 著者:外岡秀行 著者:新井康平 著者:新井康平 著者:新井康平 著者:新井康平.
十年生の 日本語 Year 10 Writing Portfolio
Unit Book 10_课件_U1_Reading2-8 4 Word power university 1.
Chapter 4 Quiz #2 Verbs Particles を、に、で
定期考査2 英語.
The Sacred Deer of 奈良(なら)
Did he/she just say that? Get your head out of the gutter! Oh wait….
CRLA Project Assisting the Project of
“You Should Go To Kyoto”
VTA 02 What do you do on a weekend? しゅうまつ、何をしますか。
Nihongo Japanese 日本ご ‘Numbers ’ & ‘Hiragana Revision’
整合性尺度を用いた 構造的対訳文アラインメント
2018/11/19 The Recent Results of (Pseudo-)Scalar Mesons/Glueballs at BES2 XU Guofa J/ Group IHEP,Beijing 2018/11/19 《全国第七届高能物理年会》 《全国第七届高能物理年会》
Session 8: How can you present your research?
Japan /12/2006 Hiragana Quiz #3 Grammar: More on じゃありません
-Get test signed and make corrections
Coloured Katakana Jumble Animals
くれます To give (someone gives something to me or my family) くれました くれます
English class Management
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
第24回応用言語学講座公開連続講演会 後援:国際言語文化研究科教育研究プロジェクト経費
My Dance Circle December 13, 2018  表紙 my dance circle.
岡山大学 工学部 情報工学科 (大学院自然科学研究科 計算機科学講座) 尺長 研究室
クイズやゲーム形式で紹介した実例です。いずれも過去のインターン作です。
いくらですか?.
にほんご JPN101 Dec. 7, 2009 (Monday).
名古屋大学大学院国際原語文化研究科 第46回日本語教育学講座講演会
Suzaku and the Results ~1 years after launch Suzaku (朱雀)
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
第1回レポートの課題 6月24日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
Tag question Aoyama Shogo.
ー生命倫理の授業を通して生徒の意識に何が生じたかー
Created by L. Whittingham
The Facilitative Cues in Learning Complex Recursive Structures
英語勉強会:川口英語 Supporting of Continuing Life Habit Improvement Using the Theory of Cognitive Dissonance : System Extension and Evaluation Experiment B4 渡邉.
JEFFREY WITZEL (University of Texas at Arlington, USA)
Visualizing Japanese Grammar Appendix
Chapter 4 – Grammar 3 and 4 Past Tense
せつぞくし 接続詞 Conjunctions.
Grammar Point 2: Describing the locations of objects
アノテーションガイドラインの管理を行う アノテーションシステムの提案
Improving Strategic Play in Shogi by Using Move Sequence Trees
Presentation transcript:

Kyoto-U: Syntactical EBMT System for NTCIR-7 Patent Translation Task Language Knowledge Engineering Lab. Kyoto University Kyoto-U: Syntactical EBMT System for NTCIR-7 Patent Translation Task Toshiaki Nakazawa, Sadao Kurohashi Graduate School of Informatics, Kyoto University System Overview Structure-based Alignment Dependency structure transformation Japanese: Morphological analyzer JUMAN and dependency analyzer KNP English: Nlparser (by Charniak) and hand-made rules defining head words for phrases Word/phrase correspondence detection bilingual dictionaries numeral normalization 二百十六万 ⇔ 2,160,000 ⇔ 2.16 million statistical substring alignment (Cromieres 2006) transliteration (Katakana, NE) ローズワイン ⇔ rosuwain ⇔ rose wine 新宿 ⇔ shinjuku ⇔ shinjuku Handling remaining words Input: 記録領域での変形形状と,記録特性の関係を調べた。 Alignment Disambiguation with Consistency Score & Dependency Type Dependency Type Distance Consistency Score Source-side Distance Target-side n = # of correspondence candidates you will have to file insurance an claim with the office in Japan 日本 で 保険 会社 に 対して 請求 の 申し立て が 可能です よ Japanese English 用言:レベルC 6 S/SBAR/SQ … 5 用言:レベルB+ / B VP/WHADVP WHADJP 4 用言:レベルB- / A ノ格 / 連体 2 ADVP/ADJP/NP/PP/ INTJ/QP/PRT/PRN 3 文節内/用言:レベルA+ 1 Others Near! Far! f(∙): consistency score - ‘near-near’: positive - ‘far-far’: 0 - ‘near-far’/’far-near’: negative d(∙): distance - dependency type distance Japanese -> English Intrinsic Evaluation Result English -> Japanese Intrinsic Evaluation Result BLEU Adequacy Fluency Average 27.20 NTT 3.81 tsbmt 4.02 Japio 3.88 27.14 moses 3.71 3.94 Tsbmt 3.86 MIT 3.15 3.66 3.40 25.48 NAIST-NTT 2.96 3.65 3.30 24.79 NICT-ATR 2.85 Kyoto-U 3.55 3.18 24.49 KLE 2.81 3.44 tori 3.10 23.10 2.66 3.43 3.04 22.29 2.59 3.35 3.01 21.57 2.58 3.28 HIT2 2.94 19.93 mibel 2.47 2.86 19.48 2.44 3.09 2.78 19.46 2.38 3.08 2.74 15.90 TH 1.87 2.42 FDU-MCandWI 2.13 9.55 1.75 2.39 2.08 1.41 NTNU 1.08 1.04 1.06 BLEU Adequacy Fluency Average 30.58 moses 3.53 tsbmt 3.69 3.60 29.15 NICT-ATR 2.90 3.67 3.30 28.07 NTT 2.74 3.54 3.14 22.65 Kyoto-U 2.59 3.20 2.89 17.46 2.42 2.54 2.48 After resolving the defect of not caring whether a child node is a pre-child or post-child, the BLEU score rose to 24.02 from 22.65. Translation Result Example (BLEU: 24.11) Input: in FIG. 3A which corresponds to Example 1 the crowning shape is set in the vicinity of the lower limit Output: 下限 近傍 に 実施 例 1 に 対応 する 図 3 クラウン 形状 は 、 設定 さ れて いる 。 Ref: 実施 例 1 に 相当 する 図 3 a で は 、 クラウニング 形状 を 下限 近傍 に 設定 した 。 Conclusion Translation result showed that our EBMT system is competitive to the state-of-the-art SMT systems Using syntactical information must be useful for structurally different language pairs such as Japanese and English Patent sentences often have typical expressions, mathematical or chemical formulas and so on, so we may need to adopt some pre-processes to avoid parsing errors to handle such peculiar expressions properly Translation Result Example (BLEU: 21.62) Input: 図 4 に 示した メモリ アレイ の 配置 を 採用 する こと で 、 下位 側 データバス 62 および 上位 側 データバス 64 は 、 それぞれ 総 延長 を 5 L に する こと が できる 。 Output: By adopting the arrangement shown in FIG. 4 of the memory array , data lower bus 62 side data bus 64 can be made a total length between can be elongated respectively into the 5L . Ref: The use of the memory-array arrangement shown in FIG . 4 allows each of a lower data bus 62 and an upper data bus 64 to have the total length of 5L . NTCIR-7 Patent Translation Task , Japan, Dec. 16-19, 2008