実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

言語情報を利用したテキストマイニ ング 奈良先端科学技術大学院大学 情報科学研究科 工藤 拓 山本 薫 坪井 裕太 松本 裕治.
自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
LZ符号化 森田 岳史.
構造的類似文検索アルゴリズムを応用した日本語文型パターン抽出法
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
言語モデル(200億文のGoogle日本語Nグラムから計算)
言語体系とコンピュータ 第5回.
意味属性の共起による 「AのB」型名詞句の翻訳規則
国内線で新千歳空港を利用している航空会社はどこですか?
実証分析の手順 経済データ解析 2011年度.
最適化ソルバーのための Python言語入門
演習3 最終発表 情報科学科4年 山崎孝裕.
情報とコンピュータ 静岡大学工学部 安藤和敏
Super-Functionに基づく日英機械翻訳
東京工科大学 コンピュータサイエンス学部 亀田弘之
カーク・マスデン 熊本学園大学 国際経済学科 2011年7月8日
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
重文・複文の基本文型に対する 文型パターン辞書のカバー率
条件式 (Conditional Expressions)
Semi-Supervised QA with Generative Domain-Adaptive Nets
平成22年6月15日 図書系職員のための アプリケーション開発講習会
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
形式言語とオートマトン Formal Languages and Automata 第4日目
複数の言語情報を用いたCRFによる音声認識誤りの検出
画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
結合価文法による動詞と 名詞の訳語選択能力の評価
機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.
インラインスクリプトに対するデータフロー 解析を用いた XHTML 文書の構文検証
東京工科大学 コンピュータサイエンス学部 亀田弘之
雑音環境下における 非負値行列因子分解を用いた声質変換
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
知能情報工学演習I 第8回( C言語第2回) 課題の回答
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
知識情報演習Ⅲ(後半第2回) 辻 慶太
東京工科大学 コンピュータサイエンス学部 亀田弘之
音声認識・翻訳 Android アプリケーション制作
統語構造に基づく入力文分割と そのハイブリッド音声翻訳への応用
交番における手話から日本語への 変換システムの検討
東京工科大学 コンピュータサイエンス学部 亀田弘之
第5章 計算とプログラム 本章で説明すること ・計算の概観と記述法 ・代表的な計算モデル ・プログラムとプログラム言語.
基礎プログラミング演習 第12回.
コーディングパターンの あいまい検索の提案と実装
東京工科大学 コンピュータサイエンス学部 亀田弘之
JavaScriptを含んだHTML文書に対する データフロー解析を用いた構文検証手法の提案
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
ブースティングとキーワードフィルタリング によるシステム要求検出
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
プログラミング入門 電卓を作ろう・パートI!!.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
ICML読む会資料 (鹿島担当) 教師ナシ の 構造→構造 マッピング 読んだ論文: Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
プログラミング基礎a 第3回 C言語によるプログラミング入門 データ入力
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
情報とコンピュータ 静岡大学工学部 安藤和敏
コードクローン解析に基づく デザインパターン適用候補の検出手法
第7章 そろそろ int 以外も使ってみよう! ~データ型 double , bool~
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
識別子の読解を目的とした名詞辞書の作成方法の一試案
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
プログラミング基礎a 第3回 C言語によるプログラミング入門 データ入力
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1 NLP2007 C1-1 2007.08.29 担当:内田 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) 実験 ◎評価方法1 文型パターン作成時に使用した日本語原文から250文を抽出。 システムに翻訳をさせて、出力が英語原文と等しい場合○、 それ以外は×。ただし、冠詞は無視。 ◎結果:○が11.6% ×が88.4% ◎分析 最も多い失敗は手順2.の局所翻訳で既存の辞書を使ったこと。 手順の3.が原因で失敗したものはない。 ◎評価方法2 さっきの250文を人手で評価する。 評価値4:文の構造・単語の訳全てOK 評価値3:文の構造は正しいけど単語の誤訳がある 評価値2:文の構造が部分的に正しい 評価値1:文の構造がダメ ◎結果 全体の評価値の平均は3.5。 内訳は評価値4が54.4%、3が42.8%、2が2.8%、1が0%。 ・尤度を使って単語を選択するときに間違ってしまった ・英語パターンの表記が不十分だった 上記の問題点を解決すると評価値4が9割を超えそう。 重文・複文の日英機械翻訳のために文型パターン辞書を作ってきた。 これまでに構築した文型パターン辞書を使って機械翻訳(日→英)をやってみる。 実験は基本的にはクローズド。 出力英文:完全一致したのは11% 人手判断で正解だったのは54% 文型パターン辞書 12万文の対訳コーパスから23万件の対訳パターン抽出 例えば… ◎日本語パターン:#1{N1が,N2に}なってからN3を(V4^meirei|V4.meireigo)。 ◎英語パターン :V4 N3 after N1 turn N2. 上のパターンと「信号が青になってから道路を渡りなさい。」を照合すると…    #1=N1がN2に N1=信号 N2=青 N3=道路 V4=渡り パターン翻訳手法  1.英語文の構造決定    入力文(日本語)とマッチする日本語パターンに基づいて決定  2.局所翻訳と英語パターンへの代入    変数ごとに翻訳→複数候補を保持したまま英語パターンに代入    変数が一致しない場合は日本語をちょっといじってから辞書引き    例)日本語変数:ADJ 英語変数:N 日本語要素:うまく →うまさ  3.英語パターンの絞込み    パターンに含まれる変数や関数によって2.で得られた候補を絞り込む    例)^past関数がついていれば過去形の候補を残す とか  4.英語の言語モデルによる翻訳候補の選択    2-gramを使って最終的な出力を選択    英文パターン辞書作成時に使用した12万文が言語モデル 評価4だった出力例 入力文1:欠点はあるがそれでも彼が好きだ。 出力文1:I like him in spite of his faults. 正解文1:I like him in spite of his faults. 入力文2:足音が遠くて聞こえなくなった。 出力文2:Footsteps died away in a long way. 正解文2:His footsteps died away in the distance.