機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.

Slides:



Advertisements
Similar presentations
1 医中誌Webについて 杏林大学 医学図書館. 2 医中誌Webとは  国内発行の雑誌に収載された論文情報を検索 できる医学文献デ-タベ-ス  医学、薬学、歯学、看護学、獣医学の分野を 網羅  約5,000誌、695万件におよぶデ-タ (2009年11月現在)  1983 年から現在までの検索が可能.
Advertisements

TKTools.jp 会員ブログ RSS 配信の利用方 法 と Web サイト多言語化方法 BMB 第 10 回オフ会.
© Copyright Hosei University 2012年 8月 1日 情報メディア教育研究センター 常盤 祐司 翻訳に使う 用語集の現状と課題 Ja Sakai Unconference 2012.
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
1 通信教育学部 コンピュータ演習 WWW における情報検索とブラウザ 担当: 遠藤 美純
Ruby on Rail の紹介 石渡正樹 Ruby on Rails とは? スクリプト言語 Ruby で書かれた web アプリケー ションフレームワーク 作者 –Devid Heinemeier Hansson という人だそうです ( 詳 しいことは知りません.
1 「ラベル屋さん」による名刺作成マニュアル エーワンラベル&カード作成ソフト「ラベル屋さん home 」は A- ONE のホームページ にアクセス して、「ラベル屋さん」無償ダウンロードを選択し、指示に 従ってダウンロードします。
この部分こそが必 要とされている ! Runtime 自身と Expression が カバーする!
音声翻訳における機械翻訳・音声合成の 性能評価および分析 ☆橋本佳 ,山岸順一 , William Byrne , Simon King ,徳田恵一 名工大 University of Edinburgh Cambridge University
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
チーム名 : X5 チーム長 : 金泰亨 チーム員 : 張洪鉉 黃政燮 金壯先
中澤 敏明 科学技術振興機構(JST)/京都大学
理解度テスト8 業務担当者の「情報活用」を支援するソフトウェアー
T2V技術 Web製作ラボ 4/25, 2011 hayashiLabo 9.
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
国内線で新千歳空港を利用している航空会社はどこですか?
SHINYについて 黄研究室4年 小林賢哉.
最適化ソルバーのための Python言語入門
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
Super-Functionに基づく日英機械翻訳
テキストマイニング, データマイニングと 社会活動のトレース
東京工科大学 コンピュータサイエンス学部 亀田弘之
セマンティックWebの現在 ISWC2005参加報告
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
共同ローカリゼーション フレームワーク 井上 謙次.
述語項構造に基づいた統計 翻訳における語句の並べ替え
情報検索演習 第2回 前から4列目までに着席すること 2005年10月05日 後期 水曜5限 江草由佳 国立教育政策研究所
図書館ツール発想日記 ~「東京大学内のサイトから関連学術用語のデータを得る」(仮称)システムへの寄り道思考経路~
ドメインという概念及び 日本語文法ペダゴジーでの応用
情報理工学部 情報知能学科 H 柏木 康志 2010年 2月 2日
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
SAP & SQL Server テクニカルアーキテクチャ概要 マイクロソフト株式会社 SAP/Microsoft コンピテンスセンター
Semi-Supervised QA with Generative Domain-Adaptive Nets
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
「串刺し」研究アプローチの例 e-learning e-space 動画配信 システム SOI Smart Web ストリーミング技術
メールガイダンス 文献検索(JDreamII)編 Part 2 特許検索
平成22年6月15日 図書系職員のための アプリケーション開発講習会
JIMDO勉強会その2 アカウント新規作成.
【プログラミング応用】 必修2単位 通年 30週 授業形態:演習.
機械翻訳勉強会 論文紹介 mamoru-k 小町守 2018/11/9.
IIR輪講復習 #1 Boolean retrieval
Phrase-base Statistical Machine Translation
画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1
プロセス.
春の文献検索講習会2010 練習問題で実践トレーニング
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
訓練データとテストデータが 異なる分布に従う場合の学習
大規模データによる未知語処理を統合したスケーラブルな仮名漢字変換
請求項記述言語(PCML)による特許文章の構造化
言語XBRLで記述された 財務諸表の分析支援ツールの試作
平成20年度 奈良教育大学学術リポジトリ成果報告
「はじめてのADaM」 パブリックレヴューについて
東京工科大学 コンピュータサイエンス学部 亀田弘之
契約上に記載のない会社の ユーザの第三者契約登録方法
テキストマイニング, データマイニングと 社会活動のトレース
Spatial Linker - 空間コンテンツ融合の研究 -
東京工科大学 コンピュータサイエンス学部 亀田弘之
Tag question Aoyama Shogo.
大規模コーパスに基づく同義語・多義語処理
第14回放送授業.
自然言語処理2015 Natural Language Processing 2015
The Personal Publication Reader: Illustrating Web Data Extraction, Personalization and Reasoning for the Semantic Web Robert Baumgartner*, Nicola Henze+,
第10回 質問(3) メール講座 Next Stage:翻訳力アップ自己トレ(1)
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
専門英語2004.
自然言語処理2016 Natural Language Processing 2016
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
1.2 言語処理の諸観点 (1)言語処理の利用分野
Presentation transcript:

機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守

NTCIR(エンティサイル) 情報アクセス技術に関するワークショップ 言語横断情報検索 自動要約 質問応答 特許情報処理 意見情報分析 動向情報分析 Web 検索

NTCIR-7 Advanced Cross-lingual Information Access 言語横断情報検索と質問応答 User Generated Contents ブログ検索 Focused Domains 特許翻訳とマイニング

特許翻訳 特殊な言い回しがある 実際の文を見てみましょう 今回は「請求項」でなく「実施例」なので、普通の技術論文とあまり変わらない ドメイン適応 専門用語

ドメイン適応 WMT 2007 Shared Task1: Domain Adaptation Philipp Koehn, Josh Schroeder. Experiments in Domain Adaptation for Statistical Machine Translation

結果 Method BLEU Large out-of-domain training data 25.11 Small in-domain training data 25.88 Combined training data 26.69 In-domain language model 27.46 Interpolated language model 27.12 Two language model 27.30 Two translation model 27.64

考えていること LDA/PLSIでトピックモデルを作って言語モデルを変えながら翻訳 技術文書はいろいろな分野が入っているので有効そう Wikipedia から専門用語の対訳辞書を作って利用する いろんな専門用語が載っているので使えそう

NTCIR-7の期間 2007年10月-2007年12月 2007年11月15日 2007年11月-2008年4月 登録〆切 ドキュメントリリース 2007年11月-2008年4月 dry run 2007年11月-2008年8月 formal run