画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1

Slides:



Advertisements
Similar presentations
VE 01 え form What is え form? え? You can do that many things with え form?
Advertisements

大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
構造的類似文検索アルゴリズムを応用した日本語文型パターン抽出法
整数計画法を用いたフレーズ対応最適化による翻訳システムの改良
Note for How to Write an English Paper (2014 Second Semester)
国内線で新千歳空港を利用している航空会社はどこですか?
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
All Rights Reserved, Copyright (C) Donovan School of English
1語から始まる英作文 baseball 1つの単語からいくつ文を作られるかな? ・I like baseball.
3人称単数現在形 3単現のs文の否定文.
Nouns and Verbs (using particles).
ひな祭り.
関係代名詞(目的格).
Jeopardy!.
中学3年 英語 主格の関係代名詞 (who, which).
一致の非対称の 極小理論的分析 小林 亜希子 島根大学 「言語と情報研究プロジェクト研究会:言語理論の動向を考える」 広島大学
情報とコンピュータ 静岡大学工学部 安藤和敏
関係代名詞 目的格の関係代名詞.
関係代名詞 Fruit Basket Turnover 関係代名詞は フルーツバスケットで導入 Anyone who has a catなど
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
疑問詞+ to 動詞の原形.
What did you do, mate? Plain-Past
英語特別講座 代名詞・前置詞・形容詞・助動詞 #1   
述語項構造に基づいた統計 翻訳における語句の並べ替え
関係代名詞の導入 Program 7-2~8-1.
How do you talk about Positions/ Locations?
テキストの類似度計算
Report from Tsukuba Group (From Galaxies to LSS)
なんがつにいきますか? What month do you/will you go?
On / in / at Honoka Tanno.
整合性尺度を用いた 構造的対訳文アラインメント
Semi-Supervised QA with Generative Domain-Adaptive Nets
にほんご JPN101 Dec. 9, 2009 (Wednesday).
IIR輪講復習 #1 Boolean retrieval
Topics on Japan これらは、過去のインターンが作成したパワポの写真です。毎回、同じような題材が多いため、皆さんの出身地等、ここにない題材も取り上げるようにしてください。
関係代名詞 that.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
Today’s Goal: Express what you did yesterday
機械翻訳勉強会 NTCIR-7について 2007年10月16日 奈良先端大D1小町守.
Present continuous Ayari Suzuki.
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
My Favorite Movie I will introduce my favorite movie.
これからすることを表現してみよう.
関係代名詞(接触節) 目的格の関係代名詞の省略.
Baa Baa Black Sheep 0:28.
Present Perfect 現在完了形.
関係代名詞 Fruit Basket Turnover 関係代名詞は フルーツバスケットで導入 Anyone who has a catなど
程度を表す表現を身につけよう どのくらいなのか?
好きなものリレー英会話 一番好きなものとその理由を15秒で素早く答える訓練をします。ただ、好きなものを述べるだけでなく、すぐにbecauseを使って理由を述べることが重要です。 CAN-DO: 自分の好きなものを理由をつけて即興で述べることができる。
My favorite soccer player Cristiano Ronald
My Dance Circle December 13, 2018  表紙 my dance circle.
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
Today’s Goal: Ask whether your friend did yesterday or not
ておく.
Smiley.
分詞 participle 文章の中で使ってみよう.
超大規模ウェブコーパスを用いた 分布類似度計算
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
ロールプレイアクティビティ ある状況設定の中で、登場人物になりきり会話をします。 CAN-DO: 状況に応じた適切な質問をすることができる。
写真描写アクティビティ 写真に関しての3つの簡単な質問をし、写真を見ながら答えるアクティビティです。簡単な質問に関してやりとりする力を育てます。 CAN-DO: 写真に関する単純な質問に答えることができる。
3人称単数現在形 疑問詞を使った疑問文.
The difference between adjectives and adverbs
構造的類似性を持つ半構造化文書における頻度分析
コーパス コーパス(Corpus)はコンピュータの発達とともに、計算機可読なデータを容易に作成・収集することができるようになったことがその背景にある。現在ではコーパス言語学などの学問もある。
大規模コーパスに基づく同義語・多義語処理
情報とコンピュータ 静岡大学工学部 安藤和敏
英語4技能指導のための 帯活動素材・2 図形再現アクティビティ.
識別子の読解を目的とした名詞辞書の作成方法の一試案
アノテーションガイドラインの管理を行う アノテーションシステムの提案
Presentation transcript:

画像ピボットパラフレーズ抽出に向けて 大阪大学 NAIST Chenhui Chu,1 大谷 まゆ,2 中島 悠太1 chu@ids.osaka-u.ac.jp, otani.mayu.ob9@is.naist.jp, n-yuta@ids.osaka-u.ac.jp 1大阪大学, 2NAIST 1. パラフレーズと自然言語処理 4. Flicker30kエンティティデータセット [Plummer+ 2016] パラフレーズとは同じ意味を持つ異なるテキスト表現 様々な自然言語処理のタスクで活用 (how, ways) (to live with, get along with) (cat, feline) (allergies, allergens) クエリの拡張による質問応答 [Riezler+ 2007 etc.] polemic about ||| 論争 ・・・ controversy over → polemic about → → 論争 ❌ 入力 パラフレーズ 翻訳モデル 出力 エンティティ(名詞句)とイメージリジョンの対応関係は人手でアノテーション 訓練:29,783、開発:1,000、テスト:1,000 機械翻訳 [Chu+ 2016 etc.] 2. 本研究のモチベーション 5. Flicker30kエンティティのアライメント 多くの言語・ドメインにおいて大量に収集可能 GIZA++ [Brown+ 1993] 5.1 ワードアライメント 画像と関連する 複数のテキストのペア イメージリジョンをピボットすれば パラフレーズを抽出可能 A boy in a red shirt sledding down a sand dune . “a sand dune” A snowboarder flies through the air in a mountain landscape = = A man jumping in the air on a snowboard “A snowboarder” = “A man on a snowboard” A child is sliding down a hill on a sled . “a hill” フレーズとリジョンのアライメント問題 大量のパラフレーズが存在 3. 先行研究との比較 エンティティとリジョンのアライメント [Plummer+ 2016] https://github.com/BryanPlummer/pl-clc 5.2 リジョンピボット A man jumping in the air on a snowboard A snowboarder flies through the air in a mountain landscape 画像と関連する 複数のテキストのペア 画像リジョンピボットパラフレーズ抽出 (“A snowboarder” = “A man on a snowboard”) 本研究 先行研究 単言語コーパス 分布類似度(noisy) (“boy” = “girl” “rise” = “fall”) 対訳コーパス (希少) En1: the overall employment and unemployment figures Ja1: 全体的な雇用者と失業 者数 En2: number of unemployed (not seasonally adjusted) Ja2: 失業者数(季節調整されていない) バイリンガルピボット (“unemployment figures”= “number of unemployed”) En1: young boys like playing soccer En2: this young girl plays piano every day En3: the horse rose on its hind legs En4: he fell down from a horse [Lin+ 2001 etc.] [Ganitkevitch+ 2013 etc.] 自然言語と画像理解 (画像キャプション生成、ビジュアル質問 応答、マルチモーダル機械翻訳等) 自然言語理解 (情報検索、質問応答、 機械翻訳、文章 要約、テキスト簡単化等) A boy in a red shirt sledding down a sand dune . “a sand dune” “a hill” = A child is sliding down a hill on a sled . 6. 実験結果と今後の課題 6.1 Flicker30kエンティティアライメントの結果 6.3 リジョンピボットの例 (ワードアライメントでは取れない例) 手法 適合率 再現率 F値 ワードアライメント 0.8330 0.5821 0.6853 リジョンピボット 0.8147 0.5283 0.6409 6.2 ワードアライメントの例 (リジョンピボットでは取れない例) 正しい例 間違った例 a group of men a group of people a man several people a motorcycle a motorbike gymnastics the air three men workers food the restaurant an asian woman a girl a table a drink the streets a busy street midair “a rock face” “a rock climbing wall” = “a brightly colored backdrop” “a colorful backdrop” = “the ocean” “a beach” = 6.4 今後の課題 エンティティ間とリジョンのジョイントアライメント エンティティ(名詞句)以外のパラフレーズの抽出と評価 WebやSNSなどのノイズが多いデータへの対応 YANS 2017, Naha, Sep. 4, 2017