テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

言語情報を利用したテキストマイニ ング 奈良先端科学技術大学院大学 情報科学研究科 工藤 拓 山本 薫 坪井 裕太 松本 裕治.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
システム開発におけるユーザ要求の 明示的表現に関する一検討
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
テキストデータベースからの 構文構造のマイニング
最大エントロピーモデルに基づく形態素解析と辞書による影響
人工知能特論 8.教師あり学習と教師なし学習
「わかりやすいパターン認識」 第1章:パターン認識とは
意味属性の共起による 「AのB」型名詞句の翻訳規則
国内線で新千歳空港を利用している航空会社はどこですか?
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
All Rights Reserved, Copyright (C) Donovan School of English
日本語教育における 発音指導の到達目標を考える
Verb てform + から、 After.
教育心理学 学習と認知プロセス 伊藤 崇 北海道大学大学院教育学研究院.
多々納 裕一 京都大学防災研究所社会システム研究分野
情報は人の行為に どのような影響を与えるか
自律学習と動機づけ 教育心理学の観点から 2011/2/19 上淵 寿 (東京学芸大学).
共起用例と名詞の出現パターンを用いた動作性名詞の項構造解析
動詞と格要素の共起と 名詞の出現パターンを用いた 事態性名詞の項構造解析
テキストマイニング, データマイニングと 社会活動のトレース
情報処理学会・経営情報学会 連続セミナー第3回 情報システム構築アプローチ 主旨
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
D. M. Rust and B. J. LaBonte 2005, ApJ, 622, L 年6月6日 太陽雑誌会(速報)
事態性名詞の項構造解析に向けた 述語項構造に関する資源の作成
重文・複文の基本文型に対する 文型パターン辞書のカバー率
日本語の自動詞・他動詞・受身 の選択(日韓ウ中比較)
第20回応用言語学講座公開講演会:文法化特集
形態素解析および係り受け解析・主語を判別
主格3形式と客格と「は」 -主語と客語- [1-2] 日本語構造伝達文法 この項は『日本語構造伝達文法(05版)』の
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
SS2009 形式手法の適用ワーキング グループの報告
リファクタリングのための 変更波及解析を利用した テスト支援ツールの提案
Lesson 22. 健康政策への応用 §C. リスク・マネージメント 疫学概論 リスク・マネージメント
日本語解析済みコーパス管理ツール 「茶器」
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
松岡葵・宮本ひかる・岩下千咲・村田葵・劉テイテイ
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
自然言語処理及び実習 第11回 形態素解析.
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
広瀬啓吉 研究室 4.音声認識における適応手法の開発 1.劣条件下での複数音源分離 5.音声認識のための韻律的特徴の利用
エージェントアプローチ人工知能 11章 プラニング
この項は 『日本語構造伝達文法(05版)』 の第30章,第31章の内容に基づいています。より詳しくはその章をお読みください。
ソースコードの特徴量を用いた機械学習による メソッド抽出リファクタリング推薦手法
2018/9/10 ACL読み会 名古屋大学大学院 M2 佐藤・松崎研 土居裕典.
Data Clustering: A Review
形態素解析ドライバモデルの実装と コーパスの品詞体系変換への応用
北陸先端科学技術大学院大学 中田豊久,金井秀明,國藤進
テキストマイニング, データマイニングと 社会活動のトレース
超大規模ウェブコーパスを用いた 分布類似度計算
より詳しく、より効果的に 相手に伝えよう.
Spatial Linker - 空間コンテンツ融合の研究 -
意味・談話解析勉強会 チュートリアル 小町守.
『組織の限界』 第1章 個人的合理性と社会的合理性 前半
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
経営学研究科 M1年 学籍番号 speedster
ブースティングとキーワードフィルタリング によるシステム要求検出
ヒューマン・インターフェースとしてのGIS —空間データ変換から地図表現へ—
構造的類似性を持つ半構造化文書における頻度分析
大規模コーパスに基づく同義語・多義語処理
述語論理式の構文と意味 一階述語論理式の構文 一階述語論理式の意味 述語,限量記号 自然言語文の述語論理式表現 解釈 妥当,充足不能
呂 雷寧 RO, Rainei (上海財経大学 外語学院・ 常勤講師)
イラストで学ぶ 音声認識 荒木雅弘 著 講談社 2015.
skill-net(MILESTONE CAI,笈川他,1982)[Fortranの課題選択など]
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
識別子の読解を目的とした名詞辞書の作成方法の一試案
アノテーションガイドラインの管理を行う アノテーションシステムの提案
1.2 言語処理の諸観点 (1)言語処理の利用分野
Elements of Style 第3回 2019年6月11日(火).
Presentation transcript:

テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に- 乾孝司 乾健太郎 松本裕治 奈良先端科学技術大学院大学 takash-i@is.aist-nara.ac.jp

概要(1分サマリー) よく晴れたため洗濯物が早く乾いた。 接続標識を含む文から 因果関係知識を獲得する 【目的】 接続標識を含む文から 因果関係知識を獲得する よく晴れたため洗濯物が早く乾いた。 cause (〈よく晴れる〉, 〈洗濯物が早く乾く〉)

【論点1】「ため」複文から獲得可能な因果関係には どのような種類があるか? 【論点1】「ため」複文から獲得可能な因果関係には       どのような種類があるか? 「ため」複文全体の約90%から、 cause, effect, precondition, means 関係の いずれかの事例が獲得できる。 【知見1】 【論点2】どの程度の精度と量の因果関係知識が       自動的に獲得できるのか? 約97%の精度で、新聞記事1年分から 約35,000件の因果事例が獲得できる見通し を得た。 【知見2】

目的 因果関係知識を テキストから 自動的に 獲得する 因果関係知識:推論の基盤/テキスト理解/プラン認識 テキスト:大量の電子化テキストの存在 自動的:人手獲得(例えばCYC)⇒拡張性の問題

因果関係知識の例 cause (〈地震が起こる〉,〈津波が発生する〉) effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 2002年5月14日 地震が起こったから津波が発生したのだ。 cause (〈地震が起こる〉,〈津波が発生する〉) 洗濯物を干したのに乾かなかった。 effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 事態の二項関係 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉, 〈切符を買う〉 ) inui@is.aist-nara.ac.jp

知識獲得の方針(接続標識が手掛かり) バングラディシュではマングローブを 破壊したため、大水害が発生した。 2002年5月14日 バングラディシュではマングローブを 破壊したため、大水害が発生した。 effect (〈バングラディシュでマングローブを破壊する〉,〈大水害が発生する〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉,〈切符を買う〉) Se use connective markers as linguistic clues. さまざまな標識が利用可 同じ標識で異なる因果関係をもつ事例が存在     ⇒獲得可能な因果関係ごとに文を分類する inui@is.aist-nara.ac.jp

因果関係の類型 類型基準:意志性 事態=(意志的行為|非意思的事態) 因果関係 言語テストの例 必要条件 (緩やかな)十分条件 Act 2002年5月14日 類型基準:意志性  事態=(意志的行為|非意思的事態) Act SOA 因果関係 言語テストの例 cause(SOA1,SOA2) SOA1が起こった結果としてSOA2が起こった。 effect(Act1,SOA2) Act1した結果、SOA2が起こる。 precond(SOA1,Act2) SOA1でないなら、Act2できない。 SOA1が成り立っている状況ではしばしば Act2する。 means(Act1,Act2) Act2を達成する手段としてAct1した。 enable(Act1,Act2) 主体X1がAct1すれば、主体X2がAct2できる。 One of the goal in discourse understanding is to recognize the intention behind each volitional action It is important to distinguish volitional actions from non-volitional states of affairs 必要条件 (緩やかな)十分条件 inui@is.aist-nara.ac.jp

【論点1】 ある接続標識(「ため」)を含む文から獲得可能な因果関係にはどのような種類があるか? 96% (220/229) 93% 従属節 主節 最頻の因果関係 SOA cause(SOAs,SOAm) 96% (220/229) Act effect(Acts,SOAm ) 93% (149/161) precond(SOAs,Actm ) 90% (202/225) means(Actm,Acts ) 85% (323/379) 「ため」複文全体の約90%から、 cause, effect, precond, means 関係のいずれかの事例が獲得できる。

ALT-J/E翻訳システム用辞書(NTT) 【論点2】 どの程度の精度と量の因果関係知識が 自動的に獲得できるのか? 機械学習アプローチ(Support Vector Machine) 素性 EDR概念辞書 ALT-J/E翻訳システム用辞書(NTT) 日本語語彙大系(NTT) 意志性 格 モダリティ means Precision cause 0.96 effect 約97%の精度で、 新聞記事1年分から 約35,000件の因果事例が 獲得できる見通しを得た。 precond 0.90 0.50 Recall

応用例:感情的テキスト理解 effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 太郎はパーティーを 楽しんだ 快 明示的 キーワードスポッティング 洗濯物を干したのに、乾いていなかった。 非明示 因果関係知識による推論 不快 期待されるゴール が成立しない effect (〈洗濯物を干す〉,〈洗濯物が乾く〉)

× 因果事例の項について 切符を買う ため 切符売り場へ行っ た means (〈切符売り場へ行く〉, 〈切符を買う〉 ) 切符を買う ため 切符売り場へ行っ た means (〈切符売り場へ行く〉, 〈切符を買う〉 ) × 自然言語で表現する(形式言語は用いない) モーダル情報は捨象される           ⇒文から文への変換⇒言い換え

修辞関係との比較 * cause (〈晴れる〉, 〈洗濯物が早く乾く〉) 本研究での因果関係は、修辞関係ではなく、 獲得 認識 CONTRAST REASON 晴れなかったのに 洗濯物が早く乾いた。 晴れたため 洗濯物が早く乾いた。 晴れたのに 洗濯物が早く乾いた。 * cause (〈晴れる〉, 〈洗濯物が早く乾く〉) 本研究での因果関係は、修辞関係ではなく、 その修辞関係を成り立たせる(より抽象度が高い)関係

因果関係知識の獲得に関する関連研究 資源 手掛かり コスト (自動化) 関係の 類型 ○ × ▲ ☆ [佐藤 他 1998] テキスト 接続標識 ○ × [Girju et al. 2002] Causative verb [Khoo et al. 2000] MED LINE 構文 パターン ▲ [Stork.1999] 人間 知識 ☆ [Lenat.1995] 専門家 本研究

(意志的行為|非意思的事態)の推定 文脈によって変動 機械学習アプローチ(Support Vector Machine) 主体(人,組織か否か) モダリティ(テンス) 変動要因 Accuracy 主節 従属節 0.97 Baseline:多数決戦略 (頻度ベース/文脈考慮なし) 0.95 0.90 0.812 Coverage

接続助詞の頻度分布[日本経済新聞1990年より] 周辺文脈 頻度 例文 連用-連用 42,577 晴れた ため 洗濯物がよく乾いた。 連用-連体 4,516 洗濯物を早く乾かす の道具です。 連体-連用 12,085 よい天気の 連体-連体 4,744 旅行者の の乾燥機 が 131,164 ため 76,087 と 56,549 (れ)ば 48,606 ながら 13,796 から 10,209 ので 9,994 なら  7,598 たら  6,027 のに 2,917

因果事例の派生操作 * * precond (〈ダンボールの需要が増える〉, 〈生産の拡大を決める〉 ) 要求する 実施する 狙う ・・・ * 一部の用言 を含む因果事例はそこから 新たな因果事例を生成できる           ⇒データスパースネス対策 *

分類に利用する素性 用言(動詞) *1 主体 *2 格 モダリティ EDR 概念辞書 “移動”or “行為” “状態”or “変化” or “現象” ALT-J/E翻訳システム用 辞書 “状態動詞” “継続動詞” “瞬間動詞” “自動詞” “他動詞” “補助動詞” “可能動詞” “自発動詞” “使役動詞” “受身” “受身(被害)” 日本語 語彙大系 用言意味属性 主体 *2 有情主体(人や組織)かどうか 格 ガ格,ヲ格の有無 格要素(日本語語彙大系で抽象化) モダリティ ル形/タ形, テイル形, レル形, セル形, デキル形, ナイ形 *1:エントリのない動詞については人手で付与 *2:人手で付与