Presentation is loading. Please wait.

Presentation is loading. Please wait.

テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-

Similar presentations


Presentation on theme: "テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-"— Presentation transcript:

1 テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-
乾孝司 乾健太郎 松本裕治 奈良先端科学技術大学院大学

2 概要(1分サマリー) よく晴れたため洗濯物が早く乾いた。 接続標識を含む文から 因果関係知識を獲得する
【目的】 接続標識を含む文から 因果関係知識を獲得する よく晴れたため洗濯物が早く乾いた。 cause (〈よく晴れる〉, 〈洗濯物が早く乾く〉)

3 【論点1】「ため」複文から獲得可能な因果関係には どのような種類があるか?
【論点1】「ため」複文から獲得可能な因果関係には       どのような種類があるか? 「ため」複文全体の約90%から、 cause, effect, precondition, means 関係の いずれかの事例が獲得できる。 【知見1】 【論点2】どの程度の精度と量の因果関係知識が       自動的に獲得できるのか? 約97%の精度で、新聞記事1年分から 約35,000件の因果事例が獲得できる見通し を得た。 【知見2】

4 目的 因果関係知識を テキストから 自動的に 獲得する 因果関係知識:推論の基盤/テキスト理解/プラン認識
テキスト:大量の電子化テキストの存在 自動的:人手獲得(例えばCYC)⇒拡張性の問題

5 因果関係知識の例 cause (〈地震が起こる〉,〈津波が発生する〉) effect (〈洗濯物を干す〉,〈洗濯物が乾く〉)
2002年5月14日 地震が起こったから津波が発生したのだ。 cause (〈地震が起こる〉,〈津波が発生する〉) 洗濯物を干したのに乾かなかった。 effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 事態の二項関係 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉, 〈切符を買う〉 )

6 知識獲得の方針(接続標識が手掛かり) バングラディシュではマングローブを 破壊したため、大水害が発生した。
2002年5月14日 バングラディシュではマングローブを 破壊したため、大水害が発生した。 effect (〈バングラディシュでマングローブを破壊する〉,〈大水害が発生する〉) 本棚が一杯になったので蔵書を捨てる。 precond (〈本棚が一杯になる〉,〈蔵書を捨てる〉) 切符を買うため切符売り場へ行った。 means (〈切符売り場へ行く〉,〈切符を買う〉) Se use connective markers as linguistic clues. さまざまな標識が利用可 同じ標識で異なる因果関係をもつ事例が存在     ⇒獲得可能な因果関係ごとに文を分類する

7 因果関係の類型 類型基準:意志性 事態=(意志的行為|非意思的事態) 因果関係 言語テストの例 必要条件 (緩やかな)十分条件 Act
2002年5月14日 類型基準:意志性  事態=(意志的行為|非意思的事態) Act SOA 因果関係 言語テストの例 cause(SOA1,SOA2) SOA1が起こった結果としてSOA2が起こった。 effect(Act1,SOA2) Act1した結果、SOA2が起こる。 precond(SOA1,Act2) SOA1でないなら、Act2できない。 SOA1が成り立っている状況ではしばしば Act2する。 means(Act1,Act2) Act2を達成する手段としてAct1した。 enable(Act1,Act2) 主体X1がAct1すれば、主体X2がAct2できる。 One of the goal in discourse understanding is to recognize the intention behind each volitional action It is important to distinguish volitional actions from non-volitional states of affairs 必要条件 (緩やかな)十分条件

8 【論点1】 ある接続標識(「ため」)を含む文から獲得可能な因果関係にはどのような種類があるか? 96% (220/229) 93%
従属節 主節 最頻の因果関係 SOA cause(SOAs,SOAm) 96% (220/229) Act effect(Acts,SOAm ) 93% (149/161) precond(SOAs,Actm ) 90% (202/225) means(Actm,Acts ) 85% (323/379) 「ため」複文全体の約90%から、 cause, effect, precond, means 関係のいずれかの事例が獲得できる。

9 ALT-J/E翻訳システム用辞書(NTT)
【論点2】 どの程度の精度と量の因果関係知識が 自動的に獲得できるのか? 機械学習アプローチ(Support Vector Machine) 素性 EDR概念辞書 ALT-J/E翻訳システム用辞書(NTT) 日本語語彙大系(NTT) 意志性 モダリティ means Precision cause 0.96 effect 約97%の精度で、 新聞記事1年分から 約35,000件の因果事例が 獲得できる見通しを得た。 precond 0.90 0.50 Recall

10 応用例:感情的テキスト理解 effect (〈洗濯物を干す〉,〈洗濯物が乾く〉) 太郎はパーティーを 楽しんだ
明示的 キーワードスポッティング 洗濯物を干したのに、乾いていなかった。 非明示 因果関係知識による推論 不快 期待されるゴール が成立しない effect (〈洗濯物を干す〉,〈洗濯物が乾く〉)

11 × 因果事例の項について 切符を買う ため 切符売り場へ行っ た means (〈切符売り場へ行く〉, 〈切符を買う〉 )
切符を買う ため 切符売り場へ行っ た means (〈切符売り場へ行く〉, 〈切符を買う〉 ) × 自然言語で表現する(形式言語は用いない) モーダル情報は捨象される           ⇒文から文への変換⇒言い換え

12 修辞関係との比較 * cause (〈晴れる〉, 〈洗濯物が早く乾く〉) 本研究での因果関係は、修辞関係ではなく、
獲得 認識 CONTRAST REASON 晴れなかったのに 洗濯物が早く乾いた。 晴れたため 洗濯物が早く乾いた。 晴れたのに 洗濯物が早く乾いた。 cause (〈晴れる〉, 〈洗濯物が早く乾く〉) 本研究での因果関係は、修辞関係ではなく、 その修辞関係を成り立たせる(より抽象度が高い)関係

13 因果関係知識の獲得に関する関連研究 資源 手掛かり コスト (自動化) 関係の 類型 ○ × ▲ ☆ [佐藤 他 1998] テキスト
接続標識 × [Girju et al. 2002] Causative verb [Khoo et al. 2000] MED LINE 構文 パターン [Stork.1999] 人間 知識 [Lenat.1995] 専門家 本研究

14 (意志的行為|非意思的事態)の推定 文脈によって変動 機械学習アプローチ(Support Vector Machine)
主体(人,組織か否か) モダリティ(テンス) 変動要因 Accuracy 主節 従属節 0.97 Baseline:多数決戦略 (頻度ベース/文脈考慮なし) 0.95 0.90 0.812 Coverage

15 接続助詞の頻度分布[日本経済新聞1990年より]
周辺文脈 頻度 例文 連用-連用 42,577 晴れた ため 洗濯物がよく乾いた。 連用-連体 4,516 洗濯物を早く乾かす の道具です。 連体-連用 12,085 よい天気の 連体-連体 4,744 旅行者の の乾燥機 131,164 ため 76,087 56,549 (れ)ば 48,606 ながら 13,796 から 10,209 ので 9,994 なら  7,598 たら  6,027 のに 2,917

16 因果事例の派生操作 * * precond (〈ダンボールの需要が増える〉, 〈生産の拡大を決める〉 )
要求する 実施する 狙う ・・・ 一部の用言 を含む因果事例はそこから 新たな因果事例を生成できる           ⇒データスパースネス対策

17 分類に利用する素性 用言(動詞) *1 主体 *2 格 モダリティ EDR 概念辞書 “移動”or “行為”
“状態”or “変化” or “現象” ALT-J/E翻訳システム用 辞書 “状態動詞” “継続動詞” “瞬間動詞” “自動詞” “他動詞” “補助動詞” “可能動詞” “自発動詞” “使役動詞” “受身” “受身(被害)” 日本語 語彙大系 用言意味属性 主体 *2 有情主体(人や組織)かどうか ガ格,ヲ格の有無 格要素(日本語語彙大系で抽象化) モダリティ ル形/タ形, テイル形, レル形, セル形, デキル形, ナイ形 *1:エントリのない動詞については人手で付与 *2:人手で付与


Download ppt "テキストから獲得可能な因果関係知識の類別 およびその自動獲得の試み -接続助詞「ため」を含む文を中心に-"

Similar presentations


Ads by Google