第62回言語・音声理解と対話処理研究会 統語論に基づく新しい意味理論の提案 上山あゆみ(九州大学)

Slides:



Advertisements
Similar presentations
キー・コンピテンシーと生きる 力 キー・コンピテンシー – 社会・文化的,技術的道具を相互作用的に活用する力 – 自律的に行動する力 – 社会的に異質な集団で交流する力 生きる力 – 基礎・基本を確実に身に付け,いかに社会が変化しようと, 自ら課題を見つけ,自ら学び,自ら考え, 主体的に判断 し,行動し,よりよく問題を解決する資質や能力.
Advertisements

バランス理論と固有値分解 小杉考司(関西学院大学) 藤澤隆史(関西大学) ソシオン理論の 三者関係における仮定  四種類の転移と三種類の推移 バランス理論をもとにした「推移性」の考え方.
適切な語を用いる. 元の文章 メールは文書が全てなので御座いまして、 メイルで何かを依頼する場合には、其れ の内容を文で明晰に書く事が貴重なので 有るから「其れ以上詳細に記帳せずとも、 受信者は必ずや内容を考察してくれるに 違いない」と判断して居ると予定外の娯 解を産む事が有るから注意する事が必修。
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
ひでき 平成17年4月12日 「日本教」モデルを ネットワーク分析する ひでき 平成17年4月12日.
小樽観光アンケートの分析について まず、基本情報について
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
メンタルレキシコンの学習:子どもはどのように単語の 意味を学習するか
レポートの作成 効果的な発表の仕方.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
仮説の立て方、RQの絞り方 論文を考える根本的思考 担当・柴田真吾
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
アルゴリズムとデータ構造1 2007年6月12日
言語体系とコンピュータ 第6回.
明示的知識とコミュニケーション能力: 文法指導の意義と位置づけに関する提案
日本語統語論:構造構築と意味 No.1 統語論とは
情報は人の行為に どのような影響を与えるか
演習3 最終発表 情報科学科4年 山崎孝裕.
情報とコンピュータ 静岡大学工学部 安藤和敏
ユースケース図 FM12012 比嘉久登.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
ジャーナリズム論 第7回 事実と真実 担当:野原仁.
●レポートを書くこと→主張の根拠を示して、他の人を説得するため ●最初から順に読んで分かるように書く ●
MFI Ontology registration Ed2 Evolution management について
日本語統語論:構造構築と意味 No.3 項と格助詞(改訂版)
形態素解析および係り受け解析・主語を判別
ユースケース図2-4~ FM11012 中島拓也.
CSP記述によるモデル設計と ツールによる検証
日本語統語論:構造構築と意味 No.2 構造と意味解釈
個体記述型・事態記述型・理由供給型の違いについて
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
理論試験速報 理論問題部会長 鈴木 亨 先生 (筑波大学附属高等学校) にインタビュー.
上山あゆみ(九州大学) 統語意味論:構造と意味の対応とズレ 上山あゆみ(九州大学)
統語意味論:認知科学としての統語論の提案
言語処理学会第15回年次大会チュートリアル 生成文法の考え方と検証の方法 上山あゆみ(九州大学)
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
上山あゆみ(九州大学) 生成文法と意味理解 上山あゆみ(九州大学)
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
上山あゆみ(九州大学) 統語構造と意味解釈:統語意味論の提案 上山あゆみ(九州大学)
この項は 『日本語構造伝達文法(05版)』 の第30章,第31章の内容に基づいています。より詳しくはその章をお読みください。
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
上山あゆみ(九州大学) 2011年度前期水曜日2限 理論言語学特論 I これまでのまとめ 上山あゆみ(九州大学)
日本語統語論:構造構築と意味 No.8 連体修飾
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
日本の高校における英語の授業は 英語がベストか?
東京工科大学 コンピュータサイエンス学部 亀田弘之
コンパイラ 2011年10月20日
 型推論3(MLの多相型).
ダスキン サービスマスターの仕事 清潔で快適な環境づくりのお手伝い! 業務向け もっと たくさんある
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
演習1に関する講評 ~ 業務仕様を書く難しさ ~
第Ⅱ部 協力ゲームの理論 第14章 交渉集合.
東京工科大学 コンピュータサイエンス学部 亀田弘之
第7回  命題論理.
明示的文法知識が 正確な言語使用に結びつかないケース 浦野 研(北海学園大学)
本当は消去できていない!? ~データを完全消去する方法~
本当は消去できていない!? ~データを完全消去する方法~
プログラミング言語論 第10回 情報工学科 篠埜 功.
自然言語処理2015 Natural Language Processing 2015
呂 雷寧 RO, Rainei (上海財経大学 外語学院・ 常勤講師)
4.プッシュダウンオートマトンと 文脈自由文法の等価性
コンパイラ 2012年10月11日
第2回実務者会議の議論を受けた検討 資料14 1 第2回実務者会議での議論の概要 (○:有識者意見、●:関係府省意見) 1
自然言語処理2016 Natural Language Processing 2016
テクニカル・ライティング 第4回 ~文章の設計法「KJ法」について~.
Presentation transcript:

上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp 第62回言語・音声理解と対話処理研究会 統語論に基づく新しい意味理論の提案 上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp 私自身としては、人間がことばを理解するというのはどういうことか、いったい言葉を用いて何をどうしているのか、ということが知りたくて言語学をやっていますが、今回話させていただく研究については、それだけでなく、自然言語解析のための基礎研究になればいいなあという希望も持っています。

生成文法のモデル Numeration (いくつかの 単語の集合) Computational System LF (Logical Form: 単語を構造化 した、意味関連の表示) Numeration (いくつかの 単語の集合) PF(Phonological Form: 単語を構造化した、音関連の表示)  生成文法では、統語論が自律的であるという考え方のもと、意味解釈というものは、統語論によって組み立てられた構造表示を解釈して行われると想定している。ところが、生成文法は、独自の意味論を持ったことがなく、その意味解釈の仕組みは、明示的に述べられてこなかった。もちろん、実際の言語分析においては、意味の記述が必要とされる場合もあるため、研究者は、それぞれ既成の形式意味論を流用するしかなかったのである。しかし、現在主流の形式意味論では、様々な局面において、非常に不自然な仮定を強いられることが多い。そこで、統語論との対応を意識して、一から作ってみた体系の一部を紹介したい。まだβ版の段階であるが、「伝達」「認知」という側面において主流の形式意味論と異なるアプローチをしている可能性があると考えている。  まず、従来の形式意味論を言語の意味論とみなすにあたって最も大きな弊害となってきたのが、真理条件しか文の意味として認めないとする仮定であったと思う。もちろん、文の意味が真理条件とみなせる場合もあるが、ことばそのものの意味は、真理条件に満たない場合もあれば、真理条件以上のことを述べている場合もある。そういう場合にも適応できる形での意味表示を用いて、文の意味を考察していかないと、単語とその機能の対応を正確に追究することができないからである。そのためにも、まず、私たちの頭の中にある世界知識のモデルをたてておく。

世界知識 Information Database  世界知識 Information Database 具体的なモノ/コト(オブジェクト)が、指標番号で区別され、次のような形式で、その性質とともに記憶されている On:attribute1=value1, attribute2=value2, attribute3=value3,... X19:名称=ジョン, 類=大学生, 年齢=20, ... X225:名称=渡辺くん, ... E65:名称=北京オリンピック, 開催年=2008年, 開催国=中国, ... E923:名称=○○海岸OL殺人事件, 犯人= X45, 被害者= X225, ... E82:類=落とす, 落下物=X53, 行為者=X19,...  脳内に、具体的なモノ/コト(オブジェクト)が、その性質とともに記憶されているという仮定は何らかの形で必要であろう。ここでは、そのデータベースをInformation Databaseと呼ぶことにする。1つ1つのオブジェクトは、以下では、指標番号つきの「O」で表すこととし、同じオブジェクトであると認識していれば同じ指標番号を、異なるオブジェクトであると認識していれば異なる指標番号を持っていると想定する。各エントリーは(1)のような形式になっていると考える。 (1) On:attribute1=value1, attribute2=value2, attribute3=value3, ... オブジェクトには、いくつかの下位分類がありうるが、少なくとも、モノ(individual)とコト(eventuality)の区別はあっていいだろう。以下、モノはXnで、コトはEnで表わすことにする。 (2) a. X19:名称=ジョン, 類=大学生, 年齢=20, ... b. X225:名称=渡辺くん, ... (3) a. E65:名称=北京オリンピック, 開催年=2008年, 場所=中国・北京, ... b. E923:名称=○○海岸OL殺人事件, 犯人=xxxxx, 被害者=yyyyy, 刑事=zzzzz, ... c. E82:類=落とす, 落下物=X53, 行為者=X19,... このように考えると、モノもコトも、項目名(attribute)が異なるだけで、同じ形式でとらえることができる。(3a,b)のようにEn全体に命名することもあるが、多くの場合、私たちは、いろいろなコトのあり方をパターン化して認識している。動詞は、いわば、そのパターンを記述したものであり、類というattributeのvalueに相当する表現であると考えてもいいであろう。さらに、Enを認識する場合、そのコトにどのような役割(role)をもつ参与者(participant)が関わっているか、ということも重要である。その役割がattributeであり、参与者がそのvalueとなる。  以下では、(2)-(3)のそれぞれの項目をObject Informationと呼ぶことにする。 Object Informationとは、いわば、具体的な世界知識である。

(Semantic Representation)  言語と世界知識の接点 Computational System LF Numeration PF Lexicon Working Space SR (Semantic Representation) Information Database Inference rules  コミュニケーションにおいては、私たちは、お互いの持つObject Informationを披露しあって、情報を増やしたり、修正したりしたい場合が多々ある。しかし、お互いのObject Informationを直接見せ合うことができない以上、別の手段を用いるしかない。言語は、その目的にかなう手段の1つである。 この作業は、言語をObject Informationと比較対照可能な式に変換しないとできないはずなので、統語論の出力であるLF表示は、何らかのモジュールでObject Informationと比較対照可能な式に変換されると考えたい。

言語と世界知識 John kissed Mary. どのようにして、これらが結びつくのか? X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... たとえば、「John kissed Mary」という文があった場合、 このような世界知識と結び付けられれば、「意味がわかった」ということになるかもしれない。 問題は、この2つがどのようにして結びつくのか、ということである。特に、発話ではなく文理解のことを考えると、Information Database の中の通し番号が初めからわかっているとは考えがたい。文の意味がわかったあとで、何のことを言っているかが結びつくことは、いくらでもあるからである。

SR (Semantic Representation) John1 kissed2 Mary3 変換 o1: ... John ... o2: ... Mary ... o3: ... kissed ... 知識内の検索と同定 X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... そこで、「John kissed Mary」という文は、まず、仮番号を持っており、 それが、いったんこのように、各単語の情報を含んだSRに変換され、それがキーとなって、知識内の検索が行われて、言語と世界知識とのつながりが生まれると考えたい。問題は、今、ほとんど省略した形であらわした SRがどのような表示であり、それが言語構造とどのような対応をしているかということである。

SR (Semantic Representation) John1 kissed2 Mary3 変換 o1: ... John ... o2: ... Mary ... o3: ... kissed ... x1: 名称=John x2: 名称=Mary e3: 類=kissed, Patient=x2, Agent=x1 linguistic SR 知識内の検索と同定 X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... たとえば、「John」や「Mary」というのが固有名詞であり、つまり、名称のvalueになるものであるということは、言語の知識の一部である。私たちは、何か新しい単語に出会ったとき、それが固有名詞なのか、それともその種のもののカバータームなのかが気になる。すなわち、単語を習得する際のその違いを登録する必要があるということである。したがって、世界知識と結合される前の段階のSRに、 ここまで情報が入っていたとしても不思議ない。このSRを導くことができるということが、狭義の意味で、私たちがこの文を理解したということであり、これを手がかりにして、知識とのつながりができれば、広義の意味で、理解が完了したことになる。

語彙の「意味」と構造の「意味」 「John1 Mary2 Alaska3 go4」 変換 x1: 名称=John x2: 名称=Mary x3: 名称=Alaska e4: 類=go, Goal=_, Agent=_ 知識内の検索と同定 X11: ... 名称=John, ... X204: ... 名称=Mary, ... X4743: ... 名称=Alaska, ... E61: ... 類=go, ... このように、それぞれの単語が1つずつキーとなって関連情報を探しに行くとしたら、「John Mary Alaska go」のような、まったく文としての形を成していないものであっても、検索そのものは行われうるであろうし、勘が良ければ、それで「正解」にたどりつかないとも限らない。しかし、当然、単語の羅列と、ちゃんとした文とでは、そこから意味を読み取ろうとする作業にかかるストレスの量が明らかに異なっている。 つまり、SR式は、それぞれの語彙の知識があれば、ある程度、作れるが、それに加えて、その言語の文法の知識があることによって、SR式の情報がより豊かになり、Information Databaseとの照合作業が正確に、効率よく、行いやすくなる。その言語の知識というものは、そのようなものであると、私は考えている。 本発表では、まず、語彙の知識によって、SR式に4つのタイプが区別されること、そして、その区別を仮定すると、形式と意味の対応を非常に体系的に把握することができるということを修飾関係にしぼって示したい。 では、これから、その4つの型のSR式について順に説明していく。

xn型のSR式を導入しうる表現 John1 あのOL3 その4人11 X19: 名称=John, 類=大学生, 年齢=20, ... x3: 類=OL x11: 人数=4人 知識内の検索 知識内の検索 知識内の検索 x1 = X19 x3 = X22 x11 = X105 X19: 名称=John, 類=大学生, 年齢=20, ... X22: 名称=Mary, 類=OL, 年齢=24, ... X105: 名称=ビートルズ, 人数=4人, ... まず、Information Database 中のモノに対応する可能性のあるSR式として、xn型のSR式がある。典型的なものとしては、モノを表す固有名詞とモノの類を表す名詞であるが、原則的には、モノの何らかのattributeのvalueを表しうる名詞ならば、 xn型のSR式を導入しうると思っている。単に、相手に通じやすいかどうか、という違いがあるだけである。

同定(Identification) 同定そのものは、言語のシステムの外の操作 であるが、表現によっては、即時の同定を要求するものがある。 B1: (その事実を知らない)へえ、そう。 B2: (そのジョンを知らない)え、ジョンって? 情報量の問題ではない。 (8) A:ジョンっていうやつがメアリを推薦したんだって。 B:へえ、そう。 (9) A: 誰かがメアリを推薦したんだって。 B: へえ、そう。 もちろん、同定可能なオブジェクトの候補がいくつも見つかる場合もあるだろう。その場合、私たちがどのようにして1つのオブジェクトを選択しているのかは、言語のシステムが関わっている問題ではない。(4)における同定が、発話者の意図に沿ったものであるかどうかは知るよしもないが、同定が起こったことで、聞き手としては、この表現と(2)の知識が結びつき、「理解」ができたことになる。  このように、同定そのものは、言語外の操作であるが、だからといって、言語が無関係なわけではない。表現によって、即時の同定が義務づけられるものがあるのである。 (7) A: ジョンがメアリを推薦したんだって。 B1: (その事実を知らない)へえ、そう。 B2: (そのジョンを知らない)え、ジョンって? (7-B1)では、Bは特に気にせず、新しく得たコトの情報を受容している。これに対して、(7-B2)の場合、Bは、新しいコトの情報を受容しようとはせず、まず、「ジョン」を同定するための、さらなる情報を要求している。コトの参与者が同定されず情報が足りない場合に常にこのようなことが起こるわけではない。表現の持つ情報量は、(7A)と(8)でほぼ同じであり、また、(9)の場合には(7A)よりも情報が少ないにも関わらず、どちらの場合にも、必ずしも情報要求が起きるとは限らないのである。(8B)でも(9B)でも、行為者というattributeのvalueが不明なまま、そのコトの情報を受容している。 (8) A: ジョンっていうやつがメアリを推薦したんだって。 B: へえ、そう。 (9) A: 誰かがメアリを推薦したんだって。 このように、固有名詞というものは、即時の同定を求める指令(instruction)を持った語彙であり、普通名詞は通常、そのような指令を持たない。そして、(8)の「~という~」は、固有名詞の持つ指令を打ち消す働きを持つ表現なのである。もちろん、同定可能なオブジェクトの候補がいくつも見つかる場合もあるだろう。その場合、私たちがどのようにして1つのオブジェクトを選択しているのかは、言語のシステムが関わっている問題ではない。(4)における同定が、発話者の意図に沿ったものであるかどうかは知るよしもないが、同定が起こったことで、聞き手としては、この表現と(2)の知識が結びつき、「理解」ができたことになる。 このように、固有名詞というものは、即時の同定を求める指令(instruction)を持った語彙であり、普通名詞は通常、そのような指令を持たない。そして、(8)の「~という~」は、固有名詞の持つ指令を打ち消す働きを持つ表現なのである。  ここでは詳細を説明することができないが、語彙には、(10)の4つのタイプがある。 (10) a. 即時の同定を求めるもの b. モノとの同定が可能なもの c. コトとの同定が可能なもの d. オブジェクトと同定されてはならないもの これまでは、指示性(referentiality)という概念が言及されながら、それが(10)のどれを指すのかが曖昧なまま議論が進むことが多かった。同定という操作を明示的に仮定することによって、その混乱を整理することができる。

en型のSR式を導入しうる表現 北京五輪2 落ちた1(Theme) E65: 名称=北京五輪, 開催年=2008年, ... 落とした38(Theme, Agent) SR式 SR式 SR式 e2:名称=北京五輪 e1:類=落ちた, Theme=_ e38:類=落とした, Theme=_, Agent=_ 知識内の検索 知識内の検索 知識内の検索 e2 = E65 e1 = E22 e38 = ?? E65: 名称=北京五輪, 開催年=2008年, ... E22: 類=落ちた, Theme=X24, ... E8825:類=落とした, Theme=_, Agent=_...  モノではなくコトに対応する表現も基本的に同じである。ただし、たとえば「落ちる/落とす」は、「類」としては似たようなコトでありながら、どのような参与者が関わっているかという認識が異なっている。参与者についての指定というものは、人間の認識を反映したものではあるものの、その指定が言語表現と結びついているという点で、言語の問題であり、その指定は、Lexiconに書かれていなければならない。ある語がどのような役割の参与者を持っているかという指定は、しばしば、その語のargument structure(項構造)と呼ばれる。たとえば、次のようにSR式が導かれ、もし、Information Databaseの中の知識と同定されれば、さらに、それぞれの役割の空欄が補填される場合もありうる。 (11)統語論落ちた1(Theme)SR式e1:類=落ちた, Theme=_value同定後e1:類=落ちた, Theme=X73 (12)統語論落とした2(Theme, Agent)SR式e2:類=落とした, Theme=_, Agent=_value同定後e2:類=落とした, Theme=X35, Agent=X90

attributeを示してvalueを指す表現 「彼女の年齢をこの欄に書いてください。」 =欄に「25」と書く 「彼女の名前をこの欄に書いてください。」 =欄に「陽子」と書く 「犯人を連れてきてください。」 =その事件の犯人である人物を連れてくる 言語表現が指すものは、常にモノやコトであるとは限らない。たとえば、このように、attribute を示して、そのvalueを指す表現が多々ある。

vn型のSR式 value :attribute (object) X19:名称=John, 類=大学生, 年齢=20, ... X22:名称=Mary, 類=OL, 年齢=24, ... E614:類=kissed, Patient = X22, Agent= X19, ... E614 : Patient = X22 E614 Patient X22 X22 : Patient(E614) vn型のSR式 value :attribute (object) John :名称(X19) 大学生 : 類(X19) 20 : 年齢(X19) そこで、xn型、en型のSR式に加えて、次のような vn型のSR式を定義する。

vn型のSR式を導入しうる表現 犯人4 目標1 年齢2 X19: 名称=John, 類=大学生, 年齢=20, ... オブジェクトの同定 オブジェクトの同定 オブジェクトの同定 v2 : 年齢(X19) v4 : 犯人(E246) v1 : 目標(X19) 知識内の検索 知識内の検索 知識内の検索 v4 = X22 v2 =20 v1 = E205 vn型のSR式を導入しうる表現は、これまでのものとは異なり、それ自身が attribute に相当する表現である。 関わるオブジェクトは、モノである場合もコトである場合もありうる。  この種の表現の場合、その犯人が誰なのかということがわからないままでも会話を進めることは可能であるが、どのコトが問題になっているのかということがわからないと、通常は、情報処理が進まない。 (89) A: このボタンは、おそらく犯人が落として行ったものだろう。 B: え、何か事件でもあったんですか。 X19: 名称=John, 類=大学生, 年齢=20, ... E246: 名称=○○殺人事件, 犯人=X22, ...

attributeを表すが、 valueだけを指しているわけではない表現 「彼女の年齢にはびっくりした。」 ≠「25才にびっくりした」 =「彼女が25才であるということにびっくりした。」 「名前は関係ない。」 ≠「陽子は関係ない」 =「名前が何であるかは関係ない。」 「犯人は知りません。」 ≠「X22は知りません」 =「犯人が誰なのか、知りません」 さらに、このようなシステマティックな多義性が見られる。

an :attribute(object)=value an型のSR式 X19:名称=John, 類=大学生, 年齢=20, ... X22:名称=Mary, 類=OL, 年齢=24, ... E614:類=kissed, Patient = X22, Agent= X19, ... E614 : Patient = X22 E614 Patient X22 a1: Patient(E614)= X22 a2:名称(X19)=John a3:類(X19)=大学生 a4:年齢(X19)=20 an型のSR式 an :attribute(object)=value そこで、xn型、en型のSR式に加えて、次のような vn型のSR式を定義する。

an型のSR式を導入しうる表現 犯人4 黄色い1 年齢2 X19: 名称=John, 類=大学生, 年齢=20, ... オブジェクトの同定 オブジェクトの同定 オブジェクトの同定 a2:年齢(X19)=_ a4:犯人(E246)=_ a1:色(X79)=黄色い 知識内の検索 知識内の検索 知識内の検索 a2:年齢(X19)=20 a4:犯人(E246)=X22 a1:色(X79)=黄色い 本当は、an型のSR式を導入できる表現はほかにもいろいろあるけれども、それは次の話を見た上で最後にまとめる。 X19: 名称=John, 類=大学生, 年齢=20, ... E246: 名称=○○殺人事件, 犯人=X22, ... X79:色=黄色い,...

SR式を導くために知らねばならない語彙の知識 en: attribute = value (その表現はvalueに対応する) このattributeは? 他に指定されたattribute(=いわゆる「項構造」)は? xn: attribute = value (その表現はvalueに対応する) vn: attribute(object) (その表現はattributeに対応する) an: attribute(object)=value その表現がvalueに対応する場合、そのattributeは? その表現がattributeに対応する場合もありうる。 とにかく、ここまでが語彙としての知識に基づく意味論の話。つまり、ある語彙の意味がわかるためには、少なくとも、これだけのことがわかっている必要がある。 逆に言えば、単語の意味だけがわかっていれば、文法がわかっていなくとも、知っている話ならば大体の見当がつく。適当に同定をしていけば、自分のInformation Databaseの中の情報がつながっているからである。しかし、もちろんのことながら、自分が知らない話の場合には、それではお手上げになる。文法がわかっている場合、SR式はバラバラの単語の状態よりも情報が豊かであり、だからこそ、私たちは、自分の知らない内容をことばを通じて知ることができるのである。 ただ、今日は、時間がないので、その syntax の話ができない。最も単純な modification の話だけしておく。

構造の違いによる意味の違い x2:類=ギター, 色=白い x3:類=箱 白い1 ギター2の 箱3 (a) a1:色( )=白い x2:類=ギター x3:類=箱 白い1 ギター2の 箱3 (b) よく知られているように、(a)と(b)の意味の違いは構造の違い、言い換えれば、「何が何に係っているか」という関係の違いから来るものである。 各語彙のSR式だけならば、このようになるところだが、 本来、(a)ならば、たとえば、こういうSRになってほしいところだし、 (b)ならば、たとえば、こういうSRになってほしいところである。どのように考えればいいだろうか。 x2:類=ギター x3:類=箱, 色=白い

修飾のSRとアブダクション 「関連している」とは? ○1: ... α ... ○2: ... β ... |○1 α1 β2 ○1: ... α ... ○2: ... β ... |○1 ○1は○2に「関連している」 「関連している」とは? [推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok [推論4 <symmetry>] α:... |β  ⇒ β:... |α [推論5 <transitivity>] α:... |β かつ、β:... |γ  ⇒ α:... |γ ここで提案したいのは、「αがβに係っている」構造は、SR式において、その主要部のほうに、何が係っているかという情報だけを加える、という分析である。 もちろん、「関連している」というだけでは、わからないので、その「関連している」という概念を定義する必要がある。そこで、次のような5つの推論規則で、この「関連している」という概念を定義する。つまり、linguistic SR では、この推論規則の出力の形が提示されるのであるから、言語使用者は、アブダクションによって、その出力を出した元の前提を割り出す作業をしなければならない。「関連している」関係を生み出す式には、いろいろな可能性があるので、答えが一通りに決まるわけではない。かくのごとく、言語理解というものは、原理的な不確定性を持っている。ただし、ここでアブダクションと呼んでいるものは、単なる「ひらめき/思いつき」という意味ではない。ちゃんと推論規則での定義があった上でのアブダクションであるから、そこは、必ずしも、まったくのむちゃくちゃではない。特に、統語論からSR式への変換は、ごく機械的に行えることであり、その結果、論理的に、意味解釈の範囲は、かなりの程度、しぼられている。残された範囲の中で、アブダクションが起こるだけであり、その起こり方も、このように少数の推論規則によって、はっきり定められているのである。

修飾関係 1 「|」を解くためのアブダクション linguistic SR a1:産地( )=フロリダx2:類=オレンジ |a1 修飾関係 1 a1:産地( )=フロリダx2:類=オレンジ |a1 linguistic SR フロリダ産1の オレンジ2 「|」を解くためのアブダクション a1:産地(x2)=フロリダ   と仮定すると、 [推論1] より、  x2:.... | a1     が導出されるので、                  この仮定は適切。 ∴ x2:類=オレンジ,産地=フロリダ たとえば、「フロリダ産のオレンジ」の場合には、こうなる。 結果的に、アブダクションを解いた仮定が、私たちにとって「理解された意味」ということになる。 [推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak

修飾関係 2 linguistic SR x1:類=高校生 v2:子供( ) |x1 高校生1の 子供2 v2:子供(x1) と仮定すると、 修飾関係 2 x1:類=高校生 v2:子供( ) |x1 linguistic SR 高校生1の 子供2 v2:子供(x1)           と仮定すると、 x1:類=高校生, 子供=v2  となり、 [推論2]とsymmetry により、 v2: ... |x1  が導出されるので、                  この仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論4 <symmetry>] α:... |β  ⇒ β:... |α

修飾関係 3 linguistic SR e1:類=落ちた, Theme=_ x2:類=おもり|e1 落ちた1 おもり2 修飾関係 3 e1:類=落ちた, Theme=_ x2:類=おもり|e1 linguistic SR 落ちた1 おもり2 e1:類=落ちた, Theme=x2 と仮定すると、 [推論2]とsymmetry により、 x2: ... |e1  が導出されるので、                  この仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論4 <symmetry>] α:... |β  ⇒ β:... |α

修飾関係 4 linguistic SR e1:類=落ちた, Theme=_ x2:類=おもり|e1 落ちた1 おもり2 修飾関係 4 e1:類=落ちた, Theme=_ x2:類=おもり|e1 linguistic SR 落ちた1 おもり2 e3:... _=e1, _=x2, ...  と仮定すると、 (たとえば、その「おもり」が何かの「落下」を引き起こしたような場合を仮定すると) [推論3]により、 x2: ... |e1  が導出されるので、                  この仮定は適切。 [推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok

修飾関係 5 linguistic SR e1:類=つかまえた, Theme=_, Agent=_ v2:人数( )|e1 つかまえた1 修飾関係 5 linguistic SR つかまえた1 人数2 e1:類=つかまえた, Theme=_, Agent=_ v2:人数( )|e1 e1:類=つかまえた, Theme=Xi, Agent=__ と仮定すると、[推論2]により、 Xi:... |e1   が導出される。さらに、 v2:人数(Xi) と仮定すると、 [推論2] により、 v2:... |Xi   が導出される。この2つに対して、 transitivity を適用すると、 v2: ... |e1 が導出されるので、これらの仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論5 <transitivity>] α:... |β かつ、β:... |γ  ⇒ α:... |γ

英語の関係節の場合 a3: x1=x2 linguistic SR x1:類=boy|a3 x2:類=person e4:類=saw,Theme=x5,Agent=x2 x5:名称=Mary a boy1 who2 φ3 t2 saw4 Mary5 NP CP IP  これに対して、英語でこのような自由な修飾関係が許されないのは、英語の場合には、主要部を後方から修飾する場合に関係代名詞が必要だからである。この関係代名詞移動を引き起こす主要部(φ3)のSR式が、(43b)のように、係り先のx1と移動してきたwh句に相当するx2の同一性を述べるものであるとすると、(32)が関与する余地がないことがわかる。 その証拠に、「John's victims' number」のように関係代名詞を用いない修飾構造においては、英語でも比較的自由な解釈が許されるのである。

Information Extractor Computational System input/output influence (dynamic) database process system reference Working Space Information Extractor Computational System Information Database (perceived) phonetic strings Concepts Lexicon LF SR (formal) features frequent patterns Numeration Phonology PF (generated) phonetic strings Inference rules Extractor