上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp 2011年度前期水曜日2限 理論言語学特論 I これまでのまとめ 上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp
生成文法のモデル Numeration (いくつかの 単語の集合) Computational System LF (Logical Form: 単語を構造化 した、意味関連の表示) Numeration (いくつかの 単語の集合) PF(Phonological Form: 単語を構造化した、音関連の表示) 私としては、人間がことばを理解するというのはどういうことか、いったい言葉を用いて何をどうしているのか、ということが知りたくて言語学をやっています。その際、このような生成文法のモデルがしっくり来ているのですが、これだけでは、なかなかこの問題に届きません。が、今回話させていただく研究については、それだけでなく、自然言語解析のための基礎研究になればいいなあという希望も持っています。 生成文法では、統語論が自律的であるという考え方のもと、意味解釈というものは、統語論によって組み立てられた構造表示を解釈して行われると想定している。ところが、生成文法は、独自の意味論を持ったことがなく、その意味解釈の仕組みは、明示的に述べられてこなかった。もちろん、実際の言語分析においては、意味の記述が必要とされる場合もあるため、研究者は、それぞれ既成の形式意味論を流用するしかなかったのである。しかし、現在主流の形式意味論では、様々な局面において、非常に不自然な仮定を強いられることが多い。そこで、統語論との対応を意識して、一から作ってみた体系の一部を紹介したい。まだβ版の段階であるが、「伝達」「認知」という側面において主流の形式意味論と異なるアプローチをしている可能性があると考えている。 まず、従来の形式意味論を言語の意味論とみなすにあたって最も大きな弊害となってきたのが、真理条件しか文の意味として認めないとする仮定であったと思う。もちろん、文の意味が真理条件とみなせる場合もあるが、ことばそのものの意味は、真理条件に満たない場合もあれば、真理条件以上のことを述べている場合もある。そういう場合にも適応できる形での意味表示を用いて、文の意味を考察していかないと、単語とその機能の対応を正確に追究することができないからである。そのためにも、まず、私たちの頭の中にある世界知識のモデルをたてておく。
世界知識 Information Database 世界知識 Information Database 具体的なモノ/コト(オブジェクト)が、指標番号で区別され、次のような形式で、その性質とともに記憶されている On:attribute1=value1, attribute2=value2, attribute3=value3,... X19:名称=ジョン, 類=大学生, 年齢=20, ... X225:名称=渡辺くん, ... E65:名称=北京オリンピック, 開催年=2008年, 開催国=中国, ... E923:名称=○○海岸OL殺人事件, 犯人= X45, 被害者= X225, ... E82:類=落とす, 落下物=X53, 行為者=X19,... 脳内に、具体的なモノ/コト(オブジェクト)が、その性質とともに記憶されているという仮定は何らかの形で必要であろう。ここでは、そのデータベースをInformation Databaseと呼ぶことにする。1つ1つのオブジェクトは、以下では、指標番号つきの「O」で表すこととし、同じオブジェクトであると認識していれば同じ指標番号を、異なるオブジェクトであると認識していれば異なる指標番号を持っていると想定する。各エントリーは(1)のような形式になっていると考える。 (1) On:attribute1=value1, attribute2=value2, attribute3=value3, ... オブジェクトには、いくつかの下位分類がありうるが、少なくとも、モノ(individual)とコト(eventuality)の区別はあっていいだろう。以下、モノはXnで、コトはEnで表わすことにする。 (2) a. X19:名称=ジョン, 類=大学生, 年齢=20, ... b. X225:名称=渡辺くん, ... (3) a. E65:名称=北京オリンピック, 開催年=2008年, 場所=中国・北京, ... b. E923:名称=○○海岸OL殺人事件, 犯人=xxxxx, 被害者=yyyyy, 刑事=zzzzz, ... c. E82:類=落とす, 落下物=X53, 行為者=X19,... このように考えると、モノもコトも、項目名(attribute)が異なるだけで、同じ形式でとらえることができる。(3a,b)のようにEn全体に命名することもあるが、多くの場合、私たちは、いろいろなコトのあり方をパターン化して認識している。動詞は、いわば、そのパターンを記述したものであり、類というattributeのvalueに相当する表現であると考えてもいいであろう。さらに、Enを認識する場合、そのコトにどのような役割(role)をもつ参与者(participant)が関わっているか、ということも重要である。その役割がattributeであり、参与者がそのvalueとなる。 以下では、(2)-(3)のそれぞれの項目をObject Informationと呼ぶことにする。 Object Informationとは、いわば、具体的な世界知識である。
(Semantic Representation) 言語と世界知識の接点 Computational System LF Numeration PF Lexicon Working Space SR (Semantic Representation) Information Database Inference rules コミュニケーションにおいては、私たちは、お互いの持つObject Informationを披露しあって、情報を増やしたり、修正したりしたい場合が多々ある。しかし、お互いのObject Informationを直接見せ合うことができない以上、別の手段を用いるしかない。言語は、その目的にかなう手段の1つである。 この作業は、言語をObject Informationと比較対照可能な式に変換しないとできないはずなので、統語論の出力であるLF表示は、何らかのモジュールでObject Informationと比較対照可能な式に変換されると考えたい。
言語と世界知識 John kissed Mary. どのようにして、これらが結びつくのか? X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... たとえば、「John kissed Mary」という文があった場合、 このような世界知識と結び付けられれば、「意味がわかった」ということになるかもしれない。 問題は、この2つがどのようにして結びつくのか、ということである。特に、発話ではなく文理解のことを考えると、Information Database の中の通し番号が初めからわかっているとは考えがたい。文の意味がわかったあとで、何のことを言っているかが結びつくことは、いくらでもあるからである。
SR (Semantic Representation) John1 kissed2 Mary3 変換 o1: ... John ... o2: ... Mary ... o3: ... kissed ... 知識内の検索と同定 X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... そこで、「John kissed Mary」という文は、まず、仮番号を持っており、 それが、いったんこのように、各単語の情報を含んだSRに変換され、それがキーとなって、知識内の検索が行われて、言語と世界知識とのつながりが生まれると考えたい。問題は、今、ほとんど省略した形であらわした SRがどのような表示であり、それが言語構造とどのような対応をしているかということである。
SR (Semantic Representation) John1 kissed2 Mary3 変換 o1: ... John ... o2: ... Mary ... o3: ... kissed ... x1: 名称=John x2: 名称=Mary e3: 類=kissed, Patient=x2, Agent=x1 linguistic SR 知識内の検索と同定 X 19: 名称=John, 類=大学生, 年齢=20, ... X 22: 名称=Mary, 類=OL, 年齢=24, ... E 614: 類=kissed, Patient= X22, Agent= X19, ... たとえば、「John」や「Mary」というのが固有名詞であり、つまり、名称のvalueになるものであるということは、言語の知識の一部である。私たちは、何か新しい単語に出会ったとき、それが固有名詞なのか、それともその種のもののカバータームなのかが気になる。すなわち、単語を習得する際のその違いを登録する必要があるということである。したがって、世界知識と結合される前の段階のSRに、 ここまで情報が入っていたとしても不思議ない。このSRを導くことができるということが、狭義の意味で、私たちがこの文を理解したということであり、これを手がかりにして、知識とのつながりができれば、広義の意味で、理解が完了したことになる。
語彙の「意味」と構造の「意味」 「John1 Mary2 Alaska3 go4」 変換 x1: 名称=John x2: 名称=Mary x3: 名称=Alaska e4: 類=go, Goal=_, Agent=_ 知識内の検索と同定 X11: ... 名称=John, ... X204: ... 名称=Mary, ... X4743: ... 名称=Alaska, ... E61: ... 類=go, ... このように、それぞれの単語が1つずつキーとなって関連情報を探しに行くとしたら、「John Mary Alaska go」のような、まったく文としての形を成していないものであっても、検索そのものは行われうるであろうし、勘が良ければ、それで「正解」にたどりつかないとも限らない。しかし、当然、単語の羅列と、ちゃんとした文とでは、そこから意味を読み取ろうとする作業にかかるストレスの量が明らかに異なっている。 つまり、SR式は、それぞれの語彙の知識があれば、ある程度、作れるが、それに加えて、その言語の文法の知識があることによって、SR式の情報がより豊かになり、Information Databaseとの照合作業が正確に、効率よく、行いやすくなる。その言語の知識というものは、そのようなものであると、私は考えている。
「意味」のでどころ 従来の区分 ↓ Computational Systemを持っているからこそ、わかる「意味」 →構造構築からくる「意味」 その言語の“文法”を知っているからこそ、わかる「意味」 →Lexiconで指定されている機能範疇の「意味/機能」 その語彙を知っているからこそ、わかる「意味」 →Lexiconで指定されている語彙範疇の「意味」 背景知識を持っているからこそ、わかる「意味」 →自分の「知識」と統合して、推論によって得られる「意味」 普遍文法 人類共通 個別文法 言語内共通。言語間では大きく異なるが 可能性の幅は定められているはず。 語彙意味論 言語間でも共通性は多い。ただし言語内でも個人差あり。 従来の研究では、概念的には、この4つの区別がされていたものの、実際の現象を研究する際には、その区分があまりかえりみられることがなかった。あらためて、その区別からしっかりしていこう、というのがここでの提案。 特に、今年度は、世界知識にも内部構造があるという提案を行った。これまでは、漠然と「語と語の関係は統語論」であるような印象を持ってきたが、世界知識の中にも内部構造があるならば、必ずしも、その「語と語の関係」が構造で表されているとは限らない、そちらにまかせるべきことは、そちらにまかせるべきだ、というのが、今年度の新しいポイントである。 語用論 人類共通の部分もあるが、文化/環境の個人差は大きい。
構造構築からくる「意味」 修飾関係 (αがβに「係っている」関係) 項関係 (αがβの「項である」関係) 修飾関係 (αがβに「係っている」関係) 項関係 (αがβの「項である」関係) 叙述関係(αがSubject、βがPredicateである関係) ←この位置づけが定まりきっていないのが、後半の停滞の原因 α1 β2 ○1: ... α ... ○2: ... β ... | ○1 α1 β2(role) α1 β2(role 1 ) e2: 類=β, role=_ e2: 類=β, role=○1 (これが起こるのは、βが機能範疇か動詞の場合)
構造構築からくる「意味」 叙述関係 (αがSubject、βがPredicateである関係) 基底生成の場合 さらに、Partitioning が起こると: α1 β2 φ3(Predicate2, Subject1) p3:Subject=○1, Predicate=○2 α1 β21 φ3(Predicate2, Subject1) p3:Subject=○1, Predicate=○21
構造構築からくる「意味」 叙述関係 (αがSubject、βがPredicateである関係) 付加移動(adjunction)による形成の場合 さらに Partitioning が起こると: 3 p3:Subject=○1, Predicate=○2 α1 β2 ... ... α1,P3 p3:Subject=○1, Predicate=○21
「意味」のでどころ 従来の区分 ↓ Computational Systemを持っているからこそ、わかる「意味」 →構造構築からくる「意味」 その言語の“文法”を知っているからこそ、わかる「意味」 →Lexiconで指定されている機能範疇の「意味/機能」 その語彙を知っているからこそ、わかる「意味」 →Lexiconで指定されている語彙範疇の「意味」 背景知識を持っているからこそ、わかる「意味」 →自分の「知識」と統合して、推論によって得られる「意味」 普遍文法 人類共通 個別文法 言語内共通。言語間では大きく異なるが 可能性の幅は定められているはず。 語彙意味論 言語間でも共通性は多い。ただし言語内でも個人差あり。 従来の研究では、概念的には、この4つの区別がされていたものの、実際の現象を研究する際には、その区分があまりかえりみられることがなかった。あらためて、その区別からしっかりしていこう、というのがここでの提案。 特に、今年度は、世界知識にも内部構造があるという提案を行った。これまでは、漠然と「語と語の関係は統語論」であるような印象を持ってきたが、世界知識の中にも内部構造があるならば、必ずしも、その「語と語の関係」が構造で表されているとは限らない、そちらにまかせるべきことは、そちらにまかせるべきだ、というのが、今年度の新しいポイントである。 語用論 人類共通の部分もあるが、文化/環境の個人差は大きい。
機能範疇の「意味」 「から」 「へ」 「と」 syntax からn(Sourcem) ... Mergeの相手が項mとなる SR式 an:Source( )=om 「へ」 syntax へn(Goalm) ... Mergeの相手が項mとなる SR式 an:Goal( )=om 「と」 syntax とn(Contentm) ... Mergeの相手が項mとなる SR式 Ln:Content=om
機能範疇の「意味」 「か」 英語の関係節のC0 「も」 syntax かn(Qm) ...c-command領域内から項mを探す SR式 an:om=? 英語の関係節のC0 syntax C0n(m, r) ... r は、このC0nが係っている要素の指標 ... spec位置に不定語mを移動させる SR式 an:om= or 「も」 Pnという素性を持ち、LFにおいて付加移動(adjunction movement)をして、叙述関係のSubjectになり、Predicateに対するPartitioningを義務的に引き起こす
英語の関係節の構造 a3: x2=x1 linguistic SR x1:類=boy|a3 x2:類=person e4:類=saw,Theme=x5,Agent=x2 x5:名称=Mary a boy1 who2 φ3(2, 1) t2 saw4 Mary5 NP CP IP これに対して、英語でこのような自由な修飾関係が許されないのは、英語の場合には、主要部を後方から修飾する場合に関係代名詞が必要だからである。この関係代名詞移動を引き起こす主要部(φ3)のSR式が、(43b)のように、係り先のx1と移動してきたwh句に相当するx2の同一性を述べるものであるとすると、(32)が関与する余地がないことがわかる。 その証拠に、「John's victims' number」のように関係代名詞を用いない修飾構造においては、英語でも比較的自由な解釈が許されるのである。
機能範疇の特性 不定語 ア系列指示詞 ソ系列指示詞 不定語「誰/何/どの~」等は、格助詞が直接後続している場合、その指標をQに付与しなければならない。 ア系列指示詞 発話者がア系列指示詞を用いるためには、それが、その人が直接体験によって知っているモノによって同定されていなければならない。 ソ系列指示詞 モノを指示するソ系列指示詞は、Numerationにおいて、その談話ですでに使われた番号の指標をになわなければならない。 ア/ソの話はlexical property ではあるが、その存在はSR式そのものには影響を与えない。
「意味」のでどころ 従来の区分 ↓ Computational Systemを持っているからこそ、わかる「意味」 →構造構築からくる「意味」 その言語の“文法”を知っているからこそ、わかる「意味」 →Lexiconで指定されている機能範疇の「意味/機能」 その語彙を知っているからこそ、わかる「意味」 →Lexiconで指定されている語彙範疇の「意味」 背景知識を持っているからこそ、わかる「意味」 →自分の「知識」と統合して、推論によって得られる「意味」 普遍文法 人類共通 個別文法 言語内共通。言語間では大きく異なるが 可能性の幅は定められているはず。 語彙意味論 言語間でも共通性は多い。ただし言語内でも個人差あり。 従来の研究では、概念的には、この4つの区別がされていたものの、実際の現象を研究する際には、その区分があまりかえりみられることがなかった。あらためて、その区別からしっかりしていこう、というのがここでの提案。 特に、今年度は、世界知識にも内部構造があるという提案を行った。これまでは、漠然と「語と語の関係は統語論」であるような印象を持ってきたが、世界知識の中にも内部構造があるならば、必ずしも、その「語と語の関係」が構造で表されているとは限らない、そちらにまかせるべきことは、そちらにまかせるべきだ、というのが、今年度の新しいポイントである。 語用論 人類共通の部分もあるが、文化/環境の個人差は大きい。
xn型のSR式を導入しうる表現 John1 あのOL3 その4人11 X19: 名称=John, 類=大学生, 年齢=20, ... x3: 類=OL x11: 人数=4人 知識内の検索 知識内の検索 知識内の検索 x1 = X19 x3 = X22 x11 = X105 X19: 名称=John, 類=大学生, 年齢=20, ... X22: 名称=Mary, 類=OL, 年齢=24, ... X105: 名称=ビートルズ, 人数=4人, ... 本発表では、まず、語彙の知識によって、SR式に4つのタイプが区別されること、そして、その区別を仮定すると、形式と意味の対応を非常に体系的に把握することができるということを修飾関係にしぼって示したい。 では、これから、その4つの型のSR式について順に説明していく。 まず、Information Database 中のモノに対応する可能性のあるSR式として、xn型のSR式がある。典型的なものとしては、モノを表す固有名詞とモノの類を表す名詞であるが、原則的には、モノの何らかのattributeのvalueを表しうる名詞ならば、 xn型のSR式を導入しうると思っている。単に、相手に通じやすいかどうか、という違いがあるだけである。
同定(Identification) 同定そのものは、言語のシステムの外の操作 であるが、表現によっては、即時の同定を要求するものがある。 B1: (その事実を知らない)へえ、そう。 B2: (そのジョンを知らない)え、ジョンって? 情報量の問題ではない。 (8) A:ジョンっていうやつがメアリを推薦したんだって。 B:へえ、そう。 (9) A: 誰かがメアリを推薦したんだって。 B: へえ、そう。 もちろん、同定可能なオブジェクトの候補がいくつも見つかる場合もあるだろう。その場合、私たちがどのようにして1つのオブジェクトを選択しているのかは、言語のシステムが関わっている問題ではない。(4)における同定が、発話者の意図に沿ったものであるかどうかは知るよしもないが、同定が起こったことで、聞き手としては、この表現と(2)の知識が結びつき、「理解」ができたことになる。 このように、同定そのものは、言語外の操作であるが、だからといって、言語が無関係なわけではない。表現によって、即時の同定が義務づけられるものがあるのである。 (7) A: ジョンがメアリを推薦したんだって。 B1: (その事実を知らない)へえ、そう。 B2: (そのジョンを知らない)え、ジョンって? (7-B1)では、Bは特に気にせず、新しく得たコトの情報を受容している。これに対して、(7-B2)の場合、Bは、新しいコトの情報を受容しようとはせず、まず、「ジョン」を同定するための、さらなる情報を要求している。コトの参与者が同定されず情報が足りない場合に常にこのようなことが起こるわけではない。表現の持つ情報量は、(7A)と(8)でほぼ同じであり、また、(9)の場合には(7A)よりも情報が少ないにも関わらず、どちらの場合にも、必ずしも情報要求が起きるとは限らないのである。(8B)でも(9B)でも、行為者というattributeのvalueが不明なまま、そのコトの情報を受容している。 (8) A: ジョンっていうやつがメアリを推薦したんだって。 B: へえ、そう。 (9) A: 誰かがメアリを推薦したんだって。 このように、固有名詞というものは、即時の同定を求める指令(instruction)を持った語彙であり、普通名詞は通常、そのような指令を持たない。そして、(8)の「~という~」は、固有名詞の持つ指令を打ち消す働きを持つ表現なのである。もちろん、同定可能なオブジェクトの候補がいくつも見つかる場合もあるだろう。その場合、私たちがどのようにして1つのオブジェクトを選択しているのかは、言語のシステムが関わっている問題ではない。(4)における同定が、発話者の意図に沿ったものであるかどうかは知るよしもないが、同定が起こったことで、聞き手としては、この表現と(2)の知識が結びつき、「理解」ができたことになる。 このように、固有名詞というものは、即時の同定を求める指令(instruction)を持った語彙であり、普通名詞は通常、そのような指令を持たない。そして、(8)の「~という~」は、固有名詞の持つ指令を打ち消す働きを持つ表現なのである。 ここでは詳細を説明することができないが、語彙には、(10)の4つのタイプがある。 (10) a. 即時の同定を求めるもの b. モノとの同定が可能なもの c. コトとの同定が可能なもの d. オブジェクトと同定されてはならないもの これまでは、指示性(referentiality)という概念が言及されながら、それが(10)のどれを指すのかが曖昧なまま議論が進むことが多かった。同定という操作を明示的に仮定することによって、その混乱を整理することができる。
en型のSR式を導入しうる表現 北京五輪2 落ちた1(Theme) E65: 名称=北京五輪, 開催年=2008年, ... 落とした38(Theme, Agent) SR式 SR式 SR式 e2:名称=北京五輪 e1:類=落ちた, Theme=_ e38:類=落とした, Theme=_, Agent=_ 知識内の検索 知識内の検索 知識内の検索 e2 = E65 e1 = E22 e38 = ?? E65: 名称=北京五輪, 開催年=2008年, ... E22: 類=落ちた, Theme=X24, ... E8825:類=落とした, Theme=_, Agent=_... モノではなくコトに対応する表現も基本的に同じである。ただし、たとえば「落ちる/落とす」は、「類」としては似たようなコトでありながら、どのような参与者が関わっているかという認識が異なっている。参与者についての指定というものは、人間の認識を反映したものではあるものの、その指定が言語表現と結びついているという点で、言語の問題であり、その指定は、Lexiconに書かれていなければならない。ある語がどのような役割の参与者を持っているかという指定は、しばしば、その語のargument structure(項構造)と呼ばれる。たとえば、次のようにSR式が導かれ、もし、Information Databaseの中の知識と同定されれば、さらに、それぞれの役割の空欄が補填される場合もありうる。 (11)統語論落ちた1(Theme)SR式e1:類=落ちた, Theme=_value同定後e1:類=落ちた, Theme=X73 (12)統語論落とした2(Theme, Agent)SR式e2:類=落とした, Theme=_, Agent=_value同定後e2:類=落とした, Theme=X35, Agent=X90
attributeを示してvalueを指す表現 「彼女の年齢をこの欄に書いてください。」 =欄に「25」と書く 「彼女の名前をこの欄に書いてください。」 =欄に「陽子」と書く 「犯人を連れてきてください。」 =その事件の犯人である人物を連れてくる 言語表現が指すものは、常にモノやコトであるとは限らない。たとえば、このように、attribute を示して、そのvalueを指す表現が多々ある。
vn型のSR式 value :attribute (object) X19:名称=John, 類=大学生, 年齢=20, ... X22:名称=Mary, 類=OL, 年齢=24, ... E614:類=kissed, Patient = X22, Agent= X19, ... E614 : Patient = X22 E614 Patient X22 X22 : Patient(E614) vn型のSR式 value :attribute (object) John :名称(X19) 大学生 : 類(X19) 20 : 年齢(X19) そこで、xn型、en型のSR式に加えて、次のような vn型のSR式を定義する。
vn型のSR式を導入しうる表現 犯人4 目標1 年齢2 X19: 名称=John, 類=大学生, 年齢=20, ... オブジェクトの同定 オブジェクトの同定 オブジェクトの同定 v2 : 年齢(X19) v4 : 犯人(E246) v1 : 目標(X19) 知識内の検索 知識内の検索 知識内の検索 v4 = X22 v2 =20 v1 = E205 vn型のSR式を導入しうる表現は、これまでのものとは異なり、それ自身が attribute に相当する表現である。 関わるオブジェクトは、モノである場合もコトである場合もありうる。 この種の表現の場合、その犯人が誰なのかということがわからないままでも会話を進めることは可能であるが、どのコトが問題になっているのかということがわからないと、通常は、情報処理が進まない。 (89) A: このボタンは、おそらく犯人が落として行ったものだろう。 B: え、何か事件でもあったんですか。 X19: 名称=John, 類=大学生, 年齢=20, ... E246: 名称=○○殺人事件, 犯人=X22, ...
attributeを表すが、 valueだけを指しているわけではない表現 「彼女の年齢にはびっくりした。」 ≠「25才にびっくりした」 =「彼女が25才であるということにびっくりした。」 「名前は関係ない。」 ≠「陽子は関係ない」 =「名前が何であるかは関係ない。」 「犯人は知りません。」 ≠「X22は知りません」 =「犯人が誰なのか、知りません」 さらに、このようなシステマティックな多義性が見られる。
an :attribute(object)=value an型のSR式 X19:名称=John, 類=大学生, 年齢=20, ... X22:名称=Mary, 類=OL, 年齢=24, ... E614:類=kissed, Patient = X22, Agent= X19, ... E614 : Patient = X22 E614 Patient X22 a1: Patient(E614)= X22 a2:名称(X19)=John a3:類(X19)=大学生 a4:年齢(X19)=20 an型のSR式 an :attribute(object)=value そこで、xn型、en型のSR式に加えて、次のような vn型のSR式を定義する。
an型のSR式を導入しうる表現 犯人4 黄色い1 年齢2 X19: 名称=John, 類=大学生, 年齢=20, ... オブジェクトの同定 オブジェクトの同定 オブジェクトの同定 a2:年齢(X19)=_ a4:犯人(E246)=_ a1:色(X79)=黄色い 知識内の検索 知識内の検索 知識内の検索 a2:年齢(X19)=20 a4:犯人(E246)=X22 a1:色(X79)=黄色い 本当は、an型のSR式を導入できる表現はほかにもいろいろあるけれども、それは次の話を見た上で最後にまとめる。 X19: 名称=John, 類=大学生, 年齢=20, ... E246: 名称=○○殺人事件, 犯人=X22, ... X79:色=黄色い,...
SR式を導くために知らねばならない語彙の知識 en: attribute = value (その表現はvalueに対応する) このattributeは? 他に指定されたattribute(=いわゆる「項構造」)は? xn: attribute = value (その表現はvalueに対応する) vn: attribute(object) (その表現はattributeに対応する) an: attribute(object)=value その表現がvalueに対応する場合、そのattributeは? その表現がattributeに対応する場合もありうる。 とにかく、ここまでが語彙としての知識に基づく意味論の話。つまり、ある語彙の意味がわかるためには、少なくとも、これだけのことがわかっている必要がある。 逆に言えば、単語の意味だけがわかっていれば、文法がわかっていなくとも、知っている話ならば大体の見当がつく。適当に同定をしていけば、自分のInformation Databaseの中の情報がつながっているからである。しかし、もちろんのことながら、自分が知らない話の場合には、それではお手上げになる。文法がわかっている場合、SR式はバラバラの単語の状態よりも情報が豊かであり、だからこそ、私たちは、自分の知らない内容をことばを通じて知ることができるのである。 ただ、今日は、時間がないので、その syntax の話ができない。最も単純な modification の話だけしておく。
「意味」のでどころ 従来の区分 ↓ Computational Systemを持っているからこそ、わかる「意味」 →構造構築からくる「意味」 その言語の“文法”を知っているからこそ、わかる「意味」 →Lexiconで指定されている機能範疇の「意味/機能」 その語彙を知っているからこそ、わかる「意味」 →Lexiconで指定されている語彙範疇の「意味」 背景知識を持っているからこそ、わかる「意味」 →自分の「知識」と統合して、推論によって得られる「意味」 普遍文法 人類共通 個別文法 言語内共通。言語間では大きく異なるが 可能性の幅は定められているはず。 語彙意味論 言語間でも共通性は多い。ただし言語内でも個人差あり。 従来の研究では、概念的には、この4つの区別がされていたものの、実際の現象を研究する際には、その区分があまりかえりみられることがなかった。あらためて、その区別からしっかりしていこう、というのがここでの提案。 特に、今年度は、世界知識にも内部構造があるという提案を行った。これまでは、漠然と「語と語の関係は統語論」であるような印象を持ってきたが、世界知識の中にも内部構造があるならば、必ずしも、その「語と語の関係」が構造で表されているとは限らない、そちらにまかせるべきことは、そちらにまかせるべきだ、というのが、今年度の新しいポイントである。 語用論 人類共通の部分もあるが、文化/環境の個人差は大きい。
修飾のSRとアブダクション 「関連している」とは? ○1: ... α ... ○2: ... β ... |○1 α1 β2 ○1: ... α ... ○2: ... β ... |○1 ○1は○2に「関連している」 「関連している」とは? [推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok [推論4 <symmetry>] α:... |β ⇒ β:... |α [推論5 <transitivity>] α:... |β かつ、β:... |γ ⇒ α:... |γ ここで提案したいのは、「αがβに係っている」構造は、SR式において、その主要部のほうに、何が係っているかという情報だけを加える、という分析である。 もちろん、「関連している」というだけでは、わからないので、その「関連している」という概念を定義する必要がある。そこで、次のような5つの推論規則で、この「関連している」という概念を定義する。つまり、linguistic SR では、この推論規則の出力の形が提示されるのであるから、言語使用者は、アブダクションによって、その出力を出した元の前提を割り出す作業をしなければならない。「関連している」関係を生み出す式には、いろいろな可能性があるので、答えが一通りに決まるわけではない。かくのごとく、言語理解というものは、原理的な不確定性を持っている。ただし、ここでアブダクションと呼んでいるものは、単なる「ひらめき/思いつき」という意味ではない。ちゃんと推論規則での定義があった上でのアブダクションであるから、そこは、必ずしも、まったくのむちゃくちゃではない。特に、統語論からSR式への変換は、ごく機械的に行えることであり、その結果、論理的に、意味解釈の範囲は、かなりの程度、しぼられている。残された範囲の中で、アブダクションが起こるだけであり、その起こり方も、このように少数の推論規則によって、はっきり定められているのである。
修飾関係 1 「|」を解くためのアブダクション linguistic SR a1:産地( )=フロリダx2:類=オレンジ |a1 修飾関係 1 a1:産地( )=フロリダx2:類=オレンジ |a1 linguistic SR フロリダ産1の オレンジ2 「|」を解くためのアブダクション a1:産地(x2)=フロリダ と仮定すると、 [推論1] より、 x2:.... | a1 が導出されるので、 この仮定は適切。 ∴ x2:類=オレンジ,産地=フロリダ たとえば、「フロリダ産のオレンジ」の場合には、こうなる。 結果的に、アブダクションを解いた仮定が、私たちにとって「理解された意味」ということになる。 [推論1] ak:Attribute(oi)=Valuej ⇒ oi:.... | ak
修飾関係 2 linguistic SR x1:類=高校生 v2:子供( ) |x1 高校生1の 子供2 v2:子供(x1) と仮定すると、 修飾関係 2 x1:類=高校生 v2:子供( ) |x1 linguistic SR 高校生1の 子供2 v2:子供(x1) と仮定すると、 x1:類=高校生, 子供=v2 となり、 [推論2]とsymmetry により、 v2: ... |x1 が導出されるので、 この仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論4 <symmetry>] α:... |β ⇒ β:... |α
修飾関係 3 linguistic SR e1:類=落ちた, Theme=_ x2:類=おもり|e1 落ちた1 おもり2 修飾関係 3 e1:類=落ちた, Theme=_ x2:類=おもり|e1 linguistic SR 落ちた1 おもり2 e1:類=落ちた, Theme=x2 と仮定すると、 [推論2]とsymmetry により、 x2: ... |e1 が導出されるので、 この仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論4 <symmetry>] α:... |β ⇒ β:... |α
修飾関係 4 linguistic SR e1:類=落ちた, Theme=_ x2:類=おもり|e1 落ちた1 おもり2 修飾関係 4 e1:類=落ちた, Theme=_ x2:類=おもり|e1 linguistic SR 落ちた1 おもり2 e3:... _=e1, _=x2, ... と仮定すると、 (たとえば、その「おもり」が何かの「落下」を引き起こしたような場合を仮定すると) [推論3]により、 x2: ... |e1 が導出されるので、 この仮定は適切。 [推論3] oi:....Attribute=oj, ...,Attribute=ok ...⇒oj:.... | ok
修飾関係 5 linguistic SR e1:類=つかまえた, Theme=_, Agent=_ v2:人数( )|e1 つかまえた1 修飾関係 5 linguistic SR つかまえた1 人数2 e1:類=つかまえた, Theme=_, Agent=_ v2:人数( )|e1 e1:類=つかまえた, Theme=Xi, Agent=__ と仮定すると、[推論2]により、 Xi:... |e1 が導出される。さらに、 v2:人数(Xi) と仮定すると、 [推論2] により、 v2:... |Xi が導出される。この2つに対して、 transitivity を適用すると、 v2: ... |e1 が導出されるので、これらの仮定は適切。 [推論2] oi:.... Attribute=vj ... ⇒ oi:.... | vj [推論5 <transitivity>] α:... |β かつ、β:... |γ ⇒ α:... |γ
「意味」のでどころ 従来の区分 ↓ Computational Systemを持っているからこそ、わかる「意味」 →構造構築からくる「意味」 その言語の“文法”を知っているからこそ、わかる「意味」 →Lexiconで指定されている機能範疇の「意味/機能」 その語彙を知っているからこそ、わかる「意味」 →Lexiconで指定されている語彙範疇の「意味」 背景知識を持っているからこそ、わかる「意味」 →自分の「知識」と統合して、推論によって得られる「意味」 普遍文法 人類共通 個別文法 言語内共通。言語間では大きく異なるが 可能性の幅は定められているはず。 語彙意味論 言語間でも共通性は多い。ただし言語内でも個人差あり。 従来の研究では、概念的には、この4つの区別がされていたものの、実際の現象を研究する際には、その区分があまりかえりみられることがなかった。あらためて、その区別からしっかりしていこう、というのがここでの提案。 特に、今年度は、世界知識にも内部構造があるという提案を行った。これまでは、漠然と「語と語の関係は統語論」であるような印象を持ってきたが、世界知識の中にも内部構造があるならば、必ずしも、その「語と語の関係」が構造で表されているとは限らない、そちらにまかせるべきことは、そちらにまかせるべきだ、というのが、今年度の新しいポイントである。 語用論 人類共通の部分もあるが、文化/環境の個人差は大きい。
Information Extractor Computational System input/output influence (dynamic) database process system reference Working Space Information Extractor Computational System Information Database (perceived) phonetic strings Concepts Lexicon LF SR (formal) features frequent patterns Numeration Phonology PF (generated) phonetic strings Inference rules Extractor