上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp 統語意味論:構造と意味の対応とズレ 上山あゆみ(九州大学) ayumi.ueyama@kyudai.jp
統語論と意味 文の意味とは、どのような仕組みで構築されるのか? 「文の意味」≠「それぞれの語の意味の総和」 → 私たちが理解する「意味」= → 私たちが理解する「意味」= 1) 各語彙の意味 + 2) 構造構築による変容 + 3) 世界知識等に基づいて推論で補われるもの 構造というものは、「音(語順)」だけでなく、「意味」についても、重要な基盤となっている。 私が興味を持っているのは、文の意味というものが、どのような仕組みで構築されるのか ということです。 語という記号が組み合わされて、実に様々な「意味」が作り出されているわけですが、文の意味というものは、その材料となっている語の単なる総和ではないということを私たちは知っています。もちろん、昔の電報文のように内容語だけを羅列しても、そこから意味を推測することが可能なこともある一方、外国語を勉強している際に、単語の意味はすべて辞書で確認したのに、文全体の意味はさっぱりわからないという場合もあります。当然のことながら、文の意味は、それぞれの語の単なる総和ではなく、組み合わせていく過程でいわば化学変化を引き起こしながら全体が形づくられていくのです。さらに、その文が発せられた意図をより正確に理解するためには、さまざまな背景知識も必要です。 つまり、私たちが理解する意味とは、この3つの部分から成っていることがわかります。 ここで私が特に興味を持っているのが、2) の部分なわけです。これは、つまり、統語論です。 統語論では、単語の並び方、つまり語順を問題にする、と述べられていることがよくありますが、構造というものは、語順を決めるだけでなく、意味の合成の仕方を決めているわけですから、統語論を考える際には、意味の話をぬきにしてはならないと考えています。生成文法では、構造構築する仕組みが実際の文理解とどのように影響を及ぼしあうかということが明示的にされていないことが多いですが、意味の話も考慮に入れるためには、文理解全体のモデルを考えざるをえません。文の意味というものが、3つの部分から成り、統語論が責任を持つ部分がその中の1つでしかない以上、全体をどのように分担するかということが重要だからです。
文理解のモデル Lexicon Information Database 知覚した音連鎖 Formation Numeration Working Space Computational System 知覚した音連鎖 Information Database Lexicon LF linguistic SR Numeration Phonology PF 内的に生成された音韻表示 Inference rules Formation 私が考えているモデルは、このようなものです。 真ん中に点線の四角で囲った部分が、構造構築の仕組みの部分です。 その上にある部分が、各語彙の特性を脳内辞書から拾ってくる部分で、それに対して構造構築がなされた出力を以下ではlinguistic SR と呼びたいと思っています。もう少しいい名前が付けられるといいのですが、ちょっと暫定的なネーミングのままでここまで来てしまっています。SRというのは「semantic representation 意味表示」の頭文字を取ったものですが、ここでは、世界知識等を含まず、純粋に、その言語表示に対応するもの、として、linguistic SR と呼んでいます。つまり、→
統語意味論の目標 linguistic SR (=LF構造表示が表す意味情報を表示したもの) 1語文でも何らかの情報を受け取ることはできる。 統語意味論の目標 linguistic SR (=LF構造表示が表す意味情報を表示したもの) 1語文でも何らかの情報を受け取ることはできる。 各語彙の「意味」も、それ自体、「断片的な情報」は表している。 文になっても、「不完全な情報」しか表していないという点は変わりない。 SR式=不完全/断片的であっても、何らかの情報を表す式 各語彙の意味は、SR式で表される。 語彙を単に並べただけでも、ある程度の情報伝達はできる。 linguistic SR も、SR式の集積である。 ただし、構造構築の過程で、各語彙のSR式に対して変容が起こる場合がある。その変容こそが、統語論が意味解釈にもたらす働きであり、その仕組みを明らかにしたい。 以下、SR式の形式について、もう少し具体的に考えていく。 linguistic SR とは、「ことばそのものが表示する情報」を表すものです。 私たちは、「犬!」とか「火事!」とか、いわゆる文の形になっていなくとも、何らかの情報を受け取ることはできるので、単語は、単体であっても、それ自体、「断片的な情報」は表していると考えるべきだと思います。さらに、ちゃんとした文になっても、コトバだけでは情報が完全には表されていないということも明らかです。従来の形式意味論では、真理条件という形で意味の表示をしてきましたが、不完全な/断片的な情報では、真理条件を表すことができません。そのため、コトバでは表現されていない部分まで補って意味表示が書かれることがしばしば行われてきましたが、そのように補ってしまうと、「ことばそのものの意味」というものが取り出せなくなると思います。つまり、不完全な/断片的な情報でも表示できるシステムが必要なのです。以下では、もう少し具体的に見ていきますが、そのような断片的な情報を表したものをSR式と呼ぶことにしたいと思います。 各語彙の意味は、SR式で表されます。語彙を単に並べただけでも、ある程度の情報伝達ができるのは、そのためです。linguistic SR も、SR式の集積であるには違いありません。ただし、構造構築の過程で、各語彙のSR式に対して変容が起こる場合があります。その変容こそが、統語論が意味解釈にもたらす働きであって、その仕組みを明らかにしていきたいのです。 4 4 4
情報データベース(Information Database) 1つ1つのオブジェクトが、指標番号で区別され、その特性の記述とともに記憶されているとする。 オブジェクトの下位タイプ: モノ(Xn)、コト(En)、場所?、時?、コトバ?、数? 各オブジェクトの特性は、項目名(attribute)とその値(value)のペアとして記述されている。 「知識の更新」とはー データベースの中に新しい「オブジェクト」が追加される 既知のオブジェクトに新しく、項目名(attribute)と値(value)のペアが追加される 既存の値(value)が書き換えられる そこで、まず、情報というものがどういう要素から成り立っているかを簡単に考えておきます。 私たちの頭の中には、さまざまな知識が蓄積されていますが、基本的に、言語活動に関わる知識というものは、何らかのオブジェクトが、その特性の記述とともに記憶されているものとみなしていいのではないかと考えています。 ここで「オブジェクト」と呼んでいるものには、いわゆるモノも、コトも、含まれます。 あのとき、こうこうこういうことがあった。そのときどうだった、というようなことは、コトについての記憶です。 そのコトを丸ごと指して「あれは、大変だったなあ」と言うこともできます。 オブジェクトと言うと、モノだけを含む印象が強いですし、本当はもっと適切な用語を思いついたら変えたいのですが、今はほかに代案がないので、モノやコトをひっくるめて、カタカナでオブジェクトと指したいと思います。 オブジェクトの下位分類として、モノやコト以外のものも認めなければならない可能性もありますが、今のところは置いておきます。 以下、モノはX、コトはEで表すことにします。 さて、オブジェクトの特性は、それぞれ、項目名とその値の組み合わせで記述されているとします。いわゆる住所録データベースなどと同じイメージです。 このような方式で「知識」というものをとらえると、「知識状態の変化」というものを具体的にイメージしやすくなると思います。つまり、知識状態の変化とは、データベースの中に新しいオブジェクトが追加されたり、既知のオブジェクトに対して、新しく、項目名と値のペアが追加されたり、既存の値が書き換えられたり、することを指します。言語というものは、さまざまな「断片的な情報」を表し、それがこの情報データベースと結びけられることによって「知識の更新」が起こるのです。 5
情報データベースでのそれぞれの情報記載 X19 [名称 :ジョン ; 類 :大学生 ; 年齢 :20 ; ... ] 情報データベースでのそれぞれの情報記載 オブジェクト番号 [項目名1: 値1 ; 項目名2: 値2 ; 項目名3: 値3; ...] Xn [attribute1:value1 ; attribute2:value2 ; attribute3:value3; ...] En [attribute1:value1 ; attribute2:value2 ; attribute3:value3; ...] X19 [名称 :ジョン ; 類 :大学生 ; 年齢 :20 ; ... ] E82 [類 :批判した ; 対象 :X53 ; 行為者 :X19 ; ... ] E812[類 :落下 ; 対象 :X3 ; 行為者 :X159 ; ... ] X225[縦 :40cm ; 横 :50cm ; 高さ :15cm ; 重さ :650g ; ... ] E65[名称 :北京オリンピック ; 開催年: 2008年 ; ... ] E923[名称 :○○海岸OL殺人事件; 犯人:X45 ; 被害者 :X225 ; ..] (項目名に対応する)Attribute表現 (値に対応する) Value表現 たとえば、このような形で、知識が頭の中に格納されていると考えます。 ここで、言語表現の中には、項目名 attribute に対応するものと、値 value に対応するものとがあることに気がつきます。 語彙には、Attribute表現と Value 表現があり、知識そのものがコトバによって整理されているのです。 6
知識状態の変化 データベース更新のために必要な機能: Select機能=いわゆる「指示」。データベースの特定の項目を検索して呼び出す機能。 Update機能=いわゆる「記述」。呼び出されている項目に対して、特性を追加する機能。 Value表現で、値を「記述」する Update 機能 (記述) Attribute表現で、値を「指示」する Value表現で、オブジェクトを「指示」する Select 機能 (指示) Attribute 表現 Value 表現 また、知識の更新のためには、いわゆる「指示」と「記述」という2つの機能が必要です。です。「指示」によって、データベースから項目を呼び出し、「記述」によって情報を書き込みます。このあたりもまだ仮の名前なのですが、データベースのプログラミングソフトウェアから名称を借りて、それぞれSelect機能とUpdate機能と呼んでみています。 値に相当するValue表現と、項目名に相当するAttribute表現があると言いましたが、それらが「指示」「記述」のどちらの機能を持つか考えると、この3つの可能性が出てきます。 ☆ まず、何かの特性がわかっていれば、その値を言うことで、つまり、Value表現を用いることで、どのオブジェクトのことを言っているのかSelect「指示」が可能になりえます。「太郎」という名前で、そのオブジェクトのことを指示できます。 これに対して、Attribute表現だけでは、どのオブジェクトを指しているのかはわかりませんが、どのオブジェクトのことを言っているのか、すでにわかっていれば、Attribute表現によって、その値を指すことは可能です。「年齢」という表現で、誰かの生きてきた年数を指すことができます。 これに対して、「記述」をしたい場合、Value表現を使えば、どのオブジェクトのことを言っているのかがわかってさえいれば、その値を新しい情報として加えることができます。 これに対して、Attribute表現だけでは、どのオブジェクトのことを言っているのかがわかっていたとしても、新しい情報の記述には至りません。 7 7 7
SR式の3つのタイプ 各語彙は、それぞれどの型のSR式に対応するか、Lexiconで定められている。 o型のSR式 : objectn [attribute :value] v型のSR式 : valuen = attribute (objectm) p型のSR式 : [attribute (objectm) = value]n Value表現で、値を「記述」する Update 機能 (記述) Attribute表現で、値を「指示」する Value表現で、オブジェクトを「指示」する Select 機能 (指示) Attribute 表現 Value 表現 このように、オブジェクト/項目名/値の3つの概念によってとらえる場合、語彙の意味タイプは大きく3つに分かれることになるので、 それぞれSR式の型(つまり書き方)が異なると考えます。 言い換えると、 ☆ SR式がo型と呼ばれる型式で書かれている場合は、オブジェクトを指示し、 v型と呼ばれる型式で書かれている場合は、値を指示し、 p型と呼ばれる型式で書かれている場合は、値を記述している、と考えます。 本発表で示したいのは、この3つのSR式のタイプの区別が、ことばの意味の構築において、重要な働きをなしている、ということです。 もう少し具体的な説明に入ります。 o型 v型 p型 8 8 8
オブジェクトを「指示」するo型 John1 (あの)OL3 (その)4人11 SR式 SR式 SR式 x1 [名称 :John] x3 [類 :OL] x11 [人数 :4] 知識内の検索 知識内の検索 知識内の検索 x3 = X22 x11 = X105 x1 = X19 X19 [ 名称 :John ; 類 :大学生 ; 年齢 :20 ; ... ] X22 [ 名称 :Mary ; 類 :OL ; 年齢 :24 ; ... ] X105 [ 名称 :ビートルズ ; 人数 :4 ; ... ] 語というものが断片的な情報を表し、それがデータベースと結びつくことによって「理解」にいたる、というここでの考え方を、o型の表現を例にとって説明します。 たとえば、「John」という言語表現は、名前が John であるようなモノを指し示します。つまり、この表現単体に対応する linguistic SR とは、「名称がJohn であるようなモノがあるだろうので、それを探せ」というinstructionを持つことになります。私たちは、このような検索作業を一度にたくさん行う必要があるので、まず、Numeration で、単語にそれぞれ番号を付けておきます。これは、情報データベースにおける固有番号とは別です。あくまでも言語から情報を読み取る作業のために必要な仮番号です。John という表現も1という仮番号がついてきたとすると、それに対応するSR式としては、 ☆ このように書くことにします。ここでの番号は仮番号ですので、このx1 はまだオブジェクトを指示できてはいません。そのため、小文字のxで書いて区別しています。これが、「名称がJohn であるようなモノがあるだろうので、それを探せ」というinstructionです。 そこで、探しに行って、 見つかれば、それで同定します。 他の表現も同様です。固有名は、オブジェクトを指示する働きをもつことが多いですが、他の表現であっても、オブジェクトを指示する働きは十分に持ちえます。 9
オブジェクトを「指示」するo型 o型のSR式 o型のSR式に変換される Value表現 表現 αn 田中一郎、山田くん、陽子ちゃん、... 学生、教師、弁護士、落下、隠蔽、出版、... 落ちた、落とした、勉強している、... 4人、52kg、5cm、10歳、... o型のSR式 表現 αn SR式 on [attribute :α] oが x か e かは、語彙的に決められている。 attribute も通常、語彙的に決められている。 (固有名詞ならば「名称」、いわゆる普通名詞ならば「類」、等) 10
値を「記述」するp型 p型のSR式 p型のSR式となる Value表現 表現 αUn SR式 [attribute(om) =α]Un 穏やか、短い、大きい、すごい、 ... 木製、特大、突然、上々、... p型のSR式 表現 αUn SR式 [attribute(om) =α]Un p型のSR式になる語彙はNumerationにおける指標に「U」が付いているとする。 p型のSR式における omを「見出しオブジェクト」と呼ぶことにする。 11 11 11
値を「指示」するv型 「この欄に年齢を書いてください。」 =欄に「25」と書く ≠欄に「年齢」と書く v型のSR式 =欄に「25」と書く ≠欄に「年齢」と書く v型のSR式となる Attribute表現 年齢、長さ、サイズ、人数、値段、... 作者、監督、実行犯、被害者、... 名称、色、職業、規模、出身地、場所、... v型のSR式 表現 αn(X/E) SR式 vn = α (X/E) v型のSR式におけるXもしくはEを「見出しオブジェクト」と呼ぶことにする。 「値段を忘れてしまいました。」 ≠「お金を忘れてしまいました。」 12 12 12
o型にならない名詞 名詞は多くの場合、Select機能を持っているが、名詞の中には、Update機能しか持たないものもある。 特大の皿 突然の大雨 上々の出来 木製の椅子 フロリダ産のオレンジ 次の語順にはなれない。 *皿の特大 *大雨の突然 *出来の上々 *椅子の木製 *オレンジのフロリダ産 13 13
修飾(modification) 関係の非対称性 修飾という関係を、従来のように「集合の交わり」という対称的な概念でとらえてしまうと、このような非対称性が説明できない。 ok木製の椅子 ←→ *椅子の木製 okフロリダ産のオレンジ ←→ *オレンジのフロリダ産 → p型に対する統語的な制限であるとみなすべきである。 14
Merge Merge : 2つの要素を1つにする操作。主要部につながる branch を太線で表すことにする。 α1 β2 15
modification の構造 Lexicon での指定のままならば、SR式は。。。 Mergeの結果、SR式は。。。 黄色いU1 鳥2 Lexicon での指定のままならば、SR式は。。。 [色( )=黄色い]U1 x2 [類 : 鳥] Mergeの結果、SR式は。。。 [色(x2)=黄色い]U1 x2 [類 :鳥] p型のSR式の見出しオブジェクトは構造的に決まる。 ⇒ x2 [類 :鳥 ; 色 :黄色い] 16
p型とo型のMerge 下図のように、p型のsisterがo型であり、o型が主要部の場合、p型のSR式の見出しオブジェクトはomとなる。 見出しオブジェクトが決定しないp型のSR式は、不適格(ill-formed)である。 p型Un o型m 17 17
助詞「の」 「の」は、Select機能を持つ表現(o型)に付いて、それをUpdate機能に変える働きを持ちうる。 x2 [類 : 大学生] 「医者の奥さん」などは、その「の」が、「のU」なのかそうでないのかで、異なった解釈となる。 このような「の」を「のU」と呼ぶことにする。 [類(x2)=バイト]U1 x2 [類 : 大学生] →
o型同士の修飾関係とアブダクション これに対して、o型同士が Merge した場合には、2つのオブジェクトの関係については、言語的にはわからない。 単に、「ジョン1が何らかの意味でパソコン2と関係がある」ということしか表されていない。(極端な場合には、「ジョン1が独り立ちしたときに、メアリが購入したパソコン2」というような可能性もありうる。) この状態を「α ... |β」という記法で表すことにする。 ジョン1の パソコン2 x1 [名称 :ジョン] x2 [類 :パソコン] |x1 linguistic SR 19 19 19
p型と o型の違い 「言語が表す意味」は、linguistic SRのみであり、そこに含まれる「|」がどのような推論の結果、成り立ったものであるかは、言語使用者がアブダクションで「解決」しなければならない。 (しばしば、このアブダクションが成功することを「理解」と呼ぶ。) 修飾部が(Select機能を持つ)o型の場合には、このように、主要部との関係がきわめて自由であるが、修飾部がp型の場合には、解釈の自由度がない。 黄色いマット ≠ 「黄色い花瓶がのっているマット」 20 20
v型に対する修飾関係とアブダクション v型は通常、見出しオブジェクト(X)がわからないと理解ができない。 そのため、linguistic SR は以下のように「|」を含むものであっても、ほとんどの場合、修飾しているo型を見出しオブジェクトとみなす解釈になる。 しかし、この解釈でなければならないということはない。 =p型の場合とは異なり、v型の見出しオブジェクトは構造的に決定されるわけではない。 メアリ1の 弟2(X) x1 [名称 :メアリ] v2=弟 (X) |x1 linguistic SR x1 [名称 :メアリ ; 弟 : v2] v2=弟 (x1) → 理解 21 21 21
のUはv型をとることができない のU は、v型をとることができない。 (1) *サイズの靴/*色の車/ *年齢の女性 ところが、それぞれ、そのattributeに対する記述を補えば容認可能になる。 (2) サイズが24の靴/色が白の車/年齢が30歳以上の女性 (3) 24のサイズの靴/白い色の車/ 30歳以上の年齢の女性 (1)が容認不可能なのは、valueが述べられていないために情報が足りないためではない。(4)のように、valueが言語表現として含まれていなくとも、情報内容にそのvalueが含まれることは可能だからである。 (4) a. この靴のサイズは私には大きすぎる。 b. あの車の色が気に入らない。 c. その女性の年齢を言い当てた。 22
Attribute表現はUpdate機能を持てない *値段の商品 *規模の大会 *大きさの靴 *性格の太郎 *作り方のプラモデル *長所のジョン *成績のメアリ *名前の男の子 *味の料理 *動機の通り魔事件 *順位の決勝レース *犯人の連続殺人事件 *日程の文化祭 *点数の合格者 → お手頃な値段の商品 → 世界最大の規模の大会 → ちょうどいい大きさの靴 → 穏やかな性格の太郎 → 複雑な作り方のプラモデル → 人懐っこさが長所のジョン → ずば抜けた成績のメアリ → 珍しい名前の男の子 → 独特な味の料理 → 理不尽な動機の通り魔事件 → 過去最高の順位の決勝レース → 残忍な犯人の連続殺人事件 → 例年通りの日程の文化祭 → 最高の点数の合格者 民部(2012:九大卒論) 23
Attribute 表現による修飾 もちろん、Select機能を持つ要素同士の 修飾関係の解釈は、何の問題もない。 値段1の乱高下2 規模の調査 大きさの好み 性格の不一致 作り方の説明 v1=値段( ) e2[類: 乱高下; Theme: _] |v1 v1=値段( ) e2[類: 乱高下; Theme: v1] 民部(2012:九大卒論) 24
付加詞を作る格助詞(p型の機能範疇) a. 東京への帰還 e1 [類 :帰還 ; Goal :x2 ] x2 [名称 :東京] b. 東京からの帰還 e1 [類 :帰還 ; Source :x2] 25 25
付加詞を作る格助詞(p型の機能範疇) linguistic SR →つまり、 帰還2(Theme) 東京1 へU8(Goal ) 1 x1 [名称 :東京] [Goal(e3)=x1]U8 e3 [類 :帰還] →つまり、 e3 [類 :帰還 ; Goal :x1] 26 26
付加詞を作る格助詞(p型の機能範疇) 「へ」 ... 項構造を持っている機能範疇 argument をとる Merge をするが、SR式は p型 Lexicon へ (Goal) syntax へun(Goalm) ... m=Mergeの相手のindex SR式 [Goal( )=om]un 「から」 Lexicon から (Source) syntax からun(Sourcem) ...m=Mergeの相手のindex SR式 [Source( )=om]un 27 27
課題文 武道館でコンサートが計画されている 解釈1: 実際に「計画」が行われている場所が「武道館」であるという解釈 解釈1: 実際に「計画」が行われている場所が「武道館」であるという解釈 解釈2: 今、計画されている「コンサート」の場所が「武道館」であるという解釈 28 28
解釈1の説明 武道館でコンサートが計画されている 「で」がp型の機能範疇であるとする。 解釈1: 実際に「計画」が行われている場所が「武道館」であるという解釈 「で」がp型の機能範疇であるとする。 この部分の linguistic SR は次のようになる。 x1 [名称 :武道館] [Location( )=x1]U2 さらに Merge が進むと、 武道館1 でU2(Location1) 29 29
解釈1の説明 計画されている3 linguistic SR x1 [名称 :武道館] [Location(e3)=x1]U2 武道館1 p型の見出しオブジェクトは構造的に決定されるため、必ず、主要部であるe3となる。その結果、この場合の解釈は、「武道館」が「計画」という出来事の場所だということになる。 武道館1 でU2(Location1) 計画されている3 30 30
解釈2の説明 武道館でコンサートが計画されている 「で」は名詞に対する接辞であり、単独でSR式に変換されないとする。 解釈2: 今、計画されている「コンサート」の場所が「武道館」であるという解釈 「で」は名詞に対する接辞であり、単独でSR式に変換されないとする。 linguistic SR x1 [名称 :武道館] e3 [類 :計画されている ; 対象 : ...] |x1 この場合、x1とe3の関係は、定まっていないため、世界知識の許す範囲で、自由に「関係づけ」が起こることになる。 武道館で1 計画されている3 31 31