日本語統語論:構造構築と意味 No.1 統語論とは 上山あゆみ(九州大学)
言語学 紀元前~ 18~19世紀 19世紀~ 哲学(アリストテレス、プラトン、パーニニ、...) 20世紀前半 20世紀後半 比較言語学(ジョーンズ、 グリム、ソシュール、...) 構造言語学(ソシュール、 ブルームフィールド、サピア、 ヤーコブソン、...) この授業は、基本的に、生成文法の言語観に立って統語論の実践を目指すものです。 まずは、言語学の流れの中で、生成文法というものがどのように位置づけられるものであるかを、簡単に見ておきます。 類型論 (グリーンバーグ, ...) 生成文法 (チョムスキー、...)
比較言語学 異なる時代や異なる地域で同じ語彙表現の形を比べる その形の対応関係に音韻的な規則性を見つける ↓ その形の対応関係に音韻的な規則性を見つける その規則性がどのような範囲で成り立っているかを調べる 言語の系統関係についての仮説を提案する 語彙の音韻形式に反映されない違いについては論じにくい
言語学 紀元前~ 18~19世紀 19世紀~ 哲学(アリストテレス、プラトン、パーニニ、...) 20世紀前半 20世紀後半 比較言語学(ジョーンズ、 グリム、ソシュール、...) 構造言語学(ソシュール、 ブルームフィールド、サピア、 ヤーコブソン、...) 類型論 (グリーンバーグ, ...) 生成文法 (チョムスキー、...)
類型論 それぞれの語彙の音韻形式に限らず、さまざまな文法的 特徴について、多くの言語を観察する。 ↓ 「不自然な空白」を見つける。(たとえば、「A&B も B&C もあるのに、A&C がない」とか。) そのような「空白」が存在する理由が納得できるような仮 説を提案する。 1つ1つの言語の分析の妥当性が不安材料になる。
言語学 紀元前~ 18~19世紀 19世紀~ 哲学(アリストテレス、プラトン、パーニニ、...) 20世紀前半 20世紀後半 比較言語学(ジョーンズ、 グリム、ソシュール、...) 構造言語学(ソシュール、 ブルームフィールド、サピア、 ヤーコブソン、...) 類型論 (グリーンバーグ, ...) 生成文法 (チョムスキー、...)
構造言語学 1つの言語の中のパターンを徹底的に調べて、その中に ある規則性を調べる。 まず、音韻について調べ、音素のリストとその配列の規則 性を明らかにする。 ↓ 次に、語を調べ、形態素のリストとその配列の規則性を 明らかにする。 そして、文を調べ、語の配列の規則性を明らかにする。 「文」の成り立ちは非常に複雑で、単純にパターン化できない。
言語学 紀元前~ 18~19世紀 19世紀~ 哲学(アリストテレス、プラトン、パーニニ、...) 20世紀前半 20世紀後半 比較言語学(ジョーンズ、 グリム、ソシュール、...) 構造言語学(ソシュール、 ブルームフィールド、サピア、 ヤーコブソン、...) 類型論 (グリーンバーグ, ...) 生成文法 (チョムスキー、...)
生成文法における言語観 言語というものを人間の認知という観点からとらえなおす。 ことさらに規則という形で教わらなくても、いつのまにか習得できて いることが多々ある。 文法の根幹の部分は、(人間という種として遺伝的に)生まれつき備 わっているものなのではないか。 普遍文法(Universal Grammar) ただし、近年の人工知能研究("deep learning")では、必ずしも「規則」として教えずとも、非常に複雑なパターンを習得しうることがわかってきている。
生成文法における言語観 言語というものを人間の認知という観点からとらえなおす。 単に、聞き覚えたまま繰り返しているわけではなく、習得した「部 品」をさまざまに組み合わせて、まったく新しい文を作り上げ、新し い意味/情景を生み出すことができる。 その点こそ、言語の本質であると考える。 生成文法(Generative grammar) 「部品の組み合わせ方(=統語論)」が言語の仕組みの根幹 である。
統語論の位置づけ 頭の中には、「部品」がたくわえられている Lexicon と、そこから いくつか選んで入力すると、それらが組み合わさって出力される計 算システムが存在していると仮定する。 Computational System LF Numeration (いくつかの単語の集合) PF Lexicon (Phonological Form: 語彙を構造化した、発音の基盤となる表示) (Logical Form: 語彙を構造化 した、意味解釈の基盤となる表示) 意味表示
統語論の位置づけ PF は、音韻的に解釈され、実際の音と結びついていく。(PFと 実際の音との対応の仕方をつかさどるのは「音韻論」) LF は、意味的に解釈され、実際の意味と結びついていく。 (LFと実際の意味との対応の仕方をつかさどるのは「意味 論」) つまり、生成文法では、統語論が音韻論や意味論のベースに なっていることになる。 (※ 構造言語学における考え方とは大きく異なっている。)
言語の知識 このように考えると、1つの言語についての知識とは、次 の2つということになる。 Lexicon、すなわち、部品となるものについての知識 Computational Systemの仕組み、すなわち、部品の組み 合わせ方についての知識 つまり、個々の語彙の知識と、それらの組み合わせ方につい ての知識があれば、文全体としては初めて見る文であっても、そ の文を適切に発音することができ、その意味がわかることになる。 生成文法の目的は、Lexicon と Computational system の仕組みを解明すること
統語論が意味論のベースになるとは? 白いギターの箱 ギターの白い箱 「ギター」が白いという解釈で容認可能 「箱」が白いという解釈で容認可能 「ギター」が白いという解釈では、容認不可能
白いギターの箱 「ギター」が白いという解釈 「(ギターの)箱」が白いという解釈
ギターの白い箱 「箱」が白いという解釈 「ギター」が白いという解釈にはならない
構造と意味解釈 このように、どの要素とどの要素がどのように組み合わされ るかによって解釈が変わる。 そして、許されない「組み合わせ方」の解釈はできない。
「白い」+「ギター」=「白いギター」 <x1, {<Kind, ギター>, <白い, _>}> このような意味表示が、「部品」から組み立てられるよう に、システムを構築したい。
derivation(派生) Numeration とその組み合わせ方(derivation)が 決まれば、出力(=<PF, LF>)が決定する。 どんな derivation が可能で、どんな derivation が不 可能かは、Lexicon と Computational System に よって決まる。 Computational System LF Numeration PF Lexicon 意味表示
minimal pair の例 この文は(日本語の)文として成り立つ この文は(日本語の)文として成り立たない (1) a. ok白いギターの箱 b. *白いのギターの箱 c. ok白のギターの箱 (1a)(1c)のような語順になる適格な derivation が存在し、 (1b)のような語順になる適格な derivation が存在しないよう に、Lexiconと Computational Systemを考える。 この文は(日本語の)文として成り立つ この文は(日本語の)文として成り立たない
意味解釈が関わる minimal pair の例 (2) a. (箱が白いという意味で) okギターの白い箱 b. (ギターが白いという意味で) *ギターの白い箱 c. (ギターが白いという意味で) ok白いギターの箱 (2a)(2c)のような語順と意味になる、適格な derivation が 存在し、(2b)のような語順と意味になる、適格な derivation が存在しないように、Lexiconと Computational Systemを 考える。 この文ではこの解釈ができる この文ではその解釈ができない
統語論の研究と意味表示 意味解釈が関わる minimal pair を取り上げる以上、 意味表示がなければ、仮説構築の目標を表現すること ができない。 これまでの生成文法では、樹形図そのものが意味を表すかのよう に想定されてきた。しかし、樹形図は derivation を表しているの であるから、説明対象としての意味を表現するための手段は、樹 形図とは別に必要である。
文法片 (Fragment of Grammar) 一般的な生成文法理論においては、構造構築のための 規則は Merge のみ、と想定されている。 しかし、この2種類だけでは、実際に minimal pair を 説明していこうとすると、どうしても無理が生じる。 それぞれの言語の状況に応じて、ある程度は、特別な Merge規則も仮定せざるをえない。 Left-Headed Merge Right-Headed Merge
生成文法の研究 説明対象を見さだめる。 現在、仮定しているシステムで、どのように説明が可能 か検討する。 必要ならば、システムを改訂する。 改訂したシステムで、これまでの説明対象が問題なく説 明できるか確認する。 一度にすべての現象を考慮に入れてシステムを作ること は不可能なので、説明対象の範囲を少しずつ広げていく しかない。
文法片 (Fragment of Grammar) 文法片0(Right-headed Merge と Left-headed Merge のみ) http://www.gges.org/syncsem/syncsem.cgi?grammar=3&mode=nu meration_select 文法片1(Right-headed Merge と J-Merge) http://www.gges.org/syncsem/syncsem.cgi?grammar=2&mode=nu meration_select 文法片2(Right-headed Merge と J-Merge と zero-Merge) http://www.gges.org/syncsem/syncsem.cgi?grammar=4&mode=nu meration_select 文法片3(V と T の分離) http://www.gges.org/syncsem/syncsem.cgi?grammar=5&mode=nu meration_select
理論構築の目標 生成文法の目的:Lexicon と Computational System の仕組みを解明すること =「こんな語順でこんな解釈ができる」という観察と合致する derivation が可能で、「こんな語順でこんな解釈はできない」とい う観察と合致する derivationが不可能なように、システムを構築 しなければならない。 ok であることを示すためには、うまくいく derivation が1つ存 在することを示せば十分であるが、* であることを示すためには、 どういう組み合わせで何をしてもダメであることを示す必要があ る。 → シュミレーション可能な理論でないと、検証が難しい。
日本語統語論:構造構築と意味 No.2 デモプログラム 上山あゆみ(九州大学)
まず、これを選んで、ここをクリックする
Mergeの左の要素と右の要素を選んで、下の 「rule」 をクリックする
rule 名をクリックすると、下のボックスに、その rule の説明が表示される
rule を適用した結果。
この表示がある間は、 その derivation は不適格。 ↓
この表示が出れば、 その derivation は適格。 ↓
解釈不可能素性(詳しくは後述) 解釈不可能素性 =規則適用終了後に残っていると表示が不適格になるもの。デモ プログラムの画面では、赤字で表示されている。 規則を適用する要素を、うまく選んでいかないと、要素を組み合わ せる間に解釈不可能素性をすべて削除することができない。 つまり、Computational Systemに課されているのは、 Numerationに含まれる解釈不可能素性をすべて消す という「問題解決(problem-solving)」である。 →デモプログラムを実際に操作することで、そういう Computational Systemの働きを体感してもらいたい。
何と何にどんな rule を適用したのか、その historyの表示
このderivationを保存しておきたければ、このピンクのbox内をコピーしておく。
derivation と樹形図 どういう順番でどの要素とどの要素を組み合わせたか (=derivation)で結果(=適格かどうか&語順&意 味)が異なる。 derivation を視覚的にわかりやすく表示したものが樹 形図である。 なるべく頻繁に樹形図を確認するようにしていると、そのう ち、どういう組み合わせ方がどのような樹形図と対応して いるのか、頭の中でイメージできるようになる。 http://www.gges.org/ueyama/TreeDrawer.s html から各自のパソコンに TreeDrawer をインス トール可能。Windows版と Mac版がある。
今の derivation の樹形図を表示させたければ、ここをクリック
樹形図 「TreeDrawer用の csvデータ作成(範疇素性)」によって作 成される樹形図
もしくは、ここをコピーして、TreeDrawer の「Load」をクリック。 不要なファイルを右クリックして、「編集」。 開いたファイルを、今、コピーしたもので貼り換えて「開く」と 樹形図が表示される。 ここをコピーして、新しいテキストファイルに保存する。 TreeDrawer の「Load」で、そのテキストファイルを読み込むと 樹形図が表示される。
TreeDrawer Add Daughter Edit Node Remove Node Toggle LineWidth Change Parent Shift Left Shift Right Save と Load
TreeDrawer の仕組み 6,7 12 ,R,"A" 7,,0,"B" 12,8 9 ,1,"" 8,10 11 ,0,"D" 10,,0,"F" 11,,0,"G" 9,,1,"E" A列 B列 C列 D列 6 7 12 R A 7 B 12 8 9 1 8 10 11 D 10 F 11 G 9 E
意味表示を表示させるために(次の画面でも「意味表示」をクリック)
意味表示 「節点ごとの意味素性」→「意味表示」 つまり、ここまでの「組み合わせ方」をすれば、 上のような意味表示ができるということ。 Numeration につけられた「メモ」 今のところ、無視 つまり、ここまでの「組み合わせ方」をすれば、 上のような意味表示ができるということ。
自分で Numeration を作るには 今度は、これを選んで、ここをクリックする
見出し語を1つずつ入力して、これをクリックする
登録されている語彙は右上の「Lexicon一覧」で 例としてあげてある Numeration 以外にも、自分で語彙項目 を拾って Numeration を作り、いろいろ試してみることができる。
特に問題なければ、「start」。 やり直すなら、ここ
この Numeration を再度使う可能性があるなら、この box 内のものをコピーしておく。
演習例 1 この「ジョンがメアリを追いかけた」を選んで、表示された Numeration から始めて、(i) 適格な derivation と (ii) 不適格な derivation を作りなさい。
適格な derivation 1
適格な derivation 2
適格な derivation 3
適格な derivation 4
不適格な derivation 1
不適格な derivation 2
不適格な derivation 3
不適格な derivation 4
不適格な derivation 5
不適格な derivation 6
日本語統語論:構造構築と意味 No.3 システムの概要 上山あゆみ(九州大学)
Lexicon における語彙項目の形式 語彙項目:統語素性・意味素性・音韻素性のリスト (a bundle of syntactic, semantic, and phonological features) 統語素性:範疇素性、その他、構造構築に関わる統語素性 意味素性:<指標, {<property>, ...}> 音韻素性:(この授業では、単に、その語彙項目を普通の日 本語表記で書いてある) 例 [{N}, <index, {<Name, ジョン>}>, ジョン] [{N}, <index, {<Kind, 男の子>}>, 男の子]
Numeration における語彙項目の形式 Numeration では、Lexicon から取り出した語彙項 目を指標とペアにして、1つの要素にすると仮定する。 <指標, [統語素性, 意味素性, 音韻素性]> 例 <x5, [{N}, <x5, {<Name, ジョン>}>, ジョン]> <x3, [{N}, <x3, {<Kind, 男の子>}>, 男の子]> Lexicon において意味素性の中に書いてあった「index」は、 Numeration で付与された指標と同じになる。 この意味素性の中の指標の場所を id-slot と呼ぶことにする。
Merge(併合) 2つの要素をとって、どちらかを主要部(head)として、 1つの要素にする操作 主要部 < , [ , , <xn, xm>]> <xn, [{範疇素性1, 統語素性1}, 意味素性1, 音韻素性1]> < xm, [ {範疇素性2}, φ, 音韻素性2]> xm {範疇素性2, 統語素性2} 意味素性2 主要部
LH-Merge 2つの要素をとって、左側の要素を主要部(head)とし て、1つの要素にする操作 <xm, [{範疇素性2, 統語素性2}, 意味素性2, body2]> <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]> ⇒ LH-Merge (=Left-headed Merge) <xm, [{範疇素性2, 統語素性2}, 意味素性2, < <xm, [{範疇素性2}, φ, body2]> <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]>, >]>
RH-Merge 2つの要素をとって、右側の要素を主要部(head)とし て、1つの要素にする操作 <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]> <xm, [{範疇素性2, 統語素性2}, 意味素性2, body2]> ⇒ RH-Merge (=Right-headed Merge) <xm, [{範疇素性2, 統語素性2}, 意味素性2, < <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]>, <xm, [{範疇素性2}, φ, body2]> >]> 日本語の場合、原則的に右の要素が主要部となるので、この RH-Merge が最も無標の規則ということになる。
「白いギター」の場合 Lexicon での形: Merge: [{A}, <★, {<白い, _>}>, 白い] <x1, [{A}, <★, {<白い, _>}>, 白い]> <x2, [{N}, <x2, {<Kind, ギター>}>, ギター]> → Merge <x2, [{N}, <x2, {<Kind, ギター>}>, < <x1, [{A}, <x2, {<白い, _>}>, 白い]>, <x2, [{N}, φ, ギター]> >]> このように、意味表示が構造構築の中で出来上がっていく。
理論構築の方針 Lexicon における語彙項目の統語素性や意味素性に は、解釈不可能素性が含まれうる 解釈不可能素性 =規則適用終了後に残っていると表示が不適格になるもの 統語的な制約を体現する =統語的に位置が制限される語彙 に解釈不可能素性を置いておき、Merge(構造構築規則) の適用相手が条件に合致すると、削除されるようにする。 意味表示を構築する =組み合わせて意味表示が形成される 箇所に解釈不可能素性を置いておき、 Merge(構造構築規 則)の適用によって、適切な「組み合わせ」が形成されるように する。
理論構築の方針 どの要素とどの要素にどの統語規則を適用していくかは、 Numerationに含まれる解釈不可能素性をすべて消すことを 目的とした「問題解決(problem-solving)」である。 (=それ自身が「文法の知識」ではない。運用能力には大きく 影響するけれど。) 統語規則が1回適用するたびに、要素の数が1つ減るか、解 釈不可能素性の数が1つ減るか、どちらかは起こる。 → Numeration が決まれば、数え上げが可能なシステムなの で、将来的に、コンピュータによるシミュレーションが可能になる。
格助詞 では、「ジョンが」や「メアリを」は、どのように組み合わされ ると考えればいいだろうか? [{V},<id,{<Kind, 追いかける>, <Time, perfect>, <Theme, ★wo>, <Agent, ★ga>}>, 追いかける] (A)のような意味表示を得るためには、「ジョン」と「が」では、「ジョ ン」のほうが主要部である必要がある。 (A) {<x1,{<Name, ジョン>}>, <x3,{<Name, メアリ>}>, <x5,{<Kind, 追いかける>, <Time, perfect>, <Theme, x3>, <Agent, x1>}>}
J-Merge そこで、右側の要素の範疇素性が J のときに適用する J-Merge という規則を仮定する。 <xn, [{N, 統語素性1}, 意味素性1, body1]> <xm, [{J, +R, 統語素性2}, φ, body2]> ⇒ J-Merge <xn, [{NP, 統語素性1, 統語素性2}, 意味素性1, < <xn, [{N}, φ, body1]>, <xm, [{J}, φ, body2]> >]> J に対して RH-Merge が適用してしまうことのないよう、Jには、 J-Merge でのみ除去される +R という解釈不可能素性も仮 定しておく。
演習例 2 文法片1で、上から3つめの 「男の子が女の子をス ケートボードで追いかけた」を選び、表示された Numeration から始めて、適格な derivationを1つ 作り、最後の画面のピンクの BOX内をコピーしたものと、 そのときの意味表示を貼り付けて提出してください。
派生例 ● ... 解釈不可能素性
派生例 +N
派生例 +N
派生例 +N <☆, {<Instrument, ★>}>
派生例 +N <★, {<Instrument, x3>}>
派生例 +N wo
派生例 +N wo
派生例 wo <x7, {<Theme, ★wo>, <Agent, ★ga>}>
派生例 wo <x7, {<Theme, x5>, <Agent, ★ga>}> ↑ ↑ Theme が決まる
派生例 <★, {<Instrument, x3>}>
派生例 <x7, {<Instrument, x3>}> ↑ 「スケートボードで」の 係り先が決まる
派生例 <x7, {<Theme, x5>, <Agent, ★ga>}>
派生例 <x7, {<Theme, x5>, <Agent, x1>}> ↑ Agent が決まる
演習例 3 文法片2で、上から5つめの 「メアリを追いかけた」を 選び、表示された Numeration から始めて、適格な derivationを1つ作り、最後の画面のピンクの BOX内 をコピーしたものと、そのときの意味表示を貼り付けて提 出してください。
「ゼロ代名詞」 日本語では、すべての項があらわれるとは限らない。 ジョンが追いかけた. メアリを追いかけた. あ,追いかけてる! これは、英語ならば代名詞が用いられるところなので、日 本語にはゼロ代名詞(empty pronoun)がある、 という言い方がされることもある。 もちろん、音形のない代名詞を Lexicon に加えておくこ とは可能ではあるが、常にゼロ代名詞を必要な数だけ Numeration に加えておかなければならないとなると、 少し面倒。
文法片 2 そこで、文法片2では、zero-Merge という規則が含ま れている。 http://www.gges.org/syncsem/syncsem.cgi?mode= numeration_select&grammar=4 <xn, [{範疇素性1, ...}, <xn,{..., <意味役割1, ★>, ...}>, body1]> ⇒ zero-Merge <xn, [{範疇素性1, ...}, <xn,{..., <意味役割1, xm>, ...}>, < <xm, [{NP}, <xm,{}>, φ]>, <xn, [{範疇素性1}, φ, body1]> >]> zero-Merge を適用すると、ゼロ代名詞と RH- Merge したのと同じ結果になる。