日本語統語論:構造構築と意味 No.3 項と格助詞(改訂版)

Slides:



Advertisements
Similar presentations
自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.
Advertisements

InstallShieldLecture InstallShield でインストーラを作成する方法 ( 初級編 ) ソニーエンジニアリング 設計 3 部 1 課 齋藤佑輔.
1 検索 ● 検索: 特定の文字列を探す ⓪検索を行う範囲を限定するときは、範囲選択をする。 ① 「ホーム」タブ⇒「編集」⇒「検索」タブとクリックする。 ②「検索する文字列」欄に検索したい文字を入力する。 ③「次を検索する」をクリックする。 ③ ‘ 「検索された項目の強調表示」⇒「すべて強調表示」とクリックすると、
コンピュータと情報 第10回 Excel を使ってみる. Excel の起動 ① 「スタート」ボタンをク リック ② すべてのプログラムにマ ウスカーソルをあわせる ③ 「 Microsoft Office 」 → 「 Microsoft Excel 2003 」 にマウスをあわせて,ク リック ④.
1 情報処理 II 第12回の 教材 高知大学理学部 数理情報科学科 1 回生い組対 象 数理情報科学科 1 回生い組対 象担当:塩田 プレゼンテーションソフト プレゼンテーションソフト PowerPoint.
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
情報基礎演習I(プログラミング) 第9回 6月22日 水曜5限 江草由佳
メール暗号化:秘密鍵・公開鍵の作成  作業手順 Windows メール(Vista).
(実はアイコンは単なる飾りで、この縦書きの部分のどこをクリックしても次のページに移動します。)
ブラウザの基本操作 前のページに戻る ブラウザの左上にある 「戻る」ボタンで、自分がたどってきた一つ前のページに戻ることができます。
Imagio カンタン文書登録V2 画面シミュレーション.
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
ファイルやフォルダを検索する ①「スタート」→「検索」→「ファイルとフォルダ」とクリックする。
情報処理 教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 塩田
日本語統語論:構造構築と意味 No.5 使役構文
情報処理 第13回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当:塩田 ここはメモを書く欄。
情報処理 第11回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当:塩田 ここはメモを書く欄。
情報処理 第12回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当教員 : 塩田
ホームページの作り方.
5.WEKOコンテンツ登録 準備 マニュアル Version 2.1
日本語統語論:構造構築と意味 No.1 統語論とは
一致の非対称の 極小理論的分析 小林 亜希子 島根大学 「言語と情報研究プロジェクト研究会:言語理論の動向を考える」 広島大学
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
日本語統語論:構造構築と意味 No.1 統語論とは
Natural Semantics 実行過程の、最初と最後の状態(state)の関係を考える。
 Combinations(2)        古川 勇輔.
情報コミュニケーション入門 2016年度版 情報コミュニケーション入門m 総合実習(1).
WebCluster スライドショーで見る操作ガイド
言語処理系(5) 金子敬一.
【トップページ-TOPICSの登録・編集】
システム開発実験No.7        解 説       “論理式の簡略化方法”.
平成22年度に実施を予定するインターネットを 用いた研修システムによる研修 ライブ配信受講手順書
Web上で管理・利用できる 面接予約データベースシステムの構築
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
2017/4/9 情報処理 第5回.
日本語統語論:構造構築と意味 No.2 構造と意味解釈
コンパイラ 2012年10月22日
マイクロソフト Access を使ってみよう 第1回
CSVファイルとは? CSVとは、Comma Separated Value(カンマで区切られた値)の頭文字をとったものです。つまり、CSVファイルとは、値(数値や文字等)をカンマ(,)で区切って書いたテキストファイルのことを指しています。 メリットは、異なるソフト間でデータの受け渡しをする時によく使われます。
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
コンパイラ 2011年10月24日
統語意味論:認知科学としての統語論の提案
経営工学基礎演習a PowerPointの利用.
10 Microsoft Word(1) 10.1 Microsoft Word v.Xの概要 起動 終了
情報処理A 第?回 Excelを使ってみる.
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
3.1 PowerPoint の概要 PowerPointを使ってできること
上山あゆみ(九州大学) 2011年度前期水曜日2限 理論言語学特論 I これまでのまとめ 上山あゆみ(九州大学)
0.2 プロジェクトの準備 DXライブラリを使うための準備.
マイクロソフト Access を使ってみよう 第2回
情報スキル活用 第2週 基礎技術ー2 : Webページの基本形.
Htmlの基本.
コンピュータ プレゼンテーション.
日本語統語論:構造構築と意味 No.8 連体修飾
管理画面操作マニュアル <物件情報> 第5版 改訂 株式会社アクア 1.
環境システム科学演習(後半) FORTRAN & C(以降FORTRANと省略して呼びます)は富士通
コンパイラ 2011年10月20日
情報処理 第13回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当教員 : 塩田
15.cons と種々のデータ構造.
統計ソフトウエアRの基礎.
表計算 Excel 演習 1.Excel を使ってみる.
情報基礎演習I(プログラミング) 第8回 6月8日 水曜5限 江草由佳
or-6. 待ち行列シミュレーション (オペレーションズリサーチを Excel で実習するシリーズ)
4.プッシュダウンオートマトンと 文脈自由文法の等価性
情報処理 II 第12回の教材 プレゼンテーションソフト PowerPoint 高知大学理学部 数理情報科学科1回生い組対象 担当:塩田教官
エクスプローラ ● エクスプローラ: ファイルやフォルダを階層構造で表示してあり、これらを操作するのに便利。
情報処理 II 第11回の教材 プレゼンテーションソフト PowerPoint 高知大学 共通教育 理学部 対象 担当:塩田
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
printf・scanf・変数・四則演算
第0.5回: ~Unity Editorの操作方法~
Presentation transcript:

日本語統語論:構造構築と意味 No.3 項と格助詞(改訂版) 上山あゆみ(九州大学)

樹形図についての補足事項 A,B,C,D,E,F,G の位置:node(節点) B,F,G,E:terminal node(終端節点) A,B,C,D,E,F,G という文字列:label(ラベル) A は B の、C は D の mother B は A の、D は C の daughter B と C は sister

「白い」+「ギター」=「白いギター」 <x1, {<Kind, ギター>, <白い, _>}> このような意味表示が、「部品」から組み立てられるよう に、システムを構築したい。

文法片1 まずは、ごく基本的な組み合わせ規則と Lexicon だけ が登録されたミニ文法である、文法片1(Fragment of Japanese Grammar 1)でどのような操作でどう いう意味表示ができるか見てみよう。 http://www.gges.org/syncsem/syncsem.cgi?grammar=2& mode=numeration_select

まず、これを選んで、ここをクリックする

Mergeの左の要素と右の要素を選んで、下の 「rule」 をクリックする

rule を適用した結果。

この表示がある間は、 その derivation は不適格。        ↓

この表示が出れば、 その derivation は適格。        ↓

解釈不可能素性 解釈不可能素性 =規則適用終了後に残っていると表示が不適格になるもの。デモ プログラムの画面では、赤字で表示されている。 規則を適用する要素を、うまく選んでいかないと、要素を組み合わ せる間に解釈不可能素性をすべて削除することができない。 つまり、Computational Systemに課されているのは、 Numerationに含まれる解釈不可能素性をすべて消す という「問題解決(problem-solving)」である。 →デモプログラムを実際に操作することで、 Computational Systemの働きを体感してもらいたい。

何と何にどんな rule を適用したのか、その historyの表示

derivation と樹形図 いう順番でどの要素とどの要素を組み合わせたかで結果 が異なる。 それを視覚的にわかりやすく表示したものが樹形図であ る。 なるべく頻繁に樹形図を確認するようにしていると、そのう ち、どういう組み合わせ方がどのような樹形図と対応して いるのか、頭の中でイメージできるようになる。

今の derivation の樹形図を表示させたければ、ここをクリック

ここをコピーして、TreeDrawer の「Load」をクリック。 不要なファイルを右クリックして、「編集」。 開いたファイルを、今、コピーしたもので貼り換えて「開く」と 樹形図が表示される。

樹形図 「TreeDrawer用の csvデータ作成(範疇素性)」によって作 成される樹形図

意味表示を表示させるために(次の画面でも「意味表示」をクリック)

意味表示 「節点ごとの意味素性」→「意味表示」 つまり、前ページのような樹形図ができるような「組み合わせ方」 Numeration につけられた「メモ」 今のところ、無視 つまり、前ページのような樹形図ができるような「組み合わせ方」 をすれば、上のような意味表示ができるということ。

このderivationを保存しておきたければ、このピンクのbox内をコピーしておく。

登録されている語彙は右上の「Lexicon一覧」で 例としてあげてある Numeration 以外にも、自分で語彙項目 を拾って Numeration を作り、いろいろ試してみることができる。

自分で Numeration を作るには 今度は、これを選んで、ここをクリックする

見出し語を1つずつ入力して、これをクリックする

特に問題なければ、「start」。 やり直すなら、ここ

この Numeration を再度使う可能性があるなら、この box 内のものをコピーしておく。

今回の実践課題 この「ジョンがメアリを追いかけた」を選んで、表示された Numeration から始めて、(i) 適格な derivation と (ii) 不適格な derivation を作りなさい。

「ジョンがメアリを追いかけた」 「ジョンがメアリを追いかけた」の意味表示は? 次のようになっていればいいのではないか。   {<x1,{<Name, ジョン>}>,    <x3,{<Name, メアリ>}>,    <x5,{<Kind, 追いかける>, <Time, perfect>,      <Theme, x3>, <Agent, x1>}>} Agent:行為者 Theme:対象

意味役割 たいていのデキゴトには,それに関わる参与者(participant) があり,ある参与者がどのような点でそのデキゴトに関与している かを述べたものは意味役割(semantic role)と呼ばれる 意味役割 Agent (行為者): 何らかの行為を意志を持って行う人・生き 物 Theme (対象物): 行為や感情などの対象となるもの,その 行為によって状況の変化をこうむるもの Goal (到達点,目標): 行為の到達点.対象物の行き先など. Source (出どころ): 移動の出発点など. Location (場所): 行為の起こる場所.

項(argument) 動詞によって、どのような参与者を項 (argument)と して持つかが決まっている。 ハンカチが落ちた.(Theme) 誰かがハンカチを落とした.(Agent, Theme) ドアが開いた.(Theme) 誰かがドアを開けた.(Agent, Theme) 氷がとけた.(Theme) 誰かが氷をとかした.(Agent, Theme) 項の取り方は言語的知識であり、これは、Lexicon に 書かれているはず。

項構造(argument structure) たとえば、Lexicon に次のように意味素性が指定されて いれば、Merge した相手の指標が★の位置に入り、 OBJECTとOBJECTの関係が意味表示にあらわれるこ とになる。 [{V}, <id,{<Kind, 落ちる>, <Theme, ★>}>, 落ち る] [{V}, <id,{<Kind, 落とす>, <Theme, ★>, <Agent, ★>}>, 落とす] ただし、...

問題 「ジョンがメアリを追いかけた」の場合、(A)の意味には なっても、決して(B)の意味にはならない。 (A) {<x1,{<Name, ジョン>}>,     <x3,{<Name, メアリ>}>,     <x5,{<Kind, 追いかける>, <Time, perfect>,      <Theme, x3>, <Agent, x1>}>} (B) {<x1,{<Name, ジョン>}>,     <x5,{<Kind, 追いかける>, <Time, perfect>,      <Theme, x1>, <Agent, x3>}>} どうすれば、この事実をとらえられるだろうか?

「ジョンがメアリを追いかけた」 明らかに、格助詞が役割を果たしている。そこで: [{V},<id,{<Kind, 追いかける>, <Time, perfect>, <Theme, ★wo>, <Agent, ★ga>}>, 追いかけた] ★wo=Merge相手が wo を持っている場合のみ、その指標と 置き換わる ★ga=Merge相手が ga を持っている場合のみ、その指標と置 き換わる このように考えれば、それぞれの意味役割のところに正しい指標 が入ることになる。

デモプログラムの理論的解説 以下の説明は、デモプログラムの内部でどのように計算が 行われているか、その中身の仕組みを解説したものであ る。 文法理論を改善していくためには、このような知識が必 要になるが、まず、Computational System のイメー ジを把握するところから始めたい場合には、以下の説明 を現時点で理解する必要はない。

Lexicon における語彙項目の形式 語彙項目:統語素性・意味素性・音韻素性のリスト (a bundle of syntactic, semantic, and phonological features) 統語素性:範疇素性、その他、構造構築に関わる統語素性 意味素性:<指標, {<property>, ...}> 音韻素性:(この授業では、単に、その語彙項目を普通の日 本語表記で書いてある) 例 [{N}, <index, {<Name, ジョン>}>, ジョン] [{N}, <index, {<Kind, 男の子>}>, 男の子]

Numeration における語彙項目の形式 Numeration では、Lexicon から取り出した語彙項 目を指標とペアにして、1つの要素にすると仮定する。 <指標, [統語素性, 意味素性, 音韻素性]> 例  <x5, [{N}, <x5, {<Name, ジョン>}>, ジョン]> <x3, [{N}, <x3, {<Kind, 男の子>}>, 男の子]> Lexicon において意味素性の中に書いてあった「index」は、 Numeration で付与された指標と同じになる。 この意味素性の中の指標の場所を id-slot と呼ぶことにする。

Merge(併合) 2つの要素をとって、どちらかを主要部(head)として、 1つの要素にする操作 主要部 < , [ , , <xn, xm>]> <xn, [{範疇素性1, 統語素性1},     意味素性1, 音韻素性1]> < xm, [ {範疇素性2}, φ, 音韻素性2]> xm {範疇素性2, 統語素性2} 意味素性2 主要部

RH-Merge 2つの要素をとって、右側の要素を主要部(head)とし て、1つの要素にする操作 <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]> <xm, [{範疇素性2, 統語素性2}, 意味素性2, body2]> ⇒ RH-Merge (=Right-headed Merge) <xm, [{範疇素性2, 統語素性2}, 意味素性2, <   <xn, [{範疇素性1, 統語素性1}, 意味素性1, body1]>,   <xm, [{範疇素性2}, φ, body2]> >]> 日本語の場合、原則的に右の要素が主要部となるので、この RH-Merge が最も無標の規則ということになる。

rule 名をクリックすると、下のボックスに、その rule の説明が表示される

「白いギター」の場合 Lexicon での形: Merge: [{A}, <★, {<白い, _>}>, 白い] <x1, [{A}, <★, {<白い, _>}>, 白い]> <x2, [{N}, <x2, {<Kind, ギター>}>, ギター]> → Merge <x2, [{N}, <x2, {<Kind, ギター>}>, < <x1, [{A}, <x2, {<白い, _>}>, 白い]>, <x2, [{N}, φ, ギター]> >]> このように、意味表示が構造構築の中で出来上がっていく。

理論構築の方針 Lexicon における語彙項目の統語素性や意味素性に は、解釈不可能素性が含まれうる 解釈不可能素性 =規則適用終了後に残っていると表示が不適格になるもの 統語的な制約を体現する =統語的に位置が制限される語彙 に解釈不可能素性を置いておき、Merge(構造構築規則) の適用相手が条件に合致すると、削除されるようにする。 意味表示を構築する =組み合わせて意味表示が形成される 箇所に解釈不可能素性を置いておき、 Merge(構造構築規 則)の適用によって、適切な「組み合わせ」が形成されるように する。

理論構築の方針 どの要素とどの要素にどの統語規則を適用していくかは、 Numerationに含まれる解釈不可能素性をすべて消すことを 目的とした「問題解決(problem-solving)」である。 (=それ自身が「文法の知識」ではない。運用能力には大きく 影響するけれど。) 統語規則が1回適用するたびに、要素の数が1つ減るか、解 釈不可能素性の数が1つ減るか、どちらかは起こる。 → Numeration が決まれば、数え上げが可能なシステムなの で、将来的に、コンピュータによるシミュレーションが可能になる。

格助詞 では、「ジョンが」や「メアリを」は、どのように組み合わされ ると考えればいいだろうか? [{V},<id,{<Kind, 追いかける>, <Time, perfect>, <Theme, ★wo>, <Agent, ★ga>}>, 追いかける] (A)のような意味表示を得るためには、「ジョン」と「が」では、「ジョ ン」のほうが主要部である必要がある。 (A) {<x1,{<Name, ジョン>}>,     <x3,{<Name, メアリ>}>,     <x5,{<Kind, 追いかける>, <Time, perfect>,      <Theme, x3>, <Agent, x1>}>}

J-Merge そこで、右側の要素の範疇素性が J のときに適用する J-Merge という規則を仮定する。 <xn, [{N, 統語素性1}, 意味素性1, body1]> <xm, [{J, +R, 統語素性2}, φ, body2]> ⇒ J-Merge <xn, [{NP, 統語素性1, 統語素性2}, 意味素性1, <   <xn, [{N}, φ, body1]>,   <xm, [{J}, φ, body2]> >]> J に対して RH-Merge が適用してしまうことのないよう、Jには、 J-Merge でのみ除去される +R という解釈不可能素性も仮 定しておく。