12月08日 構文解析 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする.

Slides:



Advertisements
Similar presentations
英作文支援システムの 構築に関する研究 平成 15 年 11 月 18 日 ( 火 ) A1 グループ M2 永易 稔 中間発表.
Advertisements

PCFG の EM アルゴリズムとス ムージング 二宮 崇 1. 今日の講義の予定 PCFG (Probabilistic Context Free Grammar, 確率付 文脈自由文法 ) EM アルゴリズム スムージング 教科書 北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル.
コーパス言語学入門 第 2 回. 授業名:情報システムコース実験演習 ( 後期 ) 火曜第 2 フレーム 担当部分:言語情報処理(コーパス言語学 入門) 担当教員:藤 正明 日時: 10 月 5 日・ 10 月 7 日・ 10 月29日・ 11 月 2 日の 3 時 30 分から 5 時 50 分。
プログラミング言語論 第3回 BNF 記法について(演習付き) 篠埜 功. 構文の記述 プログラミング言語の構文はどのように定式化できるか? 例1 : for ループの中に for ループが書ける。 for (i=0; i
自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
ことばとコンピュータ 2007年度1学期 第13回.
意味属性の共起による 「AのB」型名詞句の翻訳規則
東京工科大学 コンピュータサイエンス学部 亀田弘之
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
コーパス言語学 第1回.
言語体系とコンピュータ 第6回.
一致の非対称の 極小理論的分析 小林 亜希子 島根大学 「言語と情報研究プロジェクト研究会:言語理論の動向を考える」 広島大学
情報とコンピュータ 静岡大学工学部 安藤和敏
実験 関数・記号付き文型パターンを用いた機械翻訳の試作と評価 石上真理子 水田理夫 徳久雅人 村上仁一 池原悟 (鳥取大) ◎評価方法1
東京工科大学 コンピュータサイエンス学部 亀田弘之
人工知能特論II 第1回 二宮 崇.
統率・束縛理論2.
テキストマイニング, データマイニングと 社会活動のトレース
プログラミング言語論 第4回 式の構文、式の評価
伝統的件名標目の特徴 図書館界における統制語彙表。通常全分野型。 (1)統制語である 同義語の統制 例:絵、書画→絵画 警官→警察官
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
第12回  自然言語処理.
第6章 ユニフィケーション解析 ユニフィケーション解析とは?
形態素解析および係り受け解析・主語を判別
言語処理系(5) 金子敬一.
コンパイラ 2012年10月22日
コンパイラ 2011年10月24日
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
オントロジーを使用した プログラム開発支援システムの提案
自然言語処理及び実習 第11回 形態素解析.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
プログラミング言語論 第3回 BNF記法について(演習付き)
人工知能特論II 第2回 二宮 崇.
形式言語の理論 5. 文脈依存言語.
6.2.4 辞書項目(1) 辞書項目にも、語に対するDAGを与える。
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
自然言語処理2016 -平成28年11月7日・14日(No.6&7)-
複数対象への音声入力による行動指示 ~個別行動から共同行動への研究~
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
東京工科大学 コンピュータサイエンス学部 亀田弘之
シナリオのアニメーション表示による 妥当性確認支援
テキストマイニング, データマイニングと 社会活動のトレース
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
プログラミング言語論 第9回 情報工学科 木村昌臣 篠埜 功.
コンパイラ 2011年10月20日
モデル検査(5) CTLモデル検査アルゴリズム
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語表現と 視覚表現の比較 関西大学社会学部 雨宮俊彦.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
明示的文法知識が 正確な言語使用に結びつかないケース 浦野 研(北海学園大学)
大規模コーパスに基づく同義語・多義語処理
述語論理式の構文と意味 一階述語論理式の構文 一階述語論理式の意味 述語,限量記号 自然言語文の述語論理式表現 解釈 妥当,充足不能
自然言語処理2015 Natural Language Processing 2015
4.プッシュダウンオートマトンと 文脈自由文法の等価性
第7回 Q&A メール講座 Next Stage:翻訳力アップ自己トレ(1)
情報とコンピュータ 静岡大学工学部 安藤和敏
自然言語処理2016 Natural Language Processing 2016
識別子の読解を目的とした名詞辞書の作成方法の一試案
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
4.2 再帰下降解析 (1)再帰下降解析とは ■再帰下降解析(Recursive Descent Parsing)
Presentation transcript:

12月08日 構文解析 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする

構文木 (一郎が速いボールを軽々と投げた) 動詞句 後置詞句 後置詞句    名詞句         動詞句 名詞 助詞 形容詞 名詞  助詞 副詞   動詞 一郎  が  速い  ボール  を  軽々と  投げた

CYKアルゴリズム チョムスキーの標準形の文脈自由文法を対象とした構文解析法 チョムスキーの標準形 A→BC (A,B,C∈Vn) A→a (A∈Vn, a∈Vt) X→aBはチョムスキーの標準形ではないが   X→AB, A→aに分解できる X→ABCはチョムスキーの標準形ではないが   X→AY, Y→BCに分解できる

チョムスキーの標準形の例 「急いで走る一郎を見る」 (1) s→pp v (2) s→adv vp (3) vp→pp v (4) vp→adv v (5) np→vp n (6) np→v n (7) np→np p (8) pp→n p (9) adv→急いで (10) n→一郎 (11) p→を (12) v→走る (13) v→見る

CYK構文解析の概要 1.急いで 2.走る 3.一郎 4.を 5.見た T2,5: 走る一郎を見た T2,2: 走る| T3,5: 一郎を見た 1.急いで 2.走る 3.一郎 4.を 5.見た T2,3: 走る一郎| T4,5 を見た T2,4: 走る一郎を| T5,5 見た 1.急いで T1,5 T2,5 T1,4 T1,3 T2,4 T3,5 T1,2 T2,3 T3,4 T4,5 T1,1 T2,2 T3,3 T4,4 T5,5 急いで 走る 一郎 を 見た 2.走る T2,2 T2,3 T2,4 T2,5 3.一郎 T3,5 4.を T4,5 5.見た T5,5

T2,5までの部分木 T2,5: 走る一郎を見た T1,5 T1,5 T1,4 T2,5 T1,4 T2,5 T1,3 T2,4 T1,3 急いで 走る 一郎 を 見た 急いで 走る 一郎 を 見た T2,2: 走る| T3,5: 一郎を見た T1,5 T2,3: 走る一郎| T4,5 を見た T1,4 T2,5 T1,3 T2,4 T3,5 T1,2 T2,3 T4,5 T3,4 T1,1 T2,2 T3,3 T4,4 T5,5 急いで 走る 一郎 を 見た T2,4: 走る一郎を| T5,5 見た

CYKアルゴリズム A→aの形の規則を用いて主対角線上の要素を求める. A→BCの形の規則を用いて2番目以降の対角線上の要素を求める for i=1 to N Ti,i={A|A→wi} A→BCの形の規則を用いて2番目以降の対角線上の要素を求める for k=1 to N-1 for i=1 to N-k であれば, は開始記号Sから導出可能

CYK構文解析表 1.急いで 2.走る 3.一郎 4.を 5.見た 1.急いで 2.走る 3.一郎 4.を 5.見た vp→pp v 1.急いで 2.走る  3.一郎 4.を  5.見た vp→pp v s→pp v s→adv vp adv→急いで vp→adv v np→vp n pp→np p 1.急いで v→走る np→v n pp→np p vp→pp v s→pp v 2.走る n→一郎 pp→n p vp→pp v s→pp v 3.一郎 p→を 4.を v→見た 5.見た

文脈自由文法に基づく構文木 s s pp vp np pp vp np adv v n p v adv v n p v 急いで 走る 一郎 を 見た  急いで 走る 一郎 を 見た

意味解析 与えられた文から,妥当な語の意味と意味関係を明らかにし,意味構造を生成する 意味構造 意味解析に用いる知識 意味解析手法 コーパスによる訳語選択

意味構造 格構造 格:文を構成する要素(語や句)が述語に対して果たす役割 表層格(構文的) 深層格(意味的) 構文木から表層的に決まる格 ガ格,ヲ格,ニ格 深層格(意味的) 表層だけでは決まらない Fillmoreの深層格 動作主格,経験者格,道具格,対象格,源泉格,目標格,場所格,時間格

格構造の例 open open open 動作主格 対象格 対象格 道具格 対象格 John the door the door the key the door John opened the door. The key opened the door. The door opened. open open 動作主格 対象格 動作主格 道具格 対象格 John the door John the door the key The door was opened by John. John opened the door with the key.

述語論理式 一階述語論理 John opened the door.

概念依存構造 John gave the man a book. man P O R John ATRANS book John 過去時制 対象 受益者の関係 man P O R John ATRANS book 抽象的なものの移動 John

意味解析に用いる知識 選択制限 スクリプト 電子化辞書

選択制限 文の意味的妥当性を規定するため辞書中に記述された,単語間の共起関係に関する意味的制約 例:目の下にくまが出来た.     「くま」の意味→動物の熊,目の下の陰     動物は目の下には出来ないので     目の下に「熊」が出来たわけではない

スクリプト 典型的な事象例を一つの枠の中にまとめた記憶構造.人間が日常行っている定型化された行動を,時間の流れに沿った事象の連鎖で表現したもの 例:レストランスクリプト 客がレストランに入り,料理を注文し,食事をし,支払いをして,レストランをでる間の行動を記述する レストランで 「誤って皿を割ってしまった」の皿はひざの皿ではなくて料理を盛り付ける皿であると推測できる

電子化辞書 意味解析には体系的かつ網羅的に語彙の上位・下位関係や制約を記述した知識ベースが必要 既存の辞書を電子化 対訳辞書,英英辞書,シソーラス,類語辞典,分類語彙表 利用例:語釈文中に現れる単語を利用する語の曖昧性解消法 言語処理用に構築された辞書 EDRの辞書,オントロジー辞書,WordNet 利用例:語と語の関係(上位・下位関係などを利用)

意味解析手法

コーパスによる訳語選択 ある言語における単語を別の言語のどの単語で表現するか 例:paper→紙,新聞,論文 DMAX訳語選択法 GDMAX訳語選択法

訳語選択用コーパス パラレルコーパス コンパラブルコーパス ある言語の文(原文)と他言語の対訳文から構成されるコーパス 例:Unixのman page,天声人語とその対訳 大量収集:困難 コンパラブルコーパス 分野やトピックを共有しているある言語のコーパスと他言語のコーパス 例:各国の新聞記事 大量収集:比較的容易

コンパラブルコーパスを用いた訳語選択 DMAX訳語選択法(Double MAXimize法) GDMAX訳語選択法(Generalized Double MAXimize法)

DMAX訳語選択法 (Double MAXimize法) アイディア:ある言語コーパスにおいて最大の共起頻度をもつ二つの単語に着目し,その二つの単語の訳語候補が複数ある場合,正しい訳語はコンパラブルなコーパスにおいても最大の共起頻度を有する

訳語選択 例:裁判官のコートとネクタイ 日英対訳辞書 ネクタイ コート 裁判官 tie coat court judge 50 50 10 80 10 10 日本語コーパス 単語共起頻度 英語コーパス 単語共起頻度

GDMAX訳語選択法 (Generalized Double MAXimize法) クロス言語情報検索で検索要求の単語から適切な訳語を得るための手法

第2回 レポート 締め切り 12月15日10:30 CYKアルゴリズムを使って 「急いで走る一郎を見た」を構文解析するプログラムを作成せよ 第2回 レポート 締め切り 12月15日10:30 CYKアルゴリズムを使って 「急いで走る一郎を見た」を構文解析するプログラムを作成せよ 説明つきプログラム 結果 考察