人工知能特論II 第2回 二宮 崇.

Slides:



Advertisements
Similar presentations
PCFG の EM アルゴリズムとス ムージング 二宮 崇 1. 今日の講義の予定 PCFG (Probabilistic Context Free Grammar, 確率付 文脈自由文法 ) EM アルゴリズム スムージング 教科書 北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル.
Advertisements

プログラミング言語論 プログラミング言語の構 文 水野嘉明. 目次 1. プログラミング言語の構文 2. BNF 3. 文脈自由文法 4. 構文図式 2.
数理言語情報論 第 2 回 数理言語情報学研究室 講師 二宮 崇 2009 年 10 月 14 日 1.
プログラミング言語論 第3回 BNF 記法について(演習付き) 篠埜 功. 構文の記述 プログラミング言語の構文はどのように定式化できるか? 例1 : for ループの中に for ループが書ける。 for (i=0; i
システムソフトウェア 第3回:2007年10月17日(水)   . 2 本日学ぶこと 文法  文字と文字列  無限集合  文法とそのクラス  オートマトン.
和田俊和 資料保存場所 /2/26 文法と言語 ー正規表現とオートマトンー 和田俊和 資料保存場所
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
文法と言語 ー字句解析とオートマトンlexー
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
コンパイラ 2011年10月17日
東京工科大学 コンピュータサイエンス学部 亀田弘之
数理言語情報論 第3回 2007年10月22日 数理言語情報学研究室 講師 二宮 崇.
言語体系とコンピュータ 第6回.
日本語統語論:構造構築と意味 No.1 統語論とは
演習3 最終発表 情報科学科4年 山崎孝裕.
東京工科大学 コンピュータサイエンス学部 亀田弘之
統率・束縛理論2.
文法と言語 ー文脈自由文法とLL構文解析ー
プログラミング言語論 第4回 式の構文、式の評価
計算の理論 II 文脈自由文法と プッシュダウンオートマトン
第6章 ユニフィケーション解析 ユニフィケーション解析とは?
言語処理系(5) 金子敬一.
言語プロセッサ ー第8回目ー.
スタック長の 特徴付けによる 言語の非DCFL性 証明
コンパイラ 2012年10月15日
コンパイラ 2012年10月22日
数理言語情報論 第7回 2007年11月19日 数理言語情報学研究室 講師 二宮 崇.
言語プロセッサ2013 ー 第7回目 ー Tokyo University of Technology
東京工科大学 コンピュータサイエンス学部 亀田弘之
コンパイラ 2011年10月24日
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
人工知能特論2007 東京工科大学 亀田弘之.
プログラミング言語論 第3回 BNF記法について(演習付き)
東京工科大学 コンピュータサイエンス学部 亀田弘之
正則言語 2011/6/27.
文法と言語 ー字句解析とオートマトンlexー
東京工科大学 コンピュータサイエンス学部 亀田弘之
文法と言語 ー字句解析とオートマトンlexー
形式言語の理論 5. 文脈依存言語.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語プロセッサ2012 ー 第6回目 ー Tokyo University of technology
言語と文法 言語とは,ルールに従う記号列の無限集合である. 文法を与えることで言語が定義できる.
平成20年10月5日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之
知能情報システム特論 Introduction
東京工科大学 コンピュータサイエンス学部 担当教員:亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
プログラミング言語論 第9回 情報工学科 木村昌臣 篠埜 功.
文法と言語 ー文脈自由文法とLL構文解析ー
コンパイラ 2011年10月20日
東京工科大学 コンピュータサイエンス学部 亀田弘之
文法と言語 ー文脈自由文法とLR構文解析ー
計算の理論 I -数学的概念と記法- 火曜 12:50~14:20 大月 美佳 2004年4月20日.
計算の理論 I -プッシュダウンオートマトン-
人工知能特論II 第8回 二宮 崇.
東京工科大学 コンピュータサイエンス学部 亀田弘之
計算の理論 I -数学的概念と記法- 月曜3校時 大月 美佳.
形式言語とオートマトン 第14回 プッシュダウンオートマトンと全体のまとめ
文法と言語 ー字句解析とオートマトンlexー
4.プッシュダウンオートマトンと 文脈自由文法の等価性
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
コンパイラ 2012年10月11日
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
4.2 再帰下降解析 (1)再帰下降解析とは ■再帰下降解析(Recursive Descent Parsing)
Presentation transcript:

人工知能特論II 第2回 二宮 崇

今日の講義の予定 CFG (Context Free Grammar, 文脈自由文法) 言語学での発展

CFG

CFG (文脈自由文法): 導入 正規言語と正規文法(有限オートマトンが受理する表現とその文法;c.f. regular expression) (“a” + “b”)*は”a“と”b“の任意の組み合わせの文字列を受理する。E.g., aabababbab… 正規文法の限界 anbnだけを受理する文法がつくれない 入れ子表現「(太郎は(花子が使っていた)ペンを借りた)」など チョムスキーが言語を扱うために次の文法階層を規定 文脈依存文法 (Context Sensitive Grammar) 文脈自由文法 (Context Free Grammar)

CFG: 生成 CFG S → SUBJ VP S → VP SUBJ → N が VP → OBJ V S ⇒ SUBJ VP VP → V OBJ → N を N → S N N → N と N V → 送った V → 読んだ N → 香織 N → 恵 N → 電子メール S ⇒ SUBJ VP ⇒ N が VP ⇒ 香織 が VP ⇒ 香織 が OBJ V ⇒ 香織 が N を V ⇒ 香織 が S N を V ⇒ 香織 が SUBJ VP N を V ⇒ 香織 が N が VP N を V ⇒ 香織 が 恵 が VP N を V ⇒ 香織 が 恵 が V N を V ⇒ 香織 が 恵 が 送った N を V ⇒ 香織 が 恵 が 送った 電子メール を V ⇒ 香織 が 恵 が 送った 電子メール を 読んだ * S ⇒ 香織 が 恵 が 送った 電子メール を 読んだ

CFG: 構文木 S VP SUBJ OBJ N V が を N 香織 読んだ S N V SUBJ 電子メール N が 送った 恵 CFG S → SUBJ VP S → VP SUBJ → N が VP → OBJ V VP → V OBJ → N を N → S N N → N と N V → 送った V → 読んだ N → 香織 N → 恵 N → 電子メール S VP SUBJ OBJ N V が を N 香織 読んだ S N V SUBJ 電子メール N が 送った 恵

CFG: 再帰的 NP → S NP 太郎が好きな花子が好きな次郎が好きな恵が好きな香織が好きな……….. S A B x y y’ x’

形式文法 G (= <VN, VT, P, σ>) Pは次の形 α→β α∊ (VN∪VT )+, β∊ (VN∪VT )* 開始記号σから書換規則を順次適用して生成される言語L(G)を0型言語と呼ぶ

チョムスキーの階層 0型文法(チューリング機械) 1型文法(文脈依存文法) 2型文法(文脈自由文法) 3型文法(正規文法) もっとも制約のない形式文法 1型文法(文脈依存文法) α→β (|α| ≦ |β|) 2型文法(文脈自由文法) A→β (A∊VN, β ∊ (VN∪VT)+) 3型文法(正規文法) A→aB A→a (A, B ∊ VN, a ∊ VT)

文脈自由文法 (1/3) (Context Free Grammar, CFG) G (= <VN, VT, P, σ>) VN: 非終端記号の集合 VT: 終端記号の集合 P: 書換規則の集合 σ: 開始記号 (σ ∈VN) Pは次の形 A→α (A∊VN, α ∊ (VN∪VT)+)

文脈自由文法 (2/3) (Context Free Grammar, CFG) 直接導出 A→αの規則があれば、βAγはβαγに書き換えられる (α, β, γ ∊ (VN∪VT)*, A ∊ VN) βAγ ⇒βαγ 導出 α1⇒ α2 , α2⇒ α3 ,…, αn-1⇒ αn であるとき、 α1⇒ αn *

文脈自由文法 (3/3) (Context Free Grammar, CFG) 文形式 記号列 α ∊ (VN∪VT)* が開始記号σから導出されるとき(σ ⇒α)、αを文形式と呼ぶ 文 終端記号のみからなる文形式 言語 L(G) 文法Gから導出される文全体の集合 L(G)={s∈VT*|σ ⇒ s} * *

CFGの例 G (= < VN, VT, P, σ>) VN= {S, NP, NP1, SUBJ, OBJ1, V, VP1} P = { S → SUBJ VP1, S → SUBJ V, SUBJ → NP が, VP1 → OBJ1 V, OBJ1 → NP を, NP → S NP, V → 送った, V → 読んだ, NP → 香織, NP → 恵, NP → 電子メール, NP → プレゼント, NP → 香織 NP1, NP → 恵 NP1, NP1 → と NP } σ= S

CFGの限界 表現できる言語の限界 L(G)={uviwxiy |i = 0, 1, 2, …}となるG 正規文法では表現できない CFGは表現できる L(G)={anbncn |n = 0, 1, 2, …}となるG CFGは表現できない 文脈依存文法は表現できる

CFGの限界 文法機能の解析不足 S → SUBJ VP VP → RB VP VP → V OBJ VP → V NP → NP which S VP SUBJ he RB VP always V OBJ eats apples eats の主語、目的語が何かわからない

CFGの限界 文法機能の解析不足 always は? S → SUBJ V OBJ というルールにすれば 直接の関係はわかるけど、 助動詞などが間にはいると、 S → SUBJ always V OBJ と助動詞の数だけ規則が増え ていってしまう VP SUBJ V OBJ eats he apples always は?

CFGの限界 長距離依存 S → SUBJ VP VP → RB VP VP → V OBJ VP → V NP → NP which S apples SUBJ V he eats eats の目的語がapplesということがわからない

CFGの構文解析 ある文sが与えられた時、その可能な構文木を全て求める S → SUBJ VP SUBJ → N が N → N と N VP → PP VP PP → N と VP → OBJ V OBJ → N を N → 太郎 N → 花子 N → 映画 V → 褒める ある文sが与えられた時、その可能な構文木を全て求める ある文sが与えられた時、可能な構文木の中で最も正しそうな構文木を求める ”太郎が花子と映画を褒める”

CFGの構文解析 CFG S → SUBJ VP S → VP SUBJ → N が “香織 が 恵 が 送った 電子メール を 読んだ” VP → OBJ V VP → V OBJ → N を N → S N N → N と N V → 送った V → 読んだ N → 香織 N → 恵 N → 電子メール “香織 が 恵 が 送った 電子メール を 読んだ” “香織 と 恵 が 送った 電子メール を 読んだ”

言語学での発展

言語学 ソシュールの構造主義 言語をばらばらな要素の羅列と考えず、要素の関係による構造または体系として捉える 個々の要素をより大きな構造全体の中で位置づける 各要素の具体的な特徴ではなく、他の要素の相対的な関係(差異)から規定される 特定の言語の時間にそった変化(通時態)を追うのではなく、特定の言語の一時期の状態(共時態)を追う

構造主義 誤解をおそれずにたとえると、、、 ハンバーガーとは、「αβ*α」である α β β β α ハンバーガーの「意味」を考えるのではなくその「関係」だけを考える

構造主義といえば、、、 レヴィストロース 「『構造』とは要素と要素間の関係とからなる全体であって、この関係は一連の変形過程を通じて不変の特性を保持する」 顔 目、口、鼻、耳などのパーツからなるが、個々のパーツの関係で顔が構成される 世の中にある多種多様な顔は「顔」という関係の変形

つまり、構造主義とは、、、 「アリストテレスが死ぬ」とはどういうことですか? 死ぬ(アリストテレス) 同義語(死ぬ, 亡くなる), 同義語(死ぬ, 死亡する), ……. これだけ?!

構造言語学 構造言語学 ブルームフィールド以後の言語学 発話の資料体(コーパス)を構成する要素の帰納的・分類的研究 コーパスを構成する要素 音素 形態素

チョムスキーの変形生成文法 構造言語学への批判 CFGへの批判 帰納的・分類的から演繹的・説明的 言語の構造や体系を重視・優先 コーパスに直接みえる構造ではなく、人間の言語を生成する能力に注目 言語の構造や体系を重視・優先 CFGによる文法の記述 CFGへの批判 自然言語を記述するには不足 CFG+変形操作の文法(=変形生成文法)

チョムスキーの変形生成文法 CFG+変形 d-構造 S VP NP INFL VP V PAST be NP V Mary fired

チョムスキーの変形生成文法 CFG+変形 s-構造 S VP NP INFL VP V PAST Maryi be NP V εi fired

チョムスキーの変形生成文法 普遍文法 (Universal Grammar) Xバー理論 θ理論 下位範疇化 適格文/非文 個々の言語は普遍文法のパラメータの設定により得られる Xバー理論 名詞が形容詞や冠詞と結びつき名詞句となる θ理論 下位範疇化 適格文/非文 適格文、非文の区別により、正しい文法を模索する⇔Meaning-Text Theory

チョムスキーという人 チョムスキー??? 構造主義的 認知科学的 政治的にも有名?

チョムスキー以後 様々な文法理論 GPSG HPSG LFG TAG …. しかし、基本的な考え方はチョムスキーと同じ

まとめ CFG 言語学での発展 連絡・資料 http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/