白井 良明 立命館大学情報理工学部 知能情報学科

Slides:



Advertisements
Similar presentations
プログラミング言語論 プログラミング言語の構 文 水野嘉明. 目次 1. プログラミング言語の構文 2. BNF 3. 文脈自由文法 4. 構文図式 2.
Advertisements

プログラミング言語論 第3回 BNF 記法について(演習付き) 篠埜 功. 構文の記述 プログラミング言語の構文はどのように定式化できるか? 例1 : for ループの中に for ループが書ける。 for (i=0; i
システムソフトウェア 第3回:2007年10月17日(水)   . 2 本日学ぶこと 文法  文字と文字列  無限集合  文法とそのクラス  オートマトン.
自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.
和田俊和 資料保存場所 /2/26 文法と言語 ー正規表現とオートマトンー 和田俊和 資料保存場所
プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
東京工科大学 コンピュータサイエンス学部 亀田弘之
白井 良明 立命館大学情報理工学部 知能情報学科
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
最大エントロピーモデルに基づく形態素解析と辞書による影響
コンパイラ 2011年10月17日
言語体系とコンピュータ 第5回.
制約に基づく言語処理から 制約なしの言語処理へ
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語体系とコンピュータ 第6回.
一致の非対称の 極小理論的分析 小林 亜希子 島根大学 「言語と情報研究プロジェクト研究会:言語理論の動向を考える」 広島大学
東京工科大学 コンピュータサイエンス学部 亀田弘之
統率・束縛理論2.
プログラミング言語論 第4回 式の構文、式の評価
計算の理論 II 文脈自由文法と プッシュダウンオートマトン
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
英語特別講座 代名詞・前置詞・形容詞・助動詞 #1   
第12回  自然言語処理.
第6章 ユニフィケーション解析 ユニフィケーション解析とは?
12月08日 構文解析 入力文(記号列)が与えられたとき,文法によってその文を解析し,その構造を明らかにする.
東京工科大学 コンピュータサイエンス学部 亀田弘之
形態素解析および係り受け解析・主語を判別
言語処理系(5) 金子敬一.
主格3形式と客格と「は」 -主語と客語- [1-2] 日本語構造伝達文法 この項は『日本語構造伝達文法(05版)』の
スタック長の 特徴付けによる 言語の非DCFL性 証明
コンパイラ 2012年10月15日
コンパイラ 2012年10月22日
コンパイラ 2011年10月24日
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語学 語のかたち① pp
自然言語処理及び実習 第11回 形態素解析.
不完全な知識 不完全な知識に基づく問題解決 フレーム問題 制約条件記述問題 非単調推論 極小限定 常識の定式化 並列極小限定.
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
プログラミング言語論 第3回 BNF記法について(演習付き)
人工知能特論II 第2回 二宮 崇.
正則言語 2011/6/27.
形式言語の理論 5. 文脈依存言語.
6.2.4 辞書項目(1) 辞書項目にも、語に対するDAGを与える。
自然言語処理2016 -平成28年11月7日・14日(No.6&7)-
複数対象への音声入力による行動指示 ~個別行動から共同行動への研究~
東京工科大学 コンピュータサイエンス学部 亀田弘之
シナリオのアニメーション表示による 妥当性確認支援
日本の表音文字(ひらがな、かたかな)と漢字
言語プロセッサ ー第9回目ー 構文解析(続き).
Happinessの歴史と 日本語処理のエピソード (株)平和情報センター 沓澤 尚明.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
プログラミング言語論 第9回 情報工学科 木村昌臣 篠埜 功.
コンパイラ 2011年10月20日
現在完了形 特別な完了形.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
第7回  命題論理.
東京工科大学 コンピュータサイエンス学部 亀田弘之
4.プッシュダウンオートマトンと 文脈自由文法の等価性
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
コンパイラ 2012年10月11日
言語プロセッサ ー第9回目ー 構文解析(続き).
言語プロセッサ ー第7回目ー 構文解析(続き).
1.2 言語処理の諸観点 (1)言語処理の利用分野
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

白井 良明 立命館大学情報理工学部 知能情報学科 shirai@ci.ritsumei.ac.jp 自然言語処理 白井 良明 立命館大学情報理工学部 知能情報学科 shirai@ci.ritsumei.ac.jp

問題解決 意味解析 変 換 構文解析 変 換 文章合成 文章   文章 音声認識 音声合声 音声   音声 They buy a car with four doors. dollars.

文法の種類 定義 正規文法(regular grammar) A → a, A → aB 終端記号(terminal symbol, category) a, b, … 非終端記号(nonterminal …) A, B, ...           記号列(string) α,β… 正規文法(regular grammar) A → a, A → aB 文脈自由文法(context-free grammar) A → β 文脈依存文法(context-sensitive grammar) α → β 1型: 0型: 制限なし

文脈自由文法 S → NP VP NP → DET N DET → the S NP VP DET N VP PP V NP PREP NP boy DET N N DET hits Det: Determiner(限定詞) PP: Postpositional Phrase (後置句) the dog with a rod

Top-Down Parsing 1. S the boy hits the dog with a rod. 2. NP VP the boy hits the dog with a rod. 3. DET N VP the boy hits the dog with a rod. 4. N VP boy hits the dog with a rod. 5.   VP hits the dog with a rod. 6. V NP hits the dog with a rod. 7. NP the dog with a rod. 8. DET N the dog with a rod. 9. N dog with a rod. 5. VP hits the dog with a rod.

Top-Down Parsing S the boy hits the dog with a rod. NP VP the boy hits the dog with a rod. DET N VP the boy hits the dog with a rod. N VP   boy hits the dog with a rod. VP hits the dog with a rod. 10. VP PP hits the dog with a rod …… …………………….. PP with a rod. PREP np with a rod. DET n a rod.

左隅統語解析 NP DET 1 2 (f) (b) DET N the boy ・・・ the boy ・・・ NP NP 3 4 DET 予測 the boy ・・・ the boy ・・・ NP NP 3 4 DET N DET N N (h) the boy ・・・ the boy ・・・

左隅統語解析 S S NP VP hits ・・・ V (k) 6 5 (a) NP VP hits ・・・ S S 7 8 NP VP (c) V NP V NP the dog・・・

左隅統語解析 10 S 9 S NP VP NP VP VP V VP PP V NP sentence が完成するが、 文が残っている 8へ後戻りし、解析を続ける

Bottom-Up Parsing CYK 表 NP → NP PP the boy saw the dog in the house 8 CYK 表 7 NP → NP PP 6 5 4 3 2 NP DET  N NP DET  N NP  N DET 1 DET  N  V DET  N PREP DET  N 1 2 3 4 5 6 7 8 the boy saw the dog in the house

CYK 表 NP → NP PP the boy saw the dog in the house S1 8 S2 7 VP1 VP PP CYK 表 S1 8 S2 7 NP → NP PP VP1 VP PP 6 VP2  V NP 5 4 3 VP PP 2 NP NP NP NP 1 DET  N  V DET  N PREP DET  N 1 2 3 4 5 6 7 8 the boy saw the dog in the house

形態素解析のための辞書 い(杭) く(来;繰) かーん(空間) う(空) き(空気) る(狂) ま(車) で(出;で) み(胡桃) ま(待;間) い(枚;舞) つ(松)- で(まで)

話 歯無し 花 鼻 梨 無し 志賀 今 或 医 位 間 真 は 歯 名 菜 四 死 が 我 有 亜 る い ま は な し が あ る  形態素辞書に基づく   CYK 表の途中結果 話  歯無し 3  花 鼻  梨 無し 志賀   今  或 2  医   位  間 真  は 歯  名 菜  四 死  が 我  有 亜     る 1 1 2 3 4 5 6 7 8 い ま は な し が あ る

[ [ [ [ [ [ 今Hが有る 今は梨が有る 今Hが有 今は梨が有 話 歯無し H= 今Hが 今は梨が 名 菜 G= 今H 今は梨 花鼻  形態素解析結果とCYK表 今Hが有る 今は梨が有る 8 今Hが有  今は梨が有 7 [ 話  歯無し H= [ 今Hが    今は梨が 6 [ 名 菜 G= [ 今H     今は梨 5 [ 花鼻 F= [ 今はG    今F 4 今は     今歯 3 いまはなしがある

同音語 (1) 自立語単語 しょうひん: 商品、賞品、小品 (2) 活用形 いった : 行った、言った、入った (1) 自立語単語 しょうひん: 商品、賞品、小品 (2) 活用形 いった : 行った、言った、入った (3)文節 ひとで : 人手、人で、 火とで (4) 接辞付き しんぶんや : 新分野、新聞屋 (5) べたがき きょうはきものの: 今日は着物の、今日履物の

文節 <文節> := < 通常文節> |<数詞文節> | <固有名詞文節> <通常文節>:= (〔接頭辞〕 自立語 〔接尾辞〕*)* 〔付属語〕* <数詞文節> := 〔前置助数詞〕 数詞〔後置助数詞〕 〔接尾語〕* 〔付属語〕* <固有名詞文節> := 〔接頭語〕 固有名詞 〔 〕 は省略可、 * は繰り返し可を表す。

文節単位変換(分かち書きあり) (1) 自立語と付属語、 付属語と付属語の接続行列 C(i,j)=1: 行 i が列 j に接続可能 (大きさは250程) C(i,j)=0: 行 i が列 j に接続不可能 (2) 文節終端条件 T(i,j)=1: 文節終端可能 T(i,j)=0:文節終端不可能 例 「おもったが」 尾もったが(尾もから後が接続不可能) 重ったが(用言の語尾変化が接続不可能)

連文節変換 (1) 文節最長一致法 ていあんしたけいかくを (失敗したら次の候補へ) (1) 文節最長一致法 ていあんしたけいかくを (失敗したら次の候補へ) (2) 2文節最長一致法 (最初の文節を決めるだけ) けんきゅうの もくてきは 研究のも 九 (3) 文節数最小法 にほんの れきしを まなぶ 日本 乗れ 岸を 学ぶ (4) 前処理法 (特徴的な部分を抽出してから解析) ぶんしょうの にゅうりょくに (熟語の熟語に) (5) 共通区切り探索法 (n文節最長一致法の共通区切り) みせではかった せいひんの (店では買った、店で測った) 共通区切りで分割

あいまい性への対処 (1) 体言に直接動詞がつくものはX 私は/知っていると (私/走っていると) (1) 体言に直接動詞がつくものはX 私は/知っていると (私/走っていると) (2) 1字語名詞はX 増えてきたと/聞く (増えてきたとき/区) (3) 漢字熟語の結合○ 行政改革 (行政か/威嚇) (4) 意味情報の利用 (分類語彙表や類語辞典を参考にして辞書に付加される) 本を/読んだ (本を/呼んだ) 先生と/生徒が (宣誓と/生徒が)

第一階述語論理(FPC) 「私は本を持つ」 「私は本かノートを持つ」 「すべての女性はケーキが好きだ」 「誰もそれをできない」 「ペンギン以外の鳥は飛ぶ」 NL    parser FPC Database

格文法 break O O:対象格 (a) ”The window broke” break A O A:動作主格 John   the window (b) ”John broke the window” break I:道具格 A O I John   the window a hammer (c) ”John broke the window with a hammer”

Fillmore の与えた深層格の集合(1971年当時) Fillmore の与えた深層格の集合(1971年当時)  動作主格(A):動作を引き起こす者             経験者格(E):心理事象を体験する者           道具格(I):出来事の直接原因               対象格(O):移動する対象物や変化する対象物など  源泉格(S):対象物の移動の起点、および最初の状態 目標格(G):対象物の移動の終点、および最終的な状態場所格(L):出来事が起こる場所              時間格(T):出来事が起こる時間

概念依存理論 (Conceptual Dependency Theory) Schank, R. C. : Conceptual Information Processing, North-Holland, Amsterdam and American Elsevier , New York , 1975                  一つのまとまりを概念化   Conceptualization

“John sold his car to Bill.” に対応する概念依存構造 past Abstract Transfer John ATRANS OWNERSHIP : car  Bill ATRANS OWNERSNIP : money    α1    α2      β1    β2 が理由・原因(Reason)となって β1    β2        α1    α2 なる行為が引き起こされること P: past Bill  John P O R R John  Bill P O R

“He hurt John.” に対する概念依存構造 p he DO 状況変化が生じる r PHYS.ST.(<X) John p dead healthy PHYS.ST.(X) r: result

“He killed John.” に対する概念依存構造 p he DO r PHYS.ST.(-10) John p PHYS.ST.(>-10)

“John decided to leave the house.”の概念依存構造 Direction X D o John PTRANS John 目的語 house p o Physical John MBUILD CP(John) R 思考の生成 Z 受益者をもつ LTM(John) W 「ジョンは、ジョンがジョンを家からXに移動させる(PTRANS)という考えを、LTM(長期記憶)からCP(概念プロセッサ)に移動した。」

“Mary cried.”の概念依存構造 X p o D Mary EXPEL tears eyes(Mary)

“John shot Mary.”の概念依存構造 手段としてとる 力を加える Mary John D p o I John PROPEL bullet PROPEL gun trigger r o PHYS.ST.(<X) trigger Mary PART(gun) D p PHYS.ST.(X) out in 「ジョンは、gun の一部である trigger に力を加えてout から in にすることによって鉄砲からメアリーに bullet を動かした。その結果メアリーの物理的な状態がXからX 未満に悪化した。」

“John went to New York from Texas.”に対するMARGIEの出力 (1) JOHN CAME TO BE IN NEW YORK. (2) JOHN CEASED TO BE IN TEXAS. (3) JOHN WANTED TO DO SOMETHING IN NEW YORK. (4) JOHN THOUGHT HE WOULD ENJOY BEING IN NEW YORK.

PTRANSの概念依存構造での推論規則 C1 : X PTRANS Y Z W PTRANをひき起こすagent PTRANSしたもの D O PTRANをひき起こすagent PTRANSしたもの 上の概念依存構造から次のようなことを推論する。 (1) Yは今Zに位置している。 JOHN CAME TO BE IN NEW YORK. (2) Yはもはや位置Wにはない。    JOHN CEASED TO BE IN TEXAS. (3) もしXが人間でC1を要求したか、XとYが同じであれば、           Xは通常Zでできることをすると思われる。     JOHN WANTED TO DO SOMETHING IN NEW YORK. (4) (3)をすることがXを喜ばせるだろう。    JOHN THOUGHT HE WOULD ENJOY BEING IN NEW YORK.