自然言語処理 2012 - 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之.

Slides:



Advertisements
Similar presentations
和田俊和 資料保存場所 /2/26 文法と言語 ー正規表現とオートマトンー 和田俊和 資料保存場所
Advertisements

プログラミング言語論 第10回(演習) 情報工学科 木村昌臣   篠埜 功.
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理:第3回 1.前回の確認 2.構文解析 3.格文法.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語体系とコンピュータ 第6回.
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
第12回  自然言語処理.
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語処理系(5) 金子敬一.
コンパイラ 2012年10月22日
自然言語処理2014(3回目) Natural Language Processing 2014
コンパイラ 2011年10月24日
自然言語処理2012(3回目) Natural Language Processing 2012
自然言語処理及び実習 第11回 形態素解析.
東京工科大学 コンピュータサイエンス学部 亀田弘之
形式言語とオートマトン Formal Languages and Automata 第4日目
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
形式言語とオートマトン2016 ~第10日目(形式文法2回目)~
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
形式言語とオートマトン Formal Languages and Automata 第4日目
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2016 -平成28年11月7日・14日(No.6&7)-
自然言語処理2011(3回目) Natural Language Processing 2011
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2013(3回目) Natural Language Processing 2013
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2015(3回目) Natural Language Processing 2015
言語プロセッサ ー第9回目ー 構文解析(続き).
自然言語処理2010(3回目) Natural Language Processing 2010
東京工科大学 コンピュータサイエンス学部 亀田弘之
平成20年10月5日(月) 東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
形式言語とオートマトン2017 ~第10日目(形式文法2回目)~
自然言語処理2016(3回目) Natural Language Processing 2016
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
コンパイラ 2011年10月20日
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
自然言語処理2015 Natural Language Processing 2015
東京工科大学 コンピュータサイエンス学部 亀田 弘之
東京工科大学 コンピュータサイエンス学部 担当 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
言語プロセッサ ー第9回目ー 構文解析(続き).
東京工科大学 コンピュータサイエンス学部 亀田 弘之
東京工科大学 コンピュータサイエンス学部 亀田 弘之
形式言語とオートマトン Formal Languages and Automata 第5日目
自然言語処理2016 Natural Language Processing 2016
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
Presentation transcript:

自然言語処理 平成 24 年 11 月 5 日 (No5)- 東京工科大学 コンピュータサイエンス学部 亀田弘之

前回の復習から 今日の課題 先週授業で学んだことを列挙しなさい。 解答例) 1. XXX を学んだ。 2. XXX のインストール手順 3. XXX の定義 4. XXX という用語 2Natural Language Processing 2012 (Tokyo Univ. of Tech.)

NLP のプログラムを書いてみよ う! 1.Prolog のインストール 2. プログラム作成手順 1.IC 分析 2. 形式文法の設定 3.Prolog 形式への書き換え 4.NLP プログラムの実行 ( その1 ) 5. 構文木を出力するプログラムへの拡張 6.NLP プログラムの実行 ( その2 ) 3Natural Language Processing 2012 (Tokyo Univ. of Tech.)

1. Prolog のインストール (再確認) 4Natural Language Processing 2012 (Tokyo Univ. of Tech.)

Prolog の種類 Swi-prolog SICStus-Prolog I/F-Prolog K-Prolog Minerva Arity/Prolog RUN/Prolog C-Prolog Gnu Prolog Open Prolog YAP Prolog など 5Natural Language Processing 2012 (Tokyo Univ. of Tech.)

自由課題 どんな Prolog があるのか調べてみよう。 それぞれの Web Site を見つけてみよう。 どれか1つ download して使ってみよう。 各 Prolog の特徴を比較し、一覧表を作って みよう。 (注)本授業では swi-prolog を使います。 なぜでしょうか? 理由を考えてみてください。 6Natural Language Processing 2012 (Tokyo Univ. of Tech.)

Prolog による構文解析プログラ ム 処理対象: Tom broke the cup. Natural Language Processing 2012 (Tokyo Univ. of Tech.)7

IC 分析 Tom broke the cup 文 __ _____ 名詞句 動詞句 ___ __ __ 名詞 動詞 名詞句 __ ___ 限定詞 名詞 Natural Language Processing 2012 (Tokyo Univ. of Tech.)8

形式文法 開始記号= s 終端記号 ={ tom, broke, the, cup } 非終端記号 ={ s, n, v, d, np, vp } 書き換え規則 ={ s → np + vp.np → n. np→d+n. vp→v+np. n→tom. n→cup. v→broke. d→the. } Natural Language Processing 2012 (Tokyo Univ. of Tech.)9

Prolog で表現する s :- np + vp. np :- n. np:-d+n. vp:-v+np. n:-tom. n:-cup. v:-broke. d:-the. Natural Language Processing 2012 (Tokyo Univ. of Tech.)10

Prog1.pl s(A,C):-n(A,B),vp(B,C). vp(A,C):-v(A,B),np(B,C). np(A,C):-d(A,B),n(B,C). n([tom|T],T). n([cup|T],T). v([broke|T],T). d([the|T],T). 11Natural Language Processing 2012 (Tokyo Univ. of Tech.)

Prog2.pl s(A,C,s(_n,_vp)):- n(A,B,_n),vp(B,C,_vp). vp(A,C,vp(_v,_np)):- v(A,B,_v),np(B,C,_np). np(A,C,np(_d,_n)):- d(A,B,_d),n(B,C,_n). n([tom|T],T,n(tom)). n([cup|T],T,n(cup)). v([broke|T],T,v(broke)). d([the|T],T,d(the)). 12Natural Language Processing 2012 (Tokyo Univ. of Tech.)

今日の内容 1. 構文解析プログラムの動作を理解する 2. 構文解析プログラムを自分で書いてみる 3. その結果、先週までの内容の理解を深め る。 13Natural Language Processing 2012 (Tokyo Univ. of Tech.)

1. 構文解析プログラムの動作を理 解 (例文) Tom broke the cup. 14Natural Language Processing 2012 (Tokyo Univ. of Tech.)

2. 構文解析プログラムを自分で書 く 作成手順は? (これも復習事項です。思い出せます か?) 15Natural Language Processing 2012 (Tokyo Univ. of Tech.)

作成手順の概要 1. 処理対象を決める 2. 処理対象の各文に対して、統語構造の分 析を行う 3. 上記の分析結果をもとに、文法を書き下 す 4. 上記で得られた文法を、 Prolog の形式に 書きかえる 5. 動作を確認する Natural Language Processing 2012 (Tokyo Univ. of Tech.)16

自習問題 例文) Time flies like an arrow. Natural Language Processing 2012 (Tokyo Univ. of Tech.)17

3. その他 18Natural Language Processing 2012 (Tokyo Univ. of Tech.)

構文解析の種類 分類1 – トップダウン解析方式 (Topdown) – ボトムアップ解析方式 (Bottom-up) 分類2 – 縦型解析方式 – 横型解析方式 19Natural Language Processing 2012 (Tokyo Univ. of Tech.)

確認問題 下記の用語を自分の言葉で説明しなさい。 – 構文解析 – トップダウン解析方式とボトムアップ解析方 式 – 縦型解析方式と横型解析方式 – バックトラック – プログラミング言語 Prolog 20Natural Language Processing 2012 (Tokyo Univ. of Tech.)

次回の予告 日本語を対象とするプログラムを一緒に作 成します。 PC を忘れないように。 Swi-Prolog が動くこと、 UTF-8 コードで保存 できるエディターが必要です。メモ帳でも OK です。 必要なら、日本語の文法書や辞書を持参し てください(たぶん要らないと思いますが ...)。 Natural Language Processing 2012 (Tokyo Univ. of Tech.)21