Presentation is loading. Please wait.

Presentation is loading. Please wait.

平成20年1月16日 東京工科大学 コンピュータサイエンス学部 亀田 弘之

Similar presentations


Presentation on theme: "平成20年1月16日 東京工科大学 コンピュータサイエンス学部 亀田 弘之"— Presentation transcript:

1 平成20年1月16日 東京工科大学 コンピュータサイエンス学部 亀田 弘之
自然言語処理2007(補講) 平成20年1月16日 東京工科大学 コンピュータサイエンス学部 亀田 弘之

2 各種ツールの紹介

3 形態素解析ツール Juman Chasen

4 構文解析ツール knp

5 その他のツール Chaki Himawari + Edamame

6 デモ Juman コスト最小法

7 Jumanの辞書・文法 形態素辞書: 文法辞書: ConnectW.dic など 自立語:3万語,付属語:1500語,固有名詞:3万語
JUMAN.grammar(品詞分類) JUMAN.katuyou(活用) JUMAN.kankei(活用関係) JUMAN.connect.c(連接規則)

8 上記のものをコンパイルする. jumandic.tab(連接対応表) jumandic.mat(連接行列)
jumandic.dat(データベース) jumandic.pat(インデックス)

9 辞書エントリの追加方法 Juman\dic にファイル usr.dic を作成.
その中に,以下の情報を記載する. (名詞 ( 普通名詞 ( (読み じんぎすかん)      ( 見出し語 ジンギスカン             じんぎすかん 成吉思汗) ) ) ) Juman\dic 下にある makedic.bat を実行.

10 デモ knp

11 デモ Chasen 出力フォーマットの変更 辞書エントリの追加 などができる  (詳しくはマニュアルを読んでください.)

12 デモ Cabocha

13 デモ ひまわり

14 おまけ 未知語獲得システム UWAS 日本語文法獲得システム USRAS

15


Download ppt "平成20年1月16日 東京工科大学 コンピュータサイエンス学部 亀田 弘之"

Similar presentations


Ads by Google