コーパス管理システム 『ChaKi.NET』

Slides:



Advertisements
Similar presentations
1 実技演習1 2008/01/28,29 JaLTER Morpho 講習会. 2 起動・接続 各自、コンピュータを起動してネットワーク に接続してください。 各自、コンピュータを起動してネットワーク に接続してください。 IP アドレス自動取得 IP アドレス自動取得 無線 LAN 使用可 無線.
Advertisements

R Basics 2013/12/09 Yamada. 今日の方針 Today’s plan テキスト・文字列を扱うにあたっての用 語の理解をすることの方が、 R での操作を 見るより有意義と思われるので、そちら を優先 Learning terms on text/strings is more.
2000/Mar/22 第 136 回自然言語処理研究会 1 Unicode を用いた N-gram 索引の 一実現方式とその評価 原田昌紀・風間一洋・佐藤進也 日本電信電話 ( 株 ) 未来ねっと研究所.
情報処理 第9回第9回第9回第9回. 今日の内容 Excel の起動と画面構成 –Excel の起動 –Excel の画面構成と基本用語 データの入力 – 文字の入力 – 数値の入力 – 日時の入力 – オートフィル.
コンピュータ演習 Excel 入門 岡田孝・山下雅啓 Excel の機能は膨大 その中のごく一部を紹介 表計算機能 – データの入力、表の作成、計算など グラフ機能 – 棒グラフ、円グラフなどグラフ作成 データベース機能 – 並べ替え(ソート)、検索、抽出など マクロ機能 – VBA で自動化したマクロを作成可能.
数学のかたち 数学解析の様々なツール GRAPSE編 Masashi Sanae.
第5章 JMPのインストールと基本操作 廣野元久
情報基礎演習I(プログラミング) 第9回 6月22日 水曜5限 江草由佳
Microsoft Office クイックガイド ~Excel 2013~
コンピュータウィルス.
応用コース:ワープロを活用する WORD2000 1回目 基礎コースの復習(第1章と付録) 2回目 文字の入力(第2章と第4章)
エクセル(1)の目次 起動法、ブック、シート、セル ブックの開き方 エクセル画面 マウスポインターの種類 シート数の調節 データの入力法
Building text features for object image classification
情報処理 第12回.
図の挿入 ●方法1 ①図を挿入する位置にカーソルを置く。 ②「挿入」メニュー →「図」 → 「ファイルから」とクリックする。 ③挿入するファイルを選択し、「挿入」をクリックする。 ●方法2(書式までコピーされるので、ファイルサイズが大きくなる) ①挿入する図をコピーする。 ② 挿入する位置にカーソルを移動し、ツールバーまたは右クリックメニューの「貼り付け」をクリックする。
図の挿入 ●方法1 ①図を挿入する位置にカーソルを置く。 ②「挿入」タブ ⇒「図」 → 「ファイルから」とクリックする。 ③挿入するファイルを選択し、「挿入」をクリックする。 ●方法2(書式までコピーされるので、ファイルサイズが大きくなる) ①挿入する図をコピーする。 ② 挿入する位置にカーソルを移動し、ツールバーまたは右クリックメニューの「貼り付け」をクリックする。
情報処理 第8回.
情報処理 第7回.
パソコン教室(Word) ワークフロア清柳
静岡大学大学院理工学研究科 阿部 秀尚 Weka入門(セットアップ編) 静岡大学大学院理工学研究科 阿部 秀尚
SQC勉強会(0) (事前のご案内) -1-.
松本裕治(まつもと ゆうじ) 浅原正幸(あさはら まさゆき)
Linux リテラシ 2006 第2回 基本コマンド2.
Excel による データベース入門 Ver /9.
コーパス言語学 第1回.
Microsoft Office 2010 クイックガイド ~PowerPoint編~
エクセル(1)の目次 起動法、ブック、シート、セル ブックの開き方 エクセル画面 マウスポインターの種類 シート数の調節 データの入力法
Microsoft Office 2010 クイックガイド ~ファイルの互換性編~
SLAT2/ChaKi.NET DB Model 解説資料 (兼 ChaKi-SLAT 統合状況の経過説明)
テキストマイニング, データマイニングと 社会活動のトレース
コーパス言語学実践 2006年度2学期 第5回.
ParaViewを用いたPHITS 計算結果の3次元表示
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
9 Microsoft Word(1).
情報処理 第6回.
情報処理 第6回.
アルゴリズムとデータ構造 --- 理論編 --- 山本 真基
国語研日本語ウェブコーパス 検索系:梵天(BonTen)
日本語解析済みコーパス管理ツール 「茶器」
Microsoft Office クイックガイド ~OneNote 2013~
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/06/22
地理情報システム論演習 地理情報システム論演習
Titanium Studioを使った アプリ開発 Vol.1
空間情報サーバ (株)パスコ.
Microsoft PowerPoint Netscape Communicator
10 Microsoft Word(1) 10.1 Microsoft Word v.Xの概要 起動 終了
情報処理 第7回 表がある文書の作成.
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
Windows-XPにソフトをインストールしたい
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
第1回.リレーショナルデータベースを使ってみよう
第1回.リレーショナルデータベースを使ってみよう
情報処理 第8回.
ChaIME: 大規模コーパスを 用いた統計的仮名漢字変換
大規模データによる未知語処理を統合したスケーラブルな仮名漢字変換
データ工学特論 第六回 木村昌臣.
諸連絡 USBメモリの販売について 日時:6月23日(月)授業開始前 商品:プリンストン社製32MBのUSBメモリ
DynaMed 新しい検索インターフェースについて support.ebsco.com.
7-0.SWORD Client for WEKO インストールマニュアル Version 2.2
テキストマイニング, データマイニングと 社会活動のトレース
12 Microsoft Word(3) 12.1 表の作成 表の各部名称 列 行 セル 罫線.
ブースティングとキーワードフィルタリング によるシステム要求検出
Excel 2002,2003基本7 名前機能.
Microsoft Office 2010 クイックガイド ~Outlook編~
Microsoft Office 2010 クイックガイド ~ファイルの互換性編~
Microsoft Office 2010 クイックガイド ~Outlook編~
第1回.リレーショナルデータベースを使ってみよう
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
Microsoft Office 2010 クイックガイド ~PowerPoint編~
Presentation transcript:

コーパス管理システム 『ChaKi.NET』 梵天編

『梵天』 ChaKi.NET のインストール 梵天からのダウンロードと ChaKi.NET DB の構築 可視化 検索 統計処理 最新の ChaMame について

1. ChaKi.NET のインストール 1-1. ダウンロードする https://ja.osdn.net/projects/chaki/ ChaMameもダウンロードしてください MeCab のダウンロード http://taku910.github.io/mecab/ UniDic のダウンロード http://unidic.ninjal.ac.jp/download#unidic_bccwj CaboCha のダウンロード https://taku910.github.io/cabocha/ その他データ(以下は必須ではありません) http://chaki-data.ninjal.ac.jp/

1. ChaKi.NET のインストール 1-2. ChaKi.NET のインストール

1. ChaKi.NET のインストール 1-3. MeCab のインストール

1. ChaKi.NET のインストール 1-3. MeCab のインストール

1. ChaKi.NET のインストール 1-4. UniDic のインストール .zip を解凍して c:\Program Files (x86)\MeCab\dic 以下に置く

1. ChaKi.NET のインストール 1-5. CaboCha のインストール

1. ChaKi.NET のインストール 1-5. CaboCha のインストール

1. ChaKi.NET のインストール 1-6. ChaMame のインストール

2. 梵天からのダウンロード方法 2-1. 検索する 何でもよいので文字列検索で検索してみてください。 2. 梵天からのダウンロード方法  2-1. 検索する 何でもよいので文字列検索で検索してみてください。 上の例では “LONGMAN” と検索しています。

2. 梵天からのダウンロード方法 2-2. ダウンロードする 2. 梵天からのダウンロード方法  2-2. ダウンロードする

2. 梵天からのダウンロード方法 2-3. ChaKi.NET DB の構築

3. 可視化 3-1. ChaKi.NET DB を開く

3. 可視化 3-2. テキスト表示

3. 可視化 3-3. 係り受け表示

4. 検索 4-1. String 検索

4. 検索 4-2. Tag 検索

4. 検索 4-3. 結果の Excel へのエクスポート Sentence-wise Context-wise Word-wise 文単位 左右の文脈で分割 Word-wise 左右の単語列を含む

4. 検索 4-4. ワードリスト

4. 検索 4-5. 係り受けワードリスト

5. 統計処理 5-1. コロケーション 一旦検索した状態で コロケーションタブに移動

5. 統計処理 5-2. MI-score 一旦検索した状態で コロケーションタブに移動

5. 統計処理 5-3. N-gram (left) 一旦検索した状態で コロケーションタブに移動

5. 統計処理 5-4. N-gram (right) 一旦検索した状態で コロケーションタブに移動

5. 統計処理 5-5. Frequent Pattern Mining (n-gram) 最小頻度 2, 最小シーケンス長 3, ギャップ数 0 一旦検索した状態で コロケーションタブに移動

5. 統計処理 5-6. Frequent Pattern Mining (p-mer) 最小頻度 2, 最小シーケンス長 3, 最大ギャップ幅 20, ギャップ数 1以上 一旦検索した状態で コロケーションタブに移動

p-mer (ギャップを許す) p個組の系列

A.最新の ChaMame について マウスでテキストファイルを ドラッグアンドドロップ 分類語彙表ラベルが 付与される