情報検索演習 第2回 講義資料: 教科書が発行されました

Slides:



Advertisements
Similar presentations
身の回りの IT 情報科教育法 後期 10 回 2004/12/18 太田 剛. 目次 1. 最終提出の確認 2. ルータの説明 ( 先週の続き ) 3. 身の回りの IT 1/8 の授業は情報科教員の試験対策です。
Advertisements

論理回路 第3回 今日の内容 前回の課題の解説 論理関数の基礎 – 論理関数とは? – 真理値表と論理式 – 基本的な論理関数.
1 情報検索演習 第 3 回 2005 年 10 月 12 日 後期 水曜 5 限 江草由佳 国立教育政策研究所 前から 4 列目までに着席すること.
1 情報検索演習 第 10 回 2005 年 12 月 21 日 後期 水曜 5 限 江草由佳 国立教育政策研 パソコンを起動しておくこと 前から 4 列目までに着席すること lecture/2005/ir/
情報基礎演習I(プログラミング) 第9回 6月22日 水曜5限 江草由佳
NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
Accessによるデータベース(1) Ver.1 /11.
DB(データベース)のおはなし 作成者:小野正広 DBと言っても、  ドラゴンボール ではないですぞ! 3/1/2017.
座席指定制: 情報検索演習 第1回:オリエンテーション 座席表を確認してから座ること オリエンテーション 2006年9月27日
情報検索演習:第11回 法律・特許情報の探し方
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
情報・知能工学系 山本一公 プログラミング演習Ⅱ 第4回 配列(2) 情報・知能工学系 山本一公
情報処理基礎 2006年 6月 1日.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
情報検索演習:第7回 Web情報資源の探し方と リンク集の作り方
情報基礎演習I(プログラミング) 5月25日 水曜5限 江草由佳
<4日目内容> 今後のスケジュール HP更新内容の確認 課題の確認 (i-sys) 発表準備・予行演習の進め方について
図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
前回までの配布資料(Webにないもの):教室の後方
前回までの配布資料(Webにないもの):教室の後方
MAGAZINEPLUSの使いかた ○○大学図書館.
情報検索演習 欠席者用第3~5回演習課題 2006年11月15日 後期 水曜4/5限 江草由佳 国立教育政策研究所
情報検索演習:第6回 2006年11月 15日 後期 水曜4/5限 江草由佳 国立教育政策研究所
IT入門B2 (木曜日1限) 第一回 講義概要 2004年月9日30日.
プログラミング演習II 2004年10月19日(第1回) 理学部数学科・木村巌.
コンピュータリテラシ (1) 学習目標(到達目標) ・計算機実習室を正しく利用できる。 ・文書作成ソフトの利用方法を学び、報告作成が
情報科学1(G1) 2016年度.
文献管理ソフトRefWorksの利用.
情報検索演習 第2回 前から4列目までに着席すること 2005年10月05日 後期 水曜5限 江草由佳 国立教育政策研究所
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
情報検索演習の基礎 1.どういう検索をするのか コンピュータを用いた検索である
9 Microsoft Word(1).
情報検索演習 第10回 パソコンを起動しておくこと 前から4列目までに着席すること 2005年12月21日 後期 水曜5限
プログラミング言語論 プログラミング言語論 ガイダンス 水野 嘉明 ガイダンス 1 1.
情報検索演習 第8回 パソコンを起動しておくこと 前から4列目までに着席すること 2005年11月30日 後期 水曜5限
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
基本情報技術概論(第3回) 埼玉大学 理工学研究科 堀山 貴史
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
情報検索演習 第5回 パソコンを起動しておくこと 前から4列目までに着席すること 前回までの配布資料:教室の後方にある
データベース設計 データベース設計 第1回 データベース概論 坂口利裕.
Microsoft PowerPoint Netscape Communicator
経営工学基礎演習a PowerPointの利用.
10 Microsoft Word(1) 10.1 Microsoft Word v.Xの概要 起動 終了
管理画面操作マニュアル <サイト管理(1)> 基本設定 第9版 改訂 株式会社アクア 1.
コンピュータプラクティス I コンピュータプラクティスⅠ 校正 水野嘉明 校正.
【プログラミング応用】 必修2単位 通年 30週 授業形態:演習.
情報基礎演習I(プログラミング) 第10回 6月29日 水曜5限 江草由佳
クイックガイド <キーワードによる検索方法>
コンピュータ プレゼンテーション.
情報処理概論Ⅰ 2007 第5回 2019/4/7 情報処理概論Ⅰ 第5回.
★CD-ROMを使った情報検索 瞬時に検索できる! ★電子文字化されたデータを使いレポートを仕上げる 電子文字は加工が容易!
情報検索演習 第3回 2006年10月25日 後期 水曜4/5限 江草由佳 国立教育政策研究所
Microsoft PowerPoint 2001 Netscape Communicator Fetch 3.03
阿部研究室学生のための 文献検索および入手の講習会
情報基礎演習I(プログラミング) 第11回 7月12日 水曜5限 江草由佳
情報処理基礎A・B 坂口利裕 横浜市立大学・商学部
情報検索演習 第1回補足資料 授業Webサイトをお気に入りに追加 2006年9月27日 授業資料をダウンロード 後期 水曜4/5限
C言語 はじめに 2016年 吉田研究室.
基本情報技術概論(第2回) 埼玉大学 理工学研究科 堀山 貴史
論理回路 第4回
情報検索演習 第2回補足資料:USBメモリの使い方
情報基礎演習I(プログラミング) 6月8日 水曜5限 江草由佳
情報基礎演習I(プログラミング) 第8回 6月8日 水曜5限 江草由佳
情報検索演習:第4回 前回の配布資料: 教室の前方のカサ立てにある パソコンを起動したさいに入力する 氏名に 「時限-学籍番号-名前」
Netscape Communicator Eudora Microsoft Word
医療科学B演習のおさらい 杏林大学医学図書館 医療科学B.
コンピュータ プレゼンテーション.
岩村雅一 知能情報工学演習I 第7回(後半第1回) 岩村雅一
Presentation transcript:

情報検索演習 第2回 講義資料: http://momiji.mimoza.jp/lecture/2006/ir/ 教科書が発行されました まだ買ってない人は購入すること 原田智子編著「三訂情報検索演習」樹村房  2006年10月 ¥1,995  2006年10月11日 後期 水曜4/5限 江草由佳 国立教育政策研究所 yuka@nier.go.jp 講義資料: http://momiji.mimoza.jp/lecture/2006/ir/

今日のおしながき お知らせ USBメモリの使い方 講義内容 情報検索の流れ レコードと検索フィールド 情報検索の理論 情報検索結果の評価 論理演算子(AND,OR,NOT) トランケーション(前方一致、後方一致、中間任意、中間一致) 情報検索結果の評価 検索漏れ、ノイズ 再現率 精度

お知らせ 来週(10/18)は休講です 教科書が発行されました 提出課題(演習課題とレポート課題)について 原田智子編著「三訂情報検索演習」樹村房 2006年10月 ¥1,995 次回からは必ず持ってきてください 提出課題(演習課題とレポート課題)について 「演習課題」:授業中に作成してその場で提出する課題 「レポート課題」:授業時間外に作成して、授業開始時に提出する課題 提出課題は必ず提出すること 締切厳守。締切を過ぎて提出したものは大幅減点 欠席して提出できなかったもの→次回に提出する 当然、減点はします。

演習:講義資料の保存と利用 (USBメモリの使い方) 講義資料をWebから取得しUSBに保存 やりかたは、「第1回講義補足資料」を参照 http://localhost/~yuka/lecture/2006/ir/IR01-20060927-add.ppt 配布資料にもあります 使うときは 「スタート」→「マイコンピュータ」→「リムーバルディスク」をダブルクリック

資料訂正と補足資料 授業Webサイト スライド4 スライド8 スライド29 訂正済み第1回資料 補足資料 渡辺満彦 → 原田智子 渡辺満彦 → 原田智子 スライド8 授業のホームページ → 授業のWebサイト 「yuka@nier.go.jp」 を追加 スライド29 スライド29 第一回課題提出 を追加

2.情報検索の流れ (1)情報検索の受付と検索準備 –p.12 (2)検索の実行 –p.17 (3)検索結果の整理と情報提供 –p.17 テキストのページ数 を表す

レコードと検索フィールド(1) –18p. レコード 検索フィールド データベースに収録されている個々の論文や新聞記事などの情報単位 レコードの内容はデータベースの種類や内容によって異なる 検索フィールド レコードは複数の検索フィールドからなる 例)レコード番号、論題、著者名 p.? は テキストのページ数 を表す

レコードと検索フィールド(2) レコード 検索フィールド名 検索フィールド値 検索フィールド 論題: Reading―速読・多読            について考える  著者名:     清水由理子  請求記号:   P343-5C2-14  掲載誌名:   獨協大学外国語教育研究14  発行年月:   1995.12  掲載ページ: p.273~282  登録日:     19970930 検索フィールド

情報検索の理論(1) —p.19 コンピュータ検索では論理演算の概念が基本 論理演算 トランケーション データベース全体から合致するものを検索し 論理積、論理和、論理差の集合の概念をもちいて、広げたり、狭めたりして検索 論理演算 トランケーション

情報検索の理論(1) —p.19 (1)論理演算子 –p.19 論理積(AND)、論理和(OR)、論理差(NOT) 論理演算子 説明ではAND, OR, NOTを使うが、演算子の書き方はシステムによって様々である。 論理積 論理和 論理差 A B A B A B A AND B A OR B A NOT B 1-9図 p.19

情報検索の理論(2) —p.19 (1)論理演算子 –p.19 テキストのページ数 を表す 論理積(AND) –p.20 Aという検索語を持つ情報の集合とBという検索語をもつ集合の両方を含む部分を検索すること 情報を絞り込んでいくときに有用 例:「高校におけるコンピュータ教育」 検索式:”高校 AND コンピュータ教育” A:高校 B:コンピュータ教育

情報検索の理論(3) —p.19 (1)論理演算子 –p.19 Aという検索語を持つ情報の集合とBという検索語のいずれか一方の検索語をもつ集合部分と、両方をもつ集合部分全てを検索すること 同義語などの検索に有用 例:「高校におけるコンピュータ教育」 検索式:”高校 OR 高等学校” A:高校 B:高等学校 p.? は テキストのページ数 を表す

情報検索の理論(4) —p.20 (1)論理演算子 –p.20 テキストのページ数 を表す 論理差(NOT) –p.20 Aという検索語を持つ情報の集合からBという検索語をもつ集合部分を除いた部分を検索すること 複数の言語で書かれていることはすくないので、ロシア語文献を抜くといった検索に有効 例:「トラック事故以外の自動車事故」 検索式:”自動車事故 NOT トラック事故” A:自動車事故 B:トラック事故

情報検索の理論(8) —p.20 (3)トランケーション –p.21 検索語を入力する場合に、語の一部を任意文字に指定して検索すること マスク文字(ワイルドカード) 任意文字とする部分に使用する入力文字 マスク(mask):覆い隠すから由来 マスク文字:システムによって異なる 以下は説明で使用 ?:0文字以上、何文字でもよい #:0文字または一文字 !:ちょうど一文字 p.? は テキストのページ数 を表す

情報検索の理論(9) —p.20 (3)トランケーション –p.21 検索語の前方が一致する検索 検索語の末尾を任意文字に指定する検索 大抵どのシステムにもある 例)  情報? ⇒ 情報、情報検索、情報検索システム CAT# ⇒ CAT,CATS,CATV 猫を検索したいときによいが、CATVまで検索されてしまう DIS! ⇒ DISK,DISC 英米綴りの違いを同時に検索できる p.? は テキストのページ数 を表す

情報検索の理論(10) —p.20 (3)トランケーション –p.21 検索語の後方を一致させる検索 検索語の始まりを任意文字に指定する方検索 例)  ?情報 ⇒ 情報、安全情報、特許情報 p.? は テキストのページ数 を表す

情報検索の理論(11) —p.20 (3)トランケーション –p.21 検索語の途中を任意文字に指定する検索 例)  情報?システム⇒ 情報システム、情報管理システム、情報検索システム ログ!ン ⇒ ログイン、ログオン 同義語が同時に検索できる WOM!N ⇒ WOMAN,WOMEN 単数形、複数形が同時に検索できる GR!Y ⇒ GREY,GRAY 英米綴りの違いを同時に検索できる p.? は テキストのページ数 を表す

情報検索の理論(12) —p.20 (3)トランケーション –p.21 検索語の中間が一致する検索 検索語の両端を任意文字に指定する検索 インターネットの検索エンジンでは中間一致していることが多い 一般に3文字以下の略字ではノイズを招くので、トランケーションを使わず、完全一致させたほうがよい 例)  ?情報? ⇒情報、交通情報、情報システム、交通情報システム p.? は テキストのページ数 を表す

情報検索結果の評価(1) –p.23 検索結果の評価 検索漏れ ノイズ 検索終了後、求める情報が適切に検索できているか、検索漏れはやノイズがないかどうかをチェックする 検索漏れ 本来必要な情報でデータベースに存在するにもかかわらず検索されなかった情報 ノイズ そのテーマに不要な情報が入り込んで検索された情報 p.? は テキストのページ数 を表す

情報検索結果の評価(2) –p.23 再現率(recall ratio) データベースに合致する適合情報のうち、どれだけ適合情報が検索されたかという割合を表す 検索漏れの程度を表す指標となる データベース全体の適合情報を実際に調べるのは不可能なため、普通、正確にはわからない 精度(precision ratio)(適合率(relevance ratio)) 実際に得られた検索結果の情報全体のうち、どれだけ適合情報が検索されたかという割合を表す。 ノイズの程度を表す指標となる 検索結果から容易に計算可能 両方とも高いのが理想だが、どちらかを上げるとどちらかが下がるという関係にある

情報検索結果の評価(3) –p.23 再現率 R = B ÷ (A + B) ×100% 精度 P = B ÷ (C + B) ×100% C ノイズ 検索された 情報の 全体 A 検索漏れ B 検索された 適合情報 検索要求に 合致する 適合情報 の全体

情報検索結果の評価(4) –p.23 例)10件の文献を出力、10件全部が適合文献、データベース全体には100件の適合文書が存在 精度:10/10×100=100% 再現率:10/100×100=10% 残りの90%が検索漏れ 例)50件の文献を出力、30件が適合文献、 データベース全体には70件適合文書が存在 精度:30÷50×100 = 60% ノイズは40% 再現率:30÷70×100 = 43% 検索漏れは57%

今日のまとめ 講義内容 情報検索の流れ レコードと検索フィールド 情報検索の理論 情報検索結果の評価 論理演算子(AND,OR,NOT) トランケーション(前方一致、後方一致、中間任意、中間一致) 情報検索結果の評価 検索漏れ、ノイズ 再現率 精度

第1回レポート課題 今日までの講義をA4用紙1ページ分にまとめなさい 以下の項目をレポートの冒頭につけること 〆切:次回の講義にUSBメモリで持参すること Microsoft Office Wordで作成すること ファイル名:report01-学籍番号名前.doc ヒント:スライドの「今日のまとめ」、目次、章タイトル 以下の項目をレポートの冒頭につけること レポートのタイトル:第1回レポート課題 授業名:情報検索演習 時限:4限 or  5限 提出した日付 学籍番号 氏名

第2回演習課題 (レポート提出の練習) 今までの講義についての感想もしくは質問をなんでもよいから記述したWordファイルを作成しUSBメモリに保存しなさい 電子的なファイルとして提出しなさい ファイル名:ir2006-10-11-学籍番号名前.doc 以下の項目を演習課題の冒頭につけること 演習課題のタイトル:第2回演習課題 授業名:情報検索演習 時限:4限 or  5限 提出した日付 学籍番号 氏名