情報検索演習 第2回 前から4列目までに着席すること 2005年10月05日 後期 水曜5限 江草由佳 国立教育政策研究所

Slides:



Advertisements
Similar presentations
1 医中誌Webについて 杏林大学 医学図書館. 2 医中誌Webとは  国内発行の雑誌に収載された論文情報を検索 できる医学文献デ-タベ-ス  医学、薬学、歯学、看護学、獣医学の分野を 網羅  約5,000誌、695万件におよぶデ-タ (2009年11月現在)  1983 年から現在までの検索が可能.
Advertisements

図書・雑誌・論文検 索 岩手大学情報メディアセンター図書館 - 2012年 -. 検索とは 文書やデータの中から必要な事項をさがし 出すこと(広辞苑第6版) 文書やデータの中から必要な事項をさがし 出すこと(広辞苑第6版) – インデックス型 文字列が検索キー
1 情報検索演習 第 11 回 ( 最終回 ) 2006 年 1 月 11 日 後期 水曜 5 限 江草由佳 国立教育政策研 パソコンを起動しておくこと 前から 4 列目までに着席すること
INIS Collection Search クイックマニュアル INIS Collection Search クイックマニュアル ○ 問い合わせ先 国立研究開発法人 日本原子力研究開発機構.
論理回路 第3回 今日の内容 前回の課題の解説 論理関数の基礎 – 論理関数とは? – 真理値表と論理式 – 基本的な論理関数.
1 情報検索演習 第 3 回 2005 年 10 月 12 日 後期 水曜 5 限 江草由佳 国立教育政策研究所 前から 4 列目までに着席すること.
1 情報検索演習 第 10 回 2005 年 12 月 21 日 後期 水曜 5 限 江草由佳 国立教育政策研 パソコンを起動しておくこと 前から 4 列目までに着席すること lecture/2005/ir/
雑誌記事 DB の使用方法. 8-3 MAGAZINEPLUS データベース 38) 概要 MAGAZINEPLUS ( NICHIGAI/WEB サービス) – 約 30,000 誌、 11,000,143 件( 2010/01/22.
NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
詳細検索の方法- EBSCOhost Guided Style 検索フィールド
DB(データベース)のおはなし 作成者:小野正広 DBと言っても、  ドラゴンボール ではないですぞ! 3/1/2017.
情報処理 第12回.
情報検索演習:第11回 法律・特許情報の探し方
④CiNii ⑤NDL-OPAC(雑誌記事) ⑥日経BP
プログラミング言語としてのR 情報知能学科 白井 英俊.
情報処理基礎 2006年 6月 1日.
医学中央雑誌 Web (Ver.4)  検索マニュアル 香川大学附属図書館医学部分館.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
Google 【日本語】の利用 5-4 【日本語】Google 69) (2010/04/23現在)
情報の探し方ガイダンス 法律判例文献情報 CD-ROM編.
情報基礎演習I(プログラミング) 5月25日 水曜5限 江草由佳
図書DBの使用方法 NDL-OPAC 国立国会図書館 Webcat PLUS 国立情報学研究所 Books 日本書籍出版協会
前回までの配布資料(Webにないもの):教室の後方
前回までの配布資料(Webにないもの):教室の後方
MAGAZINEPLUSの使いかた ○○大学図書館.
情報検索演習 第2回 講義資料: 教科書が発行されました
情報検索演習 欠席者用第3~5回演習課題 2006年11月15日 後期 水曜4/5限 江草由佳 国立教育政策研究所
三上研究室学生のための 文献検索および入手の基礎講習
ネットで百科 for Library の使いかた
Z39.50プロトコルを用いた 検索クライアントの開発
文献管理ソフトRefWorksの利用.
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
情報検索演習の基礎 1.どういう検索をするのか コンピュータを用いた検索である
情報検索演習 第10回 パソコンを起動しておくこと 前から4列目までに着席すること 2005年12月21日 後期 水曜5限
Webページで自己紹介をしよう! 出席番号の席に着席し ユーザ名~user○○ パスワード~pass でログオン
情報検索演習 第8回 パソコンを起動しておくこと 前から4列目までに着席すること 2005年11月30日 後期 水曜5限
EBSCOhost 詳細検索 チュートリアル support.ebsco.com.
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
基本情報技術概論(第3回) 埼玉大学 理工学研究科 堀山 貴史
医中誌Web利用講習会 平成23年5月31日 丸善株式会社.
情報検索演習 第5回 パソコンを起動しておくこと 前から4列目までに着席すること 前回までの配布資料:教室の後方にある
CiNiiの利用方法を簡潔に説明したクイックレファレンスのうち、検索~本文入手の手順を説明したものです。
SCI/SSCI/A&HCI利用オプションを申請する
IIR輪講復習 #1 Boolean retrieval
EBSCOの利用方法.
春の文献検索講習会2010 練習問題で実践トレーニング
環境リスクマネジメントに関する 検索システム
情報基礎演習I(プログラミング) 第10回 6月29日 水曜5限 江草由佳
クイックガイド <キーワードによる検索方法>
クイックガイド <キーワードによる検索方法>
情報処理概論Ⅰ 2007 第5回 2019/4/7 情報処理概論Ⅰ 第5回.
★CD-ROMを使った情報検索 瞬時に検索できる! ★電子文字化されたデータを使いレポートを仕上げる 電子文字は加工が容易!
平成16年度東京大学技術職員研修 データベース検索
阿部研究室学生のための 文献検索および入手の講習会
OPACを利用するに あたって 学術情報総合センター医学部分館 1 学術文献の量 2 看護関係図書・雑誌の探し方 3 図書資料の配架場所
情報基礎演習I(プログラミング) 第11回 7月12日 水曜5限 江草由佳
新聞記事DBの使用方法 4種類のDB DBの使用可能期間 I. 朝日新聞(1984-現在) 遡及情報検索
情報検索演習 第1回補足資料 授業Webサイトをお気に入りに追加 2006年9月27日 授業資料をダウンロード 後期 水曜4/5限
C言語 はじめに 2016年 吉田研究室.
情報検索演習 第2回補足資料:USBメモリの使い方
データ構造とアルゴリズム (第5回) 静岡大学工学部 安藤和敏
図書館ガイダンス “30分でおさえる論文入手法”
構造的類似性を持つ半構造化文書における頻度分析
情報基礎演習I(プログラミング) 第8回 6月8日 水曜5限 江草由佳
情報検索演習:第4回 前回の配布資料: 教室の前方のカサ立てにある パソコンを起動したさいに入力する 氏名に 「時限-学籍番号-名前」
Z39.50プロトコルによる日本語書誌データ情報検索システム
自然言語処理2015 Natural Language Processing 2015
人文、社会、自然、医療、理工等、総合分野を網羅した学術機関向けの 全文データベース (2014年4月1日より開始)
情報処理Ⅱ 2005年11月25日(金).
Presentation transcript:

情報検索演習 第2回 前から4列目までに着席すること 2005年10月05日 後期 水曜5限 江草由佳 国立教育政策研究所 yuka@nier.go.jp 前から4列目までに着席すること

今日のおしながき 講義内容 レコードと検索フィールド 情報検索の理論 情報検索結果の評価 論理演算子(AND,OR,NOT) 位置演算子(隣接演算子、近接演算子) トランケーション(前方一致、後方一致、中間任意、中間一致) 情報検索結果の評価 検索漏れ、ノイズ 再現率 精度

レコードと検索フィールド(1) –18p. レコード 検索フィールド データベースに収録されている個々の論文や新聞記事などの情報単位 レコードの内容はデータベースの種類や内容によって異なる 検索フィールド レコードは複数の検索フィールドからなる 例)レコード番号、論題、著者名 p.? は テキストのページ数 を表す

レコードと検索フィールド(2) レコード レコード レコード レコード 論題 Reading―速読・多読について考える 著者名 清水由理子 著者名 清水由理子 請求記号 P343-5C2-14 掲載誌名 獨協大学外国語教育研究14 発行年月 1995.12 掲載ページ数 p.273~282 登録日 19970930 論題フィールド 著者名フィールド 請求記号フィールド 掲載誌フィールド 発行年月フィールド 掲載ページ数フィールド 登録日フィールド

情報検索の理論(1) —p.20 コンピュータ検索では論理演算の概念が基本 データベース全体から合致するものを検索し 論理積、論理和、論理差の集合の概念をもちいて、広げたり、狭めたりして検索 情報検索の理論の説明のために、JOISで使われているコマンドを利用するが、コマンドはシステムによって様々である。

情報検索の理論(2) —p.20 (1)論理演算子 –p.20 論理積(AND) Aという検索語を持つ情報の集合とBという検索語をもつ集合の両方を含む部分を検索すること 情報を絞り込んでいくときに有用 例:「高校におけるコンピュータ教育」 検索式:”高校 AND コンピュータ教育” p.? は テキストのページ数 を表す A:高校 B:コンピュータ教育

情報検索の理論(3) —p.20 (1)論理演算子 –p.20 論理和(OR) Aという検索語を持つ情報の集合とBという検索語のいずれか一方の検索語をもつ集合部分と、両方をもつ集合部分全てを検索すること 同義語などの検索に有用 例:「高校におけるコンピュータ教育」 検索式:”高校 OR 高等学校” p.? は テキストのページ数 を表す A:高校  B:高等学校

情報検索の理論(4) —p.20 (1)論理演算子 –p.20 論理積(NOT) Aという検索語を持つ情報の集合とBという検索語をもつ集合部分を除いた部分を検索すること 複数の言語で書かれていることはすくないので、ロシア語文献を抜くといった検索に有効 例:「トラック事故以外の自動車事故」 検索式:”自動車事故 NOT トラック事故” p.? は テキストのページ数 を表す A:自動車事故 B:トラック事故

情報検索の理論(5) —p.20 (2)位置演算子 –p.22 検索語と検索語の位置関係や出現順位を限定するために使用 英語のように単語に分かれている言語の場合有効、日本語の検索には通常使えない p.? は テキストのページ数 を表す

情報検索の理論(6) —p.20 (2)位置演算子 –p.22 2つの語が隣り合わせに存在し、入力した語順を指定するもの、しないものがある 語順指定あり  --- (W) 例)Information systemだけを検索 → Information (W) system 例) information とsystemが2語以内で隣接しているレコードの検索 →information (2W) system information management support system, information management systemなどが検索される 語順指定なし  ---(N) Information system, system Information両方を検索 → Information (N) system p.? は テキストのページ数 を表す

情報検索の理論(7) —p.20 (2)位置演算子 –p.22 2つの語が同一文章中もしくはフィールド中にあるレコードを検索するもの  文章中  --- (S) 例)文章中にinformation, systemがあるもの → information (S) system Information literacy education and network systemsといったものがヒットする フィールド中  ---(F) 例)フィールド中にinformation, systemがあるもの → information (F) system ・・・・・・network system. ・・・information science・・・・・.というような同一文ではないが同じ抄録フィールド内に2つの語が存在する場合に検索される p.? は テキストのページ数 を表す

情報検索の理論(8) —p.20 (3)トランケーション –p.23 検索語を入力する場合に、語の一部を任意文字に指定して検索すること 表1-1 –p.24 ?:0文字以上、何文字でもよい #:0文字または一文字 !:丁度一文字 p.? は テキストのページ数 を表す

情報検索の理論(9) —p.20 (3)トランケーション –p.23 前方の末尾を任意文字に指定する検索 大抵どのシステムにもある 例)  情報? ⇒ 情報、情報検索、情報検索システム CAT# ⇒ CAT,CATS,CATV 猫を検索したいときによいが、CATVまで検索されてしまう DIS! ⇒ DISK,DISC 英米綴りの違いを同時に検索できる p.? は テキストのページ数 を表す

情報検索の理論(10) —p.20 (3)トランケーション –p.23 検索語の始まりを任意文字に指定する方検索 例)  ?情報 ⇒ 情報、安全情報、特許情報 p.? は テキストのページ数 を表す

情報検索の理論(11) —p.20 (3)トランケーション –p.23 検索語の途中を任意文字に指定する検索 例)  情報?システム⇒ 情報システム、情報管理システム、情報検索システム ログ!ン ⇒ ログイン、ログオン 同義語が同時に検索できる WOM!N ⇒ WOMAN,WOMEN 単数形、複数形が同時に検索できる GR!Y ⇒ GREY,GRAY 英米綴りの違いを同時に検索できる p.? は テキストのページ数 を表す

情報検索の理論(12) —p.20 (3)トランケーション –p.23 検索語の両側を任意文字に指定する検索 インターネットの検索エンジンでは中間一致していることが多い 一般に3文字以下の略字ではノイズを招くので、トランケーションを使わず、完全一致させたほうがよい 例)  ?情報? ⇒情報、交通情報、情報システム、交通情報システム p.? は テキストのページ数 を表す

情報検索結果の評価(1) –p.32 検索結果の評価 検索漏れ ノイズ 検索終了後、求める情報が適切に検索できているか、検索漏れはやノイズがないかどうかをチェックする 検索漏れ 本来必要な情報でデータベースに存在するにもかかわらず検索されなかった情報 ノイズ そのテーマに不要な情報が入り込んで検索された情報 p.? は テキストのページ数 を表す

情報検索結果の評価(2) –p.32 再現率(recall ratio) データベースに合致する適合情報のうち、どれだけ適合情報が検索されたかという割合を表す 検索漏れの程度を表す指標となる データベース全体の適合情報を実際に調べるのは不可能なため、普通、正確にはわからない 精度(precision ratio)(適合率(relevance ratio)) 実際に得られた検索結果の情報全体のうち、どれだけ適合情報が検索されたかという割合を表す。 ノイズの程度を表す指標となる 検索結果から容易に計算可能 両方とも高いのが理想だが、どちらかを上げるとどちらかが下がるという関係にある

情報検索結果の評価(3) –p.32 再現率 R = B ÷ (A + B) ×100% 精度 P = B ÷ (C + B) ×100% 検索された情報の全体 A 検索漏れ B 検索された 適合情報 C ノイズ p.? は テキストのページ数 を表す データベース全体に存在する適合文書

情報検索結果の評価(4) –p.32 例)10件の文献を出力、10件全部が適合文献、データベース全体には100件の適合文書が存在 精度:10/10×100=100% 再現率:10/100×10=10% 残りの90%が検索漏れ 例)50件の文献を出力、30件が適合文献、 データベース全体には70件適合文書が存在 精度:30÷50×100 = 60% ノイズは40% 再現率:30÷70×100 = 43% 検索漏れは57%

今日のまとめ 講義内容 レコードと検索フィールド 情報検索の理論 情報検索結果の評価 論理演算子(AND,OR,NOT) △ 位置演算子(隣接演算子、近接演算子) トランケーション(前方一致、後方一致、中間任意、中間一致) 情報検索結果の評価 検索漏れ、ノイズ 再現率 精度