前回までの配布資料(Webにないもの):教室の後方 情報検索演習 第7回 2005年11月16日 後期 水曜5限 江草由佳 国立教育政策研 yuka@nier.go.jp パソコンを起動しておくこと 前から4列目までに着席すること 前回までの配布資料(Webにないもの):教室の後方 授業のWebページ:PowerPointの配布資料は↓ http://amazon.slis.tsukuba.ac.jp/~yuka/lecture/2005/ir/
前回のまとめ 第3回レポートの返却 演習 図書内容情報 新聞記事原報 第4回レポート
本日のお品書き 前回の資料の訂正 レポートの講評 演習:WWWと検索エンジン WWW 検索エンジンとは ディレクトリ型、ロボット型、ハイブリット型 メタ検索エンジン
前回の資料の訂正 スライド6 ×p.6 ○p.7
演習の準備 パソコンを起動 Internet Explorerを起動 Yahoo! Japanのサイトであることを確認 以後、Internet Explorerは「IE」と呼ぶ Yahoo! Japanのサイトであることを確認 検索フォームに「検索デスク」と入力 「検索」ボタンをクリック 検索結果の「1.検索デスク」のリンクをクリック 「お気に入り」→「お気に入りに追加」
(Uniform Resource Lolator): WWW: World Wide Web(1/2) サーバ サーバ Web ページ Web ページ リンク サーバ http://yahoo.co.jp/ ↑ URL (Uniform Resource Lolator): 各ファイルについている 住所となるもの サーバ Web ページ
WWW (2/2) サーバ WWWクライアント: WWWブラウザ:Internet Explorer リンク サーバ
検索エンジン サーチエンジンとも言う 要素 種類 情報ページの収集 検索用索引の作成 検索システムの提供 ディレクトリ型(カテゴリ型) ロボット型 ハイブリット型
ディレクトリ型検索エンジン カテゴリ型検索エンジンともいう 代表的なもの:Yahoo! 人間がページを収集 人手でページの説明情報を作成 一定の収集基準がある 有用なサイトが得られる確率が高い ロボット型に対して登録されているサイトが少ない 人手でページの説明情報を作成 人手で適切な階層(カテゴリ)に位置づけ 求める主題やトピックをたどってブラウジングができる 検索システムは階層や説明情報も検索
ロボット型検索エンジン 代表的なもの: Google, Goo ロボット(収集プログラム)でページを収集 登録しているサイトは膨大 検索結果の精度が低くなりがち インデクサ(索引プログラム)が索引語を作成 検索システムはページの全文を検索可にする ランキング(スコア) 関連の高いものから順に表示する
ハイブリット型検索エンジン ディレクトリ型とロボット型を組み合わせたもの 最近はほとんどがこのタイプ 大抵どちらかのタイプが優先的に Yahoo! はディレクトリ型優先のハイブリット型 ロボットで収集したサイトも検索できる。 Googleはロボット型優先のハイブリット型 「ディレクトリ」で、カテゴリでブラウジングできる。 「ディレクトリ」のリンクをたどってみよう
検索エンジン利用の一般的な注意(1/2) ディレクトリ型とロボット型を使い分ける 複数の検索エンジンを使い分ける 異なる種類のものを意識して使う 複数の検索エンジンを使い分ける ページ内容を推測し、キーワードを考える 同義語:「電子計算機」、「コンピュータ」 下位語:「コンピュータ」 表記の異なりに注意 「ディジタル・デバイド」 「ディジタルデバイド」 「デジタル・デバイド」「デジタルデバイド」
検索エンジン利用の一般的な注意(2/2) 複数キーワード、複合キーワードを使用する AND検索のキーワードは2~3個に 「携帯電話 NOT カメラ」 「カメラ付き携帯電話」 AND検索のキーワードは2~3個に 検索結果の参照は、最大でも数ページ程度まで 検索機能の変更が頻繁 ヘルプ(使用方法)を確認する
ディレクトリ型検索エンジンの実際 Yahoo! Japan 日本でよく利用されている アナリストは200人といわれている 日本人に有用と考えられるページを収集 簡単な解説をサイト毎に付与 検索機能 キーワード検索: 「島津製作所 ノーベル賞」 ← p.53 検索例3-1 検索オプション(詳細検索)
ロボット型検索エンジンの実際 Google(1) 検索式 AND検索: 「半角スペース」 OR検索: 「OR」 Not検索: 「-」 フレーズ検索:「”」でくくる 「I’m Feeling Lucky」 ボタン 最高位の検索結果を表示
ロボット型検索エンジンの実際 Google(2) 検索オプション(詳細検索) 語の区切りには半角を使うこと! 論理演算を使った検索 ページの記述言語の指定 情報のファイルタイプの指定:doc,画像ファイル 情報の更新日付 ドメイン指定 検索式で書けるものもある
ロボット型検索エンジンの実際 Google(3) p.55 検索例:3-2 久留米出身の洋画家で坂本繁二郎を除く青木繁、古賀春江のサイトを検索する P.57 図3-6 (少し変えている) 読書習慣に関する、日本語のページで、日本の象徴ドメイン(go.jp)にある、最近3ヶ月以内に更新されたページを検索
メタ検索エンジン 複数の検索エンジンを同時に/並行的に検索 ceek.jp http://www.ceek.jp/ 複数の検索エンジンを同時検索 検索結果を統合表示 「検索オプション」:検索対象を選べる 検索デスク「SearchDesk」 http://www.searchdesk.com/ キーワード入力はそのままで次々と異なった検索エンジンへ
演習 自分のすきなテーマでなんでもよいから、2語の検索語(例:「日本 滝」)を使って、Yahoo! JapanとGoogleを検索 それぞれ上位20件の簡易検索結果の保存と印刷 検索オプション:「表示件数」:20件 「ファイル」「名前をつけて保存」「マイドキュメント」「保存」 「ファイル」「印刷」「印刷」 Googleには各検索結果に順位を手で書き加える それぞれ上位20件の検索結果そのものの最初のページのみを印刷
演習 それぞれ、上位20件をYahoo! Japanを中心にして表にまとめる→検索結果対応表と呼ぶ 参照:配布資料
レポート課題5 以下をまとめて次回の授業の開始時に提出すること 「課題のタイトル:第5回レポート課題」「学籍番号」「氏名」「今日の日付」 Yahoo!Japan:検索式、ヒット件数 Google:検索式、ヒット件数 簡易表示結果印刷物(Yahoo!, Google) 結果そのもの印刷物(Yahoo!, Google) 検索結果対応表 右隅をホッチキスで綴じること
本日のまとめ 前回の資料の訂正 レポートの講評 演習:WWWと検索エンジン WWW 検索エンジンとは ディレクトリ型、ロボット型、ハイブリット型 メタ検索エンジン