Presentation is loading. Please wait.

Presentation is loading. Please wait.

Web情報検索(1A-5A; 教科書Vol.1) 2019/4/7

Similar presentations


Presentation on theme: "Web情報検索(1A-5A; 教科書Vol.1) 2019/4/7"— Presentation transcript:

1 Web情報検索(1A-5A; 教科書Vol.1) 2019/4/7
2019/4/13 Web情報検索(1A-5A; 教科書Vol.1) 2019/4/7 1A  情報検索の概要 2A Web情報検索(検索エンジン) 2回4/16 課題設定  3A  日本語検索エンジン(検索式) 3回4/23 日本語検索 4A(1)英語検索エンジン 4回5/7 英語検索 4A(2)Web情報の信頼性 5A  キーワードの理解 5回5/14 まとめ 期限5/18 UP

2 is.nuis.jp/ir/top/ トップページ 授業に関する全ての情報へのポータル セキュリティ対策のためリンクはありません
修正は行います

3 自主学習 1B 情報利用環境アンケート 2B Web情報検索課題の設定 3B ir03B_Web情報検索課題 4B --
課題1ファイル参照  3B ir03B_Web情報検索課題 4B -- 5B  Web情報検索課題提出項目の確認 5C 理解度テスト 資料1 検索エンジンへのポータルページ 資料2 検索エンジンの使用方法(検索式)

4

5 1 資料 2 情報検索の概念とWeb情報 3 課題 4 情報の活用
2019/4/13 1A 情報検索の概要 1 資料 2 情報検索の概念とWeb情報 3 課題 4 情報の活用 しA資料はPDFでアップされています。 原稿4ページを用紙1枚でプリントするのを前提に作成しています。

6 1 資料 http://is.nuis.jp/ir/top/
1 資料   教科書Vol.1 課題1 授業で説明 提出 画面 自主学習50%

7 授業の進め方(xxは授業の回数) 前半 60分 後半 30分 1回目 情報検索に関する概念 論理式 自主学習の説明 DBの説明 課題の説明
前半   60分 情報検索に関する概念 論理式 後半  30分 自主学習の説明 DBの説明 課題の説明 時間外 (課題提出) 情報検索の知識 irxxA 課題の説明 irxxB DBxx 1回目 ir01A ir01B UP01

8 2単位の学習時間  授業90分(2時間に読み替え) +予習2時間 +復習2時間

9 2. 情報検索の概念 情報検索は情報収集の有効な手段 情報検索により入手できる情報により、 自己の知識を深めることができる。
教科書4頁 情報検索は情報収集の有効な手段 情報検索により入手できる情報により、 自己の知識を深めることができる。 目標達成のためのスタートレベルを引き上げることができる。

10 Information retrieval
授業の情報検索の意味 主にDBを使って情報を検索する Web情報が登場する前から存在する概念 情報とは原文(一次情報)を意味する 活用するために情報を収集する 知識習得のために情報を収集する 目的達成のため情報を収集する 目的の達成に必要な知識や情報を得る検索

11 Information search Web情報の検索に使用 検索エンジンを使用 1件使える情報が見つかればよい検索
Google, Yahoo など 検索結果からハイパーリンクでWebページ(原文)を閲覧できるが、一次情報とは限らない 1件使える情報が見つかればよい検索

12 3.情報検索のねらい ①➔ 情報検索の前に目的と目標を設定できる ②➔ 複数の情報をまとめることができる
①➔ 情報検索の前に目的と目標を設定できる ②➔ 複数の情報をまとめることができる ③➔ 蓋然的信頼性を自分の判断で見極める ④➔ 原文を入手できる 書誌事項を利用する ⑤➔ 検索式を組み立てることができる AND, OR, NOT を使ったキーワード検索が可能になる

13 A ) 事前に目的と目標を設定できる ➔ 収集した情報を利用できる 単に興味を満足させる検索/単に知る検索が多い
➔ 収集した情報を利用できる 単に興味を満足させる検索/単に知る検索が多い 目的が希薄なため情報を活用できない(SNSの検索) 他人に対する働きかけができない 判断/意思決定に利用できる 課題1 UP項目6,7

14 B) 複数の情報をまとめることができる ➔ 収集した情報を自分の体系的な知識にできる ➔ 収集した情報を目的に役立つようまとめることができる
➔  収集した情報を目的に役立つようまとめることができる ➔ 収集した情報を自分の体系的な知識にできる 知識とは将来一般的に使用できるもの 知識があればデータや情報を評価できる(データを情報に変えることができる) 現状は情報の選択で用が足りるため単に知ることで終了している  検索結果の上位記事の利用/ Wikipedia/まとめサイトの利用   結果として自分の知識にならない 課題1 UP項目11-2, 日本語Google UP項目16-2, 日本語Google以外 UP項目21-2, 英語

15 C) 蓋然的信頼性を自分の判断で見極める ➔ 情報の信頼性を見極めることができる 書誌事項の理解 現状 自分に都合のよい情報を選択する
➔ 情報の信頼性を見極めることができる 現状 自分に都合のよい情報を選択する 自分が理解できる情報を選択する 書誌事項の理解 情報の発信者、情報源、発行年などを意識する 課題1 UP項目 日本語Google UP項目 日本語Google以外 UP項目 英語

16 D) 原文を入手できる 書誌事項を利用する ➔ 原文の重要性を理解できる 著者 情報発信時間 出版社 タイトル
➔ 原文の重要性を理解できる 情報検索の情報とは一次情報であることが理解できる 書誌事項を利用する 著者 情報発信時間 出版社 タイトル

17 E) 検索式を組み立てることができる ➔ 情報検索の手法を理解できる 検索エンジンの機能を理解できる 適切なキーワードを選択できる
➔ 情報検索の手法を理解できる 検索エンジンの機能を理解できる 適切なキーワードを選択できる 論理式の概念を理解できる 基礎知識が必要なことを理解できる 情報検索は有力な情報収集の方法であることを理解できる AND, OR, NOT を使ったキーワード検索が可能になる

18 4 課題1, 2, 3 課題1 Web情報検索 【学習到達目標】 以下の内容を、体験を通して理解する。
4 課題1, 2, 3 課題1 Web情報検索 【学習到達目標】 以下の内容を、体験を通して理解する。 付帯情報からサイトのC)蓋然的信頼性を推定できるようになること。 蓋然的信頼性(Probable reliability)を推定できる 複数のWeb情報をB)目的に合うようにまとめることができるようになること。 Advanced Searchの理解 AND, OR, NOT の論理式を使ったE)キーワード検索が可能になること。 Web情報の中でも一次情報が重要なことを認識できること。 複数の検索エンジンを利用し幅広い情報収集ができること。 検索エンジンによる偏りの排除 検索エンジンは常に公正ではないことに注意を払うことができるようになること。

19 課題2 図書雑誌記事検索 【学習到達目標】 以下の内容を、体験を通して理解する
課題2 図書雑誌記事検索 【学習到達目標】   以下の内容を、体験を通して理解する ① 図書情報から信頼性の高いB)体系的な知識を獲得することができる ② 図書情報は基礎知識を得るために適していることを理解できる ③ 雑誌記事情報は専門的な最新の情報を得るために適していることを理解できる データベースを使って図書・雑誌記事のD)原文情報,一次情報が収集できるようになる ④ 雑誌記事の原文を PDF ファイルでデータベースから直接入手できる ⑤ 使用するキーワードを極力少なくして図書/雑誌記事情報検索ができる ⑥ 図書館の OPAC を利用っしてインターネットで蔵書検索ができる ⑦ 原文(図書,雑誌記事)入手のため図書館を利用できる

20 課題3 複合情報検索 [学習到達目標] 以下の内容を、体験を通して理解する ①事前にA)目的と目標を設定できる
 課題3 複合情報検索  [学習到達目標]    以下の内容を、体験を通して理解する ①事前にA)目的と目標を設定できる ②情報源毎の特性を理解し、課題に合わせて必要な複数の情報源とデータベースを選択できる ③情報源からD)一次情報を得て、 目的/目標の達成に活用できる、あるいは自分の知識にできる ④グループ活動の有用性を理解できる ⑤基礎知識の必要性の認識 ⑥新しい視点を見出す ⑦英語の情報の重要性が認識できること

21 UPした資料で課題を進める 3&4列 内容の説明:irxxA 5&6列 課題の実行:irxxB 7&8列 DBの資料 :DBxx
11-14列 提出課題見本

22 4.情報検索の知識が将来必要になる理由 卒業論文で論拠となる参考文献を収集することができる 自己の知識を深化させ自分で考えることができる
偏りのない基礎知識を習得する 目的 (自己実現)を実現するために情報を活用できる 問題解決の方法を考え出すことができる。 生涯学習 ネット環境を使い生涯、自己学習が可能となる ワークシフト 自己学習により社会の構造変化に対応した働き方ができる 新しい価値を創ることができる

23 キュレーション curation 情報活用のイメージ
2019/4/13 キュレーション curation  情報活用のイメージ 美術館や博物館で企画展を実施するキュレーターに由来する言葉 見つける 情報を選んで集める まとめる 情報を整理、加工、分析する ひろげる(創造する) 収集した情報を特定のテーマに沿って編集し新たな意味や価値を付与する 議論する *インターネット上にあふれる情報やコンテンツを独自の価値基準で編集して紹介するサービスもキュレーションと呼ばれる Acquiring 21st Century Skills from Curation Learning 見つける C1. Find: find relevant information from a vast amount of resources 幅広い情報源から関連する情報を⾒つける まとめる C2. Select: select interesting information that is usable 興味のある使える情報を選択する C3. Editorialize: add our perspectives and contexts to data 自分たちの視点や文脈をデータに加え編集する 3. ひろげる(創造する) C4.Arrange: combine data and give meanings as a whole データを組み合わせ,全体としての意味付けを考える C5.Create: synthesize as a piece of information 新しい情報を作り出す 4. 議論する C6.Share: share curated contents to other learners with similar interests 創造した内容を同じ興味を持つ人と共有する C7.Engage: create space for discussion and facilitate discussion ディスカッションの場を作り,ディスカッションをファシリテートする C8.Track: improve curated results based on comments and discussions コメントやディスカッションを元にこの結果を改善する

24 1回目の復習(2時間) 【事後】現在の個人の情報検索利用環境をWebページからUPする。 (2時間)
スマホからでもOK 配布資料の再確認 情報検索のねらい 課題1の概要の理解 情報検索が必要になる理由

25 2回目の予習(2時間) 【事前】HPから教科書をダウンロードするかプリントアウトし概要を把握する。
1, 2回目の資料をダウンロードし目をとおす. ir01A, ir02Aをダウンロードし、内容を必ず確認すること   プリントはページ指定で ir01B, ir02B, 資料1, 資料2は興味があればDL確認すること 課題1をダウンロードし目をとおす 教科書Vol.1をダウンロードし目次に目をとおす。 以下は参考のページです。質問の際に使用します。

26 2A Web情報検索(検索エンジン) 1.検索エンジン 2.検索エンジンの公正さ 3.課題1の確認と検索課題の設定

27 情報検索の狙い 再確認 収集した情報を利用できる 収集した情報を自分の知識にできる C) 情報の信頼性を見極めることができる
情報検索の狙い 再確認 収集した情報を利用できる ➔事前に目的と目標を設定できる         課題1 UP項目6,7 収集した情報を自分の知識にできる   ➔ 複数の情報を1つにまとめることができる C) 情報の信頼性を見極めることができる ➔ 蓋然的信頼性を自分の判断で見極める D) 原文の重要性を理解できる ➔ 原文を入手できる E) 情報検索の手法を理解できる ➔ キーワードを使って検索式を組み立てることができる 課題1 UP項目11-2, 11-3, 16-2, 16-3 ,21-2, 21-3 課題1 UP項目11-1, 16-1, 課題1 UP項目8,910, ,14,15,18,19,20

28 Web情報検索 課題1 【学習到達目標】 以下の内容を、体験を通して理解する。
付帯情報からサイトのC)蓋然的信頼性を推定できるようになること。 蓋然的信頼性(Probable reliability)を推定できる C 複数のWeb情報を目的に合うようにまとめることができるようになること。 AB AND, OR, NOT の論理式を使ったE)キーワード検索が可能になること。 E Advanced Searchの理解     Web情報の中でも一次情報が重要なことを認識できること。 D 複数の検索エンジンを利用できること。 E 検索エンジンによる偏りの排除 検索エンジンは常に公正ではないことに注意を払うことができるようになること C

29 1.検索エンジンSearch engine 1. Spiders クモ 2. Index 索引 3. Search 検索
データベースを含めた3種の機能を含んだシステムからなる Webページを対象とした情報検索システム データベースではなく、Search Engineと呼ばれる 一般的にはWeb情報を検索するデータベースと考えることができる 1. Spiders クモ リンクをたどって新しいページを探し出す機能 2. Index 索引 探し出したページを読み込み検索に必要なインデックス/索引を作成する機能 3. Search 検索 検索結果をウエート付けして表示し、Webページに誘導する機能

30 Spiders 新しいページを探し出す機能
2019/4/13 Spiders 新しいページを探し出す機能 a spider('s) web クモの巣 www: world wide web ロボット Web情報収集ソフトがWebサイトを巡回して情報を収集する 人の代わりに作業を行う機械的ロボットと同じ概念 機械的ロボットと区別するためコンピュータロボットはbotとも呼ばれる。 データベースの概念との違い 新しいページを探し出す機能(spiders)は,通常のデータベースに含まれない機能

31 Indexing 索引 インデックスを作成する機能
2019/4/13 Indexing 索引 インデックスを作成する機能 索引 ある書物の中の語句や事項などを、容易に探し出せるように抽出して一定の順序に配列し、その所在を示した表。大辞泉 インデックスはキーワード(テキスト)から作成される 検索は一般のデータベース同様にテキスト データはテキスト/画像/映像/音声など多様だが検索はテキスト 書誌事項が存在しない HTMLタグを利用 書誌事項とみなしインデックスを作成 <title> <body>などのタグ

32 GoogleのIndex 検索結果から推定(2010/4/23現在) 見出し 抄録 出典 著者 Webページの<TITLE>部分
2019/4/13 GoogleのIndex 検索結果から推定(2010/4/23現在) 見出し Webページの<TITLE>部分 <meta name=“Description” content= >部分を使用 抄録 <body>部分の検索キーワードが含まれる前後約130字(日本語, スペースを含む)が表示される 出典 WebページのURL 著者 相当するインデックスは無い

33 Search 検索 検索を実行しウエート付けを行い結果を表示する機能
2019/4/13 Search 検索 検索を実行しウエート付けを行い結果を表示する機能 検索結果にウエート付けを行う 利用価値の高いと思われる順にWebページを表示 Googleのアルゴリズムによるウエート付け P31 言語 検索エンジンは多言語に対応している 同じ検索エンジンで英語情報検索も可能 同じ検索式を使っても検索結果が異なる Spiders,index,searchの機能は、それぞれ検索エンジンで異なる 原文 リンクでアクセス可能,Retrieve は使用されない

34 使用する検索エンジン (課題では3システムを使用:詳細は次回)
日本語検索エンジン 英語検索エンジン 1 Google.co.jp (○論理式・○件数表示)   Google.co.jp Google Google.com(不完全) 2 Bing (×論理式・○件数表示) (×論理式・○件数表示) Bing.com in English 3 Yahoo.co.jp (Googleと同じため対象外) (○論理式・○件数表示) Yahoo  yahoo.com (○論理式・×件数表示) 4 Ask.com (×検索表示・×論理式)  ask.co.jp ASK (×検索表示・×論理式)  ask.com 検索1 必須 検索3 1件選択 検索2  1件選択

35 2.検索エンジンの公正さ 広告収入により商業ベースで運営 中立な情報ではない 検索エンジン利用の前提 複数の検索エンジンの使用
2019/4/13 2.検索エンジンの公正さ 広告収入により商業ベースで運営 利用者に費用負担は生じない 中立な情報ではない 利益を優先すると恣意的な検索結果となる可能性が存在する Web情報に偏りが出る可能性が存在する 検索エンジン利用の前提 公正な結果ではない可能性があることを意識して利用する必要がある 複数の検索エンジンの使用 個々の検索エンジンの偏りを正すためにも有効である。

36 Censorship(検閲) by Google
2019/4/13 Censorship(検閲) by Google Googleの基準により、情報が検索対象からはずされ、検索しても対象になっていないことをいう 検索結果が公正でないことを認識して利用する必要 情報が常に公平に扱われていない可能性を認識する 提供された環境を単に利用していることを認識する 利益を追求する企業活動で提供されているサービスであることを認識する

37 リダイレクト redirect リダイレクト: 2009/05/04 2010/04/24,2015/6/21,2014/6/10
リダイレクト:  ネットワーク上で接続先を自動的に変更すること プログラム処理でデータの入力元や出力先などを変更すること 向きを変えることにより、意識できない国内ユーザの囲い込み 2009/05/04 国内からgoogle.comの検索ができなかった 2010/04/24,2015/6/21,2014/6/10 ”Google.com を使用”/“Google.com in English” 欄の表示が不完全 2018/3/29 google.com →  Google.comの表示無くなる Google検索結果の

38 3.課題設定と、設定課題のUP 課題1の確認 検索課題の設定 設定課題のUP 課題1:Web情報検索のファイル確認(1回目の上の行)
日本本語でも英語でも検索可能で、地域や日本に限定されない世界共通の課題を設定する 設定課題のUP UP2設定課題 4月20日 ir02Bファイル参照

39 2回目の復習(2時間) 【事後】現在の個人の情報検索利用環境をWebページからUPする。 (2時間)
配布資料の再確認 情報検索のねらい 課題1の概要の理解 情報検索が必要になる理由 課題設定の内容をWebページにUP UP2設定課題 4月20日 スマホからでもOK

40 3回目の予習(2時間) 【事前】HPから教科書をダウンロードするかプリントアウトし概要を把握する。
3回目の資料をダウンロードし目をとおす. ir03Aをダウンロードし、内容を必ず確認すること   プリントはページ指定で Ir03Bは興味があればDL確認すること

41 03A 日本語検索エンジン (検索式と論理演算)
Googleの検索オプション Googleの論理演算と詳細検索 日本語検索エンジン

42 検索エンジン 10.検索エンジンという言葉を知っていますか?KW18 8.インターネットを使って情報を検索したことがありますか?KW14
検索エンジン   10.検索エンジンという言葉を知っていますか?KW18           2017 n=182 2018 N=203 知らない % 128 63% 知っている % 75 37% 8.インターネットを使って情報を検索したことがありますか?KW14 通常の検索に使用しているキーワードの数 1 words % 2 words 3words 4 words 5 words 平均 語 2.06語

43 利用するサイト 2017年 n=182 2016年 n=178 Google 127 123 Yahoo 42 41
情報を探すために最も良く利用するサイトを1つ選んでください。KW16   2017年 n= 年 n=178 Google  127 123 Yahoo 42 Twitter 11 Mixi Other  2

44 1. Googleの検索オプション (検索式の利用)
2019/4/13 1. Googleの検索オプション (検索式の利用) キーワードの数 概念を組み合わせる場合は、通常最低3キーワードが必要 検索内容とキーワード 検索内容を200~400 字程度の文章で表現しその文章から3~5語のキーワードを抽出するのが理想的 思いつきのキーワードで情報検索を実行すると、必要な情報がどの程度収集できたが不明 検索内容の文章を作成できない原因は基礎知識の不足の場合が多い

45 検索式と論理演算子 検索式 論理演算子 初期画面の入力欄に複数のキーワードをスペースで区切って入れるとAND検索となる
2019/4/13 検索式と論理演算子 検索式 論理演算子とキーワードの組み合わせ 論理演算子 AND かつ 「全てのキーワードを含む」 OR いずれか 「いずれかのキーワードを含む」 NOT 除く 「キーワードを含めない」 初期画面の入力欄に複数のキーワードをスペースで区切って入れるとAND検索となる

46 フレーズ検索 スペースも含めた単語の並びを検索できる 論理式とフレーズ検索 フレーズ検索使用の留意点
「プライバシー」には「個人や家庭内の私事・私生活。個人の秘密。また、それが他人から干渉・侵害を受けない権利。」(小学館「大辞泉」より)という意味があるほか、最近では、「自己の情報をコントロールできる権利」という意味も含めて用いられることがあります。 “自己の情報をコントロール” 家庭内 干渉 ←google 検索 フレーズ検索使用の留意点 特定の情報を探すのに効果的 情報が限定されすぎて情報の漏れが生じやすい フレーズをキーワードの1つとして利用すると良い 

47 検索式の作成 検索式の修正 日常の情報検索 キーワードや文章を思いつく順に追加し、意識せず絞込検索
2019/4/13 検索式の作成 日常の情報検索 キーワードや文章を思いつく順に追加し、意識せず絞込検索 単純な事実や簡単な意味を知りたい場合には、1~2KWの固有名詞で必要な情報を入手できる 検索式を使った情報検索が必要な場合 有料データベースで特定の情報をもれなく収集する場合 原文を入手するため情報源を特定する場合 検索式の修正 試行錯誤を繰り返し修正することが重要 検索式の使用 キーワードと演算子の組み合わせる Advanced searchで実行可能 演算子 and(絞込検索) かつ or (いずれか検索) いずれか not (含まない検索) 除く

48 検索結果の出力順位 サービス開始当時のウエート付け ①リンクが張られている数(バックリンクの数,link juice)
2019/4/13 検索結果の出力順位 サービス開始当時のウエート付け ①リンクが張られている数(バックリンクの数,link juice) ②リンクが張られているときの説明文(アンカーテキスト) ③Webページ内のキーワード ④ドメインの信頼性 現在 ④のウエートを高くし、④、②、③、①の順でWebページがウエート付けされている 当初重視された①バックリンクのウエートは低くなる ④ドメインの信頼性が最も重要視されるようになっている 最近 まとめサイトの見直し

49 検索オプション advanced_search
2019/4/13 Google検索を1度実行する。 表示される設定をクリックし、検索オプションを選択する。 検索オプション画面が表示される。

50 検索オプション画面 ブール演算子Boolean operatorsによるAND検索、フレーズ検索、OR検索、NOT検索が可能となる
環境汚染または環境破壊に関する情報の検索 環境  破壊 OR 汚染

51 2.Googleの論理演算と詳細検索例 約 673,000 件 論理演算 地球温暖化 and 二酸化炭素

52 論理演算. 地球温暖化 and (二酸化炭素 or CO2) Googleの論理演算
論理演算  地球温暖化 and (二酸化炭素 or CO2) Googleの論理演算 地球温暖化 二酸化炭素 OR CO2 Googleの詳細検索↓ ORの前後に半角スペース 約 767,000 件

53 論理演算      地球温暖化 and 温室効果ガス not 二酸化炭素 Googleの論理演算  地球温暖化 温室効果ガス -二酸化炭素 Googleの詳細検索 ↓
- の場合はスペースなし 約 416,000 件 (0.29 秒)

54 論理演算  地球温暖化 and 温室効果ガス not (二酸化炭素 or CO2) Googleの論理演算  地球温暖化 温室効果ガス -二酸化炭素 -CO2 Googleの詳細検索 ↓
- の場合はスペースなし 約 284,000 件 (0.27 秒)

55 Googleの論理演算と一般の論理演算 論理演算式 地球温暖化 and 二酸化炭素 地球温暖化 and (二酸化炭素 or CO2)
地球温暖化  二酸化炭素 地球温暖化 and (二酸化炭素 or CO2) 地球温暖化 二酸化炭素 OR CO2 地球温暖化 and 温室効果ガス not 二酸化炭素 (課題の前練習) 地球温暖化 温室効果ガス -二酸化炭素 地球温暖化 and 温室効果ガス not (二酸化炭素 or CO2) 地球温暖化 温室効果ガス -二酸化炭素 -CO2 地球温暖化 and (二酸化炭素 or CO2) not 温室効果ガス 地球温暖化 二酸化炭素 OR CO2 -温室効果ガス ORの場合は半角スペース - の場合はスペースなし

56 詳細検索のページから実行すると、通常検索同様に、結果表示の上部にgoogleの検索式が表示される。

57 3.日本語検索エンジン 必須 1件選択 1件選択 日本語検索エンジン 英語検索エンジン 1 検索1 Google.co.jp
(○論理式・○件数表示) 検索3 Google Google.com(不完全) 2 検索2  Bing (×論理式・○件数表示) Bing (×論理式・○件数表示) Bing.com in English 3 Yahoo.co.jp (Googleと同じため対象外) (○論理式・○件数表示) Yahoo  yahoo.com (○論理式・×件数表示) 4 Ask.com (×検索表示・×論理式)  ask.co.jp ASK (×検索表示・×論理式)  ask.com 必須 1件選択 1件選択

58 検索エンジンの利用 資料1 検索エンジンへの接続 資料2 注意 Google.comへの接続を含む
日本語検索エンジンにおける論理式の使用方法 注意 YahooとGoogleは同じ検索エンジン ASKとBingは論理式が使えない 日本で作られた検索エンジンは無くなった

59 3回目の復習(2時間) 【事後】情報検索課題を確定し日本語キーワード検索に着手する。 (2時間)
3回目の復習(2時間) 【事後】情報検索課題を確定し日本語キーワード検索に着手する。 (2時間)  Googleを使った論理式の理解 課題1の概要の理解 設定課題の日本語キーワード検索に着手 Googleともう一つの検索エンジン決定 キーワード決定のための予備検索 最適検索式はエンジン毎に異なる

60 4回目の予習(2時間) 【事前】資料をダウンロードするかプリントアウトし概要を把握する。
4回目の予習(2時間) 【事前】資料をダウンロードするかプリントアウトし概要を把握する。   4回目の資料をダウンロード ir04A(1), (2) 4回目の資料に目をとおす 英語検索エンジンの詳細検索の理解 課題の実行

61 1. 英語検索エンジン 2.フレーズ検索の利用 3.適切な英語KWの選択
ir4A(1)_英語検索エンジン 1. 英語検索エンジン 2.フレーズ検索の利用 3.適切な英語KWの選択

62 Web情報検索 目的・目標の設定 ⓪ 1/2回 kw11 表題 蓋然的信頼性 ① 4回(2) 目的のためのまとめ ② 資料参照
蓋然的信頼性 ① 4回(2) 目的のためのまとめ ② 資料参照 キーワードの概念 ③ 2/5回 名詞:UP結果OK 論理演算 ③ 3/5回 AND  OR  NOT 一次情報の重要性 ④ 1/2回 図書雑誌検索で説明 検索エンジン ⑤ 2/3回 Spiders Index Search

63 学修到達目標 課題1 ⓪ 目的・目標を設定できる 付帯情報からサイトの蓋然的信頼性を推定できるようになること。
学修到達目標 課題1 ⓪ 目的・目標を設定できる 付帯情報からサイトの蓋然的信頼性を推定できるようになること。 蓋然的信頼性(Probable reliability)を推定できる 複数のWeb情報を目的に合うようにまとめることができるようになること。 Advanced Searchの理解 AND, OR, NOT の論理式を使ったキーワード検索が可能になること。 Web情報の中でも一次情報が重要なことを認識できること。 複数の検索エンジンを利用し幅広い情報収集ができること。 検索エンジンによる偏りの排除 検索エンジンは常に公正ではないことに注意を払うことができるようになること

64 1. 英語検索エンジン 必須 1件選択 1件選択 日本語検索エンジン 英語検索エンジン 1 検索1 Google.co.jp
(○論理式・○件数表示) 検索3 Google Google.com(不完全) 2 検索2  Bing (×論理式・○件数表示) Bing (×論理式・○件数表示) Bing.com in English 3 Yahoo.co.jp (Googleと同じため対象外) (○論理式・○件数表示) Yahoo  yahoo.com (○論理式・×件数表示) 4 Ask.com (×検索表示・×論理式)  ask.co.jp ASK (×検索表示・×論理式)  ask.com 必須 1件選択 1件選択

65 4大検索エンジンから1つを使用 英語Web情報検索 Google Yahoo! Ask Bing (MSN Search)
検索結果は異なる

66 検索エンジンの利用 資料1 検索エンジンへの接続 Google.comへの接続を含む 資料2 検索エンジンにおける論理式の使用方法

67 Google(英語) ○論理式・○件数表示 google.comへの接続はリダイレクトの排除が必要 以下のいずれかの方法で実行するが難しい
  以下のいずれかの方法で実行するが難しい 国アメリカ, hl=en 言語英語, gws_rd=cr リダイレクト禁止 &pws=0 パーソナライズド検索を無効化 ncr:リダイレクト禁止 言語を英語にし日本語のページを検索対象から除く Gl=us 国アメリカ, hl=en 言語英語, gws_rd=cr リダイレクト禁止

68 Google以外(英語) Yahoo Bing ASK ○論理式・×件数表示 yahoo.com ←Advanced Search
×論理式・○件数表示  Bing.com in English から利用可能 スペースでAND検索にのみ対応 他の演算子には対応していない 個別情報の検索機能が充実 ASK ×検索表示・×論理式  ask.com    直接英語サイトに接続する

69 google.co.jp と yahoo.co.jp
Yahoo.com とYahoo.co.jpは別会社, 別システム Yahoo Japan! Yahoo.co.jp はGoogle.co.jpと別会社, 同システム Google 両者は同じシステムでも異なる結果を示す

70 日本の情報を探す時の注意点 日本の英語教育の改善に関する英語情報検索 日本の英語教育の改善に関する日本語情報検索 日本は無いほうが良い
English AND education AND Japan and Improvement Japanが必須 日本の英語教育の改善に関する日本語情報検索 日本は無いほうが良い ○英語教育and 改善   ×英語教育 and 日本 and 改善 

71 2.フレーズ検索の利用 フレーズ検索 論理式とフレーズ検索 フレーズ検索使用の留意点 単語の間のスペースも含めた単語の並びを検索できる
英語は単語の間にスペースが存在 論理式とフレーズ検索 Middle East Respiratory Syndrome (MERS) is a viral respiratory illness that is new to humans. Viral illness “new to human” <----google 検索 フレーズ検索使用の留意点 特定の情報を探すのに効果的 情報が限定されすぎて情報の漏れが生じやすい フレーズをキーワードの1つとして利用すると良い 

72 3.適切な英語KWの選択 生活習慣病 1KW たばこ and 受動喫煙and 害and対策 4KW
Lifestyle related disease 3KW  フレーズ検索の利用 “Lifestyle related disease” たばこ and 受動喫煙and 害and対策 4KW Cigarette and passive and harm and measure 英語/日本語の対応とれている 式が書けていないレポートが多い

73 4回目の復習(2時間) 【事後】キーワードの概念を理解し、課題提出項目を確認する。 (2時間)
4回目の復習(2時間) 【事後】キーワードの概念を理解し、課題提出項目を確認する。 (2時間)  Web情報特質の理解 英語検索エンジンによる検索に着手する

74 5回目の予習 【事前】資料をダウンロードするかプリントアウトし概要を把握する。 (2時間)
5回目の予習 【事前】資料をダウンロードするかプリントアウトし概要を把握する。 (2時間)  5回目の資料をダウンロード ir05(1)A, ir05(2) 5回目の資料に目をとおす

75 Web情報の特質 2. サイトの信頼性を推定できる付帯情報
4A(2) Web情報の信頼性 Web情報の特質 2. サイトの信頼性を推定できる付帯情報

76 1.Web情報の特徴 (1) ハイパーリンクによる原文へのアクセス (2) 一次情報と二次情報の混在 (3)匿名の情報発信
2019/4/13 1.Web情報の特徴  (1) ハイパーリンクによる原文へのアクセス (2) 一次情報と二次情報の混在 (3)匿名の情報発信 (4) 書誌事項の欠如 (5) 断片的な内容 (6) 審査を受けない情報発信 (7)「現時点」の情報 (8) 分類のない(全分野の)情報

77 (1) ハイパーリンクによる 原文情報へのアクセス
2019/4/13 (1) ハイパーリンクによる 原文情報へのアクセス YahooやGoogleなどの検索エンジン 検索エンジンと原文Webページが同じネット上に存在する ハイパーリンクにより検索結果から原文を確認できる 検索エンジンが扱った原文Web情報を確認できる 検索エンジンの利便性は非常に高い 多くの有料データベース 原文が印刷物のため、情報検索の結果をもとに、再度図書館などで原文を探し出す必要 原文へのアクセスに多くの労力を必要とする

78 (2) 一次情報と二次情報の混在 Web情報は匿名で情報発信が容易 Web情報の活用にあたっては慎重な扱いが求められる
2019/4/13 (2) 一次情報と二次情報の混在 Web情報は匿名で情報発信が容易 Web情報は著者が作成した一次情報と、伝聞情報である二次情報が混在する 原文であるWebページを閲覧できても、著者が自ら創作した一次情報とは限らない Web情報の活用にあたっては慎重な扱いが求められる 伝聞情報や不正確な情報の割合が高い 有料のデータベースの原文は全て雑誌記事などの一次情報である。

79 (3)匿名の情報発信 Web情報では著者名が記述されない場合が多い 情報の内容に責任をもつ人を特定できない情報が多くなる
2019/4/13 (3)匿名の情報発信 Web情報では著者名が記述されない場合が多い 情報の内容に責任をもつ人を特定できない情報が多くなる 著者に関する記載があっても現実社会における実態と一致しない場合も多い 匿名情報がWeb情報の信頼性低下につながる 情報は人により創造される 著者が明示されることは情報の内容についての責任の所在が明らかにされることになる Web情報の活用にあたって著者や所属に関する情報が記載されているか確認する必要がある 有料データベース 書誌事項の一部として著者や所属は必ず明示されている

80 (4) 書誌事項の欠如 検索エンジン 一般のデータベース データベースの書誌事項がない
2019/4/13 (4) 書誌事項の欠如 検索エンジン データベースの書誌事項がない 表題 著者 出版者 出版年 分類 著者・出版年が確認できない情報が多いことを認識したうえでWeb情報を活用する 一般のデータベース 検索データとして書誌事項が整備されているのは必須の要件である。

81 (5) 断片的な内容 Web情報 印刷物 印刷情報に比べるとWeb情報の内容は断片的 サイト毎ではなく1ページ単位で構成されている。
2019/4/13 (5) 断片的な内容 Web情報 サイト毎ではなく1ページ単位で構成されている。 1ページに1000文字を超える文章が記述されるようなページは少ない。 印刷物 雑誌記事情報 1つの話題について2000字から20000字程度の文章からなる 図書情報 数万字からなる 印刷情報に比べるとWeb情報の内容は断片的 まとまりのある知識や情報をWebページから得ることは困難 簡単な情報やデータを得るには問題ない

82 (6) 審査を受けない情報発信 Web情報 著者自身の判断に従って発信される情報が多い(ブログ)
2019/4/13 (6) 審査を受けない情報発信 Web情報  著者自身の判断に従って発信される情報が多い(ブログ) 他人によるチェックが無いため、信頼性の低い情報が混在 二次情報も混在する可能性が高い Web情報の信頼性を判断する材料 ページ作成者、サイト管理者などが特定できること 比較的信頼性の高いドメイン go.jp, ac.jp, co.jpドメイン、gov, eduドメイン 有料のデータベース 出版社や査読者による事前審査をうけて発信される情報

83 (7) 「現時点」の情報 (8) 全分野の情報 Web情報の出版年月日 基本的に現時点における最新情報
2019/4/13 (7) 「現時点」の情報  Web情報の出版年月日 基本的に現時点における最新情報 「現時点」の情報が主体となっているので遡及検索に対応できない Search toolsで対応できるが1ページに1時点 (8) 全分野の情報 Webのページの情報は全ての分野の情報 検索エンジンの検索結果にはあらゆる分野の情報が表示される 有料のデータベースではデータベース毎に扱う情報の分野は限定されている

84 2. サイトの信頼性を推定できる付帯情報 ドメインの信頼性 著者/機関名の表示 ファイルの作成年月日
edu, gov, ac.jp, go.jp, co.jp > .com, .net 著者/機関名の表示 情報発信者が明示されている > 匿名 書誌事項の中で特に重要 ファイルの作成年月日 情報発信年月日の確認>古い プロパティで確認

85 4.一次情報 5.情報源 6.情報発信の背景 一次情報であること > 2次情報 情報発信者が独自に作成しているか?
一次情報であること  >  2次情報 情報発信者が独自に作成しているか? 5.情報源 複数の検索エンジンや複数のサイトの一次情報から同じ内容を確認できる >1情報源 6.情報発信の背景 情報の内容と、情報が作成された背景や、情報発信者の意図を推定できる > 内容が理解できる

86 書誌事項 書誌事項に相当する項目(付帯情報)の確認 確認できれば信頼性は一般に高い 著者 所属 表題 発信年月日
雑誌名・巻・号・ページなどに相当する項目 出版社相当項目 住所・電話番号など実体を示す項目

87 TLDの種類 https://www.nic.ad.jp/ja/dom/types.html 信頼性 注意
go.jp, ac.jp, co.jp gov, edu 注意 com, net, org

88 サイトの信頼度の自己評価 ABCで自己評価 情報に向き合う態度 書誌事項やドメインを考慮する
2019/4/13 サイトの信頼度の自己評価 ABCで自己評価 書誌事項やドメインを考慮する 情報に向き合う態度 信頼度を考えることにより、情報に向き合う基本的な態度が作られる。 常に自分で考えることが重要。

89 課題のまとめにも信頼度を記述 信頼度の例 11,16,21: サイトのURLと信頼度を忘れないように記入する サイト毎に記入
1.非常に信頼できる、 2.信頼できる、 3.ほぼ信頼できる 4. 信頼できると思われる  5.信頼できない

90 判断した理由の例 サイトのドメインが ac.jpであった。 著者名が明記されていた。 引用が明記されていた。
1次情報である(と推定できた)。 自分で考えた理由

91 2019/4/13 5A(1) キーワードの理解 1.キーワードの切り出し 2.キーワードと品詞

92 Q 検索課題を変更してよいか? Q 再履修者でUPできない 変更可能ですが、設定課題を再提出してください。
Q 検索課題を変更してよいか? 変更可能ですが、設定課題を再提出してください。 再提出の場合は、学生籍番号の最後に02を付けてUPしてください。 例:  Q 再履修者でUPできない 学生籍番号の最後に02を付けてUPしてください。

93 1.キーワードの切り出し 検索に有効なキーワードは名詞 例題 以下の新聞記事をキーワードに分解しなさい 66文字
  以下の新聞記事をキーワードに分解しなさい 66文字 東京電力福島第一原発の原子炉から溶け落ちた核燃料を取り出す工法について、原子力損害賠償・廃炉等支援機構は9日、3通りの案を公表した。   

94 キーワード 切り出し後 キーワードに分解しなさい 連続する漢字は自動的に分解しない。
キーワード 切り出し後 キーワードに分解しなさい 東京電力/福島第一原発/の/原子炉/から/溶け落ちた/核燃料/を/取り出す/工法/について、/原子力損害賠償/・/廃炉等支援機構/は/9日/、/3通り/の/案/を/公表/した。 連続する漢字は自動的に分解しない。  漢字連続なので分解不可  かなと漢字なので分解対象 × 天皇陛下出発前    ○ おことば全文 ○ 天皇陛下 出発前   ○ おことば 全文

95 練習問題 新聞記事から100文字程度の文章を抜き出し、区切りに / を使用してキーワードに分解しなさい。
(例)東京電力/福島第一原発/の/原子炉/から/溶け落ちた/核燃料/を/取り出す/工法 新聞記事100文字中にあるキーワードの数を数えなさい(重複除く) 検索課題とキーワード提出画面(提出不要)

96 2.キーワードと品詞 キーワード 概念は名詞で表現される 情報検索は複数の概念を組み合わせるため名詞が重要
2019/4/13 2.キーワードと品詞 キーワード 検索者が入手したい情報の持つ概念(アバウトネス)を表現する 概念は名詞で表現される 名詞 事物の名称を表す語 動詞  事物の動作・作用・状態・存在を表す語        ( サ変接続名詞) 形容詞 物事の性質や状態を表す語 情報検索は複数の概念を組み合わせるため名詞が重要 情報の内容は複数の概念を含む 複数のキーワードでデータベースを検索する

97 名詞の種類 数字 見出し 固有名詞 形容詞 「4月18 日」も 「4月」「18 日」もキーワードとして有効
2019/4/13 名詞の種類 数字 「4月18 日」も 「4月」「18 日」もキーワードとして有効 見出し 見出し、副見出し、表題、 図表の説明文なども対象 固有名詞 キーワードとして最も有効 人名>団体名、会社名>地名>普通名詞の順に有効 人名がキーワードとして最も有効 情報は人によって創造され発信される 形容詞 名詞の概念を限定するキーワードとして使用できる

98 動詞 英文 「管理する」「説明する」などのように、「(名詞)と(する)」で構成される動詞では名詞部分がキーワードとして有効
2019/4/13 動詞 概念を表現しないためは基本的に使用しない 「管理する」「説明する」などのように、「(名詞)と(する)」で構成される動詞では名詞部分がキーワードとして有効 例: 管理する → 管理 歓迎する → 歓迎 開通する → 開通 英文 全ての単語がスペースで区切られている 全ての単語をキーワードとして扱うことが可能 全ての言葉がキーワードとして使用可能 英語でも名詞がキーワードの基本 情報の概念は名詞で表現される

99 5回目の復習(2時間) 【事後】キーワードの概念を理解し、課題提出項目を確認する。 (2時間)
5回目の復習(2時間) 【事後】キーワードの概念を理解し、課題提出項目を確認する。 (2時間)  キーワードの概念の理解 キーワードの切り出しの復習 英語検索エンジンによる検索を実施する。 課題1を提出する。

100 6回目の予習 【事前】資料をダウンロードするかプリントアウトし概要を把握する。 (2時間)
6回目の予習 【事前】資料をダウンロードするかプリントアウトし概要を把握する。 (2時間)  6回目の資料をダウンロード ir06A 6回目の資料に目をとおす

101 ir05(2)_理解度テスト 論理演算

102 OR いずれか 米国 日本  NOT 除く 日本

103 忘れないよう 記憶してください      ➡

104 問5 日本 and アメリカ 1 2 3 4 5 6 7 8 9 10 問6 日本 and アメリカ

105 検索式 論理式をベースに考える キーワードの前後にはand or not が必要
Googleの検索式は応用例 キーワードの前後にはand or not が必要 否定Not >論理積And > 論理和 Or > 排他的論理和Xor かっこの内側の演算は外側の演算よりも常に先に実行される 新潟 OR 山形 AND 地震 ( )が必要 新潟 AND 地震 NOT 火山   問題なし

106 論理式の利用に自信が無い場合 詳細検索を利用してください


Download ppt "Web情報検索(1A-5A; 教科書Vol.1) 2019/4/7"

Similar presentations


Ads by Google