Presentation is loading. Please wait.

Presentation is loading. Please wait.

北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学

Similar presentations


Presentation on theme: "北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学"— Presentation transcript:

1 北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学
けんさくのおはなし 北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学

2 もくじ そのいち 世界は検索で満ちている、という おはなし そのに 検索エンジンはどうやって検索して いるのだろう、というおはなし
そのいち 世界は検索で満ちている、という おはなし そのに 検索エンジンはどうやって検索して いるのだろう、というおはなし そのさん コンピュータ将棋とボナンザのお はなし(都合により割愛) 検索……書物・カードなどから、必要な事柄を 探し出すこと。「索引があるので―するのに 便利だ」(goo辞書より)

3 世界は検索で満ちている 皆さんはきっと、昨日も今日も明日も、来年 の今頃も検索をしているはず フォルダ内検索を使って検索
図書館へ行って蔵書検索 アマゾンで欲しい商品があるので検索 Wikipedia で調べたいことがあるので検索 Youtube で見たい動画を検索 レポートが終わらないので、どこか丸ごとコ ピペできるウェブサイトはないかと検索(非 推奨)

4 直接検索と間接検索 直接検索 - データそのものを直接計算アルゴリズ ムで処理する 間接検索
  - データそのものを直接計算アルゴリズ ムで処理する 間接検索   - 収集したデータからメタデータを抽出 して、入力された内容とメタデータを比較す る

5 検索エンジンのしくみ ウェブページを大量に収集したデータベース 内を検索
検索語を入力するたびに検索エンジンがウェ ブページを飛び回るわけではない おおまかに、ディレクトリ型とロボット型が ある

6 ディレクトリ型とロボット型 ディレクトリ型 - 基本的にはウェブページの運営者が自 ら検索エンジンに登録申請をする ロボット型
  - 基本的にはウェブページの運営者が自 ら検索エンジンに登録申請をする ロボット型   - ロボットがリンクからリンクへとウェ ブページをたどって、かたっぱしから情報を 集めていく Google はロボット型、Yahoo! はロボット型と ディレクトリ型を併用

7 検索エンジンで検索する 例えば何かごくありふれた単語を検索窓に打 ち込んで、えいっとEnterボタンを押す
その結果、もし10,000,000件という検索結果 が出てきたら、まず間違いなく、全部は見な い 普通は1件目から順に見ていき、適当なとこ ろで見るのをやめる ということは、最初に表示されるウェブサイ トが、たくさん見てもらえる ん? じゃあ、検索エンジンってどういう風 にして表示する順番を決めているのだろう?  気になる

8 続・検索エンジンで検索する 検索エンジンにとって、検索結果の表示順は 一番肝心なところ 一番肝心なので、アルゴリズムは非公開
Google は一部に限り公開

9 PageRank ウェブページの重要度をはかるアルゴリズム で、Google が取り入れている たくさんリンクされているページは、重要
たくさんリンクされているページからリンク されているページは、重要 あまりに乱発されているリンクには、価値が ない ページランクを調べられるウェブサイトがあ る

10 まとめ 検索エンジンの検索結果は例えば企業におい ては業績に大きく関わってくる すぐれたアルゴリズムを構築することが大切

11 参考文献 Wikipedia RAK2ホームページ作成 Google PageRank Checker
RAK2ホームページ作成 Google PageRank Checker


Download ppt "北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学"

Similar presentations


Ads by Google