北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学 けんさくのおはなし 北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学
もくじ そのいち 世界は検索で満ちている、という おはなし そのに 検索エンジンはどうやって検索して いるのだろう、というおはなし そのいち 世界は検索で満ちている、という おはなし そのに 検索エンジンはどうやって検索して いるのだろう、というおはなし そのさん コンピュータ将棋とボナンザのお はなし(都合により割愛) 検索……書物・カードなどから、必要な事柄を 探し出すこと。「索引があるので―するのに 便利だ」(goo辞書より)
世界は検索で満ちている 皆さんはきっと、昨日も今日も明日も、来年 の今頃も検索をしているはず フォルダ内検索を使って検索 図書館へ行って蔵書検索 アマゾンで欲しい商品があるので検索 Wikipedia で調べたいことがあるので検索 Youtube で見たい動画を検索 レポートが終わらないので、どこか丸ごとコ ピペできるウェブサイトはないかと検索(非 推奨)
直接検索と間接検索 直接検索 - データそのものを直接計算アルゴリズ ムで処理する 間接検索 - データそのものを直接計算アルゴリズ ムで処理する 間接検索 - 収集したデータからメタデータを抽出 して、入力された内容とメタデータを比較す る
検索エンジンのしくみ ウェブページを大量に収集したデータベース 内を検索 検索語を入力するたびに検索エンジンがウェ ブページを飛び回るわけではない おおまかに、ディレクトリ型とロボット型が ある
ディレクトリ型とロボット型 ディレクトリ型 - 基本的にはウェブページの運営者が自 ら検索エンジンに登録申請をする ロボット型 - 基本的にはウェブページの運営者が自 ら検索エンジンに登録申請をする ロボット型 - ロボットがリンクからリンクへとウェ ブページをたどって、かたっぱしから情報を 集めていく Google はロボット型、Yahoo! はロボット型と ディレクトリ型を併用
検索エンジンで検索する 例えば何かごくありふれた単語を検索窓に打 ち込んで、えいっとEnterボタンを押す その結果、もし10,000,000件という検索結果 が出てきたら、まず間違いなく、全部は見な い 普通は1件目から順に見ていき、適当なとこ ろで見るのをやめる ということは、最初に表示されるウェブサイ トが、たくさん見てもらえる ん? じゃあ、検索エンジンってどういう風 にして表示する順番を決めているのだろう? 気になる
続・検索エンジンで検索する 検索エンジンにとって、検索結果の表示順は 一番肝心なところ 一番肝心なので、アルゴリズムは非公開 Google は一部に限り公開
PageRank ウェブページの重要度をはかるアルゴリズム で、Google が取り入れている たくさんリンクされているページは、重要 たくさんリンクされているページからリンク されているページは、重要 あまりに乱発されているリンクには、価値が ない ページランクを調べられるウェブサイトがあ る
まとめ 検索エンジンの検索結果は例えば企業におい ては業績に大きく関わってくる すぐれたアルゴリズムを構築することが大切
参考文献 Wikipedia RAK2ホームページ作成 Google PageRank Checker http://ja.wikipedia.org/ RAK2ホームページ作成 http://www.430.jp/rak/howtohp/search.html Google PageRank Checker http://pagerank.bookstudio.com/