WWW全文検索エンジン Vernoにおける 要素構造データベースの設計と実装

Slides:



Advertisements
Similar presentations
Web 共同編集機能を実装した メール検索システム 井上研究室 Choy Kho Yee 2006年02月27日.
Advertisements

情報の交換・共有・蓄積を目的とした GIS リモートコミュニケーションシステム の実装 Sho Otake Graduate Department of Computer and Information Systems The University of Aizu 1 Hirohide Demura,
XML ゼミ 独習 XML ~ 第 6 章 XHTML~ 6.1 XHTML の概要 6.2 XHTML の構造 谷津 哲平.
詳細検索の方法- EBSCOhost Guided Style 検索フィールド
The Perl Conference Japan ’98 朝日奈アンテナによる コンテンツ情報の取得と利用
情報理工学部 情報システム工学科 3年 H 井奈波 和也
画像展示サイト“Fragments” 『閲覧しやすさ』と『デザイン性』を両立させた Webデザイン
JavaScript プログラミング入門 2006/11/10 神津.
[グループ名]向けウェブナー [所属機関名] [日付] [発表者の氏名] [発表者の敬称/肩書]
SMART/InSightのセキュリティ機能と設計
【2.12】文字装飾機能内部設計書
第12回(1月13日) 文書処理 久野禎子.
CEC公開授業 Webサイト制作にチャレンジ! 2007年11月20日 於:東京都立板橋有徳高校 学校インターネット教育推進協会.
ウェブページ制作の基礎 タグの直接入力によるウェブページの制作 次のスライドへ進んだり,戻ったりしたい時は,右下のボタンをクリック。 次へ.
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
SlothLib.Web.
IDLTM/IONTMを使用した UDON (Universe via Darts ON-line) プロトタイプの作成
REST型Webサービスによる 楽曲検索システムの開発
HTMLの記述と WWWにおける情報公開 遠藤
売れるためのWEBサイト構築.
CSSを利用したWebデザイン 理工学部 情報学科 3回生 喜多 亮輔.
ホームページの作り方.
WWW全文検索エンジンVernoにおける 要素構造データベースの設計と実装
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
XMLゼミ 2.3 XMLのプロローグ 2.4 XMLのタグ 高橋 辰裕.
検索エンジンに関して The Anatomy of a Large-Scale Hypertextual Web Search Engine
第4回 個人の動画配信補足のためのWeb構築
第1回 JavaScriptゼミ ・ scriptエレメント ・ 記述における諸注意 ・ 古いブラウザへの対応方法
チュートリアル EBSCOhost での記事の閲覧 support.ebsco.com.
見た目を定義する技術 CSS(スタイルシート).
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
Webコミュニケーショングループ ~CGI勉強会~ (データーベース編)
近畿大学理工学部情報学科3年 自然言語処理研究室 小野 実
メディア計算機工学特論 2003 年度 Webにおける情報・知識の探索と検索の事例を とおして、現代的知識ベースとその利用法を理解する。
CiNii Articlesトップページ クイックガイド <キーワードによる検索方法>
Javaプログラムの実行まで バイト Javaの コード 実行 ソースコード Java ファイル名 ファイル名 abc.java
情報伝達・WWW・ソーシャルメディア CMSとHTMLの基礎
データベース設計 第9回 Webインタフェースの作成(1)
日本語解析済みコーパス管理ツール 「茶器」
HTTPとHTML 技術領域専攻 3回 中川 晃.
ホームページ 作成ガイド 経営学部経営学科2年 松本 隼人.
9.1 DOMの概要 9.2 DOMプログラミングの基礎 9.3 DOMのプログラミング例
第4回 javaのプログラミング 04A2029           古賀慎也.
インラインスクリプトに対するデータフロー 解析を用いた XHTML 文書の構文検証
情報スキル活用  第5週 基礎技術-5  その2 : 他のページへのリンク.
ネットショップデザイン入門Ⅰ・ⅡSEO 2013/12/18 Webデザイン入門 SEOの基本.
第3章 第2節 ネットワークを活用した 情報の収集・発信(2) 4 文書の構造と表現
制作技術ー3 双方向通信 : CGIシステムと環境変数
情報スキル活用 第8週 制作技術-2 画面の分割.
情報スキル活用  第6週    基礎技術のまとめ  復習.
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
情報スキル活用 第3週 基礎技術ー3 : 学部・学科紹介のページ作成.
ミドルウェア”TSUNAGI”を 用いたWEBアプリケーションの構築
DynaMed 新しい検索インターフェースについて support.ebsco.com.
情報スキル活用 第2週 基礎技術ー2 : Webページの基本形.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
情報スキル活用 第4週 基礎技術-4 : その1(タグのまとめ).
Htmlの基本.
コンピュータ プレゼンテーション.
ウェッブページ書法の復習 ネットワーク論以前のお話.
情報共有による Z39.50データベース選択支援環境
JavaScriptを含んだHTML文書に対する データフロー解析を用いた構文検証手法の提案
基礎技術ー3 : Webページの標準規格について
独習XML ~第1章 XMLの基礎~ 1.1 XML文書の基礎 1.2 XMLとHTML
第14回放送授業.
JSPの基本 J2EE I (データベース論) 第8回 /
人文、社会、自然、医療、理工等、総合分野を網羅した学術機関向けの 全文データベース (2014年4月1日より開始)
PHP と SQL (MySQL) の連携 日本語のデータを扱う
MVCモデル2による Webアプリケーション
Presentation transcript:

WWW全文検索エンジン Vernoにおける 要素構造データベースの設計と実装 2001年度 卒業論文 WWW全文検索エンジン Vernoにおける 要素構造データベースの設計と実装 g97p0213 大塚聡

Verno HTMLのタグ以外の部分を対象にした全文検索エンジン Scheme を用いて利用者が検索命令をプログラミングできる (ex. 「<title>タグは文書のタイトル」)

要素構造データベース HTMLの要素(タグに囲まれた部分) の意味や構造を検索に利用するためのデータベース <title>Ueda lab home page</title> Scheme (search “title” “Ueda”) HTML <head> <title>Ueda lab home page</title> </head> Scheme (search “head” (search “title” “Ueda”))

HTMLの解析 範囲テーブル 包含テーブル 要素名 ID: (範囲) html 1: (0, 292) head 2: (0, 15) ID=2: <head> ID=3: <title>Ueda lab home page</title> ID=4: <meta …> ID=5: <meta …> </head> … </html> 範囲テーブル 包含テーブル 要素名 ID: (範囲) html 1: (0, 292) head 2: (0, 15) title 3: (0, 15) meta 4: (15, 15) 5: (15, 15) 関係 (親のID, 子のID) html⊃head (1, 2) html⊃title (1, 3) head⊃title (2, 3) html⊃meta (1, 4) (1, 5) head⊃meta (2, 4) (2, 5)

構造の検索(1) html 1: (0, 292) head 2: (0, 15) title 3: (0, 15) meta <title>Ueda lab home page</title> </head> </html> html 1: (0, 292) head 2: (0, 15) title 3: (0, 15) meta 4: (15, 15) 5: (15, 15) html⊃head (1, 2) html⊃title (1, 3) head⊃title (2, 3) html⊃meta (1, 4) (1, 5) head⊃meta (2, 4) (2, 5)

構造の検索(2) html 1: (0, 292) head 2: (0, 15) title 3: (0, 15) meta <title>Ueda lab home page</title> <meta …> </head> html 1: (0, 292) head 2: (0, 15) title 3: (0, 15) meta 4: (15, 15) 5: (15, 15) html⊃head (1, 2) html⊃title (1, 3) head⊃title (2, 3) html⊃meta (1, 4) (1, 5) head⊃meta (2, 4) (2, 5)

検索の例 (define result (sdb:search “html” (sdb:search “h1”) (sdb:search “title” “Ueda”))) (define (print-proc u) (display (sdb:inner-text u)) (display (sdb:url-str u)) (newline)) (sdb:iterate result print-proc 2) www.ueda.info.waseda.ac.jp/about_j.html 上田研究室概要 ---------- www.ueda.info.waseda.ac.jp/location.html 情報学科へ来られる方へ

まとめ HTMLの要素の情報を用いて、文字列検索だけでなくHTML文書中での意味も加えた検索ができるようにした。