WWW全文検索エンジンVernoにおける 要素構造データベースの設計と実装

Slides:



Advertisements
Similar presentations
情報の交換・共有・蓄積を目的とした GIS リモートコミュニケーションシステム の実装 Sho Otake Graduate Department of Computer and Information Systems The University of Aizu 1 Hirohide Demura,
Advertisements

RailsによるAjaxの利用 回生 小野 実.
詳細検索の方法- EBSCOhost Guided Style 検索フィールド
The Perl Conference Japan ’98 朝日奈アンテナによる コンテンツ情報の取得と利用
情報理工学部 情報システム工学科 3年 H 井奈波 和也
画像展示サイト“Fragments” 『閲覧しやすさ』と『デザイン性』を両立させた Webデザイン
JavaScript 演習1.
SMART/InSightのセキュリティ機能と設計
JavaScriptゼミ第2回 2-2 変数とリテラル 発表者 直江宗紀.
第12回(1月13日) 文書処理 久野禎子.
ウェブページ制作の基礎 タグの直接入力によるウェブページの制作 次のスライドへ進んだり,戻ったりしたい時は,右下のボタンをクリック。 次へ.
情報学類 吉田光男 アドバイザー教官: 山本幹雄 先生
SlothLib.Web.
HTMLの記述と WWWにおける情報公開 遠藤
売れるためのWEBサイト構築.
CSSを利用したWebデザイン 理工学部 情報学科 3回生 喜多 亮輔.
ホームページの作り方.
WWW全文検索エンジン Vernoにおける 要素構造データベースの設計と実装
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
XMLゼミ 2.3 XMLのプロローグ 2.4 XMLのタグ 高橋 辰裕.
15分でわかる RefWorks 基本操作.
検索エンジンに関して The Anatomy of a Large-Scale Hypertextual Web Search Engine
Multi Search System wwwアプリケーション最終課題 Fri. <7班>
オペレーティングシステムⅡ 第3回 講師 松本 章代 VirtuaWin・・・仮想デスクトップソフト 2009/10/16.
チュートリアル EBSCOhost での記事の閲覧 support.ebsco.com.
見た目を定義する技術 CSS(スタイルシート).
卒業論文 最終発表 WWW情報検索 ナビゲーションシステムの設計と実装
平成19年5月19日 第3版 東京大学理学部生物化学図書室 前田 朗
Full Text Finder Publication Finder の概要
Webコミュニケーショングループ ~CGI勉強会~ (データーベース編)
チュートリアル EBSCOhostの概要
メディア計算機工学特論 2003 年度 Webにおける情報・知識の探索と検索の事例を とおして、現代的知識ベースとその利用法を理解する。
XML データベース XRel の実装とその評価
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
Javaプログラムの実行まで バイト Javaの コード 実行 ソースコード Java ファイル名 ファイル名 abc.java
データベース設計 第9回 Webインタフェースの作成(1)
日本語解析済みコーパス管理ツール 「茶器」
プログラム実行履歴を用いたトランザクションファンクション抽出手法
HTTPとHTML 技術領域専攻 3回 中川 晃.
ホームページ 作成ガイド 経営学部経営学科2年 松本 隼人.
CINAHL データベース チュートリアル 基本検索 featuring:
EBSCOhost オンラインデータベースのご紹介.
第8回 2007年6月15日 応用Java (Java/XML).
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
第4回 javaのプログラミング 04A2029           古賀慎也.
インラインスクリプトに対するデータフロー 解析を用いた XHTML 文書の構文検証
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
ネットショップデザイン入門Ⅰ・ⅡSEO 2013/12/18 Webデザイン入門 SEOの基本.
Microsoft PowerPoint98 Netscape Communicator 4.06[ja]
12. 意味・意図の解析 12.1 意味表現とは 12.2 規則による意味解析処理 12.3 統計的な意味解析処理 12.4 スマートフォンでの音声サービス ニューラルネットワークによる意味解析.
ミドルウェア”TSUNAGI”を 用いたWEBアプリケーションの構築
XMLゼミ 1.3 XML文書の表示 1.4 XMLの役割 1.5 XMLとプログラミング M2 正木 裕一.
独習XML ~第3章 文書と構造~ 3.3 スキーマ 3.3 XML Schema
エピソード記憶に訴えるBookmarkless Bookmarkの実現
情報スキル活用 第4週 基礎技術-4 : その1(タグのまとめ).
コンピュータ プレゼンテーション.
ウェッブページ書法の復習 ネットワーク論以前のお話.
応用Java(Java/XML) 第7回 2006年6月16日 植田龍男.
XMLゼミ 3.5 DTD M2 正木 裕一.
情報共有による Z39.50データベース選択支援環境
コーディングパターンの あいまい検索の提案と実装
基礎技術ー3 : Webページの標準規格について
構造的類似性を持つ半構造化文書における頻度分析
独習XML ~第1章 XMLの基礎~ 1.1 XML文書の基礎 1.2 XMLとHTML
Webページに動きを持たせるJavascript言語について 例題のプログラムを通して体験的に理解することとします。
第14回放送授業.
人文、社会、自然、医療、理工等、総合分野を網羅した学術機関向けの 全文データベース (2014年4月1日より開始)
NDL Search Screen Okuinshi/Sakai 09/15/04.
PHP と SQL (MySQL) の連携 日本語のデータを扱う
MVCモデル2による Webアプリケーション
Presentation transcript:

WWW全文検索エンジンVernoにおける 要素構造データベースの設計と実装 2001年度 卒業論文 WWW全文検索エンジンVernoにおける 要素構造データベースの設計と実装 g97p0213 大塚聡

Verno 全文検索エンジン Scheme を用いて利用者が検索命令をプログラミングできる HTMLの要素データの利用が難しい

要素構造データベース 要素とはHTMLの要素(element) HTMLの特定の要素の中に限定した検索(「<title></title>から検索」) HTMLの要素間の構造を利用した検索(「<head></head>の中の<title></title>から検索」)

特定の要素内からの検索 h1 x1 = ( 8, 12 ) h2 x2 = (12,24) x3 = (250,265) <h1> </h1> : 要素ID = x1, 範囲 = ( 8, 12 ) <h2> </h2> : 要素ID = x2, 範囲 = ( 12, 24 ) <h2> </h2> : 要素ID = x3, 範囲 = ( 250, 265 ) h1 x1 = ( 8, 12 ) h2 x2 = (12,24) x3 = (250,265)

特定の要素内からの検索 + h1 x1 = ( 8, 12 ) h2 x2 = (12,24) x3 = (250,265) (search “h2” “Ueda”) 文字列 Ueda のこの文書内での出現 : ( 12,16 ) と (120, 124) + h1 x1 = ( 8, 12 ) h2 x2 = (12,24) x3 = (250,265)

要素の構造の解析 (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) html⊃head <html> : 要素ID = 1 <head> : 要素ID = 2 <title> </title> : 要素ID = 3 <meta …> : 要素ID = 4 <meta …> : 要素ID = 5 </head> </html> html⊃head html⊃title html⊃meta head⊃title head⊃meta (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5)

要素の構造の検索(1) (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) (search “html” (search “head” (search “title”))) html⊃head html⊃title html⊃meta head⊃title head⊃meta (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5)

要素の構造の検索(1) (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) (search “html” (search “head” (search “title”))) html⊃head html⊃title html⊃meta head⊃title head⊃meta (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) 要素ID 1, 2, 3 の組が、この構造に該当

要素の構造の検索(2) (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) (search “head” (search “title” (search “meta”))) html⊃head html⊃title html⊃meta head⊃title head⊃meta (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5)

要素の構造の検索(2) (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) (search “head” (search “title” (search “meta”))) html⊃head html⊃title html⊃meta head⊃title head⊃meta (1,2) (1,3) (1,4) (1,5) (2,3) (2,4) (2,5) 要素ID 2, 3, 4 と 2, 3, 5 の組が、この構造に該当

検索の例 (define result (sdb:search “html” (sdb:search “h1”) (sdb:search “title” “Ueda”))) (define (print-proc u) (display (sdb:url-str u)) (newline) (display (sdb:inner-text u)) (newline)) (sdb:iterate result print-proc 10)

検索の例