ISO23950による分散検索の課題と その解決案に関する検討

Slides:



Advertisements
Similar presentations
1 プリミティブ Web サービスの 入出力データに関する一考察 2005 年 3 月 21 日 松江工業高等専門学校 情報工学科 奈良先端科学技術大学院大学 情報科学研究科 越田高志 電子情報通信学会 2005年総合 大会.
Advertisements

All Rights Reserved, Copyright © 2001 GeoBasic® & IIMS® Networking GIS データ共有型 GIS 2001年2月 ジーイーネット 株式会社.
図書館活用法 Ⅰ 第8講 インターネット情報とその利用法 (1) (明治大学図書館庶務課 菊池).
位置情報履歴を利用した サービス提供機構の構築 慶応大学環境情報学部 4 年 徳田研究室 土田泰徳
当社の 「品質マネジメントシステム」(QMS)の 今後の運用について
電子透かしにおける マスキング効果の主観評価
到着時刻と燃料消費量を同時に最適化する船速・航路計画
メール暗号化:秘密鍵・公開鍵の作成  作業手順 Windows メール(Vista).
計算機工学III オペレーティングシステム #14 ファイル: より進んだファイルシステム 2006/07/21 津邑 公暁
最新ファイルの提供を保証する代理FTPサーバの開発
駒澤大学 経営学部 情報セキュリティ B 公開鍵暗号による 認証つきの秘匿通信 ―― 鍵に注目して ――
情報工学科 06A2055 平塚 翔太 Hiratsuka Shota
SAP システムにおける SQL Server 運用ノウハウ
情報処理基礎 2006年 6月 1日.
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
共通設定.
神奈川大学大学院工学研究科 電気電子情報工学専攻
東京経営短期大学 経営総合学科 准教授 玉田 和恵
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
「コンピュータと情報システム」 07章 インターネットとセキュリティ
「まめだくん Ver.1.0」 特徴と利用方法.
高専間教育素材共有システム (教育素材の登録)
既存システムを連携させることによるeラーニング ― MoodleとXoopsのアカウント情報を交換するモジュール ―
空間メタデータ整備 における課題 園山 実 三菱総合研究所.
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
最短路問題のための LMS(Levelwise Mesh Sparsification)
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
メッシュネットワークに関する研究 ーチャネル割り当ての一手法ー
入出力データ型に透過な Webサービス動的実行システム 松江工業高等専門学校 情報工学科 越田高志 情報処理学会第68回全国大会
第2章 第1節 情報通信の仕組み 1 ネットワークの仕組み 2 通信プロトコル 3 認証と情報の保護
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
モバイルP2Pを用いた携帯電話 動画配信手法の提案 第3回
IPv6アドレスによる RFIDシステム利用方式
大規模アドホックネットワークにおける 階層的な名前解決法
東京経営短期大学 経営総合学科 准教授 玉田 和恵
情報化が社会に及ぼす影響 情報セキュリティの確保
第10回 情報セキュリティ 伊藤 高廣 計算機リテラシーM 第10回 情報セキュリティ 伊藤 高廣
大阪大学 大学院情報科学研究科 博士前期課程2年 宮原研究室 土居 聡
第17章 ドメインネームシステム.
インターネットと遠隔講義/講座 大阪市立大学 学術情報総合センター 中野秀男
Office IME 2010 を使う.
製品情報 Windows Server 2003のサポート終了をむかえ、ファイルサーバーの入れ替えを検討されていらっしゃる方も多いのではないでしょうか?既存のファイルサーバーをいきなりクラウド化するとインターネット回線の影響で、エクセルやワードのようなサイズの小さなファイルでさえ、開くまでに時間がかかってしまうことがあります。
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
新たなバックアップソリューション「クローン機能」はここがスゴイ 新たなバックアップ方法「クローン機能」なら全て解決!
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
平成20年11月 国土交通省国土技術政策総合研究所 高度情報化研究センター情報基盤研究室
新たなバックアップソリューション「クローン機能」はここがスゴイ 新たなバックアップ方法「クローン機能」なら全て解決!
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
2章 暗号技術 FM15002 友池 絲子.
Internet広域分散協調サーチロボット の研究開発
12の発明の原理だけで発想できるプロセス アイデア発想とアイデア選定
クリアリングハウスの実現と展望 -検索から共用へ-
Data Clustering: A Review
宇宙科学統合解析環境の構築とAstro-E2解析支援
事務所における情報管理の問題点 情報管理の現状 “欲しいデータが探せない” 情報管理の現状 “媒体ごとの個別管理”
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
コミュニケーションと ネットワークを探索する
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
資料2-2 平成26年度 第2回技術委員会資料 次年度検討テーマ案
Data Clustering: A Review
修士研究計画 CGM作成・共有支援基盤(仮)の構築
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
ネット時代のセキュリティ3(暗号化) 2SK 情報機器工学.
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
SSH2の認証シーケンス(keyboard-interactive)
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
プログラミング論 バイナリーサーチ 1.
Presentation transcript:

ISO23950による分散検索の課題と その解決案に関する検討 (株)トロピカルテクノセンター 情報開発部 贄 良則          平良 洋樹

本発表の流れ ISO23950検索の仕組み ISO23950が抱える問題点 クリアリングハウスノード連携案の紹介 メタデータ複製型の考察 階層配置型 ノード情報型 メタデータ複製型 メタデータ複製型の考察 まとめ

ISO23950の仕組み(1) ISO23950 Client (Origin) ISO23950 Server (Target) ステートフルなプロトコル 同時に複数のTargetを指定可能 マシンアーキテクチャに非依存

ISO23950の仕組み(2) WWW Browser ISO23950 Gateway ISO23950 Server WWWとISO23950との連携にGatewayを用いる Gatewayによる同報検索

分散検索への取り組み ISO23950 Gateway の問題点 WWW Browser ISO23950 Gateway ISO23950 Server 利用者が自らの判断で検索対象ノードを指定しなければならない。 48ノード ・・・ 38 秒   94ノード ・・・ 138 秒 205ノード ・・・ 216 秒

分散検索への取り組み 国土交通省国土地理院ゲートウェイの例 利用者が自ら 選択する必要が ある。

ISO23950クリアリングハウスへの補完 ノード連携による解決手法の模索 利用者は複数のクリアリングハウスノードの存在を意識せずに検索したい。 ISO23950の補完 ノード同士で事前に連携させることで解決できないか? ノード連携手法の検討 ディレクトリ型 ノード情報型 メタデータ複製型

ノード連携手法の模索 検討:ディレクトリ型 長所: (1)階層構造は直感的にわかりやすい。 日本 短所: (1)最初に階層構造の定義が必要。 (2)検索の転送回数に比例して検索   レスポンスが劣化する。 (3)階層構造維持のための管理業務   が発生する。 (4)階層構造以外での検索指定では、   逆に非効率になる。 (5)どのノードが管理すべきかが不明瞭   なデータが発生した場合、仲裁が   必要となる。 茨城 富山 沖縄 那覇 浦添 名護 地域ディレクトリの例

長所: 短所: (1)インデックスを共有すれば、どの メタデータ ノードに問い合わせても、そのノード 内で完結して処理できるため、高速 ノード連携手法の模索 検討:ノード情報型 長所: (1)インデックスを共有すれば、どの    ノードに問い合わせても、そのノード    内で完結して処理できるため、高速    である。 メタデータ 検索用 インデックス を用意 ノード 短所: (1)インデックス共有のための標準的    な手法が存在しない。 (2)何をインデックスとするかを決める    ことが難しい。 ノード ノード インデックスを共有

ノード連携手法の模索 検討:メタデータ複製型 長所: (1)メタデータを共有すれば、どの    ノードに問い合わせても、そのノード    内で完結して処理できるため高速。 (2)各ノードでデータの複製を保持する    ため、障害に強い。 ノード メタデータ ノード ノード 短所: (1)メタデータ共有のための標準的    な手法が存在しない。 (2)各ノードが用意すべきディスク容量    が多めに必要である。 (3)メタデータの著作権問題。 (4)複製タイムラグの問題。 メタデータ メタデータそのものを共有

メタデータ共有のための標準的手法の確立 各ノードが自律的に動作するアルゴリズムを提案する。 メタデータ複製型 問題点と対応策(1) メタデータ共有のための標準的手法の確立 各ノードが自律的に動作するアルゴリズムを提案する。 ノードの追加、削除も自動化する。(管理者の負担軽減) ノードが追加されると自動的にメタデータの複製が開始される。 各ノードは、複製されたデータのオリジナルノードがどこかを知っている。

複製データを格納するディスク容量の問題 個々のメタデータのサイズは非常に小さい。 容量の試算 ハードディスクの大容量化の進展。 メタデータ複製型 問題点と対応策(2) 複製データを格納するディスク容量の問題 個々のメタデータのサイズは非常に小さい。 10kbyte/1メタデータ程度 容量の試算 総メタデータ数10000 … 100Mbyte 総メタデータ数100000 … 1Gbyte 総メタデータ数1000000 … 10Gbyte ハードディスクの大容量化の進展。 60GByte の HDD が 3 万円以下

メタデータの著作権問題 メタデータの著作権 電子署名の適用による解決が可能 基本的に公開されるべきデータ。 メタデータ複製型 問題点と対応策(3) メタデータの著作権問題 メタデータの著作権 基本的に公開されるべきデータ。 どの組織が作成したかがわかればよい。 改変されることは好ましくない。 電子署名の適用による解決が可能 電子署名 により、改変されていないかどうかを調べることが可能になる。

メタデータ複製型 補足:電子署名 署名 署名されたメタデータ 第三者認証機関 (CA) 作成したメタデータ 作成したメタデータ      この文書は作成元によって署名されています。 署名 このメタデータは作成元の署名がついているから安心して利用できます。 クリアリングハウスで公開 作成元の秘密鍵 利用者 公開鍵

複製タイムラグの問題 更新が頻繁に起こる場合、常に最新のメタデータを持つことが難しい。 メタデータ複製型 問題点と対応策(4) 複製タイムラグの問題 更新が頻繁に起こる場合、常に最新のメタデータを持つことが難しい。 地理情報メタデータの場合、日々更新されるような性質のデータではない。 複製された過去のデータであっても、検索できないよりは検索できた方が良いという解釈もある。 更新頻度とノード数をパラメータとした、最新状態率をシミュレーションにより測定中。

メタデータ複製型 ISO23950システムとの連携(1) 各クリアリングハウスノードがそれぞれ検索インターフェースを提供する場合。 どのノードに問い合わせても結果が返る。 検索結果の情報をベースに、(メタデータを作成した)オリジナルのノードに対して直接、検索をかける場合には ISO23950 を使うことが可能。

メタデータ複製型 ISO23950システムとの連携(2) 一つの(あるいはいくつかの代表的な)クリアリングハウスゲートウェイが検索機能を提供する場合。 メタデータの(中央のゲートウェイへの)自動収集システムとして有効に活用できる。 ゲートウェイ同士の情報交換としての利用も可能。

まとめ ISO23950の問題点の明確化 分散連携方式の検討 利用者は複数のクリアリングハウスノードの存在を意識しなくとも、検索を行える仕組みが必要。 分散連携方式の検討 階層型、ノード情報型、メタデータ複製型の検討 メタデータ複製型の課題と解決案 複製アルゴリズムの共通化が必要 データ容量に関する検討 著作権に関する検討 タイムラグに関する検討