成 凱、 上林弥彦 京都大学大学院 情報学研究科 社会情報学専攻 DBWeb2000合同シンポジウム (12月06日~08日・東京)

Slides:



Advertisements
Similar presentations
地図の重ね合わせに伴う 位相関係の矛盾訂正手法 萬上 裕 † 阿部光敏* 高倉弘喜 † 上林彌彦 ‡ 京都大学工学研究科 † 京都大学工学部 * 京都大学情報学研究科 ‡
Advertisements

Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
Webプロキシサーバにおける 動的資源管理方式の提案と実装
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
状況に応じたサービスを 提供するための人や物に 共通の情報管理
Ibaraki Univ. Dept of Electrical & Electronic Eng.
動画像品質調整可能なプロキシキャッシュのためのキャッシングメカニズム
最新ファイルの提供を保証する代理FTPサーバの開発
クラスタ分析手法を用いた新しい 侵入検知システムの構築
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
秘密のリンク構造を持つグラフのリンク解析
Shelf-Navigator ユーザ動作による書籍相関抽出機構
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
局所探索に基づく 原子炉燃料装荷パターンの最適化
記 憶 管 理(2) オペレーティングシステム 第10回.
ファイルシステムキャッシュを 考慮した仮想マシン監視機構
OSが乗っ取られた場合にも機能するファイルアクセス制御システム
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
ネストした仮想化を用いた VMの安全な帯域外リモート管理
予備親探索機能を有した アプリケーションレベルマルチキャスト
プロキシ協調型動画像配信システムの検討 大阪大学 若宮 直紀.
動画像ストリーミングサービスのための プロキシキャッシングシステムの 設計と実装および評価
Java ソフトウェア部品検索システム SPARS-J のための リポジトリ自動更新機能の実現
プログラム実行時情報を用いたトランザクションファンクション抽出手法
型付きアセンブリ言語を用いた安全なカーネル拡張
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
VM専用仮想メモリとの連携による VMマイグレーションの高速化
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
12/14 全体ミーティング 米澤研究室卒論生 山崎孝裕
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
WWW上の効率的な ハブ探索法の提案と実装
Internet広域分散協調サーチロボット の研究開発
ソースコードの特徴量を用いた機械学習による メソッド抽出リファクタリング推薦手法
MEMSセンサを用いたINS/GPS複合航法システム
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Data Clustering: A Review
千葉大学とJSPS北京研究連絡センターとの共同シンポジウム
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
Intel SGXを用いた仮想マシンの 安全な監視機構
信頼できないクラウドにおける仮想化システムの監視機構
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
コードクローン分類の詳細化に基づく 集約パターンの提案と評価
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
コーディングパターンの あいまい検索の提案と実装
オブジェクトの協調動作を用いた オブジェクト指向プログラム実行履歴分割手法
秘匿リストマッチングプロトコルとその応用
ユーザコンテキストを反映した セマンティックキャストの基盤技術
ISO23950による分散検索の課題と その解決案に関する検討
全体ミーティング (5/23) 村田雅之.
VMリダイレクト攻撃を防ぐための 安全なリモート管理機構
ポッツスピン型隠れ変数による画像領域分割
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
強制パススルー機構を用いた VMの安全な帯域外リモート管理
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
現在対応 将来展望 変動的 操作スキル プログラミング 情報モラル 探究スキル 普遍的 図13−1 情報活用能力の構成要素 (p.176)
一問一答式クイズAQuAsにおける学習支援の方法
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Ibaraki Univ. Dept of Electrical & Electronic Eng.
強制パススルー機構を用いた VMの安全な帯域外リモート管理
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
Presentation transcript:

成 凱、 上林弥彦 京都大学大学院 情報学研究科 社会情報学専攻 DBWeb2000合同シンポジウム (12月06日~08日・東京) コンテンツを意識する ウェブキャッシュ 成  凱、  上林弥彦 京都大学大学院 情報学研究科 社会情報学専攻 DBWeb2000合同シンポジウム (12月06日~08日・東京)

発表内容 背 景 ウェブキャッシュとその特徴 従来のウェブキャッシュ手法の欠点 セメンチックスよりアクセス傾向の推定 背 景 ウェブキャッシュとその特徴 従来のウェブキャッシュ手法の欠点 セメンチックスよりアクセス傾向の推定 コンテンツを意識するウェブキャッシュ コンテンツを意識する置換手法LRU-SP+ 実験結果とディスカッション 2000年12月7日 (C)上林研究室

サーバ能力、ネットワーク帯域幅増加だけではいけなくて 冗長データ技術(キャッシュなど)は必要不可欠 背 景 アクセススピード:ウェブユーザの最も気になる要素(GUVインターネットユーザ調査・98) Scalability対策→キャッシュ必要不可欠 インターネット・トラフィック:ウェブは75%あまり かつ半年ぐらい倍になる しかしネットワーク帯域幅:僅か年に50%増加 サーバ能力、ネットワーク帯域幅増加だけではいけなくて 冗長データ技術(キャッシュなど)は必要不可欠 2000年12月7日 (C)上林研究室

ウェブキャッシュとは ウェブアクセスを効率化するミッドルウェア よくアクセスされるものをキャッシュに格納 三種類: WWW 繰り返し 再利用 プロキシ・キャッシュ サーバ逆キャッシュ ブラウザ・キャッシュ 複数ユーザ 共    有 2000年12月7日 (C)上林研究室

キャッシュに関する問題 置換手法→ヒット率(Hit Rate)もっと高める 一致性維持→コンテンツの新鮮さ 1 2 置換手法→ヒット率(Hit Rate)もっと高める 一致性維持→コンテンツの新鮮さ コンテンツ管理→キャッシュコンテンツを共有情報源として積極的利用 法的・倫理的・経済的な問題 著作権 プライバシー ウェブ広告ヒット数 2000年12月7日 (C)上林研究室

ウェブキャッシュの特徴 従来のキャッシュ ウェブキャッシュ キャッシュ・ユーザ システム 人 間 働く環境 CPU、OS、DBなど WWW 人 間 働く環境 CPU、OS、DBなど WWW データ単位 物理的・ブロック 論理的・ウェブページ データサイズ 単一、小さい 大きい差がある 時間制約 厳しい 余裕がある アルゴリズム 簡 単、履歴ベース 複 雑 性能測定 Hit Rate Hit Rate、Byte Hit Rate 2000年12月7日 (C)上林研究室

従来のウェブキャッシュ手法の欠点 利用履歴だけに基づくキャッシュ置換手法 アクセス履歴データなしでも測定できる方法は?? アクセス頻度→60%一度しかアクセスしてない→判断できず アクセス時間 キャッシュ空間 観測時間が必要 新入者 被観測者 置換該当者 アクセス履歴データなしでも測定できる方法は?? 2000年12月7日 (C)上林研究室

提案:コンテンツを意識するキャッシュ Request/Response (Hits/Misses) ④人気内容をユーザに推薦など ① 情報要求解析 どんな内容が欲しいか? ②新規内容測定 ③キャッシュ置換 2000年12月7日 (C)上林研究室

新しいキャッシュ構造 制約条件 ユーザ・興味 制御部 CKBルール ストレージ ロード ブラウジング 索 引 WWW 質問 サーチ 子キャッシュ 制約条件 ユーザ・興味 制御部 CKBルール ストレージ ロード ブラウジング 索 引 WWW 質問 サーチ 2000年12月7日 (C)上林研究室

ユーザ情報要求(Needs)解析 順番 MFQ言葉 重み 1 Movie 3 2 database hardcore 4 Gambling 1. Most Frequently Queried 2. Most Frequently Appeared 順番 MFQ言葉 重み 1 Movie 3 2 database hardcore 4 Gambling 5 Investing 6 Game 順番 MFA言葉 重み 1 Gambling 3 2 Game Investing 4 Movie 5 ticket 6 Java W1 = 0.7 W2 = 0.3 2000年12月7日 (C)上林研究室

セメンチックスよりアクセス傾向の推定 順番 人気トピックP 重み 1 Movie 2.7 2 Gambling 2.3 3 Database 2.1 4 Investing 2.0 5 Game 1.6 6 hardcore 1.4 Document 内容による人気度 (類似度計算)) 2000年12月7日 (C)上林研究室

セメンチックスを利用する利点 内容による人気度推定 観察時間短縮 時空効率 高い 情報要求 キャッシュ空間 人気内容 置換該当者 空いている  高い キャッシュ空間 人気内容 置換該当者 空いている 非人気内容 2000年12月7日 (C)上林研究室

従来のウェブキャッシュ手法 アルゴリズム 最近度 頻度 サイズ LRU O X LFU SIZE Size-Ajusted LRU Segmented LRU LRU-SP 2000年12月7日 (C)上林研究室

コンテンツを意識するLRU-SP+ LRU-SP(Size-adjusted and Popularity-aware LRU, K. Cheng et al Compsac’00) LRU-SP+ (Content-Sensitive LRU-SP) 利益 小さいものをキャッシングしない RF:引用頻度; アクセス最近度 小さいものをキャッシングしない 利益 2000年12月7日 (C)上林研究室

LRU-SP+の実装について ③. 最終決置換 一番小さい ②.置換候補 時間的に最も長く 引用されてないもの Hit ①.オブジェクト分類 2.5KB 一番小さい 2.5KB 5KB ②.置換候補 時間的に最も長く 引用されてないもの 2.5KB 5KB Hit 2.4KB/2 4KB/2 5.2KB 5.2KB/2 5.02KB ①.オブジェクト分類 2000年12月7日 (C)上林研究室

実験設計 実験内容の選択 実験モデル: “コンテンツ人気度“=1+ コンテンツによる人気度測定は正確か?(実験中) コンテンツの人気度=長期的人気度?(実験中) 長期的人気度を用いてキャッシュ効率高める? 実験モデル: “コンテンツ人気度“=1+     ドキュメントAのアクセス回数       実験データでのすべてのアクセス記録数 2000年12月7日 (C)上林研究室

実験結果: Hit Rates 2000年12月7日 (C)上林研究室

実験結果: Byte Hit Rates 2000年12月7日 (C)上林研究室

終わりに ウェブの人間向き、ドキュメントベースの特徴を生かし、キャッシュ(データ!)とキャッシュの使い道(情報!)を再び検討すべき コンテンツを積極的に利用しキャッシュ効率を高める方法は提案した。 実験的検証について コンテンツもワークロードもあるBenchmarkはない → シミュレーション的検証は困難 実験内容を分けて、段階的にやる必要がある 2000年12月7日 (C)上林研究室