ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発

Slides:



Advertisements
Similar presentations
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Advertisements

嗜好ベクトルの近似による サービス享受条件の自動設定 立命館大学大学院 理工学研究科 データ工学研究室 ◎川成宗剛,山原裕之, 原田史子, 島川博光 2007 年 9 月 6 日.
1 EASE プロジェクトにおける EPM ( Empirical Project Monitor) を用いたプロジェクト管理デモ 奈良先端科学技術大学院大学 産学官連携研究員 松村 知子 2005 年 9 月 30 日 JISA 経営者セミナー.
新潟インターネット研究会 神保道夫 NTP入門 新潟インターネット研究会 神保道夫
IIS 4.0で開発をするコツ Webアプリケーション構築.
ファイルキャッシュを考慮したディスク監視のオフロード
最新ファイルの提供を保証する代理FTPサーバの開発
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
クラスタ分析手法を用いた新しい 侵入検知システムの構築
オペレーティングシステムⅡ 第11回 講師 松本 章代 VirtuaWin・・・仮想デスクトップソフト.
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
HTTP proxy サーバにおける 動的コネクション管理方式
クロストーク成分の相互相関に 着目した音場再生システム
先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning
徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司
TextonBoost:Joint Appearance, Shape and Context Modeling for Multi-Class Object Recognition and Segmentation 伊原有仁.
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
センサノード 時刻同期と位置測定 浅川 和久 2008/11/16 センサノード 時刻同期と位置測定.
PlanetLab における 効率的な近隣サーバ選択法
CSP記述によるモデル設計と ツールによる検証
ネストした仮想化を用いた VMの安全な帯域外リモート管理
技術参照モデルとシステム要件定義 に関する学習システム
IPv6アドレスによる RFIDシステム利用方式
サーバ負荷分散におけるOpenFlowを用いた省電力法
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
プログラム実行履歴を用いたトランザクションファンクション抽出手法
プログラム実行時情報を用いたトランザクションファンクション抽出手法
Astro-E2衛星搭載 XISの データ処理方法の最適化
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
セキュリティ(6) 05A2013 大川内 斉.
他のプロセスに あたえる影響が少ない 実行時ミラーリングシステム
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
ステレオカメラを用いた歩行者の行動解析.
ステレオカメラを用いた人の行動解析.
リモートホストの異常を検知するための GPUとの直接通信機構
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
Internet広域分散協調サーチロボット の研究開発
ETPB:歩行者行動コンテクストの抽出 申請学生1: 諸富 賢 総合政策学部3年 申請学生2: 佐藤 文啓 環境情報学部1年
通信機構合わせた最適化をおこなう並列化ンパイラ
ソースコードの特徴量を用いた機械学習による メソッド抽出リファクタリング推薦手法
Data Clustering: A Review
プログラム実行に対するフェイズ検出を用いた ログ取得量の動的変更手法の提案
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
Intel SGXを用いた仮想マシンの 安全な監視機構
ステレオカメラを用いた歩行者の行動解析 ステレオカメラを用いた歩行者の行動解析.
Number of random matrices
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
IDSとFirewallの連携によるネットワーク構築
オブジェクトの協調動作を用いた オブジェクト指向プログラム実行履歴分割手法
仮想マシンと物理マシンを一元管理するための仮想AMT
保守請負時を対象とした 労力見積のためのメトリクスの提案
ETPB: Extraction of Context from Pedestrians' Behavior
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
VMリダイレクト攻撃を防ぐための 安全なリモート管理機構
メソッドの同時更新履歴を用いたクラスの機能別分類法
卒業研究 JCSPを用いたプログラム開発  池部理奈.
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
ステレオカメラを用いた歩行者の行動解析.
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの 数学的基礎 3.1 ベイジアンネットワークモデルの概要
オントロジーを利用した Webサービスの実行支援に関する研究
強制パススルー機構を用いた VMの安全な帯域外リモート管理
Webページタイプによるクラスタ リングを用いた検索支援システム
プログラムの一時停止時に 将来の実行情報を提供するデバッガ
Presentation transcript:

ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発 井上研究室 爲岡 啓

背景  社会基盤としてのWebシステム 資源やサービスを一括管理 安定した長期稼働が求められる       信頼度の高い障害検知が必要

障害検知 障害検知とは Webシステムの障害検知の現状 システムの異常を認識し,検知すること ハードウェア ソフトウェア 物理状態の常時監視 障害を検知したら系を切り替える ソフトウェア CPU利用率,メモリ使用量など,個々のメトリクスから管理者が判断 ソフトウェア側に着目します,ということを説明する ソフトウェアの障害検知に着目しました

問題点 管理者の扱うメトリクス量,種類の増加 それらの複雑な連携 →人間の勘や経験のみに依存してしまう 複雑性の高いメトリクス群を,  →人間の勘や経験のみに依存してしまう  複雑性の高いメトリクス群を,  解析技術を用いて処理し,検知を自動化

メトリクス解析技術 ベイジアンネットワーク 過去に起こった事象の因果関係をモデル化し,現在の状態から注目する事象の発生確率を算出する →因果関係を元にして,障害の確率検知が可能 事象F 事象D 事象B 事象E 事象A 事象C

メトリクス解析技術 クラスタリング 正常時の状態のn個のメトリクスを利用し,n次元空間上にプロットする 正常時の点が集まる位置をクラスタとして認識し,現在の状態と最近クラスタとの距離を計算する →正常時と異常時の差を距離として検出できる 正常時クラスタ 現在の状態 メトリクスA メトリクスC メトリクスB

解析技術の特徴 ベイジアンネットワーク クラスタリング 2つの解析技術を組み合わせた障害検知を行う 利点:メトリクスの相関関係を反映できる 欠点:学習情報が少ない場合には検知できない 負荷がかかった状態の学習情報がないと認識しない クラスタリング 利点:学習データが少量であっても検知が可能 欠点:学習データの選定が難しい モデル化の際,異常時のデータ除去が必要 2つの解析技術を組み合わせた障害検知を行う

研究概要 目的 方法 2つのデータ解析技術を組み合わせて, 障害検知を自動化する Webシステムの実装  障害検知を自動化する 方法 Webシステムの実装 システムに負荷をかけて,メトリクスを収集 メトリクスを元にモデルを生成 モデルを利用して実際に検知できるか実験,評価

Webシステムの実験環境 4つのコンポーネントで構成 Webサーバには2台,残りは1台ずつ,計5台の仮想計算機を用意する Load Balancer Apache mod_proxy, balancer Client Apache JMeter Web Server Apache Tomcat JPetStore Database MySQL

実験プロセス メトリクス収集対象 Load Balancer Apache mod_proxy, balancer Web Server Web : Apache Coyote AP : Tomcat System : JPetStore Client Apache JMeter Database MySQL 学習用メトリクス 生成 収集 取得メトリクス 入力 収集 外部ツールによる 負荷 異常検知モデル 出力 異常発生確率,距離 10

計測メトリクス CPU Memory Disk Network CPU利用率(%) メモリ利用量(byte) Disk I/Oのオペレーション数(ops/sec) Network ネットワーク送受信量(byte/sec)

メトリクス取得方法 クライアントからWebサーバA,Bへアクセスを継続し,要件に従いサーバに負荷をかける 学習用メトリクス収集期間を「区間」とする 時間 要件 区間 0:00~3:00 負荷注入なし   ① 3:00~6:00 WebAのみに負荷注入 6:00~9:00 WebA,B両方に負荷注入 9:00~12:00 WebBのみに負荷注入 12:00~15:00      ②

モデル生成 2つの区間において,ベイジアンネットワーク,クラスタリングのモデルを生成する 植田のツールを利用 クラスタリングは正常時である区間①を,ベイジアンネットワークは負荷学習のため区間②を利用 実験データを元に30種類のモデルを生成し,その中から検知率の高い1種類を,それぞれ選定した

障害とその検知の定義 Webシステムの障害を,「応答時間が3秒を超える場合」として定義する 以下の2つの条件を満たす時,検知を行う ベイジアンネットワークモデルで算出した確率の値が0.6を超える クラスタリングモデルで算出した距離の値が100000以上である この定義のもと,検知開始から1分以内に障害が発生すれば検知成功とする

ベイジアンネットワークによる検知  区間②に対して異常発生確率を計算 (確率) (秒) (分) 検知点 検知成功点 障害発生点

クラスタリングによる検知 区間②に対して距離計算 異常発生時刻の距離は高い値を示している (距離) (秒) (分) 障害発生点

評価 モデル作成に利用したものとは別のデータを用意し,以下の項目について調査する これらのデータを基に,適合率,再現率を算出 実験期間中に障害が起こった回数 検知回数 検知成功回数,失敗回数 対処時間 検知成功時,障害が起こった時刻と検知開始時刻との差を対処時間とする これらのデータを基に,適合率,再現率を算出

評価結果 15回の実験を行った 平均障害回数 平均検知回数 平均検知成功回数 平均検知失敗回数 平均対処時間 3.47回 4.40回  15回の実験を行った 平均障害回数 平均検知回数 平均検知成功回数 平均検知失敗回数 平均対処時間 3.47回 4.40回 1.87回 2.53回 20.6秒 検知成功率が低い原因 ・障害が連続して起こり,確率が高い値を出し続ける ・検知しても応答時間が閾値に到達しない 適合率 再現率 42.5% 53.9% 適合率<再現率に対して 漏れを許して障害を確実に検知する(適合率が高い)より,なるべく多くの障害を検知する(再現率が高い)ほうが良い 検知の方向性として正しい

今後の課題 パラメータを変更して実験する 対処時間を伸ばす 実際に障害検知を行うツールを作成する メトリクスの最適化 対処のための行動を取れる最短時間:5分 実際に障害検知を行うツールを作成する