固有空間における コンピュータシステムの障害検知

Slides:



Advertisements
Similar presentations
OWL-Sを用いたWebアプリケーションの検査と生成
Advertisements

近傍保存原理による異常検知 Anomaly Detection with Neighborhood Preservation Principle 井手剛 IBM東京基礎研究所 | 2007/11/07 | IBIS 2007 |
白井ゼミ 豊田秀樹(2008)『データマイニング入門』 (東京図書)。4章
最新ファイルの提供を保証する代理FTPサーバの開発
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
1.基礎概念 1.1 ディペンダブルなシステムとは Dependability Fault Avoidance
秘密のリンク構造を持つグラフのリンク解析
共通設定.
数理手法IV 「統計的機械学習入門」 数理情報学専攻 中川裕志.
ISDASインターネット分散観測: ワームの平均寿命はいくらか?
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
Linked e-Stat インディゴ株式会社 STAT DASH グランプリ 2016 行政サービス開拓部門 2016/3/5
時空間データからのオブジェクトベース知識発見
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
リンク構造を考慮したベクトル空間法によるWebグラフ分割手法に関する研究
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
通信トラヒックの相関構造を利用した通信品質の劣化検出
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
プログラム実行履歴を用いたトランザクションファンクション抽出手法
協調機械システム論 ( ,本郷) 協調機械システム論 東京大学 人工物工学研究センター 淺間 一.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
5 テスト技術 5.1 テストとは LISのテスト 故障診断 fault diagnosis 故障解析 fault analysis
動的依存グラフの3-gramを用いた 実行トレースの比較手法
ステレオカメラを用いた歩行者の行動解析.
P3-12 教師が真の教師のまわりをまわる場合のオンライン学習 三好 誠司(P)(神戸高専) 岡田 真人(東大,理研,さきがけ)
細胞の形と変形のための データ駆動型解析手法
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
情報コミュニケーション入門e 第11回 Part2 Web入門(1)
Internet広域分散協調サーチロボット の研究開発
Introduction to Soft Computing (第11回目)
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
モバイルエージェントネットワークの拡張とシミュレーション
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Data Clustering: A Review
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
様々な情報源(4章).
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
構音障害者を対象とした混合正規分布モデルに基づく統計的声質変換に関する研究
ステレオカメラを用いた歩行者の行動解析 ステレオカメラを用いた歩行者の行動解析.
シナリオを用いたレビュー手法PBRの追証実験 - UMLで記述された設計仕様書を対象として -
Number of random matrices
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
オブジェクトの協調動作を用いた オブジェクト指向プログラム実行履歴分割手法
HMM音声合成における 変分ベイズ法に基づく線形回帰
プログラミング入門2 第13回、14回 総合演習 情報工学科 篠埜 功.
保守請負時を対象とした 労力見積のためのメトリクスの提案
ETPB: Extraction of Context from Pedestrians' Behavior
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
UMLモデルを対象とした リファクタリング候補検出手法の提案と実現
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
コードクローン解析に基づく デザインパターン適用候補の検出手法
回帰テストにおける実行系列の差分の効率的な検出手法
線形符号(10章).
木構造の比較に基づく メソッド呼び出し履歴の変化の可視化手法
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

固有空間における コンピュータシステムの障害検知 3F3-05 固有空間における コンピュータシステムの障害検知 IBM東京基礎研究所 井手剛 ・ 鹿島久嗣

コンピュータシステムの障害検知の特徴 データマイニングの新しい方向性 背景 複数サーバが連係動作する場合、障害検知が困難 グラフ時系列からの知識発見とみなせる データマイニングの新しい方向性 空間方向への拡張: グラフマイニング 時間軸方向への拡張: ストリームマイニング 人工知能学会全国大会2004 | 2004/06/04 |

Web系システムのモデル化 - 定義 サービス サービス関連度 サービス関連度グラフ (要求元、要求相手、ポート番号、アプリ種) 二つのIPアドレスを含んでいることに注意。 サービス関連度 あるサービスが別のサービスを単位時間に何度呼んだか 対数変換して対称化 サービス関連度グラフ サービスを頂点、サービス関連度を辺の重みとするグラフ 無向グラフとして定義 HTTP WAS DB 人工知能学会全国大会2004 | 2004/06/04 |

Web系システムのモデル化 - 具体例と特徴 グラフの辺の重みの時間変動は激しい 数十分程度の範囲では自己回帰モデルは無理 グラフの辺の数はそれなりに多い 50種のサービスがあれば1000以上のサービス関連度。 グラフの頂点同士の相互関係が現象に本質的 そうやってシステムが動作している。 サービスの実例 サービス9から11への呼び出し回数 回/20秒 人工知能学会全国大会2004 | 2004/06/04 |

素人可読性 解かれるべき問題 Web系システムのモデル化 - 問題設定 時系列にサービス関連度グラフが与えられる。 そのグラフ列から、教師データなしで、異常を検出せよ。 実用上の要請 素人可読性 ある程度わかりやすい特徴量を使って、 系についての詳細な事前知識を前提とせずに、 従来検知が難しかった障害を見つけたい。 人工知能学会全国大会2004 | 2004/06/04 |

特徴抽出 - 定義 「サービス活動度ベクトル」 解釈1「サービスの活動度」 解釈2「コントロールトークンの保持確率」 定義: すなわち、サービス関連度行列の、最大固有値に属する規格化された固有ベクトル 解釈1「サービスの活動度」 他のサービスを活発に呼び出している(呼び出されている)ようなサービスにおいて重みが強くなる 解釈2「コントロールトークンの保持確率」 サービス関連度行列に従って時間発展する力学系の定常状態 人工知能学会全国大会2004 | 2004/06/04 |

活動度ベクトルはトラフィックの一様な変化に不変 活動度ベクトルは正ベクトルである 活動度ベクトルに縮退はない 特徴抽出 - 数学的に言えること 活動度ベクトルはトラフィックの一様な変化に不変 活動度ベクトルは正ベクトルである 活動度ベクトルに縮退はない Perron-Frobenius グラフが非連結の場合 各部分グラフに対して活動度ベクトルを定義できる 活動度に基づく自然なクラスタリング サービス数に対するスケーラビリティ 人工知能学会全国大会2004 | 2004/06/04 |

方向データ(directional data)の外れ値検出問題 異常の検知 方向データ(directional data)の外れ値検出問題 「異常度」をどう定義するか 異常の判定をどうするか コサイン尺度として定義 u(t) : 時刻 t での活動度ベクトル r(t-1) : 時刻 t-1 の時点での代表パターン u(t) r(t-1) 代表パターンはKL展開により抽出 Karhunen-Loeve 人工知能学会全国大会2004 | 2004/06/04 |

手法のまとめ 隣接行列 特徴ベクトル Web系システム 過去の典型 パターン 相違度 の評価 パターン抽出 現在の 人工知能学会全国大会2004 | 2004/06/04 |

実験 - アプリケーションの一方にバグを仕込む 舞台設定 2つのWASそれぞれの上で2つのアプリケーションを動作させる(花屋と株屋) 20秒おきにサービス関連度行列を出力 主固有クラスターに注目(12個のサービスが存在) 仕込んだバグ ある時刻において、花屋の一方がディスク書き込み不能で固まるようにする プロセス自体は正常に存在しているが、動作自体が妙。 冗長化されているので、トラフィックが小さいうちはユーザも異常を感じないはず。 HTTP WAS DB 負荷生成 人工知能学会全国大会2004 | 2004/06/04 |

実験 - 結果 計算 活動度ベクトル 異常度 関連度グラフから活動度ベクトルを求め、さらに異常度zを計算 zに対して閾値を更新 明瞭に異常区間を可視化している ひとつのアプリケーションの機能不全が、リンクをたどって他の活動度に影響 異常度 異常度に二つの大きなピーク 機能不全の発生(tA)と終了(tB) 閾値により自動検出 後者はオンライン学習が機能している証拠 time [min] 人工知能学会全国大会2004 | 2004/06/04 |

まとめ 冗長化されたWeb系システムの振る舞いをサービス関連度行列で表現した。 特徴量として主固有ベクトルを取れば系の動態を要約できることが分かった。 系の異常検出問題を、方向データの時系列の外れ値検出問題に帰着させた。 「外れ度」の統計的振る舞いを記述するためのオンライン更新式を導いた。 従来困難であったアプリケーション層の障害検知に成功した。 省略箇所および詳細はフルペーパー版を参照願います(8月下旬公開)。 T. Ide and H. Kashima, “Eigenspace-based Anomaly Detection in Computer Systems,” to appear in Proc. 10th ACM SIGKDD, 2004. 人工知能学会全国大会2004 | 2004/06/04 |