疎な相関グラフの学習による相関異常の検出

Slides:

Advertisements

Similar presentations

Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:

Advertisements

Maximal likelihood 法に基づく Matched filter について田越秀行（阪大理） LCGT コヒーレンス解析 WG 修正 Ref: Finn, PRD63, (2001) Pai, Dhurandhar, Bose, PRD64,

生物統計学・第 5 回比べる準備をする標準偏差、標準誤差、標準化 2013 年 11 月 7 日生命環境科学域応用生命科学類尾形善之.

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

マルチレベル共分散構造分析清水裕士大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的個人 - 集団データの階層性個人 - 集団データの階層性階層的データは従来の方法では十分な分析ができない階層的データは従来の方法では十分な分析ができない従来の方法は何が不十分なのか？

2016 年度計量経済学講義内容担当者：河田正樹

エクセルと SPSS によるデータ分析の方法社会調査法・実習資料. 仮説の分析に使う代表的なモデル１クロス表２ｔ検定（平均値の差の検定）３相関係数.

近傍保存原理による異常検知 Anomaly Detection with Neighborhood Preservation Principle 井手剛 IBM東京基礎研究所 | 2007/11/07 | IBIS 2007 |

グラフィカル多変量解析 ----目で見る共分散構造分析----

看護学部中澤港統計学第５回看護学部　中澤　港

コンピュータビジョン特論第８回対象追跡２００６年１１月２２日加藤丈和.

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

多変量解析　－重回帰分析－発表者：時田　陽一発表日：11月20日.

Pattern Recognition and Machine Learning 1.5 決定理論

第４回 (10/16) 授業の学習目標先輩の卒論の調査に協力する。２つの定量的変数間の関係を調べる最も簡単な方法は？

Bassモデルにおける最尤法を用いたパラメータ推定

統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える

Bias2 - Variance - Noise 分解

第3章重回帰分析ｰ計量経済学ｰ.

第3章重回帰分析ｰ計量経済学ｰ.

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

固有空間におけるコンピュータシステムの障害検知

回帰モデル・クラス分類モデルを評価・比較するためのモデルの検証 Model validation

高次元データにおける幾つかの検定統計量の漸近分布について

脳活動に関するデータデータの種類データの特徴脳波・脳磁図・fMRI画像脳活動とパフォーマンスの関係はきわめて冗長。

スペクトル・時系列データの前処理方法～平滑化 (スムージング) と微分～

ガウス過程による回帰 Gaussian Process Regression GPR

第6章　カーネル法修士2年藤井　敬士.

高次元データの解析－平均ベクトルに関する検定統計量の漸近分布に対する共分散構造の影響－

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

Online Decoding of Markov Models under Latency Constraints

P3-12 教師が真の教師のまわりをまわる場合のオンライン学習三好誠司(P)（神戸高専）岡田真人（東大，理研，さきがけ）

T2統計量・Q統計量明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

第14章　モデルの結合修士２年山川佳洋.

独立成分分析５　アルゴリズムの安定性と効率２００７/１０/２４　　　名雪　勲.

訓練データとテストデータが異なる分布に従う場合の学習

主成分分析 Principal Component Analysis PCA

多変量解析～主成分分析～１．主成分解析とは２．適用例と解析の目的３．解析の流れ４．変数が２個の場合の主成分分析

変換されても変換されない頑固ベクトルどうしたら頑固になれるか頑固なベクトルは何に使える？

Data Clustering: A Review

Black Litterman Modelによる最適化

パターン認識特論担当：和田俊和部屋 A513 主成分分析

部分的最小二乗回帰 Partial Least Squares Regression PLS

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

ガウシアン確率伝搬法の近似精度に対する理論解析

知識科学研究科知識システム構築論講座林研究室佛明智

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

第3章　線形回帰モデル修士1年山田　孝太郎.

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

データ解析静岡大学工学部安藤和敏

第5回確率変数の共分散確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

情報の集約記述統計記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

藤本翔太1, 狩野裕1, Muni.S.Srivastava2 1大阪大学基礎工学研究科

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで渡辺一帆（東大・新領域）

人工知能特論II　第8回二宮　崇.

ベイズ音声合成における事前分布とモデル構造の話者間共有

スパース構造学習の異常検知への応用 IBM東京基礎研究所井手剛 | 2008/10/30 | IBIS 2008.

プログラミング論相関

分枝カット法に基づいた線形符号の復号法に関する一考察

パターン認識特論ｶｰﾈﾙ主成分分析和田俊和.

わかりやすいパターン認識第６章特徴空間の変換６．５ KL展開の適用法〔１〕 KL展開と線形判別法〔２〕 KL展開と学習パターン数

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

疎な相関グラフの学習による相関異常の検出 IBM東京基礎研究所井手剛 | 2009/03/03 | 第9回 DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ Acknowledgement This is a joint work with Aurelie C. Lozano, Naoki Abe, and Yan Liu (IBM T. J. Watson Research Center). The author thanks them for fruitful discussions. | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

やりたいこと: 変数同士の「関係の崩れ」を検出したい x2 「x2 と x4の関係がどうもおかしい」 x4 変数個別に見ているだけでは検知できない異常を捉えたい（「アクセルを踏んでもうまく吹けない」など）「本当の不具合は x2 に潜んでいる可能性が高い」 reference data | 2009/03/03 | 第9回DMSM

正常時のデータを元にして、個々の変数の相関異常度を計算したい x2 各変数の相関異常度を計算したい x4 variable 異常度 reference data | 2009/03/03 | 第9回DMSM

何が難しいか: ノイジーなセンサーデータでは変数同士の関係は非常に不安定。 Actual spot rates データの例（1/2）各国通貨の対ドルレートの変動を表した時系列データほとんどの相関係数の値は非常に不安定経済メカニズム自体は変わっていないはずだが、値は安定してない世界経済のメカニズムは変わっていないという前 | 2009/03/03 | 第9回DMSM

何が難しいか: ノイジーなセンサーデータでは変数同士の関係は非常に不安定。 Actual spot rates データの例（2/2）相関の強いペアについては関係が安定している個々の変数の「近傍」だけ見ればノイズにだまされないはずここにしか真実がない。 | 2009/03/03 | 第9回DMSM

本質的なつながりだけを残すように、変数の依存関係を表すグラフを学習したい → 疎な構造を学習したい入力: （今回は）実数値の、多次元データ出力: つながりを表す重み付きグラフ頂点は各変数辺は変数間の関連 2つの頂点間に辺がない＝他を与えた時に両者は独立 | 2009/03/03 | 第9回DMSM

全体の方針：疎な構造学習によって近傍を選択する。そしてその近傍に基づき各変数の異常度スコアを計算する問題多変量データふたつを比べて、その相違に対する個々の変数の寄与度を計算スパース構造学習各変数のスコアリング reference data | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

Graphical Gaussian Model (GGM) におけるグラフの定義: 「精度行列の行列要素がゼロなら辺なし」例: Λ1,2 = 0 なら x1 と x2 は条件付き独立で、頂点1と2の間には辺はないなぜなら exp の部分が因子化されるから: 例2: 6変数の場合の例 | 2009/03/03 | 第9回DMSM

疎な精度行列が得られるようにしたい。しかし、ノイジーなデータでは、行列要素が厳密にゼロになることは決してない素朴な方法： Sの逆行列を求めて、ある閾値以下の要素をゼロとしてしまうダメ。確率モデルじゃなくなってしまう。例えば、そういう精度行列は正定値ではなくなる伝統的な方法: 共分散構造選択（Dempster 1972）ざっくり言えば以下の繰り返し小さい行列要素をひとつゼロにするそれを拘束として、確率モデルを推定しなおすその上で小さい行列要素をひとつゼロにする．．． | 2009/03/03 | 第9回DMSM

グラフィカル・ガウシアン・モデル（GGM）の学習には最近大きな動きがあった: 「手作業」によるスパース化から、L1正規化へ共分散構造選択（古典理論） Dempster (1972): 小さい偏相関係数から順に枝狩りをする Drton & Perlman (2008): 辺を枝狩りする時の統計的検定を改良 L1正規化に基づく方法（盛り上がり中） Meinshausen & Bühlmann (2006): ラッソ回帰に基づくスパース構造学習の一致性を証明 Barnergee (2006): ブロック勾配法により精度行列を直接求める Friedman et al. (2008): ブロック勾配法から計算効率のよい固定点方程式を導くその他いろいろ共分散行列の逆行列の存在を仮定しているので、変数の数が増えると実質的に計算不能！変数の数＞標本数の時ですら構造学習が可能（でもそう甘くはない．．．） | 2009/03/03 | 第9回DMSM

その他の関連研究 2標本検定: ふたつのデータセット同士の相違を仮説検定する相関係数の検定非線形への拡張は今後の課題問題が違う：個々の変数のスコアリングまではしない伝統的には漸近分布での仮説検定：ノイジーで小標本なデータだと使いにくい相関係数の検定 Wishart 分布論に基づく検定の手法があるたとえば Anderson, “An Introduction to Multivariate Statistical Analysis”, Willy 参照が、ノイジーで小標本なデータには使い物にならない非線形への拡張は今後の課題 GGMに基づく以上、今回は線形な相関異常のみに着目している理論的には可能だと思われるが、うまい実例が見つかるかが（論文的には）カギ | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

L1正規化項付きの最尤方程式を解くことでスパース構造学習を行うことにする入力：共分散行列 S 平均ゼロ、分散1に標準化したデータが前提普通、ランク落ちしているので逆は存在せず出力：スパースな精度行列 Λ 精度行列＝共分散行列の逆行列正定でスパースなΛを何とかして求める必要がある方法： L1正規化項付きの最尤方程式を解く対数尤度正規化項 | 2009/03/03 | 第9回DMSM

Graphical lasso algorithm は、L1正規化項付きの最尤方程式を解くための非常に効率のよいアルゴリズムである精度行列を1列（1行）づつ最適化灰色部分を定数だと思って、青色部分についての最適化問題を導く青色ベクトルについての最適化問題は、L1正則化項付きの2次計画問題になる劣勾配法により効率のよい固定点方程式を導ける（Friedman et al. 2008）スパースな精度行列を、明示的な逆行列計算なしに求めることができる副産物として、精度行列の逆も（逆行列計算なしに）求まる標本共分散行列Sの修正版のようなもの（詳しくは: T. Idé et al., “Proximity-Based Anomaly Detection using Sparse Structure Learning,” SDM 2009, to appear.) | 2009/03/03 | 第9回DMSM

正規化項の係数ρは相関係数の閾値と解釈できる今の問題設定では、異常検知性能を最大化するようにρを決める ρは、「相関係数のどの値までを有意な相関とみなすか」の指標と解釈できる 2×2の問題を解析的に解くことで、次の結果を導ける（Idé et al., 2009）相関係数 r が ρ よりも小さいと、対応する偏相関係数はゼロになるつまり、ρより小さい |相関係数| はゼロセットされるというような感じ（T. Idé et al., “Proximity-Based Anomaly Detection using Sparse Structure Learning,” SDM 2009, to appear.) | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

GGMとして学習された確率モデルを使って、各変数の異常度をKL距離として定義するデータAとデータBを比べた時の、第 i 番目の変数のスコアの定義 GGMの範囲では解析的に計算ができる diAB = (xi の近傍グラフの次数の変化を表す項) + （xi の近傍グラフの密集度を表す項） + （ xi それ自身の分散の変化を表す項）条件付き分布同士のKL距離データAにおける xi の近傍データBにおける xi の近傍 | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデルと関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

実験1: 共線形性が強いデータでの構造学習実験の設定為替レートデータ@UCR Archive いくつかの変数がほぼ完全相関ノイズを入れる前後における構造の変化を測定データから構造学習各変数に、標準偏差の10％分のノイズを混ぜてもう一度構造学習比較した手法 “Glasso” Friedman, Hastie, & Tibshirani., Biostatistics, 2008 “Lasso” Meinshausen & Bühlmann, Ann. Stats. 2006 “AdaLasso” 上記のアルゴリズムにおいて、回帰をAdaptive Lasso [H. Zou, JASA, 2006] で行ったもの | 2009/03/03 | 第9回DMSM

実験1: 共線形性が強いデータでの構造学習: Graphical lassoアルゴリズムは、Lasso回帰に基づく他の構造学習法に比べて圧倒的にノイズに頑強である sparsity: グラフがどれだけスパースか flip prob.: ノイズ印加前後でどれだけ辺が変わるかの確率（辺の発生 or 消滅） Meinshausen & Bühlmann の方法は、共線形性の下で結果が不安定 Dempsterの伝統的な共分散構造選択の欠点を引き継いでいるこれはL1回帰で構造学習をやる際の避けがたい問題相関が強い変数の中のどれかひとつを強制的に選ぶので、どれが選択されるかはほとんど偶然による | 2009/03/03 | 第9回DMSM

実験2: sensor_error データでの異常度のスコアリング実験の設定正常時異常時 sensor_error データある機械システムの実測定データ（M=44変数） 79個の正常時データと20個の異常データ異常データでは、2つの変数が相関異常を呈している（右図） 79×20個の正常-異常ペアで異常検知をしてROC曲線を描かせる 2つの異常変数が常にトップ2を占めることを期待この時、AUC (area under curve)はほぼ1となる | 2009/03/03 | 第9回DMSM

実験2: sensor_error データでの異常度のスコアリング構造学習による近傍選択を組み込むことで、擬陽性を大幅に減らせる３つの別のスコアと比較尤度に基づくもの近傍グラフを素朴に k-NN法で作ったものあるヒューリスティックスに基づいたスコア定義を用いたもの [Idé et al, ICDM 07] KL距離によるスコアが最も良い成績しかも理論的に素性正しい | 2009/03/03 | 第9回DMSM

内容やりたいことグラフィカル・ガウシアン・モデル関連研究疎構造学習の方法相関異常度の定義実験結果まとめ | 2009/03/03 | 第9回DMSM

まとめ相関異常のスコアリングという問題に対して、疎な構造学習を始めて適用した最近提案された疎構造学習の手法の比較検討を行い、代表的な手法と目されるMeinshausen-Bühlmann の方法が、共線形性の下では破綻すること、また、精度行列を直接L1正規化する方法はそのような弱点を持たないことを示した疎なGGMに対して計算される条件付き期待KL距離を異常度尺度とすることにより、実問題において、相関異常の検知性能を顕著に上げられることを示した | 2009/03/03 | 第9回DMSM