行列の圧縮による変化点検出の高速化 IBM東京基礎研究所 井手 剛 | 2006/11/01 | IBIS 2006.

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
0章 数学基礎.
特異値分解とその応用 2009年5月12日 計算理工学専攻 張研究室 山本有作.
到着時刻と燃料消費量を同時に最適化する船速・航路計画
データ解析
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
三重対角化アルゴリズムの性能評価 早戸拓也・廣田悠輔.
論文紹介 “Data Spectroscopy: Learning mixture models using eigenspaces of convolution operators” (ICML 2008) ─ by Tao Shi, Mikhail Belkin, and Bin Yu IBM東京基礎研究所.
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
AllReduce アルゴリズムによる QR 分解の精度について
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
データ分析入門(13) 第13章 主成分分析 廣野元久.
固有空間における コンピュータシステムの障害検知
最短路問題のための LMS(Levelwise Mesh Sparsification)
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
ガウス過程による回帰 Gaussian Process Regression GPR
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
2A-1-2 部分時系列クラスタリングの 理論的基礎 IBM東京基礎研究所 井手 剛 | 2006/ / | 第20回 人工知能学会全国大会.
サポートベクターマシン によるパターン認識
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
k 個のミスマッチを許した点集合マッチング・アルゴリズム
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
スペクトル法の一部の基礎の初歩への はじめの一歩
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
訓練データとテストデータが 異なる分布に従う場合の学習
「R入門」  5.7 行列に対する諸機能  10月23日 (木) 発表者 大城亜里沙.
独立成分分析 (ICA:Independent Component Analysis )
Introduction to Soft Computing (第11回目)
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
主成分分析 Principal Component Analysis PCA
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
“Regression on Manifolds using Kernel Dimension Reduction” by Jens Nilsson, Fei Sha, and Michael I. Jordan IBM東京基礎研究所 井手剛 | 2007/08/20 | ICML
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Data Clustering: A Review
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
様々な情報源(4章).
3次元Nクイーン問題の 解の存在の検証 07-1-037-0106 前波 大貴 情報論理工学研究室 宜しくお願いします。
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
4. システムの安定性.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
データ構造とアルゴリズム (第5回) 静岡大学工学部 安藤和敏
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
ETPB: Extraction of Context from Pedestrians' Behavior
原子核物理学 第7講 殻模型.
PROGRAMMING IN HASKELL
メモリ使用量の少ないGCR法の提案 東京大学理学部情報科学科 工藤 誠 東京大学情報基盤センター 黒田 久泰
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
PROGRAMMING IN HASKELL
密行列固有値解法の最近の発展 (I) - Multiple Relatively Robust Representation アルゴリズム - 2004年11月26日 名古屋大学 計算理工学専攻 山本有作 日立製作所の山本有作です。 「~」について発表いたします。
パターン認識特論 カーネル主成分分析 和田俊和.
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
AAMと回帰分析による視線、顔方向同時推定
ランダムプロジェクションを用いた音響モデルの線形変換
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
グラフの帯域幅連続多重彩色 を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室 西川和秀.
空間図形の取り扱いについて.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

行列の圧縮による変化点検出の高速化 IBM東京基礎研究所 井手 剛 | 2006/11/01 | IBIS 2006

変化点とは、データ生成機構にある変化が生じた時点。 変化度とはその変化の度合い。 時系列データ 変化度 変化点検出 ≒ 知識発見 ≒ マイニング 異常検知 評判分析 etc 変化点の現れ方は多様である。 「きめ打ち」は避けたい なるべく無垢な心で変化点を捉えたい | 2006/11/01 | T.Idé | IBIS 2006

特異スペクトル変換法(Singular Spectrum Transformation; SST)は “model-free”な変化点検出手法。「過去」と「今」のパターンを比べる。 各時刻ごとに移動 特徴ベクトル 特徴ベクトル SVD SVD 変化度 V. Moskvina and A. Zhigljavsky, "An algorithm based on singular spectrum analysis for change-point detection", Communications in Statistics—Simulation and Computation, 32(4):319–352, 2003. T.Ide and K.Inoue, "Knowledge Discovery from Heterogeneous Dynamic Systems using Change-Point Correlations", Proc. 2005 SIAM Intl. Conf. Data Mining (SDM 05), April 21-23, 2005, pp.571-576 Moskvina & Zhigljavsky 2003 Ide & Inoue 2005. | 2006/11/01 | T.Idé | IBIS 2006

SSTは計算が遅い! 100×100くらいのSVDを、各時刻でやる必要がある。 time 履歴行列 テスト行列 SVD SVD 左特異ベクトル上位 r 個 ここが最も重い 最大左特異ベクトル 両者の食い違い=変化度 | 2006/11/01 | T.Idé | IBIS 2006

問題: 特異ベクトル同士のカーネル関数を、高速に計算せよ 変化度の定義 ただし μは数値的に簡単に求まる 最大特異ベクトルだけなら、数値的に安定かつ高速に計算可能。 μが与えられたとして、Kをどう求めるか考えたい 生の固有ベクトルを求めずに、Kを評価したい。 | 2006/11/01 | T.Idé | IBIS 2006

ふたつの着眼点: (1) 内積をじかに求めたい、(2) 必要な情報を事前に圧縮したい (1) 知りたいのは内積(=射影)だけだから、あらわに特異ベクトルを計算するのは無駄 特異ベクトルの計算を省略して、内積を直接求めることはできないか? (2) 必要な特異ベクトルの個数は履歴行列の次元よりはるかに小さい。フルSVDをやるのは無駄 特異値の高い特異ベクトルの成分が「濃く」なるように、行列を圧縮はできないか? この二つを同時に満たす行列圧縮手法が、ある! | 2006/11/01 | T.Idé | IBIS 2006

の上位の固有ベクトルを濃縮するような部分空間を作ろう。 μで張られる1次元空間から出発して、次々に基底を付け加えることで、 上位の固有ベクトルを濃く含む空間を構成したい。 だから、Rの最急方向を付け加えればよい! 第1項はすでにあるから、第2項を付加すればOK! | 2006/11/01 | T.Idé | IBIS 2006

μを出発ベクトルとすることで、μと関係する成分だけを抜き出せる。 この論法を続けると、 という k 次元空間は、ρの上位の固有ベクトルの成分を最も濃く含む部分空間であることがわかる。 べき乗法的なノリ Krylov部分空間と呼ばれる しかも、μと関係する成分だけを抜き出していることに対応。 | 2006/11/01 | T.Idé | IBIS 2006

Implicit kernel 近似 ── 元の固有値問題が k×k の問題に帰着され、 しかも内積計算が自動実行される の正規直交基底でρの固有値問題を書き表す k×k の固有値問題に帰着(近似) 高々5×5くらいのサイズ。 固有ベクトル μを第1基底に取っておけば、第1成分がカーネル関数になる(陰なカーネル計算) | 2006/11/01 | T.Idé | IBIS 2006

計算手順まとめ。2種類の特異ベクトル同士の比較は陰になされる。 しかも、面倒なことすべてが、圧縮された空間内で行われる。 time に対する反復法で最大固有値を求める μに無関係な成分は自動的に軽視される。 Krylov部分空間近似で圧縮。 3重対角化行列 T に。 最大固有ベクトル 次のテスト行列における反復法の初期値 出発ベクトル 圧縮された行列 T の固有値分解 変化度 | 2006/11/01 | T.Idé | IBIS 2006

パラメターによっては、計算速度が100倍に。しかも目立った誤差はない。 従来 本手法 | 2006/11/01 | T.Idé | IBIS 2006

まとめ 変化点検出は、知識発見工学の興味深い問題である。 特異スペクトル変換(SST)は、model-freeな変化点検出手法であり、多様な変化点に対応する能力がある。 しかし、とんでもなく遅い。 Implicit kernel近似という新しいアルゴリズムにより、SSTの計算速度を数10倍高速化することに成功した SSTの実用度は格段に増すことになる。 Implicit kernel近似は、SSTのみならず、固有状態への遷移確率の計算などの用途に使える汎用技術である。 | 2006/11/01 | T.Idé | IBIS 2006

FELIX-SST 命名 FEedback impLIcit kernel approXimation-SST Thank you. | 2006/11/01 | T.Idé | IBIS 2006

(参考) いわゆるオンラインSVDじゃだめなのか? Folding-in的仮定に基づくものは軒並み不可。 仮定が成り立たない 「文書をためたDBがあまり時間変化しない」 「行列は疎な高次元行列」 代表的な手法 “folding-in”: t-1での特異ベクトルを使って、tでの特異ベクトルを表す近似的更新算法 Zha-Simon [SIAM J. Sc. Com. 1999]: いわば改良folding-in。応用例多数。 いにしえなSVD諸手法を単に使っても、速度向上には限界がある。 何らかの方法で3重対角化し、QR反復などを使うのが定番 密行列: ハウスホルダー変換 疎行列: ランチョス法 計算量的上限が決まっている。越えられない壁がある。 学習手法ごとに、適切にサボりながらPCA/SVDをやる手法は地味ながらそこそこ関心を集めている 間引く Nyström 法 [Williams-Seeger, NIPS 00] Channubhotla-Jepson [NIPS 04] いろいろなrandomized algorithms 圧縮する Krylov部分空間法 数学的にはいにしえだが、 KDD業界ではあまり知られていない(らしい) | 2006/11/01 | T.Idé | IBIS 2006