Download presentation
Presentation is loading. Please wait.
1
不完全な定点観測から 真の不正ホストの分布が分かるか?
◎小堀 智弘,菊池 浩明(東海大学) 寺田 真敏(日立製作所)
2
不正パケット:送信元アドレスの分布 どちらの観測値が正しいのか? 218.*.*.* 222.*. *.*
3
モデル 基本定義 条件付確率 P(A|B = b1) 定点センサ a1 a2 観測地b1での分布 P(A|B = b2) B = b1
ワーム P(A) a1 a2 B = b2 発信元 A = a1 観測地b2での分布 a1 a2 B = b3 発信元の真の分布 A = a2 A: 発信元の確率変数 B: 宛先の確率変数
4
定点観測の問題点 ポートスキャンの局所性 センサの非一様性 不完全な観測データ
多くのワームは感染元のサブネットを狙う. 観測データはセンサのアドレスに依存 センサの非一様性 センサの設置アドレスの制約(未使用アドレス). センサはアドレス空間上に偏る 不完全な観測データ 局所性とセンサアドレスの偏りから生じる 観測データの歪み
5
約半分のパケットは観測地から8ビット以内のアドレスから届く
スキャンの局所性[石黒2005] 約半分のパケットは観測地から8ビット以内のアドレスから届く 観測アドレスと発信元アドレス間のビット差(MSBから)
6
本研究の目的 入力:不完全な観測データ 出力:
S = {s1,…,sn}のn台のセンサで観測した 宛先がsiの時の発信元Aの確率分布 P(A|B = si) 出力: 不正パケット発信元の真の分布 P(A) 任意の宛先アドレスbにおける,発信元の観測値 P(A|B = b)
7
従来研究 センサの平均 空間補間 時系列分析 ISDAS定点観測,センサの平均値 センサアドレスの偏りに依存して歪む.国内のみ.
[田村2005] アドレス距離から空間近似モデル IPアドレス間の距離とパケット数は比例? 時系列分析 [Zou2003] カルマンフィルタを用いた予測モデル 時間軸上の近似.
8
新規性 提案方式のアイデア 1. ワームブラックボックス解析 2. ベイズ推定 3. 逐次的学習
9
1. ブラックボックス解析 任意の発信元Aにおける宛先Bの分布 宛先の分布 P(B|A=a1) B = b1 ワーム 感染実験 b1 b2
10
感染実験 実験PC 仮想OSを構築するソフト 感染させたOS 観測期間 – 60[s] ウィルスの入手元 - Pentium4 3.0GHz
- 1.0GB RAM - Windows XP SP2 仮想OSを構築するソフト - VMware 感染させたOS - Windows 2000 SP2 観測期間 – 60[s] ウィルスの入手元 - ベースのOS 仮想OS ログをキャプチャー 10
11
実験結果:宛先の分布 P(B|A=b) W32.Sasser.F (発信元b= )
12
モデル化した宛先分布 宛先分布P(A|B=60) 実際の観測値に近くなるように作った ピークを0.54とした確率分布
13
2. ベイズの定理 宛先分布P(B|A)から,センサアドレスsiにおける発信元分布P(A|B)を推定 宛先分布は 感染実験から既知
事前確率(ワーム分布) は未知
14
3. 逐次的学習 第0次近似 第k次近似 終了条件 P(A)* = P(A)k if P(A)k = P(A)k+1
15
数値例 真の分布 P(AB) 宛先分布 P(B|A) B A 1 2 3 0.2 0.1 0.05 0.15 0.25 B A 1 2 3
B A 1 2 3 0.5 0.3 0.2 0.37 0.7 0.13 0.8 観測値 P(A|B) B A 1 2 3 0.57 0.3 0.13 0.6 0.2 0.8 ←わざと抜いて推定する
16
数値例 P(A)の収束 真の値 0次近似 (センサ平均)
17
実観測値による評価 JPCERT/CC ISDAS 定点観測システム 定常的に不正アクセスを観察 センサ数11台
観測期間2006年5月 (1ヶ月間) 学習: S = {s1,…,s10} 10台 評価: s11 1台
18
実験結果1: 不正者分布P(A)*
19
実験結果2: 未知観測値 P(A|B=s11)* 1 9
20
考察 誤差の原因 宛先分布P(B|A)が不正確: Aに依存しない一様な分布の仮定に問題 アドレスブロックの粒度: /8のブロックの大きさ
21
結論 不完全な観測データから真の分布を推定する方式を提案した 提案方式の妥当性を,人工的な数値例と実観測データに適用して評価した.
不正ホストの分布 P(A)* 任意のアドレスにおける不正パケットの観測値分布 P(A|B)* 提案方式の妥当性を,人工的な数値例と実観測データに適用して評価した.
23
実測値と予測値の散布図 A=61の宛先アドレスの確率
24
SasserFの宛先分布 Frequency IP/8
25
問題点 ウィルスやワームの探索パケットには大きな局所性が存在する
26
実験結果3: 誤差 宛先分布P(A|B=60) A P(B=b)1 P(B=b) 58 0.14 0.11 59 0.05 0.01 61
0.09 … 222 0.19
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.