Presentation is loading. Please wait.

Presentation is loading. Please wait.

不完全な定点観測から 真の不正ホストの分布が分かるか?

Similar presentations


Presentation on theme: "不完全な定点観測から 真の不正ホストの分布が分かるか?"— Presentation transcript:

1 不完全な定点観測から 真の不正ホストの分布が分かるか?
◎小堀 智弘,菊池 浩明(東海大学) 寺田 真敏(日立製作所)

2 不正パケット:送信元アドレスの分布 どちらの観測値が正しいのか? 218.*.*.* 222.*. *.*

3 モデル 基本定義 条件付確率 P(A|B = b1) 定点センサ a1 a2 観測地b1での分布 P(A|B = b2) B = b1
ワーム P(A) a1 a2 B = b2 発信元 A = a1 観測地b2での分布 a1 a2 B = b3 発信元の真の分布 A = a2 A: 発信元の確率変数 B: 宛先の確率変数

4 定点観測の問題点 ポートスキャンの局所性 センサの非一様性 不完全な観測データ
多くのワームは感染元のサブネットを狙う. 観測データはセンサのアドレスに依存 センサの非一様性 センサの設置アドレスの制約(未使用アドレス). センサはアドレス空間上に偏る 不完全な観測データ 局所性とセンサアドレスの偏りから生じる 観測データの歪み

5 約半分のパケットは観測地から8ビット以内のアドレスから届く
スキャンの局所性[石黒2005] 約半分のパケットは観測地から8ビット以内のアドレスから届く 観測アドレスと発信元アドレス間のビット差(MSBから)

6 本研究の目的 入力:不完全な観測データ 出力:
S = {s1,…,sn}のn台のセンサで観測した 宛先がsiの時の発信元Aの確率分布 P(A|B = si) 出力: 不正パケット発信元の真の分布 P(A) 任意の宛先アドレスbにおける,発信元の観測値 P(A|B = b)

7 従来研究 センサの平均 空間補間 時系列分析 ISDAS定点観測,センサの平均値 センサアドレスの偏りに依存して歪む.国内のみ.
[田村2005] アドレス距離から空間近似モデル IPアドレス間の距離とパケット数は比例? 時系列分析 [Zou2003] カルマンフィルタを用いた予測モデル 時間軸上の近似.

8 新規性 提案方式のアイデア 1. ワームブラックボックス解析 2. ベイズ推定 3. 逐次的学習

9 1. ブラックボックス解析 任意の発信元Aにおける宛先Bの分布 宛先の分布 P(B|A=a1) B = b1 ワーム 感染実験 b1 b2

10 感染実験 実験PC 仮想OSを構築するソフト 感染させたOS 観測期間 – 60[s] ウィルスの入手元 - Pentium4 3.0GHz
- 1.0GB RAM - Windows XP SP2 仮想OSを構築するソフト - VMware 感染させたOS - Windows 2000 SP2 観測期間 – 60[s] ウィルスの入手元 - ベースのOS   仮想OS ログをキャプチャー 10

11 実験結果:宛先の分布 P(B|A=b) W32.Sasser.F (発信元b= )

12 モデル化した宛先分布 宛先分布P(A|B=60) 実際の観測値に近くなるように作った ピークを0.54とした確率分布

13 2. ベイズの定理 宛先分布P(B|A)から,センサアドレスsiにおける発信元分布P(A|B)を推定 宛先分布は 感染実験から既知
事前確率(ワーム分布) は未知

14 3. 逐次的学習 第0次近似 第k次近似 終了条件 P(A)* = P(A)k if P(A)k = P(A)k+1

15 数値例 真の分布 P(AB) 宛先分布 P(B|A) B A 1 2 3 0.2 0.1 0.05 0.15 0.25 B A 1 2 3
B A 1 2 3 0.5 0.3 0.2 0.37 0.7 0.13 0.8 観測値 P(A|B) B A 1 2 3 0.57 0.3 0.13 0.6 0.2 0.8 ←わざと抜いて推定する

16 数値例 P(A)の収束 真の値 0次近似 (センサ平均)

17 実観測値による評価 JPCERT/CC ISDAS 定点観測システム 定常的に不正アクセスを観察 センサ数11台
観測期間2006年5月 (1ヶ月間) 学習: S = {s1,…,s10} 10台 評価: s11 1台 

18 実験結果1: 不正者分布P(A)*

19 実験結果2: 未知観測値 P(A|B=s11)* 1 9

20 考察 誤差の原因 宛先分布P(B|A)が不正確: Aに依存しない一様な分布の仮定に問題 アドレスブロックの粒度: /8のブロックの大きさ

21 結論 不完全な観測データから真の分布を推定する方式を提案した 提案方式の妥当性を,人工的な数値例と実観測データに適用して評価した.
不正ホストの分布 P(A)* 任意のアドレスにおける不正パケットの観測値分布 P(A|B)* 提案方式の妥当性を,人工的な数値例と実観測データに適用して評価した.

22

23 実測値と予測値の散布図 A=61の宛先アドレスの確率

24 SasserFの宛先分布 Frequency IP/8

25 問題点 ウィルスやワームの探索パケットには大きな局所性が存在する

26 実験結果3: 誤差 宛先分布P(A|B=60) A P(B=b)1 P(B=b) 58 0.14 0.11 59 0.05 0.01 61
0.09 222 0.19


Download ppt "不完全な定点観測から 真の不正ホストの分布が分かるか?"

Similar presentations


Ads by Google