停止ストリームの検知(2)
前回までのあらすじ 研究の概要 停止ストリームの検知方法 使用するプログラムの大まかな動き グラフの説明 研究の進み具合 今回の内容
プログラムについて ① トラヒックデータをグループ化。 ② そのグループで平均を求める。 ③ その平均を元に不偏分散を求める。 ④ 全体の不偏分散との商を求める。
X X グループ化と平均 同様に = 変数m個ごとにデータを分け、平均を計算する。 X X X ・・・・ X X X ・・・・ X ・・ 1 2 3 m m+1 m+2 2m X X X ・・・・ X 1 2 3 m 同様に m X (m) X (m) = 1 2
不偏分散 STEP1:データの平均を計算する。 STEP2:各データと求めた平均の差を求める。 STEP3:その差の2乗の値を足していく。
不偏分散 V = {( ) + ( ) ・ ・ ・ ・ ( ) } V = {( ) + ( ) ・ ・ ・ ・ ( ) } あるデータの集合X{ }として、 平均をxとすると、不偏分散Vは以下の式となる。 V = {( ) + ( ) ・ ・ ・ ・ ( ) } 変数mずつグループ化したデータの不偏分散V は V = {( ) + ( ) ・ ・ ・ ・ ( ) } x x x ・ ・ ・ ・ 1 , 2 , n 1 2 2 2 x - x x - x x - x n - 1 1 2 n (m) 1 2 2 2 (m) x - x (m) x - x (m) x - x (m) [n / m]-1 1 2 n / m
自己相似性 同じ形のものが、同じ図形に複数存在する。
トラヒックの自己相似性 x x m i ( i ) msec msec 1 2 3 1 2 3 そこで、ハースト指数(H)を使用する!!
ハースト指数とは? V = {( ) + ( ) ・ ・ ・ ・ ( ) } X = 0 < H < 1 H:ハースト指数 V = V となるような変数のこと。 V = {( ) + ( ) ・ ・ ・ ・ ( ) } X = 0 < H < 1 H:ハースト指数 (m) H 1 (m) 2 2 2 x - x (m) x - x (m) x - x (m) H [n / m]-1 1(H) H 2(H) H n / m (H) H X + X + X ・・・・ X (m) 1 2 3 m m H 1(H)
関係式 X = × V = {( ) + ( ) ・ ・ ・ ・ ( ) } = C V をCに置き換えて、V を使って V を求めると、 X + X + X ・・・・ X X = × をCに置き換えて、V を使って V を求めると、 V = {( ) + ( ) ・ ・ ・ ・ ( ) } = C V (m) m H 1 2 3 m 1 m H m m H (m) (m) m H 2 (m) C 2 2 2 x - x (m) x - x (m) x - x (m) 1(H) H 2(H) H n / m (H) H [n / m]-1 2 (m) H
V / V = m 関係式 V = m V となります。 Cを = m に戻し、V = Vとすると (m) 2H -2 m m (m) H
グラフについて 関係式の対数をとってグラフにする。 log ( V / V )= (2H – 2)log m (m) 10 10
現在までの研究の進み具合 プログラムを少しいじる。
今後の研究について グラフの相関性の検証 順調に進めば実際のデータで!
参考文献 IT用語辞典 e-Words http://e-words.jp/ 種田先生との講義ノート
ご清聴ありがとうございました