Presentation is loading. Please wait.

Presentation is loading. Please wait.

遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部

Similar presentations


Presentation on theme: "遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部"— Presentation transcript:

1 遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
大阪大学 大学院理学研究科        鈴木譲 CISJ2005 於早稲田大学理工学部       2005年11月8日

2 GA 個体( ビットの列) → 正実数(適合度) 世代交代によって、集団に適合度 の高い個体 が含まれるようにする ビット ビット ビット
個体(   ビットの列) → 正実数(適合度) ビット ビット ビット 個体 1 個体 1 個体 1 個体 2 個体 2 個体 2 集団 集団 集団 個体 個体 個体 世代 1 世代 2 世代  世代交代によって、集団に適合度     の高い個体  が含まれるようにする は、十分に大きい (   が小さければ全探索)

3 遺伝的操作 選択: 交叉: 突然変異 に比例する確率で個体 を選択 1点交叉
に比例する確率で個体 を選択 : 個体  の頻度 1 2 3 d 1 2 3 4 1点交叉 a b c 4 a b c d (他に複数点交叉、一様交叉など) a B c d a b c d ( 選択2回 → 交叉1回 → 1個体をランダムに選択 → 突然変異 ) x 回

4 エルゴードな有限マルコフ連鎖 集団内の個体の順序は気にしない (0,0,0,3), (0,0,1,2), (0,0,2,1), (0,0,3,0), (0,1,0,2), (0,1,1,1), (0,1,2,0), (0,2,0,1), (0,2,1,0), (0,3,0,0), (1,0,0,2), (1,0,1,1), (1,0,2,0), (1,1,0,1), (1,1,1,0), (1,2,0,0), (2,0,0,1), (2,0,1,0), (2,1,0,0), (3,0,0,0) :  推移確率行列 有限マルコフ連鎖がエルゴード的: の各成分 > 0 となる有限の   突然変異確率> エルゴード よい解が早く見つかるのなら、交叉、突然変異にこだわることはない

5 ボルツマン分布ありきとしてのGA 最大 最大 交叉なし、突然変異なしであれば、 (温度の逆数が増えていく) 最大 (  の指数時間)

6 なぜGA 交叉なし、突然変異なし エルゴードではない (David Goldberg) GAは、エルゴード性を維持しながら、
GAは進化の過程を模倣しているので、適合性の高い個体だけが生き残る (John Holland) 飛行機が飛ぶことを誰も証明していないが、皆安心して乗っている (David Goldberg) GAは、エルゴード性を維持しながら、 ボルツマン分布を推定しながら、 温度を下げている (Heinz Mulenbein)

7 Estimation of Distribution Algorithms
初期集団をランダムに発生、  世代目の集団に基づいて、  2a.    個中、適合度の高い   個体を選択  2b.   個の個体に基づいて、      を推定  2c.      に基づいて、     世代の   個の個体をランダムに生成 停止条件が満足されない場合、          として、2へ エルゴードな有限マルコフ連鎖 (公理論的なGAの範囲内)

8 BN 確率変数間の条件付独立性を有向グラフで図示
P(C,A,R,E,B) = P(B) P(C|B) P(R|E,B) P(A|R,E,B) P(C|A,R,E,B) Burglary Earthquake Alarm Radio Announcement Call

9 BN P(C,A,R,E,B) = P(B) P(E|B) P(R|E,B) P(A|R,E,B) P(C|A,R,E,B)
確率変数間の条件付独立性を有向グラフで図示 P(C,A,R,E,B) = P(B) P(E|B) P(R|E,B) P(A|R,E,B) P(C|A,R,E,B) Burglary Earthquake Alarm Radio Announcement Call

10 BN 確率変数間の条件付独立性を有向グラフで図示
P(C,A,R,E,B) = P(B) P(E|B) P(R|E,B) P(A|R,E,B) P(C|A,R,E,B) P(C,A,R,E,B) = P(B) P(E) P(R|E) P(A|E,B) P(C|A) Burglary Earthquake Alarm Radio Announcement Call

11 BNの推定との関係 個の例から を推定 個体数 個体長 の集団と みなせる 構造推定も、パラメータ推定も   の指数時間かかる

12 GAにおける平均場近似 各変数を独立 とみなして、 のパラメータ推定のみを行う(相対頻度) の計算量だが、K-L情報量

13 GAにおけるベータ近似 分布     のグラフを         最小の木で近似

14 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

15 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

16 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

17 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

18 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

19 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

20 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

21 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

22 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

23 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

24 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

25 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

26 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

27 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 6 3 4 5 4 3 2 1. がループを持たない
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) 1 2 3 4 1 2 6 3 5 4 4 3 2 1 KKk

28 Chow-Liuアルゴリズム として、 となる を に加えていく ( が最小) 1 2 3 4 1. がループを持たない 2. が最大
1.              がループを持たない 2.              が最大 となる      を    に加えていく (         が最小) KKk

29 ボルツマン分布の因数分解 自明な因数分解 というよりは、 によらない定数個数の変数の因子の積に が大 スキーマ の適合度大
というよりは、   によらない定数個数の変数の因子の積に               が大      スキーマ      の適合度大 スキーマ仮説: GAは、適合度の高いスキーマを学習する情報処理    が大きくなっても、ボルツマン分布の因数分解は同じ(事前に行えるはず)

30 場合1: が加法的に分解可能

31 Running Intersection Property
1. 各               について、                  2.  3.                について、         なる RIPを満たさない

32 Running Intersection Property
RIPを満たす

33 RIPまとめ の非巡回性 ( を頂点とするJunction Tree が存在) RIPが満足されないとき 1. の順序を変える
1.          の順序を変える 2.          の一部をマージする

34 有向グラフ: ベイジアンネットワーク(BN)
場合2: スキーマが無向グラフで表現 有向グラフ: ベイジアンネットワーク(BN) 無向: マルコフネットワーク(MN) 確率変数間の条件付独立性            が無向グラフ            のJunction Tree              各        に対して、     の各クリーク  に対して       となる       が存在            を結ぶ各       に対して、 

35 Junction Tree アルゴリズム に辺を加えて長さ4以上のサイクルを無くす (三角化) を のクリークとし、
  に辺を加えて長さ4以上のサイクルを無くす (三角化)           を   のクリークとし、 以下の2条件を満たす         を   に加える。 3a.      がループを持たない 3b.               が最大 :    の各要素         を         で置き換えた集合

36

37

38

39

40 Junction Tree

41 最適なJTを求める Junction Treeは、各無向グラフに対して、複数個存在 分子の各因数の変数の個数の和を最小にすることは、NP困難

42 まとめ GAは、統計力学的にみると、もっとよくわかる GAは、エルゴードな有限マルコフ連鎖の中で、よいものを選べばよい。
個体長  が十分に大きいので、  の多項式時間で実行せよ。 構造推定 vs 因数分解。因数分解もそれなりに難しい。

43 今後に向けて: GA vs 変分方程式 定数 平均場近似であれば

44 ベーテ近似、菊池近似でも最適化問題は解ける
確率の和=1の制約条件の下で、    に関するラグランジュ未定係数法を解く 問題: GAによる解法と変分方程式の解法で、相互乗り入れはあるのか


Download ppt "遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部"

Similar presentations


Ads by Google