確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研
確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専　　　　東大，理研

あらまし確率的フィルタリングを用いたアンサンブル学習がMurataによって提案されている．このアルゴリズムは生徒集団の多様性を維持するために，わざと間違った例題（負例）も用いる点が特徴的である．我々は統計力学的手法を用いてこのアルゴリズムの解析を行った．非単調な出力特性を有する教師を単純パーセプトロンの生徒集団がヘブ則で学習するモデルについて解析した結果，確率的フィルタリングの効果により生徒集団の多様性が維持され，汎化能力が大きく改善されることが明らかになった．また，次元Nが有限の場合には負例を用いる確率が0.5より大きいと生徒の対称性の破れが生じることがわかった．

背景 (1/2) バッチ学習オンライン学習与えられたいくつかの例題を繰り返し使用すべての例題に正しく答えられる長い時間が必要
背　景　(1/2) バッチ学習与えられたいくつかの例題を繰り返し使用すべての例題に正しく答えられる長い時間が必要例題を蓄えておくメモリが必要オンライン学習一度使った例題は捨ててしまう過去の例題に必ず正しく答えられるとは限らない例題を蓄えておくメモリが不要時間的に変化する教師にも追随

背景（2/2）目的オンライン学習の枠組みで統計力学的手法を用いた解析を行い，確率的フィルタリングの効果を理論的に明らかにする
背　景　（2/2）アンサンブル学習精度の低いルールや学習機械を組み合わせて精度の高い予測や分類を行う生徒集団の多様性を維持することが重要確率的フィルタリングを用いたアンサンブル学習（Murata, 2005) Schapireのアルゴリズムをオンライン学習に適した形に修正生徒集団の多様性を維持するために，わざと間違った例題（負例）も用いる点が特徴的目　的オンライン学習の枠組みで統計力学的手法を用いた解析を行い，確率的フィルタリングの効果を理論的に明らかにする

モデル（1/2） Teacher Students B J1 J2 J3 教師は非単調な出力特性生徒集団の出力は３人の多数決で決定

モデル（2/2）入力:　教師: 生徒の初期値:　 N→∞ （熱力学的極限）巨視的変数生徒の長さ類似度（方向余弦）

確率的フィルタリング(Murata, 2005) ←負例

■確率的フィルタリングは以下の更新式で書ける（J1の場合）
J2とJ3 の答が同じ場合 J2とJ3 の答が異なる場合正例負例（ステップ関数）（正例を使う確率） ■統計力学的な取り扱いを容易にするためにstep2は以下とする（３個の生徒が順番に更新）

統計的学習理論の目的のひとつは汎化誤差を理論的に計算することである
まず誤差を定義汎化誤差多重ガウス分布

巨視的変数のダイナミクスを記述する連立微分方程式を熱力学的極限における自己平均性に基づいて決定論的な形で導出
１．解析を容易にするため補助的巨視的変数を導入２．の両辺にBをかける３． Nr1m+1 = Nr1m [θ(-u2mu3m)f1m + θ(-u2mu3m)(smf1m +(1-sm)g1m)]vm Nr1m+2 = Nr1m [θ(-u2m+1u3m+1)f1m+1 + θ(-u2m+1u3m+1)(sm+1f1m+1 +(1-sm+1)g1m+1)]vm+1 Ndt inputs + Nr1m+Ndt = Nr1m+Ndt-1 + [θ(-u2m+Ndt-1u3m+Ndt-1)f1m+Ndt-1 + θ(-u2m+Ndt-1u3m+Ndt-1)(sm+Ndt-1f1m+Ndt-1 +(1-sm+Ndt-1)g1m+Ndt-1)]vm+Ndt-1 Nr1m+Ndt = Nr1m + Ndt<θ(-u2u3)f1 v + θ(-u2u3)(sf1 v+(1-s)g1v)]>/3 r1+dr1= r1 + dt<θ(-u2u3)f1 v + θ(-u2u3)(bf1 v+(1-b)g1v)]>/3

３個の巨視的変数 l,R,q のダイナミクスを記述する連立微分方程式

ヘブ学習の場合

汎化誤差の計算手順微分方程式を数値的に解いてl,R,qのダイナミクスを計算．その際，サンプル平均<・>はメトロポリス法で算出

汎化誤差のダイナミクス (a=0.6) 確率的フィルタリングには効果がある！
→正解ばかり使うより，わざと間違った答も使うことで汎化能力が向上！ →おもしろい!! 理論と計算機シミュレーションが不一致

Rのダイナミクス途中で生徒の対称性が破れ，以後は理論と計算機シミュレーションが不一致

qのダイナミクス途中で生徒の対称性が破れ，以後は理論と計算機シミュレーションが不一致

l のダイナミクス途中で生徒の対称性が破れ，以後は理論と計算機シミュレーションが不一致

Rとqの関係負例を使う確率(=1-b)が大きくなるほどRに対してqが小さく抑えられている →生徒集団の多様性が維持されている t=0

b<0.5の計算機シミュレーションで生徒の対称性が破れる理由
例として，R1～1， R2～1 ， R3～-1の場合を考える． J1やJ2 の更新の際にはH(x)=0となり通常のヘブ則になるのでR1 とR2 はさらに1に近づいてゆく． J3 の更新を行う場合にはH(x)=±2となりcoinが振られる．b<0.5だと平均的には「負例を使った学習」となるのでR3 はさらに-1 に近づいてゆく．このようにb<0.5 の場合はR1＝ R2＝１， R3＝-1 は安定平衡点．よってb<0.5 の場合の計算機シミュレーションでは次元Nが有限であることによる生徒の対称性の微小な破れが徐々に拡大し，この安定平衡点に至る．

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

Similar presentations

Presentation on theme: "確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大， 理 研

Similar presentations

Presentation on theme: "確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大， 理 研"— Presentation transcript:

Similar presentations

About project

フィードバック

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

Presentation on theme: "確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研"— Presentation transcript: