Presentation is loading. Please wait.

Presentation is loading. Please wait.

教師が真の教師のまわりを まわる場合のオンライン学習

Similar presentations


Presentation on theme: "教師が真の教師のまわりを まわる場合のオンライン学習"— Presentation transcript:

1 教師が真の教師のまわりを まわる場合のオンライン学習
三好 誠司       岡田 真人    神戸市立工業高専  東大, 理研, 科技機構さきがけ

2 背景(1) バッチ学習 オンライン学習 与えられたいくつかの例題を繰り返し使用 すべての例題に正しく答えられる 長い時間が必要
例題を蓄えておくメモリが必要 オンライン学習 一度使った例題は捨ててしまう 過去の例題に必ず正しく答えられるとは限らない 例題を蓄えておくメモリが不要 時間的に変化する教師にも追随

3 背景(2) Teacher Student 学習可能な場合

4 背景(3) 学習不能な場合 (Inoue & Nishimori, Phys. Rev. E, 1997)
Teacher Student 学習不能な場合 (Inoue & Nishimori, Phys. Rev. E, 1997) (Inoue, Nishimori & Kabashima, TANC-97, cond-mat/ , 1997)

5 背景(4) ヘブ学習 パーセプトロン学習 アダトロン学習

6 モデル(1) 真の教師 生徒 動く教師

7 モデル(2) 動く教師の長さ 生徒の長さ

8 モデル(3) 線形パーセプトロン ノイズ

9 モデル(4) 二乗誤差 勾配法 g f

10 汎化誤差 多重ガウス分布 誤差

11 巨視的変数のダイナミクスを記述する連立微分方程式

12 モデル(4) 二乗誤差 勾配法 g f

13 + Bm+1 = Bm + gm xm NRm+1 lBm+1 = NRm lBm + gmvm
Ndt NRm+1 lBm = NRm lBm gmvm NRm+2 lBm = NRm+1 lBm gm+1vm+1 + NRm+Ndt lBm+Ndt = NRm+Ndt-1 lBm+Ndt-1 + gm+Ndt-1vm+Ndt-1 NRm+Ndt lBm+Ndt = NRm lBm + Ndt <gv> N r m+Ndt = N r m + Ndt <gv> N(r+dr) = Nr + Ndt <gv> dr/dt = <gv>

14 巨視的変数のダイナミクスを記述する連立微分方程式

15 サンプル平均

16 巨視的変数のダイナミクスを記述する連立微分方程式

17 巨視的変数の解析解

18 巨視的変数のダイナミクスを記述する連立微分方程式

19 汎化誤差

20 汎化誤差のダイナミクス ηJ=0.3の場合 ηJ=1.2の場合

21 Rとlのダイナミクス ηJ=1.2の場合 ηJ=0.3の場合

22 巨視的変数の解析解

23 定常解析

24 ηJ=1.8 ηJ=0

25 まとめ 真の教師,動く教師,生徒がノイズ有りの線形なパーセプトロンである場合を考え,統計力学的手法により汎化誤差を解析的に求めた.
生徒が動く教師の入出力だけを使用するにもかかわらず,生徒が動く教師よりも賢くなりうるという興味深い結果が明らかになった.


Download ppt "教師が真の教師のまわりを まわる場合のオンライン学習"

Similar presentations


Ads by Google