Statistical Physics and Singularity Theory

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

Division of Process Control & Process Systems Engineering Department of Chemical Engineering, Kyoto University
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ニューラルネットのモデル選択 村田研究室 4年  1G06Q117-5 園田 翔.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
H25年5月22日(水) 中央水研 「水産資源のデータ解析入門」 Terrapub
ベイズ的ロジスティックモデル に関する研究
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
ニューラルネットは、いつ、なぜ、どのようにして役立つか?
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
NTTコミュニケーション科学基礎研究所 村山 立人
Mathematical Learning Theory
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
物理学者でない人 のための統計力学 東京工業大学 渡辺澄夫 DEX-SMI 1/1/2019.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
P3-12 教師が真の教師のまわりをまわる場合のオンライン学習 三好 誠司(P)(神戸高専) 岡田 真人(東大,理研,さきがけ)
あらまし アンサンブル学習の大きな特徴として,多数決などで生徒を組み合わせることにより,単一の生徒では表現できない入出力関係を実現できることがあげられる.その意味で,教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い.そこで本研究では,教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する.メトロポリス法により汎化誤差を計算した結果,ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること,パーセプトロン学習では
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
Algebraic Geometry of Learning Machines
顧客維持に関するモデル.
【第二講義】1次元非線形写像の不変集合とエントロピー
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
完全2部グラフ型ボルツマンマシンにおける平均場近似自由エネルギーの 漸近的挙動
予測に用いる数学 2004/05/07 ide.
Extractor D3 川原 純.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
ボルツマンマシンの定義 ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
2重井戸型ポテンシャルに捕捉された 冷却原子気体の非平衡初期分布緩和過程に対する非平衡Thermo Field Dynamics
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
教師が真の教師のまわりを まわる場合のオンライン学習
ベイズ音声合成における 事前分布とモデル構造の話者間共有
JNNS-DEX-SMI-玉川 公開講座 「交換モンテカルロ法とその応用」
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
一般ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動
混合ガウスモデル Gaussian Mixture Model GMM
教師がコミティマシンの場合のアンサンブル学習 三好 誠司(神戸高専) 原 一之(都立高専) 岡田 真人(東大,理研,さきがけ)
Presentation transcript:

Statistical Physics and Singularity Theory 広義統計物理学 と特異点論 渡辺澄夫 東京工業大学 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 統計物理学とは・・・ V 興味のない自由度に  ついて和を取る PV =nRT W S=logW P 微視的な方程式 巨視的な量 が従う法則 ハミルトニアン Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 真の分布 と 学習モデル 学習者 x: 見える si sj wij y: 隠れ部分 p(x|w) 真の分布 例 推測 si p(x|w*) wij* sj y: 隠れ部分 x: 見える W W*  W* = {w; p(x|w*)=p(x|w) (∀x) } ⊂ W Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 特異点の問題 p(x|w*) p(x|w) D(w*||w) = ∫p(x|w*) log dx 相対エントロピー W D(w*||w) =0 : 解析的集合 特異点 事後分布も最尤推定量の分布も正規分布には漸近しません。 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 学習の統計力学(1) n 個の例 真: q(x) 学習者 : p(x|w) , 事前 φ(w) Dn={xi} Hn(w) = ∑ log q(xi) p(xi|w) n i=1 ランダム ハミルトニアン 1 E[ Hn(w) ] = D(q||pw) =H(w) W 上の ボルツマン分布 e -n Hn(w) φ(w) dw 1 Z p(w|Dn) dw = Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 学習の統計力学(2) p(x|Dn) = ∫p(x|w) p(w|Dn) dw 予測分布 ∫q(x) log dx q(x) p(x|Dn) マクロ変数 G(n) = E[ ] n G(n) 学習曲線 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 自由エネルギーと経験過程 自由エネルギー F (n) = -E [ log ∫e -n Hn(w) φ(w) dw ] と定義すると G(n) = F(n+1) - F(n) n Hn(w) = n H (w) + {nH(w)}1/2 σn(w) σn(w) →σ(w) H(w)=0が正規交差特異点なら Well-defined : 正規確率過程へ Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 特異点のエントロピー H(w) = D(w*||w) Z(n) = ∫e -nH(w) φ(w) dw 分配関数 v(t) = ∫ δ(t – H(w) )φ(w) dw 状態密度 ラプラス変換 ζ(z) = ∫ H(w)z  φ(w) dw   ゼータ関数 メーリン変換 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 特異点解消定理 H(g(u))=a(u) u1s1 u2s2 ・・・ udsd a(u)>0 正規交差点 H(w) g U locally U0 W W0 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 学習曲線 Neural Computation,13(4),899-933,2001. ある w* ∈ W があって q(x) = p(x|w*) のとき ζ(z) = ∫H(w)zφ(w) dw ゼータ関数  (-λ): ζ(z) の一番大きな極、m:位数 F(n) = λlog n – (m-1)loglog n Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 学習係数 NIPS, 13,329-335,2002 det I(w*)>0, φ(w)>0ならば    λ=d/2 (d: wの次元) (2) det I(w*)=0,φ(w)>0 ならば    λ<< d/2 (3) φ(w): ジェフリーズならば    λ≧ d/2 パラメータ空間 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 統計的正則モデルと特異モデル 正則モデル 正規分布、指数分布、多項式回帰 特異モデル   神経回路網  (Watanabe,2001) 混合正規分布 (Yamazaki&Watanabe,2002)   ベイズネットワーク (Rusakov&Geiger,2002) 縮小ランク回帰 (Watanabe&Watanabe,2002) その他、隠れマルコフモデル、ボルツマンマシンなど Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 真の分布がモデルの外にあるとき Neural Networks, 14(8),1049-1060. 真の分布 n:学習例数 G(n) パラメータ空間 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory もっと詳しく見たい! G(n) ここでは何が起こっているか? n:学習例数 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 相転移点の解析 Watanabe,S.&Amari,S.NIPS,15,to appear. エネルギー 対 エントロピー  関数近似誤差 対 統計的推測誤差 D (特異点|| 真の分布) = c/n モデルの選択・検定 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 特異点 : {(a,b):a=0 or b=0} a=0 b=0 真 具体例 真: q(y|x) = 1 2π exp[ - (y – a* ∑ bj* ej(x) )2 ] 2 n 推測 Kullback = |a*|2|b*|2/n 例題 N j=1 x ∈RN, y ∈R1 a ∈R1 , b ∈RN N j=1 1 2π 1 2 exp[ - (y – a∑ bj ej(x) )2 ] 学習者: p(y|x,a,b) = Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 汎化誤差と学習誤差 G(n) = λ/ 2n + o(1/n) , T(n) = μ/ 2n + o(1/n) , ここで λ= 1 + Eg[ (a*2 b*2+a*b*・g)YN(g)/YN-2(g)] μ = λ–2N+ Eg[ (2a* b*・g+2g2) YN(g)/YN-2(g)] YN(g)=∫0π/2 sinN t exp(-|a*b*+g|2 sin2t /2) dt g ~ N次元の標準正規分布 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 漸近展開 |a*| |b*|→∞ のとき λ(a*,b*) = N - (N-1)(N-3) / |a*|2 |b*|2, μ(a*,b*) = - N + (N-1)2 / |a*|2 |b* |2. N : b の次元 (N-1)(N-3), (N-1)2 : 特異点の指標? Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 対応する正則モデル 真: q(y|x) = 同じ N j=1 1 2π 1 2 exp[ - (y – a∑ bj ej(x) )2 ] 学習者: p(y|x,b) = G(n) = N/2n +o(1/n) 真の場所に依存しない T(n) = - N/2n +o(1/n) Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory モデルと確率分布 Rd/~ Rd 内在的な定義 外在的な定義 W Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 外在的なものの意義 数学 ー 内在的なもの 物理 ー 座標不変 神経回路網の有用性は ある特別な外在的な定義が 実世界では有用であることを 述べているのではないだろうか? Statistical Physics and Singularity Theory

統計的な有効性と 座標不変性は両立するか? 統計的な有効性と    座標不変性は両立するか? 最急降下 途中停止 一般アルゴリズム 微分同相不変 アルゴリズム 双有理不変 アルゴリズム 最尤推定法 ベイズ法 事前分布 最適化 有界ジェフリーズ分布 Statistical Physics and Singularity Theory

Statistical Physics and Singularity Theory 結論 (1) 学習モデルにおける特異点の重要性 (2) 特異点の数学的解析 ー 代数幾何、代数解析 (3) 数理から見た神経回路網の研究の目的とは? Statistical Physics and Singularity Theory