ニューラルネットは、いつ、なぜ、どのようにして役立つか？

Slides:

Advertisements

Similar presentations

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

Advertisements

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

白井ゼミ豊田秀樹(2008)『データマイニング入門』 (東京図書)。４章

データ解析

ニューラルネットのモデル選択村田研究室　４年　1G06Q117-5　園田　翔.

確率･統計Ⅰ 第11回 i.i.d.の和と大数の法則ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

「Self-Organizing Map 自己組織化マップ」を説明するスライド

Permutationグラフと Distance-Hereditaryグラフの再構築アルゴリズム

多数の疑似システムを用いたシステム同定の統計力学三好誠司岡田真人神戸高専東大，理研

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

情報学習理論最後までご聴講いただきありがとうございました。渡辺澄夫東京工業大学.

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

放射線の計算や測定における統計誤差「平均の誤差」とその応用（1H) 2項分布、ポアソン分布、ガウス分布（1H）最小二乗法（1H）

ベイズ的ロジスティックモデルに関する研究

データ構造とアルゴリズム第二回知能情報学部新田直也.

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

京都大学化学研究所バイオインフォマティクスセンター

計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日　Ⅰ限目.

ベイジアンネットワーク概説第3章　ベイジアンネットワークモデルの　　　　　数学的基礎 3.5 情報量基準を用いた構造学習岩崎唯史.

ガウス過程による回帰 Gaussian Process Regression GPR

第6章　カーネル法修士2年藤井　敬士.

パターン認識とニューラルネットワーク栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.

サポートベクターマシンによるパターン認識

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

Statistical Physics and Singularity Theory

正規分布におけるベーテ近似の解析解と数値解東京工業大学総合理工学研究科知能システム科学専攻　渡辺研究室　　　西山　悠，　渡辺澄夫.

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

Mathematical Learning Theory

教師なしデータ学習データ　X1, X2, …, Xn 　真の情報源テストデータ　X 　.

物理学者でない人のための統計力学東京工業大学　渡辺澄夫 DEX-SMI 1/1/2019.

卒業論文重力波のデータ解析における分散処理の必要性

P3-12 教師が真の教師のまわりをまわる場合のオンライン学習三好誠司(P)（神戸高専）岡田真人（東大，理研，さきがけ）

あらましアンサンブル学習の大きな特徴として，多数決などで生徒を組み合わせることにより，単一の生徒では表現できない入出力関係を実現できることがあげられる．その意味で，教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い．そこで本研究では，教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する．メトロポリス法により汎化誤差を計算した結果，ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること，パーセプトロン学習では

情報理工学系研究科数理情報学専攻数理第四研究室博士三年指導教員：駒木文保准教授鈴木大慈 2008年8月14日

Algebraic Geometry of Learning Machines

最小自乗法.

顧客維持に関するモデル.

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

訓練データとテストデータが異なる分布に従う場合の学習

第7章　疎な解を持つカーネルマシン修士２年山川佳洋.

第3回アルゴリズムと計算量 2019/2/24.

第１２回　　　ディジタル画像（３）ディジタル画像処理(３)

ルンゲクッタ法となる微分方程式の解を数値的に解く方法.

Extractor D3 川原　純.

計測工学 -誤差、演習問題計測工学(第6回) 2009年5月26日　Ⅱ限目.

Additive Combinatrics 7

Data Clustering: A Review

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

ニューラルコンピューティングを理解する 2006/12/12 Graduate School of Media and Governance

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

第3章　線形回帰モデル修士1年山田　孝太郎.

データ解析静岡大学工学部安藤和敏

サポートベクターマシン Support Vector Machine SVM

第5回確率変数の共分散確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

第9章学習アルゴリズムとベイズ決定側〔3〕最小2乗法とベイズ決定側発表：2003年7月4日時田陽一

Max Cut and the Smallest Eigenvalue 論文紹介

人工知能特論II　第8回二宮　崇.

データ解析静岡大学工学部安藤和敏

JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」

情報工学概論 (アルゴリズムとデータ構造)

ガウス分布におけるベーテ近似の理論解析東京工業大学総合理工学研究科知能システム科学専攻　渡辺研究室　　　西山　悠，　渡辺澄夫.

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

計算の理論 II 多テープTuring機械月曜4校時大月美佳平成16年11月29日佐賀大学知能情報システム学科.

一般ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動

Presentation transcript:

ニューラルネットは、いつ、なぜ、どのようにして役立つか？東京工業大学渡辺澄夫 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks ニューラルネット(NN)とは K k=1 f(x,w) = Σ a k σ(bk・x+ck) ◎階層的な構造階層構造は何を引き起こすか？ 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks NNが役立つときどれだけたくさんの関数になりうるか？ (1) 対象がまったく未知であるとき NNは関数空間の中で豊富か？ (2) できる限りよい予測をしたい精度のよい予測ができるか？ NNの予測は高精度か？ ※　学習理論の鉄の掟: (1) と (2) は普通、相反する 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 関数空間の中での豊富さ g(x) が二乗可積分なら g(x) = ∫u(b,c)σ(b・x+c) dbdc 超完全性：　　u(b,c) はユニークには定まらない特定できない 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 関数近似 Barron, A.R.(1993) 　g(x) のフーリエ展開が L1 に属するとき x の次元によらず K k=1 = C K ∫[ g(x)- Σ a k σ(bk・x+ck) ]2 q(x) dx を満たす (a k , bk, ck ) が存在どれだけ早く誤差が消えるか 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 関数近似効率科学的に比較できるニューラルネット C/K 多項式,三角関数 C/K2/N N:xの次元近似誤差 K:パラメータ数 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 学習の問題 q(x) ～ x1,x2,…,xn 学習して夢をかなえる yi = g(xi) + εi εi～ N(0,12) y y = g(x) x 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 学習と予測データから s(x) を作り出すアルゴリズムはいろいろ (x1 ,y1 ) (x2 ,y2 ) (xi ,yi ) s(x) 学習 (xn ,yn ) ∫( g(x) - s(x) )2q(x)dx G(n)=E[ ] 予測誤差 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 予測アルゴリズム n i=1 1 2 E(w) = ∑ (yi – f(xi,w))2 最尤推測 w* = argmin E(w) f(x,w*) 一人で予測ベイズ推測 p(w) ∝ e – E(w) φ(w) ∫f(x,w)p(w)dw みんなで予測 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 予測誤差 NN 最尤法 Open Problem NN ベイズ法 Watanabe(1999) 正則モデル最尤法 Akaike(1974) 正則モデルベイズ法 Schwarz(1978) 予測誤差予測誤差パラメータ数パラメータ数 2018/11/28 Mathematical foundation of neural networks

なぜNNは統計的正則モデルと異なるのか？ K k=1 f(x,w) = Σ a k σ(bk・x+ck) パラメータが特定可能でない f(x, w1) = f(x, w2) ⇒　w1 = w2 が成り立たない中身は不明 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks パラメータ空間 K k=1 入力 X パラメ｜タ w 学習モデル出力Ｙ大きいモデル中間のモデル C B A 小さいモデルパラメータ空間　 W 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks NNの学習理論 K k=1 真の関数　g(x) = Σ a* k σ(b*k・x+c*k) f(x,w) = Σ a k σ(bk・x+ck) H k=1 学習モデル K＜H のときの予測誤差を解明せよ集合 {w; g(x) =f(x,w) } は特異点を持つ解析的集合 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks ベイズ法 Re(z) Im(z) -λ 1 2 H(w) = ∫(g(x)-f(x,w))2 q(x)dx J(z) = ∫ H(w)z φ(w)dw ゼータ関数 G(n) = λ　　　　(m-1) n 　　 n log n 数理の不思議 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks 最尤法,MAP法 n i=1 1 2 E(w) = ∑ (yi – f(xi,w))2　+ α t(w) w* = argmin E(w) 未解決問題 H(w*) = ∫(g(x)-f(x,w*))2 q(x)dx 1 2 予想 ∝ log n n 正則モデルならパラメータ数 2n 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks なぜベイズ法でうまくいくのか？ 1 2 E(w) = ∑ (g(xi) + εi– f(xi,w))2　 H(w) = ∫(g(x)-f(x,w))2 q(x)dx 1 2 　p(w) に従う w は　w* の近く　　にはない w* = argmin E(w) p(w) ∝e – E(w) φ(w) 最尤ベイズ 2018/11/28 Mathematical foundation of neural networks

Mathematical foundation of neural networks まとめニューラルネットは真の分布が未知のとき (2) パラメータが特定不能であることが理由で (3) ベイズ法により高精度な予測ができるので実問題において役立つ 2018/11/28 Mathematical foundation of neural networks