「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

Slides:

Advertisements

Similar presentations

母平均の区間推定ケース２・・・母分散 σ ２が未知の場合母集団（平均 μ 、分散 σ ２）からの N 個の無作為標本から平均値が得られている標本平均は平均 μ 、分散 σ ２／Ｎの正規分布に近似的に従う信頼水準１－ α で区間推定 95 ％信頼水準 α= % 信頼水準.

Advertisements

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

●母集団と標本母集団標本母数母平均、母分散無作為抽出標本データの分析（記述統計学）母集団における状態の推測（推測統計学）

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

確率と統計平成23年12月8日 (徐々に統計へ戻ります).

統計解析第7回第6章離散確率分布.

補章時系列モデル入門ｰ計量経済学ｰ.

ニューラルネットのモデル選択村田研究室　４年　1G06Q117-5　園田　翔.

確率･統計Ⅰ 第11回 i.i.d.の和と大数の法則ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

Pattern Recognition and Machine Learning 1.5 決定理論

「Self-Organizing Map 自己組織化マップ」を説明するスライド

統計解析第9回第9章正規分布、第11章理論分布.

Bassモデルにおける最尤法を用いたパラメータ推定

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

大数の法則平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>

時空間データからのオブジェクトベース知識発見

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

制約条件の確率的選択に基づく資源追加削減法の改良三木光範（同志社大工）廣安知之（同志社大工） ○小林繁（同志社大院）

第３章補足：パラメータが極小値に収束する例

東京工業大学機械制御システム専攻山北昌毅

補章時系列モデル入門ｰ計量経済学ｰ.

ガウス過程による回帰 Gaussian Process Regression GPR

第6章　カーネル法修士2年藤井　敬士.

果物識別マハラノビス距離を求める.

発表日：平成１５年４月２５日担当者：時田陽一担当箇所：第３章誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則

パターン認識とニューラルネットワーク栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.

第６章連立方程式モデルｰ計量経済学ｰ.

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

第9章　混合モデルとEM 修士２年北川直樹.

Mathematical Learning Theory

教師なしデータ学習データ　X1, X2, …, Xn 　真の情報源テストデータ　X 　.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

あらましアンサンブル学習の大きな特徴として，多数決などで生徒を組み合わせることにより，単一の生徒では表現できない入出力関係を実現できることがあげられる．その意味で，教師が生徒のモデル空間内にない場合のアンサンブル学習の解析は非常に興味深い．そこで本研究では，教師がコミティマシンであり生徒が単純パーセプトロンである場合のアンサンブル学習を統計力学的なオンライン学習の枠組みで議論する．メトロポリス法により汎化誤差を計算した結果，ヘブ学習ではすべての生徒は教師中間層の中央に漸近すること，パーセプトロン学習では

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

強化学習を用いたバックギャモンプレイヤーの生成 TD-Gammon

第7章　疎な解を持つカーネルマシン修士２年山川佳洋.

ルンゲクッタ法となる微分方程式の解を数値的に解く方法.

Data Clustering: A Review

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

ボルツマンマシンの定義ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。

パターン認識とニューラルネットワーク栗田多喜夫 2019/4/26 早稲田大学大学院理工学研究科講義.

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

第3章　線形回帰モデル修士1年山田　孝太郎.

ベイズ最適化 Bayesian Optimization BO

経営学研究科 M1年学籍番号 speedster

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

回帰分析（Regression Analysis)

第9章学習アルゴリズムとベイズ決定側〔3〕最小2乗法とベイズ決定側発表：2003年7月4日時田陽一

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

人工知能特論II　第8回二宮　崇.

JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」

誤差逆伝播法によるニューラルネットワーク (BackPropagation Neural Network, BPNN)

わかりやすいパターン認識第３章　誤差評価に基づく学習３．３　誤差逆伝播法.

制約付き非負行列因子分解を用いた音声特徴抽出の検討

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

第3章統計的推定（その2）統計学　2006年度＜修正・補足版＞.

統計現象高嶋　隆一 6/26/2019.

Mathematica Package (BimodalAnalysis.m)

混合ガウスモデル Gaussian Mixture Model GMM

教師がコミティマシンの場合のアンサンブル学習三好誠司（神戸高専）原一之（都立高専）岡田真人（東大，理研，さきがけ）

Presentation transcript:

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習報告者佐々木　稔 2003年8月1日第3章複雑な学習モデル　3.2 競合学習　 3.2.1 確率競合モデル　 3.2.2 混合正規モデルの推論　 3.2.3 混合分布の最急降下法　 3.2.4 確率競合モデルとEMアルゴリズム　 3.2.5 EMアルゴリズム　 3.2.6 ノンパラメトリック学習　 3.2.7 自己組織化写像

一般的なモデルでのEMアルゴリズム確率モデル p(x, u | w) 競合的な確率変数 U は観測されない観測データ x1, x2, ･･･, xn 最適な分布となるパラメータを学習する

EMアルゴリズムの概略図山の形（分散）は同じで中心（分布の平均）が最適な場所に移動学習データ中心の初期値からに中心移動が繰り返される

w を固定したとき、u の関数 f(u) の平均損失関数損失関数を最小にするパラメータを見つける w を固定したとき、u の関数 f(u) の平均 u は 0 と 1 だけとるので、

EMアルゴリズム w1 を初期化 w1 を固定して G(w1, w2) が最小となるように w2 を定める。（Eステップ）

w2 における損失関数

右辺第2項はカルバックの擬距離 G*(w1, w2) は、「w2 が Ln(w2) を最小にし、かつ w1=w2」のとき最小で、最小値は「nLn(w2) の最小値」と等しい

w1 を固定し、G(w1, w2) を最小にする w2 を見つける最小値 w2 には関係ない定数 G*(w1, w2) の値は減少する

w1 に w2 を代入する w1、w2 が同じ値なので、擬距離は 0 G*(w1, w2) の値は、最適化したい損失関数 nLn(w2) に等しくなる Ln(w2) を小さくするパラメータ w2 が見つかる

［注２７］局所解に落ちた場合その局所解に収束してしまうかどうか繰り返しで局所解から脱出するのかどうか詳しい動作はまだ明らかになっていない「だいたいよい推定量」を探すことも多い理論的にも実用的にも重要な問題

確率競合モデルのEMアルゴリズムパラメータ w : 確率変数 X, U ここで、パラメータ bh での確率分布 q(x | bh)

固定したパラメータ w1 = w = (ah, bh), bh = (ξh, σh) w に固定したときの uh の平均 Ei(h) u の平均値 Ei(h) をすべての xi に関して和を求める

Gn(w, w) が最小となる w を求める（係数）（正規分布の平均）（正規分布の分散）

［注２８］与えられたデータをいくつかのクラスタに分類 K-means 法データ {xi ∈ RM; i = 1, 2, ･･･, n} データを H 個のクラスタに分類するクラスタ Ch の重心 ξh データ xi を距離 || xi – ξh|| が最小になるクラスタ Ch に分類し、重心 ξh を再計算クラスタの重心 {ξh} を繰返し求めて最適化

［注２８］の続き EMアルゴリズムを使う場合の注意クラスタの大きさに偏りがある場合、偏りを緩和させる必要クラスタの個数 H を最適化する際、情報量規準を使うことはできない損失関数の2次近似をすることができない比較的大きめな H を決めて、EMアルゴリズムを少ない回数で停止させるとクラスタの偏りが緩和

例４６確率競合型モデルと3層パーセプトロンの比較 10人が描いた 8×8 ピクセルの ○、△、× の画像 600 例を学習同じく10人が描いた 8×8 ピクセルの画像 600 例をテストに用いる確率競合型モデル K-means法で初期化したパラメータを最急降下法で学習 3層パーセプトロン誤差逆伝播法で学習

中間ユニット数 20 までの場合の認識率確率競合型モデル 96～98.5％ 3層パーセプトロン 98～98.5％中間ユニット数 20 までの場合の認識率確率競合型モデル 98.5～99％ 3層パーセプトロン 98～98.5％