JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」

Slides:

Advertisements

Similar presentations

北海道大学 Hokkaido University 1 情報理論講義資料 2016/06/22 情報エレクトロニクス学科共通科目・２年次・第 1 学期〔必修科目〕講義「情報理論」第 5 回第 3 章情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.

Advertisements

1 小暮研究会２第１章ベイジアンアルゴリズム２値選択ベルヌーイ試行尤度原理同一性交換可能性尤度についてのまとめ環境情報学部３年渡邊洋一.

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

あみだくじ AMIDA-KUJI 井上康博 Statistical analysis on Amida-kuji, Physica A 369(2006)

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

自動映像生成のためのパーティクルフィルタによるボールの追跡 2007 年 3 月 21 日神戸大学大学院自然科学研究科矢野一樹.

コンピュータビジョン特論第８回対象追跡２００６年１１月２２日加藤丈和.

点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上

菊池自由エネルギーに対する CCCPアルゴリズムの拡張

Pattern Recognition and Machine Learning 1.5 決定理論

マルコフ連鎖モンテカルロ法がひらく確率の世界

疫学概論母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

時空間データからのオブジェクトベース知識発見

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

Bias2 - Variance - Noise 分解

ベイズ的ロジスティックモデルに関する研究

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--

制約条件の確率的選択に基づく資源追加削減法の改良三木光範（同志社大工）廣安知之（同志社大工） ○小林繁（同志社大院）

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

ベイジアンネットワーク概説第3章　ベイジアンネットワークモデルの　　　　　数学的基礎 3.5 情報量基準を用いた構造学習岩崎唯史.

【小暮研究会２】「ベイズのアルゴリズム」：序章【１，２：計量経済分析と統計分析】【３：ベイズ定理】

ガウス過程による回帰 Gaussian Process Regression GPR

第６章連立方程式モデルｰ計量経済学ｰ.

Fuzzy c-Means法によるクラスター分析に関する研究

Statistical Physics and Singularity Theory

Bottom-UpとTop-Down アプローチの統合による単眼画像からの人体3次元姿勢推定

正規分布におけるベーテ近似の解析解と数値解東京工業大学総合理工学研究科知能システム科学専攻　渡辺研究室　　　西山　悠，　渡辺澄夫.

決定木とランダムフォレスト和田　俊和.

第9章　混合モデルとEM 修士２年北川直樹.

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

情報理工学系研究科数理情報学専攻数理第四研究室博士三年指導教員：駒木文保准教授鈴木大慈 2008年8月14日

第14章　モデルの結合修士２年山川佳洋.

確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究

独立成分分析５　アルゴリズムの安定性と効率２００７/１０/２４　　　名雪　勲.

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

Introduction to Soft Computing （第11回目）

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

完全２部グラフ型ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動

2009年12月4日 ○ 前田康成（北見工業大学）吉田秀樹（北見工業大学）鈴木正清（北見工業大学）松嶋敏泰（早稲田大学）

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

様々な情報源（４章）.

適応的近傍を持つシミュレーテッドアニーリングの性能

ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部佐々木稔

生物情報ソフトウェア特論（２）たたみ込みとハッシュに基づくマッチング

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

第3章　線形回帰モデル修士1年山田　孝太郎.

ベイズ最適化 Bayesian Optimization BO

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

クロスバリデーションを用いたベイズ基準によるHMM音声合成

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

第9章学習アルゴリズムとベイズ決定側〔3〕最小2乗法とベイズ決定側発表：2003年7月4日時田陽一

HMM音声合成における変分ベイズ法に基づく線形回帰

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

ベイズ音声合成における事前分布とモデル構造の話者間共有

ガウス分布におけるベーテ近似の理論解析東京工業大学総合理工学研究科知能システム科学専攻　渡辺研究室　　　西山　悠，　渡辺澄夫.

実験計画法 Design of Experiments (DoE)

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

Q状態イジング模型を用いた多値画像修復における周辺尤度最大化によるハイパパラメータ推定

確率的フィルタリングを用いたアンサンブル学習の統計力学三好誠司岡田真人神戸高専東大，理研

一般ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」東京工業大学大学院　総合理工学研究科知能システム科学専攻　博士課程2年永田賢二

交換モンテカルロ法とは？マルコフ連鎖モンテカルロ法（MCMC法）のひとつサンプリング期待値計算＜MCMC法の主な目的＞乱数を用いて、確率分布を再現するための一群の手法正規分布など、性質のわかっている分布だけでなく、離散・連続を問わず、　様々な分布に適用できる。汎用性が高い。交換モンテカルロ法は、従来のMCMC法の改良アルゴリズム[Hukushima,96] ＜MCMC法の主な目的＞サンプリング期待値計算確率分布

MCMC法の応用例＜ベイズ統計＞＜統計物理＞：確率モデル：パラメータの事前分布データ　　が与えられたもとでのパラメータ　　の条件付き確率（事後分布）＜統計物理＞ギブス分布・カノニカル分布における期待値計算：エネルギー関数：温度の逆数（逆温度）

Outline マルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

Outline マルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

マルコフ連鎖モンテカルロ法 d次元空間上の点が従う確率分布が与えられているとする。また、点の各成分は連続値をとるものとする。また、点　　の各成分は連続値をとるものとする。　　　１．確率分布　　　　に従う点をサンプリング　　　２．　の関数　　　　の確率分布　　　　についての期待値の計算　　　　

メトロポリス法（例）以下の確率分布に従うサンプル生成２．現在の点から、以下の式で候補を生成する。１．の初期値を設定する。（例）以下の確率分布　　　　に従うサンプル生成２．　現在の点　　　から、以下の式で候補　　を生成する。１．　　の初期値　　　　を設定する。３．　密度の比較により、次の点　　　　を決める。確率　　で確率　　　　で : 平均0の一様乱数、正規乱数など

メトロポリス法（例）以下の確率分布　　　　に従うサンプル生成３．　密度の比較により、次の点　　　　を決める。確率　　で確率　　　　で

メトロポリス法のアルゴリズム＜確率分布に従うサンプリング・アルゴリズム＞１．の初期値を適当に設定する。＜確率分布　　　　に従うサンプリング・アルゴリズム＞１．　　の初期値　　　を適当に設定する。２．現在の点　　　から、以下の式で候補　　　を生成する。３．密度の比較により、次の状態　　　　を決める。４．ステップ２に戻り、繰り返す。 : 平均0の一様乱数、正規乱数など確率　　で確率　　　　で

ステップサイズステップサイズ：候補を選ぶ際の範囲の大きさ（例）以下の２次元の確率分布からのサンプリング・大きすぎると・・・・大きすぎると、ほとんどの候補が採択されなくなる。・小さすぎると・・・・小さすぎると、一回の更新が少ないため、遠くに行きにくい。

ステップサイズ (例) 右の目標分布から1000個のサンプルを生成・実際には、採択される割合が40%～60%程度になるように設定 :２次元の一様分布からランダムに選ぶ。ステップサイズ：0.05 ステップサイズ：0.5 ステップサイズ:5 ・実際には、採択される割合が40%～60%程度になるように設定・要素ごとに更新するのも一つの手。

「メトロポリス法」のまとめ確率的に「候補」を選んで、それを採用するかどうかを、確率的に決定する。目標分布の情報は、密度の比のみしか用いないため、密度さえ計算できれば、どんな分布にも適用できる。規格化されていなくても大丈夫。ステップサイズの設定は、アルゴリズムの効率アップのために、重要。大きすぎず、小さすぎず。要素ごとの更新を考えてもいいかも。

Outline マルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

マルコフ連鎖マルコフ連鎖：直前の点のみに依存して、次の点を決定する。・遷移確率：点から点に移る確率（メトロポリス法の場合）マルコフ連鎖：直前の点　　　　のみに依存して、次の点　　　を決定する。・遷移確率　　　　　　　　：点　　から点　　に移る確率（メトロポリス法の場合） :[-D,D]の範囲の一様分布からランダムに選ぶ。 Case1: Case2: Case3:

マルコフ連鎖の原理＜遷移確率が満たすべき条件＞１．詳細つりあい条件確率分布に従う点がたくさんある状況を考える。＜遷移確率　　　　　　　　が満たすべき条件＞１．詳細つりあい条件確率分布　　　　に従う点がたくさんある状況を考える。それぞれの点を更新（左辺）：　　から　　　に移る個数（右辺）：　　から　　　に移る個数任意の２つの位置での「流入」と「流出」がつりあっている。「確率分布　　　　を不変にする」

マルコフ連鎖の原理＜遷移確率が満たすべき条件＞２．エルゴード性任意の2つの点との間の遷移確率がゼロでないか、＜遷移確率　　　　　　　　が満たすべき条件＞２．エルゴード性任意の2つの点　　と　　の間の遷移確率がゼロでないか、有限個のゼロでない遷移確率の積で表すことができる。・何回かの更新で、どこへでも到達することが可能である。・どんな初期値から始めても唯一の分布に収束する。

メトロポリス法における詳細つりあい条件（先のメトロポリス法の場合） :[-D,D]の範囲の一様乱数１．　　　　　　　　　の場合２．　　　　　　　　　　　の場合

MCMC法のアルゴリズム遷移確率の満たすべき条件は緩くて、一意に決定できない。 MCMC法のアルゴリズムは、たくさん存在する。（例）詳細つりあい条件エルゴード性 MCMC法のアルゴリズムは、たくさん存在する。（例）メトロポリス法メトロポリス・ヘイスティングス法ギブスサンプラー、熱浴法独立サンプラーハミルトニアン・モンテカルロ法

「マルコフ連鎖の原理」のまとめマルコフ連鎖マルコフ連鎖の基本原理直前の状態にのみ依存して、次の状態が決まる系列遷移確率で特徴づけられる。マルコフ連鎖の基本原理詳細つりあい条件任意の２つの位置での「流入」と「流出」がつりあっている。エルゴード性有限回のステップで、任意の２点間を行き来できる。条件は緩く、いろいろなアルゴリズムが存在する。

Outline マルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

ある確率分布に対しては、ものすごく効率が悪くなってしまう。遅い緩和の問題メトロポリス法の基本は、「少し変えて、選ぶかどうかを確率的に決める。」ある確率分布に対しては、ものすごく効率が悪くなってしまう。（例１）密度の高い領域が、いくつもあり、互いに離れている場合（多峰性のある確率分布）・ある領域から、他の領域に到達するには、密度の低い領域を通る必要がある。　　　　⇒サンプリング効率の悪化

遅い緩和の問題（例１）基底状態が一点ではなく、次元を持った集合になっている。（ベイズ学習でみられる問題）基底状態：エネルギー関数　　　　　を最小にする点　　のこと＜一点の例＞＜集合の例＞

拡張アンサンブル法確率分布によっては、サンプリング精度が悪くなり、遷移確率が著しく小さくなる。期待値の評価に影響を与えてしまう。＜実質的なエルゴード性の破れ・遅い緩和の問題＞＜拡張アンサンブル法＞　上記の問題を解決する一群の手法確率分布を拡張したり、混合したものを考える。　　・マルチカノニカル法　　・シミュレーテッド・テンパリング法　　・交換モンテカルロ法　[Hukushima-Nemoto,96]

交換モンテカルロ法のアイデア（温度の導入）・確率分布　　　　に対して、ギブス分布の場合：＜高温状態＞＜低温状態＞・エネルギーの低い点は探せない・大域的に行き渡れる・常にエネルギーの低い点にいる・局所領域に留まりやすいサンプリング中に温度を上げ下げする。＜問題＞　　・温度を上げ下げする過程で、詳細つりあい条件を破ることになるので、　　　目標分布からのサンプリングの保証がなくなる！

交換モンテカルロ法[Hukushima,96] 目標分布：拡張された確率分布　　　　　（　　: 逆温度）＜アルゴリズム＞　　１．（通常の更新）それぞれの確率分布について、状態の更新　　２．隣り合った分布間で、状態の交換を行う。

交換モンテカルロ法の詳細つりあい条件＜詳細つりあい条件＞ <Case1> :小 <Case2> :大

交換の採択確率 1.メトロポリス型交換前必ず交換する。 (1) 交換後交換前確率で交換する。 (2) 交換後 2.熱浴型確率　　で交換する。 (2) 交換後 2.熱浴型（交換後）（交換前）

交換モンテカルロ法のイメージ <メトロポリス法> <交換モンテカルロ法> １．（通常の更新）　　メトロポリス法により、状態の更新２．（状態の交換）　　隣り合った分布間で、状態の交換＜交換の採択確率＞

交換モンテカルロ法の挙動（イメージ）＜前に出した例では・・・＞・低温での点が、高温に移ることで、大域的なサンプリングが可能に。・詳細つりあいを満たしているので、サンプリングの保証つき。

交換モンテカルロ法の実験結果の例右の確率分布から10000個のサンプルを生成メトロポリス法交換モンテカルロ法

ベイズ学習での交換モンテカルロ法＜混合正規分布モデルにおけるベイズ学習＞推定汎化誤差：真の構造と予測結果の相違 <学習データ> 　　1000個の3次元データを生成 <正規分布の数> データ生成: 4個　　学習モデル:　10個　　アルゴリズム汎化誤差 Gibbs　sampler 交換法理論値(上限)

その他の応用例ポリマーの構造推定タンパク質の立体構造推定スピングラス・シミュレーション組み合わせ最適化問題

「交換モンテカルロ法」のまとめ遅い緩和の問題交換モンテカルロ法の原理密度の高い領域が複数存在し、互いに離れている場合エネルギーの基底状態が、次元をもった集合になっている場合交換モンテカルロ法の原理温度パラメータを導入することで、大域的なサンプリングが可能に同時分布の詳細つりあい条件を考える

Outline マルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析

交換法が有効に働くには・・・＜交換が、ある程度の確率で行われている。＞交換が行われないと、通常のメトロポリス法を行っているのと同じ。＜　　　　のヒストグラム＞低温温度パラメータの値によって交換の頻度が決まる。高温＜温度パラメータの設定＞　　・各　　の間隔は？　　・温度パラメータの総数は？

温度パラメータ設定の際の基準例＜平均交換率＞各温度間で、交換が行われた頻度・もし、各温度で定常分布に収束していると、＜平均交換率＞　　　各温度間で、交換が行われた頻度・もし、各温度で定常分布に収束していると、平均交換率は、２つの温度パラメータによって定まる関数。

平均交換率の理論解析＜低温同士での平均交換率＞　　　　がある程度大きい状況：　ある点　　において、最小値　　　　　をもつ関数：　任意の確率分布

平均交換率の理論解析＜交換に関する採択確率＞＜平均交換率＞

メトロポリス型における平均交換率＜定理１＞[Nagata, 2008] 　　　平均交換率　　は、　　　　　　　　において以下の式に収束する。

熱浴型における平均交換率＜定理２＞[Nagata, 2008] 　　　平均交換率　　は、　　　　　　　　において以下の式に収束する。

平均交換率の挙動平均交換率は、　　　　　　　　　　　と　　　の関数平均交換率

平均交換率と温度パラメータ平均交換率は、の関数各温度でが一定ならば、平均交換率は同じ値になる。このとき、温度パラメータの値は、平均交換率は、　　　　　　　　　　　の関数各温度で　　　　　　　　が一定ならば、平均交換率は同じ値になる。このとき、温度パラメータの値は、指数的に区切れば、平均交換率が一定の値になる。

ってなに？「自由エネルギー」・「周辺対数尤度」・「確率的複雑さ」・の値は、主にの性質によって定まる。＜正則なケース＞　　ってなに？「自由エネルギー」・「周辺対数尤度」・「確率的複雑さ」・　　の値は、主に　　　　の性質によって定まる。＜正則なケース＞・任意の　　において　　　　のヘッセ行列が正定値ヘッセ行列：

ってなに？＜特異なケース＞・ヘッセ行列が縮退するが存在する場合右の例では、・特異なケースでのの解析法の極を調べる。　　ってなに？＜特異なケース＞・ヘッセ行列が縮退する　　が存在する場合右の例では、・特異なケースでの　　の解析法　　　　の極を調べる。代数幾何学の手法である特異点解消を行えば求められる。

ベイズ学習でのの性質＜汎化誤差[Watanabe, 2001]＞漸近形：様々な学習モデルにおいて、の値を求める研究がなされている。ベイズ学習での　　の性質＜汎化誤差[Watanabe, 2001]＞：真の構造と予測分布のカルバック距離　　予測の精度を示す尺度の一つ漸近形：様々な学習モデルにおいて、　　の値を求める研究がなされている。＜厳密解＞・ニューラルネットワーク　　　　　　　・縮小ランク回帰モデル・隠れマルコフモデル　　　　　　　　・混合二項分布モデル＜上限値＞・一般混合分布モデル　　　　　　　　・ベイジアンネットワーク・確率文脈自由文法

平均交換率の理論値の検証＜縮小ランク回帰モデル（線形ニューラルネットワーク）のベイズ学習＞パラメータパラメータの次元：学習モデルが　　　　　　　　　　　　　　　　　のとき（真の構造は　　　　　　　）

温度パラメータ設定に関する研究平均交換率を均等にするよう設定関数などの挙動をもとにした繰り返しアルゴリズム最適な平均交換率の値関数　　　　などの挙動をもとにした繰り返しアルゴリズム最適な平均交換率の値 20%～25%くらいが最適らしい。温度の端から端まで動くための時間の最小化

全体のまとめマルコフ連鎖モンテカルロ法交換モンテカルロ法交換モンテカルロ法の設計に関する理論メトロポリス法マルコフ連鎖の原理遅い緩和の問題交換モンテカルロ法の原理交換モンテカルロ法の設計に関する理論温度パラメータの設定平均交換率の理論解析