JNNS-DEX-SMI-玉川 公開講座 「交換モンテカルロ法とその応用」

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
あみだくじ AMIDA-KUJI 井上 康博 Statistical analysis on Amida-kuji, Physica A 369(2006)
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
菊池自由エネルギーに対する CCCPアルゴリズムの拡張
Pattern Recognition and Machine Learning 1.5 決定理論
マルコフ連鎖モンテカルロ法がひらく確率の世界
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
Bias2 - Variance - Noise 分解
ベイズ的ロジスティックモデル に関する研究
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 連立方程式モデル ー 計量経済学 ー.
Fuzzy c-Means法による クラスター分析に関する研究
Statistical Physics and Singularity Theory
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
第14章 モデルの結合 修士2年 山川佳洋.
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
Introduction to Soft Computing (第11回目)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
完全2部グラフ型ボルツマンマシンにおける平均場近似自由エネルギーの 漸近的挙動
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
様々な情報源(4章).
適応的近傍を持つ シミュレーテッドアニーリングの性能
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
実験計画法 Design of Experiments (DoE)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
一般ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

JNNS-DEX-SMI-玉川 公開講座 「交換モンテカルロ法とその応用」 東京工業大学大学院 総合理工学研究科 知能システム科学専攻 博士課程2年 永田賢二

交換モンテカルロ法とは? マルコフ連鎖モンテカルロ法(MCMC法)のひとつ サンプリング 期待値計算 <MCMC法の主な目的> 乱数を用いて、確率分布を再現するための一群の手法 正規分布など、性質のわかっている分布だけでなく、離散・連続を問わず、  様々な分布に適用できる。汎用性が高い。 交換モンテカルロ法は、従来のMCMC法の改良アルゴリズム[Hukushima,96] <MCMC法の主な目的> サンプリング 期待値計算 確率分布

MCMC法の応用例 <ベイズ統計> <統計物理> :確率モデル :パラメータの事前分布 データ  が与えられたもとでのパラメータ  の条件付き確率(事後分布) <統計物理> ギブス分布・カノニカル分布における期待値計算 :エネルギー関数 :温度の逆数(逆温度)

Outline マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析

Outline マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析

マルコフ連鎖モンテカルロ法 d次元空間上の点 が従う確率分布 が与えられているとする。 また、点 の各成分は連続値をとるものとする。 また、点  の各成分は連続値をとるものとする。    1.確率分布    に従う点をサンプリング    2. の関数    の確率分布    についての期待値の計算    

メトロポリス法 (例)以下の確率分布 に従うサンプル生成 2. 現在の点 から、以下の式で候補 を生成する。 1. の初期値 を設定する。 (例)以下の確率分布    に従うサンプル生成 2. 現在の点   から、以下の式で候補  を生成する。 1.  の初期値    を設定する。 3. 密度の比較により、次の点    を決める。 確率  で 確率    で : 平均0の一様乱数、正規乱数など

メトロポリス法 (例)以下の確率分布    に従うサンプル生成 3. 密度の比較により、次の点    を決める。 確率  で 確率    で

メトロポリス法のアルゴリズム <確率分布 に従うサンプリング・アルゴリズム> 1. の初期値 を適当に設定する。 <確率分布    に従うサンプリング・アルゴリズム> 1.  の初期値   を適当に設定する。 2.現在の点   から、以下の式で候補   を生成する。 3.密度の比較により、次の状態    を決める。 4.ステップ2に戻り、繰り返す。 : 平均0の一様乱数、正規乱数など 確率  で 確率    で

ステップサイズ ステップサイズ:候補を選ぶ際の範囲の大きさ (例)以下の2次元の確率分布からのサンプリング ・大きすぎると・・・ ・大きすぎると、ほとんどの候補が採択されなくなる。 ・小さすぎると・・・ ・小さすぎると、一回の更新が少ないため、遠くに行きにくい。

ステップサイズ (例) 右の目標分布から1000個のサンプルを生成 ・実際には、採択される割合が40%~60%程度になるように設定 :2次元の一様分布からランダムに選ぶ。 ステップサイズ:0.05 ステップサイズ:0.5 ステップサイズ:5 ・実際には、採択される割合が40%~60%程度になるように設定 ・要素ごとに更新するのも一つの手。

「メトロポリス法」のまとめ 確率的に「候補」を選んで、それを採用するかどうかを、確率的に決定する。 目標分布の情報は、密度の比のみしか用いないため、密度さえ計算できれば、どんな分布にも適用できる。規格化されていなくても大丈夫。 ステップサイズの設定は、アルゴリズムの効率アップのために、重要。大きすぎず、小さすぎず。要素ごとの更新を考えてもいいかも。

Outline マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析

マルコフ連鎖 マルコフ連鎖:直前の点 のみに依存して、次の点 を決定する。 ・遷移確率 : 点 から点 に移る確率 (メトロポリス法の場合) マルコフ連鎖:直前の点    のみに依存して、次の点   を決定する。 ・遷移確率        : 点  から点  に移る確率 (メトロポリス法の場合) :[-D,D]の範囲の一様分布からランダムに選ぶ。 Case1: Case2: Case3:

マルコフ連鎖の原理 <遷移確率 が満たすべき条件> 1.詳細つりあい条件 確率分布 に従う点がたくさんある状況を考える。 <遷移確率        が満たすべき条件> 1.詳細つりあい条件 確率分布    に従う点がたくさんある状況を考える。 それぞれの点を更新 (左辺):  から   に移る個数 (右辺):  から   に移る個数 任意の2つの位置での 「流入」と「流出」がつりあっている。 「確率分布    を不変にする」

マルコフ連鎖の原理 <遷移確率 が満たすべき条件> 2.エルゴード性 任意の2つの点 と の間の遷移確率がゼロでないか、 <遷移確率        が満たすべき条件> 2.エルゴード性 任意の2つの点  と  の間の遷移確率がゼロでないか、 有限個のゼロでない遷移確率の積で表すことができる。 ・何回かの更新で、どこへでも 到達することが可能である。 ・どんな初期値から始めても 唯一の分布に収束する。

メトロポリス法における詳細つりあい条件 (先のメトロポリス法の場合) :[-D,D]の範囲の一様乱数 1.         の場合 2.           の場合

MCMC法のアルゴリズム 遷移確率の満たすべき条件は緩くて、一意に決定できない。 MCMC法のアルゴリズムは、たくさん存在する。 (例) 詳細つりあい条件 エルゴード性 MCMC法のアルゴリズムは、たくさん存在する。 (例) メトロポリス法 メトロポリス・ヘイスティングス法 ギブスサンプラー、熱浴法 独立サンプラー ハミルトニアン・モンテカルロ法

「マルコフ連鎖の原理」のまとめ マルコフ連鎖 マルコフ連鎖の基本原理 直前の状態にのみ依存して、次の状態が決まる系列 遷移確率で特徴づけられる。 マルコフ連鎖の基本原理 詳細つりあい条件 任意の2つの位置での「流入」と「流出」がつりあっている。 エルゴード性 有限回のステップで、任意の2点間を行き来できる。 条件は緩く、いろいろなアルゴリズムが存在する。

Outline マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析

ある確率分布に対しては、ものすごく効率が悪くなってしまう。 遅い緩和の問題 メトロポリス法の基本は、「少し変えて、選ぶかどうかを確率的に決める。」 ある確率分布に対しては、ものすごく効率が悪くなってしまう。 (例1)密度の高い領域が、いくつもあり、互いに離れている場合 (多峰性のある確率分布) ・ある領域から、他の領域に到達するには、 密度の低い領域を通る必要がある。     ⇒サンプリング効率の悪化

遅い緩和の問題 (例1)基底状態が一点ではなく、次元を持った集合になっている。 (ベイズ学習でみられる問題) 基底状態:エネルギー関数     を最小にする点  のこと <一点の例> <集合の例>

拡張アンサンブル法 確率分布によっては、 サンプリング精度が悪くなり、 遷移確率が著しく小さくなる。 期待値の評価に影響を与えてしまう。 <実質的なエルゴード性の破れ・遅い緩和の問題> <拡張アンサンブル法> 上記の問題を解決する一群の手法 確率分布を拡張したり、混合したものを考える。   ・マルチカノニカル法   ・シミュレーテッド・テンパリング法   ・交換モンテカルロ法 [Hukushima-Nemoto,96]

交換モンテカルロ法のアイデア(温度の導入) ・確率分布    に対して、 ギブス分布の場合: <高温状態> <低温状態> ・エネルギーの低い点は探せない ・大域的に行き渡れる ・常にエネルギーの低い点にいる ・局所領域に留まりやすい サンプリング中に 温度を上げ下げする。 <問題>   ・温度を上げ下げする過程で、詳細つりあい条件を破ることになるので、    目標分布からのサンプリングの保証がなくなる!

交換モンテカルロ法[Hukushima,96] 目標分布: 拡張された確率分布      (  : 逆温度) <アルゴリズム>   1.(通常の更新)それぞれの確率分布について、状態の更新   2.隣り合った分布間で、状態の交換を行う。

交換モンテカルロ法の詳細つりあい条件 <詳細つりあい条件> <Case1> :小 <Case2> :大

交換の採択確率 1.メトロポリス型 交換前 必ず交換する。 (1) 交換後 交換前 確率 で交換する。 (2) 交換後 2.熱浴型 確率  で交換する。 (2) 交換後 2.熱浴型 (交換後) (交換前)

交換モンテカルロ法のイメージ <メトロポリス法> <交換モンテカルロ法> 1.(通常の更新)   メトロポリス法により、状態の更新 2.(状態の交換)   隣り合った分布間で、状態の交換 <交換の採択確率>

交換モンテカルロ法の挙動(イメージ) <前に出した例では・・・> ・低温での点が、高温に移ることで、大域的なサンプリングが可能に。 ・詳細つりあいを満たしているので、サンプリングの保証つき。

交換モンテカルロ法の 実験結果の例 右の確率分布から10000個のサンプルを生成 メトロポリス法 交換モンテカルロ法

ベイズ学習での交換モンテカルロ法 <混合正規分布モデルにおけるベイズ学習> 推定 汎化誤差:真の構造と予測結果の相違 <学習データ>   1000個の3次元データを生成 <正規分布の数> データ生成: 4個   学習モデル: 10個   アルゴリズム 汎化誤差 Gibbs sampler 交換法 理論値(上限)

その他の応用例 ポリマーの構造推定 タンパク質の立体構造推定 スピングラス・シミュレーション 組み合わせ最適化問題

「交換モンテカルロ法」のまとめ 遅い緩和の問題 交換モンテカルロ法の原理 密度の高い領域が複数存在し、互いに離れている場合 エネルギーの基底状態が、次元をもった集合になっている場合 交換モンテカルロ法の原理 温度パラメータを導入することで、大域的なサンプリングが可能に 同時分布の詳細つりあい条件を考える

Outline マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析

交換法が有効に働くには・・・ <交換が、ある程度の確率で行われている。> 交換が行われないと、通常のメトロポリス法を行っているのと同じ。 <    のヒストグラム> 低温 温度パラメータの値によって 交換の頻度が決まる。 高温 <温度パラメータの設定>   ・各  の間隔は?   ・温度パラメータの総数は?

温度パラメータ設定の際の基準例 <平均交換率> 各温度間で、交換が行われた頻度 ・もし、各温度で定常分布に収束していると、 <平均交換率>    各温度間で、交換が行われた頻度 ・もし、各温度で定常分布に収束していると、 平均交換率は、2つの温度パラメータによって定まる関数。

平均交換率の理論解析 <低温同士での平均交換率>    がある程度大きい状況 : ある点  において、最小値     をもつ関数 : 任意の確率分布

平均交換率の理論解析 <交換に関する採択確率> <平均交換率>

メトロポリス型における平均交換率 <定理1>[Nagata, 2008]    平均交換率  は、        において以下の式に収束する。

熱浴型における平均交換率 <定理2>[Nagata, 2008]    平均交換率  は、        において以下の式に収束する。

平均交換率の挙動 平均交換率は、           と   の関数 平均交換率

平均交換率と温度パラメータ 平均交換率は、 の関数 各温度で が一定ならば、平均交換率は同じ値になる。 このとき、温度パラメータの値は、 平均交換率は、           の関数 各温度で        が一定ならば、平均交換率は同じ値になる。 このとき、温度パラメータの値は、 指数的に区切れば、平均交換率が一定の値になる。

ってなに? 「自由エネルギー」・「周辺対数尤度」・「確率的複雑さ」 ・ の値は、主に の性質によって定まる。 <正則なケース>   ってなに? 「自由エネルギー」・「周辺対数尤度」・「確率的複雑さ」 ・  の値は、主に    の性質によって定まる。 <正則なケース> ・任意の  において    のヘッセ行列が正定値 ヘッセ行列:

ってなに? <特異なケース> ・ヘッセ行列が縮退する が存在する場合 右の例では、 ・特異なケースでの の解析法 の極を調べる。   ってなに? <特異なケース> ・ヘッセ行列が縮退する  が存在する場合 右の例では、 ・特異なケースでの  の解析法     の極を調べる。 代数幾何学の手法である 特異点解消を行えば求められる。

ベイズ学習での の性質 <汎化誤差[Watanabe, 2001]> 漸近形: 様々な学習モデルにおいて、 の値を求める研究がなされている。 ベイズ学習での  の性質 <汎化誤差[Watanabe, 2001]> :真の構造と予測分布のカルバック距離   予測の精度を示す尺度の一つ 漸近形: 様々な学習モデルにおいて、  の値を求める研究がなされている。 <厳密解> ・ニューラルネットワーク       ・縮小ランク回帰モデル ・隠れマルコフモデル         ・混合二項分布モデル <上限値> ・一般混合分布モデル        ・ベイジアンネットワーク ・確率文脈自由文法

平均交換率の理論値の検証 <縮小ランク回帰モデル(線形ニューラルネットワーク)のベイズ学習> パラメータ パラメータの次元: 学習モデルが                 のとき (真の構造は       )

温度パラメータ設定に関する研究 平均交換率を均等にするよう設定 関数 などの挙動をもとにした繰り返しアルゴリズム 最適な平均交換率の値 関数    などの挙動をもとにした繰り返しアルゴリズム 最適な平均交換率の値 20%~25%くらいが最適らしい。 温度の端から端まで動くための時間の最小化

全体のまとめ マルコフ連鎖モンテカルロ法 交換モンテカルロ法 交換モンテカルロ法の設計に関する理論 メトロポリス法 マルコフ連鎖の原理 遅い緩和の問題 交換モンテカルロ法の原理 交換モンテカルロ法の設計に関する理論 温度パラメータの設定 平均交換率の理論解析