【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
データ分析入門(12) 第12章 単回帰分析 廣野元久.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
実証分析の手順 経済データ解析 2011年度.
Pattern Recognition and Machine Learning 1.5 決定理論
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
情報の扱いのける 数学的基礎 確率 エントロピー 統計 確率分布 形式言語理論 計算量の理論.
時空間データからのオブジェクトベース知識発見
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
回帰分析.
ベイズ的ロジスティックモデル に関する研究
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
頻度論とベイジアンの比較 慶應義塾大学 SFC 小暮研究会 梶田幸作
補章 時系列モデル入門 ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
データ解析 静岡大学工学部 安藤和敏
第6章 連立方程式モデル ー 計量経済学 ー.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第9章 混合モデルとEM 修士2年 北川直樹.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
予測に用いる数学 2004/05/07 ide.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
部分的最小二乗回帰 Partial Least Squares Regression PLS
ベイズ・アプローチによる グラフィカル・テスト理論
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
不完全な定点観測から 真の不正ホストの分布が分かるか?
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
データ解析 静岡大学工学部 安藤和敏
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析(Regression Analysis)
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
ベイズ音声合成における 事前分布とモデル構造の話者間共有
回帰分析入門 経済データ解析 2011年度.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】 【小暮研究会2】  「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】 【 4(1,1):構成要素(尤度、例:回帰関数)】 総合政策学部3年 高阪亮平

計量経済分析とは 目的: 例: 経済モデルが実際の経済動向と一致しているか? 一致していると仮定したとき、モデルと異なる構造になる確率がいくらか? 例: 消費=Y、収入=C、とした 「C=α+βY」という経済モデルの場合 CやY:観測可能な量、「データ」 αやβ:観測不可能な量、「パラメータ」 経済学の理論に基づいて経済モデルを作成し、統計学の方法によってその実証分析を行う学問 θ=(α、β)となる集合Θが-∞~∞。モデルは任意のθに連動。

計量経済分析 (従来の手法とベイズの違い) 計量経済分析 (従来の手法とベイズの違い) 従来の手法 αやβについて データを用いて「一つの最も正しい値」を求める。 ベイズの手法 データを用いて「その確率分布」を求める。

統計分析 目的 例 計量経済分析との違い 膨大で複雑な数値データを、要約してわかりやすく理解できる形にすること。 平均や標準偏差や傾きや回帰直線の計算 散布図やヒストグラムやカーネル平滑化などの視覚化 計量経済分析との違い 計量経済分析 :データ同士の「関連」の分析を重視 統計分析 :データ「そのもの」の分析を重視

ベイズ定理 ベイジアン計量経済学では、例外なく 以下の定理を基本としている。 条件付確率Bが起こったという条件の下でAが起きる確率は である。 また、     より

ベイズ定理:2つの疑問 解釈の問題と適用範囲の問題 ベイズ定理:2つの疑問 解釈の問題と適用範囲の問題 確率の解釈 ベイズでは、「Aが起きる確率」P(A)を【主観的に】扱う。 つまり、「このデータより、Aという事象はめったに起きることではないが、Bという事象はよく起きます」ということによって、計量経済分析が行える。 ベイズ定理はその考えを操作する。 つまり、P(A)によって主観的に与えられたAについての考えを、P(A|B)によって別の考えAに変わる。 定理の適用範囲 P(A)は多くの人が直感的に理解している可能性のあるもののみ扱う。(つまり、月が生チーズでできている確率はないとする。)

推論のための ベイズ定理の利用法 例:(θ=(α,β)) 推論のための ベイズ定理の利用法 例:(θ=(α,β)) 構造Aでは、C=10+0.9Y (θ1=(10,0.9)):A 構造Bでは、C=Y (θ2=(0,1)):B あなたは、双方の構造は等確率で発生と「とりあえず」仮定(P(A)=P(B)=0.5) そのうえで、どちらか片方が正しいと仮定した上での、そのモデルが正しい確率を測定する。 構造Aのとき、その構造がデータどおりの確率0.1 構造Bのとき、その構造がデータどおりの確率0.6

推論のための ベイズ定理の利用法 このとき、P(E|A)=0.1、P(E|B)=0.6より またベイズ定理より 推論のための ベイズ定理の利用法 このとき、P(E|A)=0.1、P(E|B)=0.6より P(E)=P(E|A)P(A)+P(E|B)P(B)=0.35 またベイズ定理より P(A|E)=1/7 P(B|E)=6/7 となり、BのほうがAより6倍起こりやすいということが、数学的に帰結できる。 (主観による)事前確率P(A)             ↓←(実験や調査による証拠) (修正された)事後確率P(A|E) どのようにして、P(A)による考えAをP(A|B)による考えA’に変えるのか

計量経済モデル の構成要素 データ:y(観測される前は未知、された後は既知の値) パラメータ:θ 計量経済モデル の構成要素 データ:y(観測される前は未知、された後は既知の値) パラメータ:θ 後述の(証拠による)尤度や(主観的な)事前分布によって値が変わるものの、データが観測される前、後において未知の値。 尤度:p(y|θ) パラメータがθによって特定の値をとったとき、データがどのように見えるかについての予測を与える。 事前分布:p(θ) Θのとりうる値についての「考え」を与える。 X、Y:標本空間(Ω)上にある確率変数 周辺密度p(x)とp(y)を持つ同時確率密度をp(x,y)、p(x|y)とp(y|x)を条件付確率密度とする。 尤度と事前分布の両方を満たしているときのみ、計量経済モデル

ベイズ定理の構成要素 右辺の分母P(y)は、θを含んでいないと見ることができるため、θの推定のために無視すると P(θ|y)∝P(y|θ)P(θ) (∝:比例するという意味) つまり、尤度(関数):P(y|θ)と、事前確率(密度関数)P(θ)をかけ合わせて、事後分布P(θ|y)を得ると理解してよい。

ベイズのアルゴリズム モデルを確率分布の集まりとして定式化。 θについての「あなたの考え」から、事前確率を構築する。 : p(θ) データを収集し、ステップ1で設定した分布の集まりに加える。 ベイズの定理から、θについての「新たな考え」を計算する。 モデルを評価する。 : p(θ) : p(y|θ) : p(θ|y)

尤度:p(y|θ) の性質 例えば(回帰モデル) YとCに実際の観測値をあてはめ、βの関数としたものが、【尤度】である。 「C=α+βY」という経済モデルの場合 YとCに実際の観測値をあてはめ、βの関数としたものが、【尤度】である。

尤度:p(y|θ)に関する例:回帰 回帰関数:2つの確率変数の同時分布 変数がXとYならば、yの関数としてE(X|Y=y)、 xの関数としてE(Y|X=x)と表現。 例:両親の身長と子供の身長 両親たちの特定の身長X=xにおける子供たちの平均身長E(Y|X=x)を計算してプロット その関係を1次の式、線形のグラフにしたものが、従来の線形回帰分析

尤度:p(y|θ)に関する例:回帰 経済モデルを単純にc=βyと表現されるとき。 これをcとyについて、平均βyであるランダムな正規分布を与えたときのcの値がわかるようにする。 条件付き分布の精度をτと定義し、cとyが独立でn個のcの値の同時確率分布は、それらに対応するyの値が与えられた上で 1行目右辺は、確率変数の正規密度関数、その値がc、平均がβy、分散が1/τ。確率の積という形で表現。 2行目は掛け算の項を省く。「分布のカーネル」と呼ぶ。

尤度:p(y|θ)とシミュレーション (1)回帰モデルのための乱数生成 「C=βY」という経済モデルの場合 1:データ数n、傾きβ、モデルの条件付分布の精度τの値を選択。 2:n個の個数分10~20までの一様分布を発生させyに代入。 3:正規変量(平均βyi,分散1/τ)のn個の独立した実現値を発生。 > n<-50;beta<-0.9;tau<-1 > y<-runif(n,10,20) > consump<-rnorm(n,beta*y,1/sqrt(tau))

尤度:p(y|θ)とシミュレーション (2)尤度関数のプロット 1:最小二乗推定値bの計算 2:βの値の範囲(点がプロットされる範囲)の選択(手動で試行錯誤) > b<-sum(consump*y)/sum(y*y) > betavalues<-seq(0.86,0.94,length=100)

Rでのプロット プロットするためのコマンド > par(mfrow=c(1,2)) #2箇所ウインドウ > plot(y,consump,xlab="Y",ylab="C") #横軸y、縦軸cとしたデータのプロット > curve(b*x,add=T) #回帰直線c=byを上書き > plot(betavalues,dnorm(betavalues,b, 1/sqrt(tau*sum(y*y))),type="l",xlab="beta",ylab="likelihood") #尤度関数の分布のプロット

Rでのプロット

尤度:p(y|θ)に関する例:時系列

尤度:p(y|θ)に関する例:時系列

尤度:p(y|θ)とシミュレーション (2)自己回帰データの生成とプロット 1:T,ρ,τの値を設定。 2:yの値を入れるための空ベクトル生成。 3:時系列の初期値y1を選択。 4:y2…yTの時系列の値を生成。 > T<-51; rho<-0.9;tau<-1 > y<-rep(0,T) > y[1]<-0 > for(i in 2:n){y[i]<-rho*y[i-1]+rnorm(1,0,1/sqrt(tau))}

Rでのプロット プロットするためのコマンド > r<-sum(y[-1]*y[1:n-1])/sum(y[1:n-1]*y[1:n-1]) #最小二乗値の計算 > rhovalues <- seq(0.4,1.2,length=100) > par(mfrow=c(1,2)) > plot(y, xlab="Time",ylab="Y",type="l",lwd=2) > plot(rhovalues,dnorm(rhovalues,r,1/sqrt(tau*sum(y[-1]*y[-1]))),type="l",xlab="rho",ylab="likelihood")

Rでのプロット