ベイズ推定入門.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

ベイズ推定入門

推定 何かデータがあったときに…

従来の統計学(頻度論) 母数を定数として取り扱う その定数で規定された確率分布からデータの生起確率を算出し、母数の妥当性を議論する データ x 母数 μ 僕は統計に詳しくないので省略 …

ベイズ統計学 母数を確率変数として取り扱う 母数の分布を推定(事後分布) 母数 μ

社会的地位のベイズ推定 事後分布 尤度 事前分布 事後分布1 μ 事前分布 μ 事後分布2 μ 事後分布3 μ 個体A: 事後分布3 μ zT 自身のサイズが閾値を超えている確率 相手1: 相手2: 推定体サイズ z 相手3:

ベイズの定理とは? 条件付き確率 𝑃 𝐵 𝐴 = 𝑃 𝐴∩𝐵 𝑃 𝐴 A 男性 女性 20人 めがね B 50人 計 200人 めがねナシ 80人 A B 条件付き確率 同時確率: AとBがともに起こる確率 𝑃 𝐵 𝐴 = 𝑃 𝐴∩𝐵 𝑃 𝐴 条件付き確率: Aという条件のもとで、Bが起こる確率 200人から一人を選んだ時: = 100 200 = 1 2 男性である確率: 𝑃 𝐴 = 50 200 = 1 4 男性でかつめがねをかけている確率: 𝑃 𝐴∩𝐵 = 50 100 = 1 2 男性であった。その人がめがねをかけている確率: 𝑃 𝐵 𝐴

条件付き確率 𝑃 𝐴 𝐵 = 𝑃 𝐴∩𝐵 𝑃 𝐵 A 男性 女性 先ほどと性別、めがねの順を逆にしてみる 20人 めがね B 50人 計 200人 めがねナシ 80人 A B 条件付き確率 先ほどと性別、めがねの順を逆にしてみる 𝑃 𝐴 𝐵 = 𝑃 𝐴∩𝐵 𝑃 𝐵 200人から一人を選んだ時: = 70 200 = 7 20 めがねをかけている確率: 𝑃 𝐵 = 50 200 = 1 4 めがねをかけていて、かつ男性の確率: 𝑃 𝐴∩𝐵 = 50 70 = 5 7 めがねをかけていた。その人が男性である確率: 𝑃 𝐴 𝐵

ベイズの定理 乗法定理を用いて先ほどの例は 𝑃 𝐴 𝑃 𝐵 𝐴 =𝑃 𝐴∩𝐵 𝑃 𝐵 𝑃 𝐴 𝐵 =𝑃 𝐴∩𝐵 めがね 50人 女性 男性 20人 計 200人 めがねナシ 80人 A B ベイズの定理 乗法定理を用いて先ほどの例は 𝑃 𝐴 𝑃 𝐵 𝐴 =𝑃 𝐴∩𝐵 𝑃 𝐵 𝑃 𝐴 𝐵 =𝑃 𝐴∩𝐵 と書き直せる。 右辺が共通しているので… 𝑃 𝐵 𝑃 𝐴 𝐵 =𝑃 𝐴 𝑃 𝐵 𝐴 より、 𝑃 𝐴 𝐵 = 𝑃 𝐴 𝑃 𝐵 𝐴 𝑃 𝐵 (ベイズの定理)

ベイズの定理の読み替え 𝑃 𝐴 𝐵 = 𝑃 𝐴 𝑃 𝐵 𝐴 𝑃 𝐵 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷 A 男性 女性 20人 めがね 50人 女性 男性 20人 計 200人 めがねナシ 80人 A B 𝑃 𝐴 𝐵 = 𝑃 𝐴 𝑃 𝐵 𝐴 𝑃 𝐵 A: 仮説(Hypothesis) B: データ(Data) と読み替えてみる 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷 (ベイズの基本公式) データがDの時に、仮説Hである確率。

ベイズの展開公式 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷 𝑃 𝐷 =𝑃 𝐷∩ 𝐻 1 +𝑃 𝐷∩ 𝐻 2 +𝑃 𝐷∩ 𝐻 3 +… 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷 仮説(H)にはいろいろある(先の例で言えば男性 or 女性)。仮説が互いに排反なとき、 𝑃 𝐷 =𝑃 𝐷∩ 𝐻 1 +𝑃 𝐷∩ 𝐻 2 +𝑃 𝐷∩ 𝐻 3 +… 例えば、メガネをD、男性をH1、女性をH2とすると、 𝑃 メガネ =𝑃 メガネ∩男性 +𝑃 メガネ∩女性

ベイズの展開公式 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷 を仮説H1に着目して書き直してみると 𝑃 𝐻 1 𝐷 = 𝑃 𝐻 1 𝑃 𝐷 𝐻 1 𝑃 𝐷∩ 𝐻 1 +𝑃 𝐷∩ 𝐻 2 +𝑃 𝐷∩ 𝐻 3 +… = 𝑃 𝐻 1 𝑃 𝐷 𝐻 1 𝑃 𝐻 1 𝑃 𝐷 𝐻 1 +𝑃 𝐻 2 𝑃 𝐷 𝐻 2 +𝑃 𝐻 3 𝑃 𝐷 𝐻 3 +… (ベイズの展開公式) 𝑃 𝐻 1 :事前確率 𝑃 𝐻 1 𝐷 :事後確率 𝑃 𝐷 𝐻 1 : 尤度

ベイズの展開公式 (連続量のとき) 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷∩𝐻 𝑑𝐻 多くの統計的問題では、仮説は連続量をとる(例えば推定したい分布の母数など) ここで仮説Hを連続量だと思うと、離散的だった時の確率Pは確率密度になり、 ベイズの展開公式は以下のようになる: 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷∩𝐻 𝑑𝐻 (ベイズの展開公式: 連続版) 𝑃 𝐻 :事前分布 𝑃 𝐻 𝐷 :事後分布 𝑃 𝐷 𝐻 : 尤度関数 そもそも分母はデータDが得られる確率であったが、ここでは、事後分布についての規格化定数という意味になっている。よって、単に分母をパラメータで表現するのが一般的 ベイズ統計学ではこの公式に基づいて事後分布を得る。

事前確率 (事前分布) 推定統計量に関する事前の期待を取り込むことが できる 事前に情報がない時には「理由不十分の原則」か ら無情報事前分布(一様分布)を与える。

尤度 (likelihood [直訳] 見込み,可能性, ありそうなこと) 仮説がHの時にデータDが得られる(生起する)確率 つまり仮説の尤もらしさ

いかなる統計においても結局、尤度がカギ 𝑃 𝐷 𝐻 これが完全にわかっていれば、現象の生起確率がわかる。 𝑃 𝐷 𝐻 これが完全にわかっていれば、現象の生起確率がわかる。 ふつうはわからないので、モデルを用いる。

自然な共役事前分布とベイズ更新 尤度をかけられても、事後分布と同じ分布族にな る事前分布のこと 𝑃 𝐻 𝐷 = 𝑃 𝐻 𝑃 𝐷 𝐻 𝑃 𝐷∩𝐻 𝑑𝐻 尤度をかけられても、事後分布と同じ分布族にな る事前分布のこと データの分布(尤度) 自然な共役事前分布 二項分布 ベータ分布 正規分布 正規分布 正規分布 逆ガンマ分布 ポアソン分布 ガンマ分布

実践例 ある工場で作られる内容量100gと表示されたチョコレート菓子の内容量xは正規分布に従い、分散は12であることがわかっている。製品を3つ抽出して調べたところ、その内容量は: 99, 101, 103 であった。このとき、この工場で作られる製品の内容量xのに関する平均値μの確率分布を求めよ。 正規分布: 出典: 涌井&涌井2012 図解これならわかる! ベイズ統計学

ある工場で作られる内容量100gと表示されたチョコレート菓子の内容量xは正規分布に従い、分散は12であることがわかっている。製品を3つ抽出して調べたところ、その内容量は: 99, 101, 103 であった。このとき、この工場で作られる製品の内容量xのに関する平均値μの確率分布を求めよ。 尤度 𝑃 𝐷 𝐻 の算出 データは平均がμ、分散が1の正規分布に従うので、尤度 𝑃 𝐷 𝜇 = 1 2𝜋 𝑒 − 99−𝜇 2 2 1 2𝜋 𝑒 − 101−𝜇 2 2 1 2𝜋 𝑒 − 99−𝜇 2 2 ∝ 𝑒 − 101−𝜇 2 2/3 平均値101, 分散1/3の正規分布に比例する。

ある工場で作られる内容量100gと表示されたチョコレート菓子の内容量xは正規分布に従い、分散は12であることがわかっている。製品を3つ抽出して調べたところ、その内容量は: 99, 101, 103 であった。このとき、この工場で作られる製品の内容量xのに関する平均値μの確率分布を求めよ。 事前分布 何も情報がない時には「無情報事前分布」、その場合、事後分布は尤度に比例するので、 事後分布は、 平均値101, 分散1/3の正規分布に比例する。 今回は、「内容量100g」と表示されているので、だいたい100gだろうという期待感を含む。 𝑃 𝜇 = 1 2𝜋 ×2 𝑒 − 𝜇−100 2 2×4 事前分布: 𝑃 𝜇 𝐷 ∝𝑃 𝜇 𝑃 𝐷 𝜇 より、事後分布は平均100.9、 分散4/13の正規分布だと推定される

ベイズ決定(統計的決定理論) ただ一つの推定値を得たいときに用いられる方法

最尤推定とは 尤度の最頻値(モード)を取ってくること

MAP(maximum a posteriori)推定値 事後分布の最頻値(モード)をとってくること。 無情報事前分布(一様分布)を用いた場合、最尤推 定とMAP推定値は一致する。

様々な損失関数(loss function) 絶対損失 (対象、非対称) 平方損失 0-1型単純損失

複雑な生物のプロセスでどのように尤度を与えるの? データや、生物のプロセスから モデルを構築する 共役な分布が存在する確率分布から頑張って解釈

ABC法の範囲においては、ざっくばらんに言うと、要約統計量は 無理な時 Approximate Bayesian Computation (ABC法) 「要約統計量」に近い値を返すパラメータセットの集合を事後分布と捉える事で、近似的に尤度を計算したことにする。 「要約統計量」 データの特性を表現する統計量: ABC法の範囲においては、ざっくばらんに言うと、要約統計量は 何でも良い

出典: wikipedia

動物行動学におけるベイズ意思決定モデル