統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像

Slides:



Advertisements
Similar presentations
北海道大学 Hokkaido University 1 情報理論 講義資料 2016/06/22 情報エレクトロニクス学科共通科目・2年次・第 1 学期〔必修 科目〕 講義「情報理論」第 5 回 第 3 章 情報源のモデル [ 後半 ] 3.5 情報源のエントロピー.
Advertisements

PRML読書会第11回 8.4 グラフィカルモデルによる推論 SUHARA YOSHIHIKO (id:sleepy_yoshi)
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
プログラミング 平成24年1月11日 森田 彦.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
    有限幾何学        第8回.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
白井ゼミ 豊田秀樹(2008)『データマイニング入門』 (東京図書)第7章
第8章 グラフィカルモデル 修士2年 浦田 淳司.
ベイジアンネットワーク概説 第5章 ベイジアンネットワークの応用 5.1 ベイジアンネットワークのソフトウェア BayoNet
コンピュータリテラシ (1) 学習目標(到達目標) ・計算機実習室を正しく利用できる。 ・文書作成ソフトの利用方法を学び、報告作成が
情報数理Ⅱ 平成27年9月30日 森田 彦.
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
計算の理論 I -講義について+αー 月曜3校時 大月美佳.
2010年度 コンピュータリテラシー クラス:  B1 講義日: 前学期 月曜日7時限.
ベイジアンネットワーク概説 3.6 構造の探索アルゴリズム
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Practice (2014年4月)
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
地域社会論 第1回その1 授業の概要 10月2日.
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Practice (2012年4月)
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
ネットワーク上での社会的効用と個人的効用の対立問題に対するアルゴリズム的研究
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Practice (2013年4月)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
予測に用いる数学 2004/05/07 ide.
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
(昨年度のオープンコースウェア) 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
千葉大学とJSPS北京研究連絡センターとの共同シンポジウム
知能情報システム特論 Introduction
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Practice (2015年4月)
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
第4章 データ構造 p.82 [誤] ハミルトニアン経路問題  [正] ハミルトン閉路問題 p.82,83 [誤] セールスパーソン問題
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Part 4 (2015年4月)
シミュレーション論 Ⅱ 第1回.
確率的画像処理アルゴリズム入門 東北大学 大学院情報科学研究科 田中 和之
確率の生み出す新しい情報処理技術 東北大学 大学院情報科学研究科 田中 和之
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Part 5 (2012年4月)
第14回 前半:ラムダ計算(演習付) 後半:小テスト
人工知能特論II 第8回 二宮 崇.
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
計算の理論 I -講義について+αー 月曜3校時 大月美佳 平成31年5月18日 佐賀大学理工学部知能情報システム学科.
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの 数学的基礎 3.1 ベイジアンネットワークモデルの概要
情報数理Ⅱ 平成28年9月21日 森田 彦.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Part 5 (2013年4月)
計算の理論 I -講義について+αー 火曜3校時 大月美佳 平成31年8月23日 佐賀大学理工学部知能情報システム学科.
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Part 4 (2012年4月)
電気・通信・電子・情報工学実験D 確率的情報処理の基礎技術 Practice (2019年4月)
インターネットプロトコル実習 第1回:ガイダンス
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像 鈴木譲 2017年4月10日

ロードマップ 自己紹介, 講義の進め方 (20分) 本日の講義 (45分) 証明(10分) 演習問題(5分)

鈴木譲 (基礎工学研究科 システム創生 数理科学領域 統計数理講座 教授) 鈴木譲 (基礎工学研究科 システム創生 数理科学領域 統計数理講座 教授) 確率的グラフィカルモデル 機械学習 情報理論 1994年4月から、 2017年3月まで の23年間、 理学研究科数学専攻

講義のスケジュール 5/8(月)は、公務出張のため、休講。 日時 内容 キーワード 4/10, 4/17, 4/24 (最初の3回) 確率的グラフィカルモデルによる 表現 DAG, 無向グラフ Bayesianネット, Markovネット 5/15, 5/22,5/29, 6/5, 6/12,6/19, 6/26, 7/3 (8回) 確率的グラフィカルモデルにおける 機械学習 データ圧縮と機械学習 相互情報量の推定と独立性検定 事後確率最大のBNの構造学習 事後確率最大の森の学習 分枝限定法による計算量の削減 連続量を含む場合の適用 情報量基準の適用と、モデル選択の誤り率 ゲノム解析への適用 7/10, 7/17, 7/24 (最後の3回) 確率推論 Belief Propagation NP完全性の証明 統計力学との関連 (予備) 5/8(月)は、公務出張のため、休講。

ゲノム解析への応用 1000遺伝子の発現量と case/controlの変量 青: 遺伝子発現量 赤: SNP

学習と推論の関係 確率としてモデル化された知識の学習と推論

単位を取得するには 出席点 (毎回1点) 課題提出 (1問2点、毎回4問以上、合計50問以上) 60点以上で合格としているが、結果的に単位取得者の殆どは100点になっている 演習問題は、ビデオでヒントを詳しく(解答に限りなく近い)を言うので、 (阪大生なら) 難しくて提出できないことは絶対ない

数学(高校数学程度)には向かって行って欲しい 身につけて欲しいスキル、態度 機械学習、確率論理の知識だけではなく、その見方、考え方 自分の持っている知識を最大限に活用し、ないものは積極的 に学んでいく態度 数学的な論理展開力で、ものごとの真偽を見極める態度 数理科学、社会数理、数学ではない人も、 数学(高校数学程度)には向かって行って欲しい

Rパッケージ BNSL (Bayesian Network Structure Learning) 2017年3月5日公開 鈴木譲 (阪大) 川原純(NAIST) 提案アルゴリズムの他、 ベイジアンネットワークの自動生成など

Foundations of Probabilistic Graphical Models (Springer) 「既存のテキストの 問題点を改善する」 ということで、 Springerと契約した 1. Introduction; 2. Graphical Models; 3. Probabilistic Graphical Models; 4. Learning Bayesian Networks; 5. Learning Markov Networks; 6. Model selection with Information Criteria; 7.Probabilistic Inference with Graphical Models.

記法その他 特に、今回は、各確率変数が離散の値を取るものとして、議論を進める (一般化は可能だが、理解に時間を要する)

事象の独立性、条件付独立性

確率的グラフィカルモデル 確率変数間の(複数の)条件付き独立性をあらわすグラフ 有向非巡回グラフ(DAG): Bayesianネットワーク 無向グラフ: Markovネットワーク 無向グラフ DAG Bayesian ネットワーク Markov ネットワーク

(条件付き)因数分解をDAGであらわしたもの Bayesianネットワーク (BN) (条件付き)因数分解をDAGであらわしたもの 矢印が同じ方向 に向かっている 結ばれない 衝突

p頂点のDAGの個数 P=3の場合、各辺をどちらの方向にするか結ばないかで27通り ただし、ループになる(時計回り、反時計回り)場合(2通り)を除く

3変数の分布の因数分解

3変数のBN 講義では、p=3だけでなく、一般のp変数のBNを考えていく

極大 クリーク 2 極大 クリーク 1 Y X W Z

Y 極大 クリーク X Z

極大 クリーク 4 極大 クリーク 1 Y X W 極大 クリーク 2 Z 極大 クリーク 3

マルコフネットワーク

Bayesianネットワークも、Markovネットワークも 変数間の条件付き独立性を表現

Bayesianネットワークで表現できるが Markovネットワークでは表現できない 矢印の向きを除いても、同じにはならない =/= == は成立しない 衝突を含むBNは、MNで表現できない

Markovネットワークで表現できるが Bayesianネットワークでは表現できない 矢印の向きを除いても、同じにはならない 長さ4以上の弧を含むMNは、BNでは表現できない Y Y Y X W X X W W Z Z Z

条件付き独立性に関する性質

まとめ この講義の進め方(ガイダンス) 独立性、条件付き独立性の定義 Bayesianネットワーク、Markovネットワークの定義 条件付独立性で成立する一般的な性質