潜在クラス分析入門山口和範. 内容条件付独立シンプソンのパラドックス対数線形モデルにおける表現局所独立潜在変数モデル Lem 入門.

Slides:

Advertisements

Similar presentations

第６回適合度の検定問題例１サイコロを 60 回振って、各目の出た度数は次の通りであった。目の出方は一様と考えてよいか。サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説：サイコロの目は一様に出る＝＞それぞれの目の出る確率 p.

Advertisements

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

社会調査データの分析社会調査・実習. 分析の手順（１）１１入力データの点検（全部の調査票に目を通す）２２通し番号の入力。必要ならば回答のコード化。３３入力フォーマットの決定４４データ入力（ Excel, エディターなど）

統計学入門２関係を探る方法講義のまとめ. 今日の話変数間の関係を探るクロス集計表の検定：独立性の検定散布図、相関係数講義のまとめとキーワード「統計学入門」後の関連講義・実習社会調査士.

1 調査データ分析 2003/5/27 第６回堀啓造（香川大学経済学部）. 2 課題 (1) 解答（１） Pearson のカイ２乗＝自由度＝ 1 漸近有意確率＝男女とコーヒー・紅茶の好みにおいて連関がない（ χ ２ (1)=0.084,p>0.05 ）。または.

ベイズの定理とベイズ統計学東京工業大学大学院社会理工学研究科前川眞一. 2 Coffe or Tea 珈琲と紅茶のどちらが好きかと聞いた場合、 Star Trek のファンの 60% が紅茶を好む。 Star Wars のファンの 95% が珈琲を好む。ある人が紅茶を好むと分かったとき、その人が.

エクセルと SPSS によるデータ分析の方法社会調査法・実習資料. 仮説の分析に使う代表的なモデル１クロス表２ｔ検定（平均値の差の検定）３相関係数.

統計的仮説検定の手順と用語の説明代表的な統計的仮説検定ー標準正規分布を用いた検定、ｔ分布を用いた検定、無相関検定、カイ二乗検定の説明

寺尾敦青山学院大学社会情報学部 Fisher の直接確率法寺尾　敦青山学院大学社会情報学部

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

第1部一元配置分散分析：１つの条件による母平均の違いの検定第２部： 2つの条件の組み合わせによる二元配置分散分析

統計学１０/25（木）鈴木智也.

Pattern Recognition and Machine Learning 1.5 決定理論

市場調査の手順問題の設定調査方法の決定データ収集方法の決定データ収集の実行データ分析と解釈データ入力データ分析報告書の作成.

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

Bassモデルにおける最尤法を用いたパラメータ推定

白井ゼミ豊田秀樹(2008)『データマイニング入門』 (東京図書)第7章

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

確率･統計Ⅱ 第7回.

質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

第2章確率と確率分布統計学　2006年度.

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

最尤推定によるロジスティック回帰対数尤度関数の最大化.

クロス集計とχ２検定Ｐ．１４４.

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

ベイジアンネットワーク概説第3章　ベイジアンネットワークモデルの　　　　　数学的基礎 3.5 情報量基準を用いた構造学習岩崎唯史.

【小暮研究会２】「ベイズのアルゴリズム」：序章【１，２：計量経済分析と統計分析】【３：ベイズ定理】

土木計画学第６回（１１月９日）調査データの統計処理と分析４担当：榊原　弘之.

analysis of survey data 第３回香川大学経済学部堀啓造

analysis of survey data 第２回堀啓造

Excelによる実験計画法演習小木哲朗.

第13章　系列データ修士 1年村下昇平.

看護研究における統計の活用法 Part １京都府立医科大学　浅野　弘明 2012年11月10日.

第9章　混合モデルとEM 修士２年北川直樹.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

第５章：特徴の評価とベイズ誤り確率５・３：ベイズ誤り確率とは

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

Basic Tools B4 　八田　直樹.

指標の数と信頼性・内容的妥当性指標の数は多いほうがよい.

標本分散の標本分布標本分散の統計量　　　の定義　　　の性質分布表の使い方　　　分布の信頼区間　

数量分析第２回データ解析技法とソフトウェア

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

ベイズ･アプローチによるグラフィカル･テスト理論

パターン認識とニューラルネットワーク栗田多喜夫 2019/4/26 早稲田大学大学院理工学研究科講義.

母分散の検定母分散の比の検定カイ2乗分布の応用

確率と統計2009 第12日目(A).

データの型量的データ質的データ数字で表現されるデータ身長、年収、得点カテゴリで表現されるデータ性別、職種、学歴

「パレスチナ社会の民主主義的価値観」報告のアウトラインはじめに民主主義的価値観仮説とデータ検証１：パレスチナ社会における民主化の

母分散の検定母分散の比の検定カイ2乗分布の応用

「アルゴリズムとプログラム」結果を統計的に正しく判断三学期第7回袖高の生徒ってどうよ調査(3)

クロス表分析補遺。堀　啓造（香川大学経済学部） 2003年5月.

クロス表とχ2検定.

第３日目第４時限の学習目標第１日目第３時限のスライドによる、名義尺度２変数間の連関のカイ２乗統計量についての復習

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

人工知能特論II　第8回二宮　崇.

ベイズ音声合成における事前分布とモデル構造の話者間共有

藤田保健衛生大学医学部公衆衛生学柿崎真沙子

確率と統計2007（最終回）平成20年1月17日(木) 東京工科大学亀田弘之.

数値解析　第6章.

モデルの微分による非線形モデルの解釈明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

潜在クラス分析入門山口和範

内容条件付独立シンプソンのパラドックス対数線形モデルにおける表現局所独立潜在変数モデル Lem 入門

簡単に復習を … クロス集計表における独立性の検定  2 検定独立期待度数 3 元表、多元表集計表の併合併合可能性条件付独立

条件付き分布２つの変数 X, Y があり、 X = x となる場合にのみ Y の分布を考えたとき、その分布を X = x があたえられたときの Y の条件付き分布という

クロス集計表

条件付き分布変数 X X=x 2 が与えられたときの、 Y の条件付き分布

周辺分布

同時分布

独立２つの変数が独立であれば、周辺分布は、いかなる条件付き分布とも同じになる

積事象の確率 P （ AB) = P （ A) P(B|A ） = P （ B) P(A|B) P(A|B) : B の下での A の条件付確率 P(B|A) : A の下での B の条件付確率

事象 A と B が独立 P(AB) = P(A) P(B) P(A|B) = P(A) P(B|A) = P(B)

独立性の検定観測度数と独立期待度数の比較ただし、

p 値の計算と検定結果検定統計量の分布は、自由度 (a-1)(b-1) の  2 分布  2 分布の分布点を求める関数 =CHIDIST(  2, df) p 値を設定された有意水準 ( 通常は 5%) と比較し、 p 値が小さい場合は独立でないと判断する

３元表の分析

ちょっとここで Lem を man 3 dim lab S A B mod {SAB} dat […]

ちょっとここで Lem を man 3 dim lab S A B mod {SAB} dat [ ]

Model の改良１ man 3 dim lab S A B mod {SA SB AB} dat [ ]

Model の改良 2 man 3 dim lab S A B mod {SA SB} dat [ ]

例題データ用のモデル S A B 条件付独立

結果 A と B には連関あり男性のみでの A と B は連関なし女性のみでの A と B は連関なし

グループを併合すると相関が生じる例

相関なし ( 女性のみ )

相関なし（男性のみ）

もし、 S が潜在変数であれば … lat 1 man 2 dim lab S A B mod {SA SB} dat [ ] man 3 dim lab S A B mod {SA SB} dat [ ]

潜在変数モデル S A B 局所独立

併合と分割１５４６４１６１９９０２１０ 34 ９4９分割は？

併合と分割１５４６４１６１９９０２１０ 34 ９4９分割は？独立に近い表に分けることは一意！？

Lem の出力 *** LATENT CLASS OUTPUT *** S 1 S A A B B

同時確率 *** (CONDITIONAL) PROBABILITIES *** * P(SAB) * (0.0334) (0.0502) (0.0058) (0.0240) (0.0493) (0.0269) (0.0281) (0.0398)

条件付確率： Pr(A|S) 、 Pr(B|S) *** LATENT CLASS OUTPUT *** S 1 S A A B B

同時確率と条件付確率 Pr(SAB)=Pr(AB|S)Pr(S) もし、条件付独立 ( 局所独立 ) であれば、 Pr(SAB)=Pr(A|S)Pr(B|S)Pr(S)

Lem の出力 *** LATENT CLASS OUTPUT *** S 1 S A A B B ・・・ Pr(S) ・・・ Pr(A|S) ・・・ Pr(B|S) 注意：観測変数が２つしかないのでモデルの識別可能性はない。あくまで理解のための例題！

EM 体験を Excel で手作業 EM を

EM で計算したこと E-step 完全データを作成これは、尤度が完全データの線形関数なので M-step 完全データから単純集計を ( 局所 ) 独立であるので、クロス集計の必要なし

E-step の計算の中で Pr(S=1|AB) =Pr(S=1,AB)/(Pr(S=1,AB)+Pr(S=2,AB)) Bayes の定理

E-step の計算の中で Pr(S=1|AB) =Pr(S=1,AB)/(Pr(S=1,AB)+Pr(S=2,AB)) 観測されたパターンが各クラスに属する可能性を計算事後確率、帰属確率、ファジークラスタリングの重み

Lem の例題で本格的な LCA を

LCA の定式化

E-step

M-step( 単純集計 )

LCA の実践においてクラス数の決定適合度情報量規準によるモデル選択クラスの解釈反応確率事後的な集計

適合度観測度数 VS 期待度数観測変数すべてのクロス集計表上で … もし、２値型変数が１０個あれば、セルの数は 1024(=2 10 )