寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

Maximal likelihood 法に基づく Matched filter について 田越秀行(阪大理) LCGT コヒーレンス解析 WG 修正 Ref: Finn, PRD63, (2001) Pai, Dhurandhar, Bose, PRD64,
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
logistic regression をしたい場合の STATISTICA2000のアプリケーションの使い方について
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
寺尾 敦 青山学院大学社会情報学部 R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部
カイ二乗(X2) とFisherの検定/化審法 動物数:5 vs. 5, 7 vs. 7 or 12 vs. 12を考える
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
相関係数 植物生態学研究室木村 一也.
Microsoft Excel 2010 を利用した 2項分布の確率計算
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
統計学の授業でのセカンド モニタとしてのiPhoneの使用
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
ベイズ的ロジスティックモデル に関する研究
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
計算値が表の値より小さいので「異なるとは言えない」。
寺尾 敦 青山学院大学社会情報学部 社会統計 第4回:分割表の分析(第4章) 寺尾 敦 青山学院大学社会情報学部
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
統計学の授業でのセカンド モニタとしてのiPhoneの使用
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
Excel 2016 のピボットテーブルを用いた度数分布表とヒストグラムの作成
analysis of survey data 第2回 堀 啓造
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
応用数理工学特論 期末発表 西口健太郎 渡邉崇充
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
analysis of survey data 堀 啓造
統計学の授業でのセカンド モニタとしてのiPhoneの使用
母分散の検定 母分散の比の検定 カイ2乗分布の応用
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
クロス表分析補遺 。堀 啓造(香川大学経済学部) 2003年5月.
クロス表とχ2検定.
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第2章 統計データの記述 データについての理解 度数分布表の作成.
Microsoft Excel 2010 を利用した 2項分布の確率計算
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

小標本でのカイ2乗検定の問題 小さな標本で分割表のカイ2乗検定を行うのは,カイ2乗分布への近似がよくないため,適切ではない. ひとつの基準として,5以下の期待度数があるとよくない. 2行2列の分割表では,Fisher の直接確率を用いるとよい.

Fisher の例題 ミルクを先に入れたか,紅茶を先に入れたか,飲めばわかると主張する女性がいたとする. ミルクを先に入れたカップを4つ,紅茶を先に入れたカップを4つ用意する. ランダムな順序で飲んでもらい,どちらのタイプのカップかを当ててもらう.それぞれ4杯あることは教える. The Design of Experiment より.藤井『カテゴリカルデータ解析』第4章,Agresti『カテゴリカルデータ解析入門』第2章

Fisher の例題 実験結果 3 1 4 8 女性の予想 ミルク先 紅茶先 計 実際の順序 R でカイ2乗検定を行うには,(R Editor を使って) Teatable <- matrix(c(3,1,1,3), nr=2) result <- chisq.test(Teatable, correct=F) result

パターンの出現確率とカイ2乗値 標本の大きさは小さく,周辺度数が固定されているので,とりうるカイ2乗値は限られている. 8.0 0.014 n11セル の値 カイ2乗 パターンの出現確率 8.0 0.014 1 2.0 0.229 2 0.0 0.514 3 4

紅茶実験でのカイ2乗値の分布と 自由度1のカイ2乗分布

標本分布の実験 以下のスクリプトを実行する chisq <- numeric(length=1000) table_list <- r2dtable(1000, c(4,4), c(4,4)) for(i in 1:1000){ ctable <- table_list[[i]] chisq[i] <- ((ctable[1,1]*ctable[2,2]-ctable[1,2]*ctable[2,1])^2)/32 } Freq <- table(cut(chisq, seq(-0.5,8.5,1))) rFreq <- Freq/1000 barplot(rFreq, names.arg=c(0:8), ylim=c(0,1)) curve(dchisq(x,1), add=T) (注)chisq.test関数を使ってもいいのだが, 警告がずらずら並んでしまう.

標本分布の実験 カイ2乗分布への近似はよくない

Fisher の直接確率 特定のパターンよりも極端なパターンが出現する確率を計算する.超幾何分布モデル. 3 1 4 8 女性の予想 ミルク先 紅茶先 計 実際の順序 3 1 4 8

Fisher の直接確率 得られたデータよりも極端なパターン 女性の予想 ミルク先 紅茶先 計 実際の順序 4 8

R での紅茶データ Fisher’s Test > Teatable <- matrix(c(3,1,1,3),nr=2) > fisher.test(Teatable) Fisher's Exact Test for Count Data data: Teatable p-value = 0.4857 alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: 0.2117329 621.9337505 sample estimates: odds ratio 6.408309 逆方向の極端を考慮しているため, p 値は 0.243 の2倍になっている. オッズ比が大きい方の片側検定ならば, alternative = “greater” オプションを利用

実習 授業ウェブから table5_4.xlsx を入手 エクセル上でのFisherの直接確率を計算してあるので,自分でもやってみる. R を使って Fisher の直接確率法を実行する. 数学と統計に関する好き・嫌いの分割表(表5.2)を分析してもよい.「数学が好きで,統計が嫌い」というセルの度数をゼロに近づける.