クロス表とχ2検定.

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
1DS04180Y 阪本真一郎 1NC04019K 福原菜美 1DS04208T 山根章平 高木先生担当
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
計算値が表の値より小さいので「異なるとは言えない」。
統計学 10/19 鈴木智也.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
社会統計学Ic・統計科学I 第六回 ~仮説検証~
analysis of survey data 第2回 堀 啓造
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
analysis of survey data 堀 啓造
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学  第12回 西 山.
Presentation transcript:

クロス表とχ2検定

記述統計と推測統計の違い 記述統計 サンプルデータそのものの集計 推測統計 サンプルデータから母集団の傾向を推測する

クロス表を作成しよう クロス表とは 文系 理系 男 120 280 女 240 160 クロス表を作成しよう           クロス表とは 質的変数同士を組み合わせて、度数を集計するのに使う表(この集計をクロス集計ともいう) 文系 理系 男 120 280 女 240 160 ※セルに入っているのは度数(平均値ではないことに注意) ※要素の数に合わせて2×2のクロス表とかのように呼ぶ

χ2検定 各セルの期待度数に偏りがあるかを調べる 文系 理系 男 200 120 280 女 240 160 (偏りなし) 観測度数 (実際のデータ) 文系 理系 男 200 120 280 女 240 160 比較 比較 各セルの期待度数に偏りがあるかを調べる →2×2のクロス表の場合には…..

推測統計と検定 (目的)仮説を検証すること 検定の考え方:帰無仮説を立てて、仮説とどちらが支持される可能性が高いかを考える 仮説は、傾向に基本的に違いがあるということ サンプルから計算する差だけで、母集団にも差があると言えるかどうかを決める 検定の考え方:帰無仮説を立てて、仮説とどちらが支持される可能性が高いかを考える 帰無仮説は逆方向の仮説であることに注意

仮説と帰無仮説 先の例の場合は 結論は、仮説を選択するのか、帰無仮説を選択する(仮説を棄却する)のか、どちらか(二択) 帰無仮説 :男女の間で[                         ] 仮説 結論は、仮説を選択するのか、帰無仮説を選択する(仮説を棄却する)のか、どちらか(二択) 文系か理系かを選択する割合に差はない 文系か理系かを選択する割合に差がある

有罪 無罪 検定の基本的な考え方 有罪 無罪 ある事件 の裁判 「彼が犯人である可能性が 「彼が犯人である」 非常に高い」 「彼が犯人である可能性は  ゼロではないが、非常に低い」 「彼が犯人である可能性が 非常に高い」 有罪 ある事件 の裁判 「彼が犯人である」 無罪 「彼は犯人ではない」

検定の基本的な考え方 仮説 帰無仮説 どちらの可能性(確率)が高いかで決める 仮説の支持 仮説の棄却 結果は 二択 (※帰無仮説の支持とは書かない) 仮説 帰無仮説 結果は 二択 「男性と女性には差がある」 「男女間には差がある とは言えない」 どちらの可能性(確率)が高いかで決める

χ2検定の手順 1. 帰無仮説を立てる 2.χ2値を計算する ※2×2のクロス表の場合

χ2検定の手順 3.χ2分布の表を見ながら臨界値を算出する 表のどこを見ればよいか:自由度と有意水準の交叉した値を臨界値(基準)とする 自由度(df)=[セル数-1]×[セル数-1] 2×2のクロス表ではdf =1

χ2分布の表 自由度

χ2分布表で見てみると… 72.7 95%(偶然に生じる誤差の範囲) 5%(偏りがある) 帰無仮説を棄却 0 2.71 10% 3.84 帰無仮説を採用 5%(偏りがある)  帰無仮説を棄却     =仮説を採用     0 (理論値とのズレが  全くない場合) 2.71 10% 3.84 5% 6.63 1% 72.7 有意水準

χ2検定の手順 有意水準の意味 帰無仮説を棄却するかどうかを決める基準(偶然に生起する確率がどの程度あるか。危険率とも呼ぶ) χ2値が大きくなる  →偶然に生起するという可能性が小さくなる    (たまたまの結果ではなく、偏りが偶然ではない)  →帰無仮説が支持される可能性は非常に小さいので、      仮説の方を採用する 「χ2値が大きい」では基準があいまいなので、一定の基準(全体の5%や1%)を設けておく(これが有意水準。p<.05やp<.01と書く)

4. 結果の解釈 χ2値が表の値よりも大きい場合には、帰無仮説の棄却(仮説の支持) χ2値が表よりも小さければ帰無仮説の支持(仮説の不支持) χ2値が表の値よりも大きい場合には、帰無仮説の棄却(仮説の支持)       χ2値が表よりも小さければ帰無仮説の支持(仮説の不支持) 有意水準を5%とした場合には、調査を行うと、仮説は95%の確率で支持される可能性があることになる 100名中95名ではなく、100回中95回程度支持される

おまけ1 どこに差があるか ~残差分析 タテかヨコかが3セル以上の場合には全体で偏りがあることは分かっても、どこが偏っているのかは分からない どこに差があるか ~残差分析 タテかヨコかが3セル以上の場合には全体で偏りがあることは分かっても、どこが偏っているのかは分からない どの程度偏りがあるかを示す値

おまけ2 効果サイズとクラマーのV 社会調査などではサンプル数が多いので、分析結果は有意になりやすい