統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

Maximal likelihood 法に基づく Matched filter について 田越秀行(阪大理) LCGT コヒーレンス解析 WG 修正 Ref: Finn, PRD63, (2001) Pai, Dhurandhar, Bose, PRD64,
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
頻度の分析 頻度データ 着果率,発芽率,生存率 離散量と離散量の比率である 頻度データに相当しないパーセント表記 のデータ 糖度,含水率 連続量と連続量の比率である.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相関係数 植物生態学研究室木村 一也.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
計算値が表の値より小さいので「異なるとは言えない」。
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
寺尾 敦 青山学院大学社会情報学部 社会統計 第4回:分割表の分析(第4章) 寺尾 敦 青山学院大学社会情報学部
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
子どものコミュニケーションチェックリスト(CCC-2) 日本語版の標準化:定型就学前児
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
母分散の検定 母分散の比の検定 カイ2乗分布の応用
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之

カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。

適合度検定の例 東邦大学の学生の男女比は [1:1] と言えるか。 独立性検定の例 東邦大学の理学部と薬学部で男女比に差があると 言 えるか。

カイ二乗値 観測値と期待値の差の 2 乗を期待値で割った値の総 和。 χ2 =χ2 = Σ n i=1 (Oi-Ei)2(Oi-Ei)2 EiEi O :観測値 E :期待値 期待値と観測値の差が小さいほど 0 に近付く。 期待値と観測値の差が大きいほど大きくなる。

カイ二乗分布 カイ二乗値をプロットした曲線。 自由度により異なる。 自由度 =1 自由度 =3 自由度 =

カイ二乗分布のイメージ(自由度 1 の場 合) 赤と白のボールが 100 個ずつ入った箱から、無作為に 10 個 のボールを取ると、赤と白が 5 個ずつとなる確率が最も大き く、 10 個 0 個に近付くに従って確率は小さくなる。 この確率の分布したものが自由度 1 の時のカイ二乗分布であ る。 >

自由度 1 の時のカイ二乗分布 95 %

カイ二乗分布のイメージ(自由度 5 の場 合) サイコロを 120 回振って、出た目の数を記録する。すると、 全てが 20 回ずつとなる確率は 0 に近く、ある程度バラつく 確率が最も大きい。さらにバラつく確率は小さくなってい く。 ^ ^ ^ %

0.95 の時のカイ二乗値表 自由度 χ2 χ 自由度 χ2 χ この値よりカイ二乗値が大きければ、帰無仮説を棄却する。 この値よりカイ二乗値が小さければ、帰無仮説を採用する。

例題① 現在東邦大学理学部では、男子 1500 名、女子 900 名が在籍 している。また、地理生態学研究室では、男子 13 名、女子 7 名が在籍している。これは、理学部の男女比と同じだと言 えるか。 地理生態学研究室の男女の人数の期待値は 男: 女 : カイ二乗値は 今回の自由度は 1 。また 1.07 は 3.84 より小さいため帰無仮説を採用する。 したがって、理学部と地理生態学研究室の男女比は同じだと言える。 20× = + × = + 900 (13 - 12.5) (7 - 7.5) + = 1.07

> geoeco <-c(13,7) > pn <-c(1500,900)/( ) > chisq.test(x=geoeco, p=pn) Chi-squared test for given probabilities data: geoeco X-squared = , df = 1, p-value = R でやってみる P 値> 0.05 であるから、帰無仮説は棄却できない。 よって、理学部と地理生態学研究室の男女比は同じ。

例題② ある年の生物学科の学生の進路を示した。 男女で、就職・進学・教職の割合に差はあるか。 就職進学教職 男子 女子 32118

就職進学教職合計 男子 女子 合計 就職進学教職合計 男子??? 70 女子??? 50 合計 就職進学教職合計 男子 女子 合計 合計の比から期待値を算出する。

カイ二乗値を算出する。 (38 - 41) 2 (24 - 20) 2 (7 - 9) 2 (32 - 29) 2 (11 - 15) 2 (8 - 6) = 3.51 正確には 2.82 今回の自由度は 2×1 で 2 。カイ二乗値 3.51 は 5.99 より小さいため帰 無仮説を採用する。 したがって、男女で進路の比に差はないと言える。

> shinro <-matrix(c(38,24,7,32,11,8),ncol=3,byrow=T) > rownames(shinro) <-c("men","women") > colnames(shinro) <-c("syusyoku","shingaku","kyosyoku") > shinro syusyoku shingaku kyosyoku men women > chisq.test(shinro) Pearson's Chi-squared test data: shinro X-squared = , df = 2, p-value = R でやってみる P 値> 0.05 であるから、帰無仮説は棄却できない。 よって、男女で進路の比に差はない。