カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
頻度の分析 頻度データ 着果率,発芽率,生存率 離散量と離散量の比率である 頻度データに相当しないパーセント表記 のデータ 糖度,含水率 連続量と連続量の比率である.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
検定 P.137.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
計算値が表の値より小さいので「異なるとは言えない」。
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
確率と統計 年1月7日(木) Version 3.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度 プリント「生物統計学_第7回カイ二乗分布,F分布とその応用2013」P4以降を予習しながら空所を埋めていきましょう. カイ二乗検定はメンデル遺伝の分離比や,計数(比率)データの標本(群)の差の検定にも利用できます.イエス-ノー,生-死など二者択一的なデータであるため範疇(category)データとも呼ばれるデータのことです.具体例で検定した方がわかりやすいので,とりあえずよくわからない人は次へ進んでください.画面の式を用いて,メンデル遺伝の分離比や,計数(比率)データの標本(群)の差の検定にカイ二乗検定を利用できます.なお今回は画面の式は覚えなくても,ただデータを入力するだけでp値を計算できるようにしてあります. 自由度

1遺伝子座の場合:例 例:F1のエンドウの交配から赤花80,白花30を得た.3:1に分離するかを検定せよ. 帰無仮説 分離比は3:1である 帰無仮説 分離比は3:1である 対立仮説 分離比は3:1でない メンデル遺伝の分離についてカイ二乗検定を利用する具体的な方法をこれから説明します. 1.1遺伝子座の場合です. メンデル遺伝の分離比では1つの遺伝子座しか考えないときは,χ2の値がやや高めに算出されるため,2遺伝子座以上の場合のようにエクセルの関数1つでは計算できないので,ここではデータをシートの黄色いところに観測数を代入すると計算できるようにしました.エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB117のところをみてください. 例題を考えましょう.F1のエンドウの交配から赤花80,白花30を得ました.3:1に分離するかを検定しましょう.メンデルの遺伝の法則に従えば,分離比は3:1になりますが,そうならない遺伝様式をとるかもしれません.それを統計的に検定します. 帰無仮説:「分離比は3:1である」.対立仮説:「分離比は3:1でない」となります. 黄色い枠に赤花80と白花30のデータを入れるだけです. 検定結果,p-値=0.6597となります.したがって,有意水準5%で帰無仮説は棄却できず,分離比は3:1でないという有意な証拠はない.つまり分離比は3:1であると考えてよいとなります.この場合は,応用的な使い方なので,正しい結論は「帰無仮説は棄却できないので,3:1に分離しないとはいえない」ですが,3:1に分離するとみなせると結論することもあります.統計的には3:1に分離しないことを証明できても,3:1に分離することは証明できません. 検定 p-値 帰無仮説は棄却できないので,3:1に分離しないという証拠はない

1遺伝子座の場合:予習問題 例:F1のエンドウの交配から赤花105,白花15を得た.3:1に分離するかを検定せよ. それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問6①に入力して提出してください.

2遺伝子座の場合:例 例: 「花色赤色・草丈が高い×花色白色・草丈が低い」を交配したF1はすべて花色赤色・草丈が高いとなった.F1同士を交配した結果,下の表のような分離比を得た.これは9:3:3:1の分離比かどうかを検定する. 遺伝子型 表現型 観測値 分離比 期待値 赤ー高ー 赤色・草丈高い 65 9 160×9/16=90 赤ー低低 赤色・草丈低い 50 3 160×3/16=30 白白高ー 白色・草丈高い 30 白白低低 白色・草丈低い 15 1 160×1/16=10 計 160 16 2.2遺伝子座の場合です. 2遺伝子座の場合でも,データをシートの黄色いところに観測数を代入すると計算できるようにしました. 例題を考えましょう.花色赤色・草丈が高い×花色白色・草丈が低い」を交配したF1はすべて花色赤色・草丈が高いとなりました.F1同士を交配した結果,下の表のような分離比を得ました.これは9:3:3:1の分離比かどうかを有意水準5%で検定してみましょう. メンデルの遺伝の法則に従えば,分離比は9:3:3:1になりますが,そうならない遺伝様式をとるかもしれません.それを統計的に検定します.

エクセルでの計算の手順 帰無仮説: 分離比は9:3:3:1である 対立仮説: 分離比は9:3:3:1でない 帰無仮説: 分離比は9:3:3:1である 対立仮説: 分離比は9:3:3:1でない 帰無仮説:「分離比は9:3:3:1である」.対立仮説:「分離比は9:3:3:1でない」となります. エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB136のところをみてください. 黄色いところに上から順に9:3:31に分離すると予想した観測値を入れてください. 検定結果,p-値=0.00004493となります.4.49E-05というエクセルの表示は,4.49×10-5を意味します.したがって,有意水準5%で帰無仮説は棄却され,分離比は9:3:3:1でないという結論になります.だからメンデルの遺伝の法則にこれは従わないことがわかります. 5%の有意水準で帰無仮説は棄却され,9:3:3:1に分離しないと結論される

練習:次のデータでは9:3:3:1に分離しているか F1のエンドウの交配から以下の結果を得た.9:33:1に分離するかを検定せよ. 遺伝子型 表現型 観測値 分離比 理論値 赤ー高ー 赤色・草丈高い 80 9 160×9/16=90 赤ー低低 赤色・草丈低い 35 3 160×3/16=30 白白高ー 白色・草丈高い 30 白白低低 白色・草丈低い 15 1 160×1/16=10 計 160 16 それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問6②に入力して提出してください.

頻度データの性質 1.等分散性を示さない 分散分析,t検定などでは分散が等しいことが検定の条件   分散分析,t検定などでは分散が等しいことが検定の条件   頻度では0%や100%の値をとると分散は0になる 2.正規分布に従わない 3.パーセントで表記してしまうと,もともとの個数の違いが失われる 着果率,発芽率,生存率のように全体のうち,何パーセントが着果,発芽,生存したかを示すデータを頻度データあるいは計数(比率)データという.頻度データの場合は調べた標本数が多くても,少なくてもパーセント表示にしてしまうとその違いがなくなってしまうので,できるだけパーセントにしないで統計的検定をする方がよい.すなわちもし2つのデータがどちらも30%であったとしても,片方が100個体から得たデータ(すなわち30個体が該当した),片方が10個体から得たデータ(すなわち3個体が該当した)ではデータの意味が全然違うからである. このような頻度データの性質は1.等分散性を示さない.多くの統計的検定(分散分析,t検定など)では分散が等しいことが検定の条件であることが多いです.頻度では0%や100%の値をとると分散は0になります.詳しいことは第15回の授業で説明します. 2.正規分布に従いません. 3.パーセントで表記してしまうと,もともとの個数の違いが失われてしまいます.

カイ二乗検定 右のような分割表で 示されるデータを 検定するときに カイ二乗検定を利用できる なおa, b, c, dの値は3より小さいと精度が落ちるとされるので,なるべく観測度数を増やして検定することが望ましい. ここでは昔からよく使われた方法であるカイ二乗検定を使う方法を説明します.しかし,カイ二乗検定は近似法であり,検出力も劣るので,コンピュータが利用できる昨今では二項検定やフィッシャーの正確確率検定を使うことも増えています.しかし,現在でもよく使われるので,カイ二乗検定をとりあげます. A,Bの2つの方法で飼育した昆虫の生存数と死亡数,ある特産品を1, 2, 3, 4, ・・・・・・等級品に分け,地域ごとのこれら特産品の出現数などを行・列の2元表に分類したとき,この表を分割表といいます.この分割表についてカイ二乗検定を行うことができます.ここでは2×2の分割表について説明します.画面のような表にデータをまとめることができる場合,それは2×2の分割表となります. 2つの飼育法による生存数と死亡数の差を表では使っていますが,性別(オスとメス),出身(北海道産と沖縄産),品種などいろいろな分け方に応用できます. このようなデータでよくやることですが,飼育法Aについて生存率○○パーセント,飼育法Bについて生存率△△パーセントと計算して,どうやって検定したかわからない・・・となる人がいます.このようなデータはこれから学ぶカイ二乗検定で検定できます. なお画面の表にあるa, b, c, dの値は3より小さいと精度が落ちるとされるので,なるべく観測度数を増やして検定することが望ましいと考えられています. カイ二乗検定は近似法であり,検出力も劣るためにコンピュータが利用できるならば,二項検定やフィッシャーの正確確率検定を用いる方がよい

カイ二乗検定の例 例:トノサマガエルのオタマジャクシをA,B2つの方法で飼育し,成体まで生存した数と死亡数を調査した結果は以下のようになった.2つの飼育方法で生存数に違いがあるかを有意水準5%で検定せよ. では例題です.トノサマガエルのオタマジャクシをA,B2つの方法で飼育し,成体まで生存した数と死亡数を調査した結果は以下のようになりました.2つの飼育方法で生存数に違いがあるかを検定しましょう. 帰無仮説は2つの飼育方法には生存率に違いはないです. 対立仮説は2つの飼育方法には生存率に差があるです. エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB151のところをみてください. 黄色いところに2つの飼育法による生存数と死亡数をそれぞれ入れてください.そうするとp値を計算できます. 帰無仮説:2つの飼育方法には生存率に違いはない. 対立仮説:2つの飼育方法には生存率に差がある.

カイ二乗値とp-値の計算 したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できる. 2種類のp値を計算するので,大きい方のp値を検定には利用してください. p値は0.0155となります. したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できます. 飼育法Aの生存率は77.7%,飼育法Bの生存率は86.4%です.パーセント表記すると飼育法Bの方が生存率が高いことがすぐ読み取れます.しかし,検定する場合はパーセント表記したデータでは多くの情報が失われるので,検定する上では望ましくありません. したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できる.

カイ二乗検定の予習問題 カブトムシを宍道湖北側の山から採集してきた腐葉土と宍道湖の南側の山から採集してきた腐葉土で幼虫を飼育,成体まで生存した数と死亡数を調査した結果は以下のようになった.腐葉土の採集地点の違いで生存数に違いがあるかを有意水準5%で検定せよ. それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問7に入力して提出してください.