Download presentation
Presentation is loading. Please wait.
1
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
プリント「生物統計学_第7回カイ二乗分布,F分布とその応用2013」P4以降を予習しながら空所を埋めていきましょう. カイ二乗検定はメンデル遺伝の分離比や,計数(比率)データの標本(群)の差の検定にも利用できます.イエス-ノー,生-死など二者択一的なデータであるため範疇(category)データとも呼ばれるデータのことです.具体例で検定した方がわかりやすいので,とりあえずよくわからない人は次へ進んでください.画面の式を用いて,メンデル遺伝の分離比や,計数(比率)データの標本(群)の差の検定にカイ二乗検定を利用できます.なお今回は画面の式は覚えなくても,ただデータを入力するだけでp値を計算できるようにしてあります. 自由度
2
1遺伝子座の場合:例 例:F1のエンドウの交配から赤花80,白花30を得た.3:1に分離するかを検定せよ. 帰無仮説 分離比は3:1である
帰無仮説 分離比は3:1である 対立仮説 分離比は3:1でない メンデル遺伝の分離についてカイ二乗検定を利用する具体的な方法をこれから説明します. 1.1遺伝子座の場合です. メンデル遺伝の分離比では1つの遺伝子座しか考えないときは,χ2の値がやや高めに算出されるため,2遺伝子座以上の場合のようにエクセルの関数1つでは計算できないので,ここではデータをシートの黄色いところに観測数を代入すると計算できるようにしました.エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB117のところをみてください. 例題を考えましょう.F1のエンドウの交配から赤花80,白花30を得ました.3:1に分離するかを検定しましょう.メンデルの遺伝の法則に従えば,分離比は3:1になりますが,そうならない遺伝様式をとるかもしれません.それを統計的に検定します. 帰無仮説:「分離比は3:1である」.対立仮説:「分離比は3:1でない」となります. 黄色い枠に赤花80と白花30のデータを入れるだけです. 検定結果,p-値=0.6597となります.したがって,有意水準5%で帰無仮説は棄却できず,分離比は3:1でないという有意な証拠はない.つまり分離比は3:1であると考えてよいとなります.この場合は,応用的な使い方なので,正しい結論は「帰無仮説は棄却できないので,3:1に分離しないとはいえない」ですが,3:1に分離するとみなせると結論することもあります.統計的には3:1に分離しないことを証明できても,3:1に分離することは証明できません. 検定 p-値 帰無仮説は棄却できないので,3:1に分離しないという証拠はない
3
1遺伝子座の場合:予習問題 例:F1のエンドウの交配から赤花105,白花15を得た.3:1に分離するかを検定せよ.
それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問6①に入力して提出してください.
4
2遺伝子座の場合:例 例: 「花色赤色・草丈が高い×花色白色・草丈が低い」を交配したF1はすべて花色赤色・草丈が高いとなった.F1同士を交配した結果,下の表のような分離比を得た.これは9:3:3:1の分離比かどうかを検定する. 遺伝子型 表現型 観測値 分離比 期待値 赤ー高ー 赤色・草丈高い 65 9 160×9/16=90 赤ー低低 赤色・草丈低い 50 3 160×3/16=30 白白高ー 白色・草丈高い 30 白白低低 白色・草丈低い 15 1 160×1/16=10 計 160 16 2.2遺伝子座の場合です. 2遺伝子座の場合でも,データをシートの黄色いところに観測数を代入すると計算できるようにしました. 例題を考えましょう.花色赤色・草丈が高い×花色白色・草丈が低い」を交配したF1はすべて花色赤色・草丈が高いとなりました.F1同士を交配した結果,下の表のような分離比を得ました.これは9:3:3:1の分離比かどうかを有意水準5%で検定してみましょう. メンデルの遺伝の法則に従えば,分離比は9:3:3:1になりますが,そうならない遺伝様式をとるかもしれません.それを統計的に検定します.
5
エクセルでの計算の手順 帰無仮説: 分離比は9:3:3:1である 対立仮説: 分離比は9:3:3:1でない
帰無仮説: 分離比は9:3:3:1である 対立仮説: 分離比は9:3:3:1でない 帰無仮説:「分離比は9:3:3:1である」.対立仮説:「分離比は9:3:3:1でない」となります. エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB136のところをみてください. 黄色いところに上から順に9:3:31に分離すると予想した観測値を入れてください. 検定結果,p-値= となります.4.49E-05というエクセルの表示は,4.49×10-5を意味します.したがって,有意水準5%で帰無仮説は棄却され,分離比は9:3:3:1でないという結論になります.だからメンデルの遺伝の法則にこれは従わないことがわかります. 5%の有意水準で帰無仮説は棄却され,9:3:3:1に分離しないと結論される
6
練習:次のデータでは9:3:3:1に分離しているか
F1のエンドウの交配から以下の結果を得た.9:33:1に分離するかを検定せよ. 遺伝子型 表現型 観測値 分離比 理論値 赤ー高ー 赤色・草丈高い 80 9 160×9/16=90 赤ー低低 赤色・草丈低い 35 3 160×3/16=30 白白高ー 白色・草丈高い 30 白白低低 白色・草丈低い 15 1 160×1/16=10 計 160 16 それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問6②に入力して提出してください.
7
頻度データの性質 1.等分散性を示さない 分散分析,t検定などでは分散が等しいことが検定の条件
分散分析,t検定などでは分散が等しいことが検定の条件 頻度では0%や100%の値をとると分散は0になる 2.正規分布に従わない 3.パーセントで表記してしまうと,もともとの個数の違いが失われる 着果率,発芽率,生存率のように全体のうち,何パーセントが着果,発芽,生存したかを示すデータを頻度データあるいは計数(比率)データという.頻度データの場合は調べた標本数が多くても,少なくてもパーセント表示にしてしまうとその違いがなくなってしまうので,できるだけパーセントにしないで統計的検定をする方がよい.すなわちもし2つのデータがどちらも30%であったとしても,片方が100個体から得たデータ(すなわち30個体が該当した),片方が10個体から得たデータ(すなわち3個体が該当した)ではデータの意味が全然違うからである. このような頻度データの性質は1.等分散性を示さない.多くの統計的検定(分散分析,t検定など)では分散が等しいことが検定の条件であることが多いです.頻度では0%や100%の値をとると分散は0になります.詳しいことは第15回の授業で説明します. 2.正規分布に従いません. 3.パーセントで表記してしまうと,もともとの個数の違いが失われてしまいます.
8
カイ二乗検定 右のような分割表で 示されるデータを 検定するときに カイ二乗検定を利用できる
なおa, b, c, dの値は3より小さいと精度が落ちるとされるので,なるべく観測度数を増やして検定することが望ましい. ここでは昔からよく使われた方法であるカイ二乗検定を使う方法を説明します.しかし,カイ二乗検定は近似法であり,検出力も劣るので,コンピュータが利用できる昨今では二項検定やフィッシャーの正確確率検定を使うことも増えています.しかし,現在でもよく使われるので,カイ二乗検定をとりあげます. A,Bの2つの方法で飼育した昆虫の生存数と死亡数,ある特産品を1, 2, 3, 4, ・・・・・・等級品に分け,地域ごとのこれら特産品の出現数などを行・列の2元表に分類したとき,この表を分割表といいます.この分割表についてカイ二乗検定を行うことができます.ここでは2×2の分割表について説明します.画面のような表にデータをまとめることができる場合,それは2×2の分割表となります. 2つの飼育法による生存数と死亡数の差を表では使っていますが,性別(オスとメス),出身(北海道産と沖縄産),品種などいろいろな分け方に応用できます. このようなデータでよくやることですが,飼育法Aについて生存率○○パーセント,飼育法Bについて生存率△△パーセントと計算して,どうやって検定したかわからない・・・となる人がいます.このようなデータはこれから学ぶカイ二乗検定で検定できます. なお画面の表にあるa, b, c, dの値は3より小さいと精度が落ちるとされるので,なるべく観測度数を増やして検定することが望ましいと考えられています. カイ二乗検定は近似法であり,検出力も劣るためにコンピュータが利用できるならば,二項検定やフィッシャーの正確確率検定を用いる方がよい
9
カイ二乗検定の例 例:トノサマガエルのオタマジャクシをA,B2つの方法で飼育し,成体まで生存した数と死亡数を調査した結果は以下のようになった.2つの飼育方法で生存数に違いがあるかを有意水準5%で検定せよ. では例題です.トノサマガエルのオタマジャクシをA,B2つの方法で飼育し,成体まで生存した数と死亡数を調査した結果は以下のようになりました.2つの飼育方法で生存数に違いがあるかを検定しましょう. 帰無仮説は2つの飼育方法には生存率に違いはないです. 対立仮説は2つの飼育方法には生存率に差があるです. エクセルの生物統計学_授業用データ集2013の第7回カイ二乗検定・F検定タブで,セルB151のところをみてください. 黄色いところに2つの飼育法による生存数と死亡数をそれぞれ入れてください.そうするとp値を計算できます. 帰無仮説:2つの飼育方法には生存率に違いはない. 対立仮説:2つの飼育方法には生存率に差がある.
10
カイ二乗値とp-値の計算 したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できる.
2種類のp値を計算するので,大きい方のp値を検定には利用してください. p値は0.0155となります. したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できます. 飼育法Aの生存率は77.7%,飼育法Bの生存率は86.4%です.パーセント表記すると飼育法Bの方が生存率が高いことがすぐ読み取れます.しかし,検定する場合はパーセント表記したデータでは多くの情報が失われるので,検定する上では望ましくありません. したがって,5%の有意水準で帰無仮説は棄却され,2つの飼育方法には生存数に差があると結論できる.
11
カイ二乗検定の予習問題 カブトムシを宍道湖北側の山から採集してきた腐葉土と宍道湖の南側の山から採集してきた腐葉土で幼虫を飼育,成体まで生存した数と死亡数を調査した結果は以下のようになった.腐葉土の採集地点の違いで生存数に違いがあるかを有意水準5%で検定せよ. それでは予習問題をやってみましょう.有意水準は5%とします.予習は「生物統計学第6回宿題と第7回のための予習2013 」の提出用タブ欄問7に入力して提出してください.
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.