系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう. 前回の授業でも学んだように右図のような測定結果が得られた場合,大きな系統誤差を含むBとDの場合は,系統誤差のために測定回数を増やしても真の値には近づきません.統計解析では系統誤差を実験の処理による効果と見分けることができませんから,系統誤差に対して,適切に対処しないと実験結果を正しく解釈できません. そこで,フィッシャーの三原則のうち,無作為化と局所管理によってこのような系統誤差に対して適切に対応する必要があります.
りんごで実験をする りんごの違い(重さ,大きさ,果皮の色,熟度など)を無作為化によって偶然誤差に転化する 無作為化とはランダムに実験の処理を割り付けることです.一見,簡単そうに思える無作為化です.けれども,実はそんなに簡単なことではありません. 例えばりんご15個を3つにわけて,3段階の温度処理(20℃,25℃,30℃)×5反復の実験をして,温度がエチレン発生量に及ぼす影響を調べる実験を計画するとしましょう. りんごによって,重さ,大きさ,果皮の色,熟度などいろいろな要因が異なっています.それらはエチレン発生量を変化させる要因になるかもしれませんから,エチレン発生量の系統誤差の原因となります.しかし,重さ,大きさを完全に揃えたりんごを準備することは不可能ですから,重さ,大きさが少しは異なるりんごを15個集めて実験するしかありません.この場合,重さや大きさのちがいによる系統誤差は無作為化によって,偶然誤差に転化しないと,統計解析できません. りんごの違い(重さ,大きさ,果皮の色,熟度など)を無作為化によって偶然誤差に転化する
ランダムにりんごをわりつける 20℃ 20℃ 25℃ 30℃ 25℃ 30℃ 20℃ 30℃ 20℃ 30℃ 20℃ 25℃ 25℃ 30℃ ではりんごを適当にとって,3つの温度処理に分ければよいと思うかもしれません.しかし,人間の無意識の好みによって,先に大きいりんごを,あるいは赤いりんごを,あるいは軽いりんごを取る人がいるかもしれません.適当に取れば無作為化するとは限らないのです.自分自身も知らない癖が系統誤差の結果になる可能性は決して否定できないのです.したがって,乱数表を使う,エクセルの乱数関数(=randbetweenあるいは=rand)を使うなどの方法でりんごを無作為化しなければなりません. 25℃ 25℃ 30℃ 25℃ 乱数表などでランダムに処理をわりつける
=randbetweenによる無作為化 3は6回目なので無視して飛ばす あとは2しかないからこれで終わり =randbetween関数は=randbetween(a,b)とすると整数a以上整数b以下の数値をaからbのどの整数も同じ確率でランダムに出力する関数です.=randbetween(1,6)はさいころということになります. 20℃区を1,25℃区を2,30℃区を3と決めましょう.そうすれば=randbetween(1,3)とすると1,2,3の3つの数字のどれかをランダムに出力します.りんごをそうして各処理に割り付けることが,画面のようにできます.なお先にどれかの処理に5つの処理が当たれば,それ以降はいっぱいになった数字は無視して飛ばしてやればよいのです. 画面ではりんごの13回目で3が6回目なので,これは無視します.さらにりんご15回目で1も6回目ですが,あとは2しかいらないので,終わりです.あるいはりんご12で実は1と3は5回目がでたので,ここで終わりにして,のこり3つは全部2をわりあててよいのです.3つ続くからランダムじゃないということではありません. これ以外の方法に=rand関数,=rank関数,=mod関数を組み合わせる方法もあります.この方法だと飛ばす必要はなくなります.エクセルファイルに例があるので,興味がある人は見てください. あとは2しかないからこれで終わり
ガラス室にポットを置く 次にポット実験でA,B,C3つのイネの品種をポットに移植し,ガラス温室内で実験することを考えてみましょう. この場合,ポットによって,大きさ,土の養分なども微妙に異なります.しかもポットを置く場所によって,ガラス室内における日当たり,風,温度のむら,ばらつきも系統誤差の原因となります.したがって,どのポットに植えるかをランダムに決めなければいけません. ポットの違い(重さ,土など)だけでなく,ガラス室の場所による違い(日当たり,風,温度のむら)なども系統誤差の原因となる
ガラス室に規則的にポットを置くと A B C A B C A B C A B C A B C しかし,調査が面倒だからと画面のように品種を整然と並べる研究者はけっこういます.しかし,このような並べ方をすると系統誤差を無作為化できません.ガラス室の場所による違い(日当たり,風,温度のむら)などが系統誤差を引き起こすからです. このようなむらを減らす方法として,定期的にポットをローテーションして移動する方法もあります.しかし,まずは無作為化が基本です.無作為化した上でポットを規則的にローテーション移動する(一種の局所管理)とさらに系統誤差は小さくなります. ガラス室の場所による違い(日当たり,風,温度のむら)などが系統誤差を引き起こす
ガラス室にポットを置く それでは予習問題をやってみましょう. ではポットに3つの品種,A,B,Cをランダムに割り振ってみましょう. 予習は「生物統計学第10回宿題と第11回のための予習2013 」の提出用タブ欄問4に入力して提出してください. ポットの違い(重さ,土など)だけでなく,ガラス室の場所による違い(日当たり,風,温度のむら)なども系統誤差の原因となる
完全無作為化法 豚番号 1 2 3 4 5 6 7 8 9 10 11 12 乱数 5 3 1 12 7 2 9 8 4 6 11 10 処理 B A C 12頭の子豚(体重順に1~12番)に3種類(A,B,C)の餌を与える処理について,フィッシャーの三原則を適用してみましょう.完全無作為化法では12頭にランダムにA,B,Cを割り当てます.先ほどのりんごやポットと同じように乱数を使って,例えば画面の表のようになったとしましょう. このような完全無作為法で得られたデータは一元配置の分散分析で処理間に差があるのかを検定できます.完全無作為化法による二元配置ももちろん可能です).さきほどりんごやガラス室のポットに処理を配置した方法も完全無作為化法によるものです. フィッシャーの3原則のうち,反復と無作為化を満たす実験計画
乱塊法 ブロック 1 2 3 4 豚番号 5 6 7 8 9 10 11 12 乱数 3 2 1 処理 C B A 系統誤差の原因をブロック間の差として除去するのが乱塊法である しかし,事前に子豚の体重がわかっており,さらに餌の効果は体重によって異なることもわかっているなら,体重の近いものを1つにまとめて,そのブロック内でA,B,Cを1つずつ割り当てた方が精度が向上します.すなわち体重順にブロック1(1~3),ブロック2(4~6),ブロック3(7~9),ブロック4(10~12)とし,各ブロック内ではランダムにA,B,Cを割り当てます. このように局所管理された(ここでは体重をなるべく同じになるように局所管理した)ブロックを作り,ブロック因子以外の系統誤差を偶然誤差に転化するためにブロック内では無作為に配置する方法を乱塊法といいます. フィッシャーの3原則をすべて満たすもっとも基本的な実験計画
完全無作為化法から乱塊法の例 品種A~Eの水稲品種試験,3反復 E A B D B E C D E C D C B A A それではいくつかの例で完全無作為化法による実験配置を乱塊法による実験配置にした例をみていきましょう. 水田に品種A~Eの5品種を比較する試験を3反復でおこなうとしましょう.3反復×5品種なので,15の試験区を準備し, そこに無作為に(ランダムに)品種を配置します.例えば画面のように品種を配置することになったとしましょう. D C B A A
乱塊法の例(水田試験) ブロック1~3,品種A~Eの水稲品種試験 1 B C D A E 地力の高低 ブロック 2 D E B A C 3 しかし,水田の地力の高低が画面右の矢印のようになっていることがわかっていて,それが水稲収量に影響することがわかっていたら,力の高い上をブロック1,低い下をブロック3,真ん中をブロック2として,それぞれのブロックに品種A~Eを1回ずつ割り当てることによって精度を向上させることができます.こうすると画面のように実験を配置することができます. 3 A E C D B 位置の違い(空間的差異)がブロックになる場合
ガラス室にポットを置く ブロック1 ブロック2 ブロック3 ブロック4 ブロック5 北 南 それでは予習問題をやってみましょう. 先ほどのポット実験でA,B,C3つのイネの品種をポットに移植し,ガラス温室内で実験することを考えてみよう.ガラス室は南北に長く,ポットを置くと,南北で生育にむらがあることがわかっているとしたら,南北にブロック化したら,系統誤差をブロック間差として消去できるようになる. それでは予習問題として,ポットに3つの品種,A,B,Cを乱塊法に基づいて割り振ってみよう. 予習は「生物統計学第10回宿題と第11回のための予習2013 」の提出用タブ欄問5に入力して提出してください. 北 南
乱塊法の分散分析 水稲5品種の収量(kg/10a)を比較する実験を行った 4ブロックある乱塊法で実験を配置した 乱塊法での分散分析は二元配置と同じように行えます.二元配置の因子の一つがブロック因子である(残りひとつは制御因子)と考えればよいのです.ただし,ブロック因子は制御因子や標示因子と交互作用があってはいけません.もしそのような因子をブロック因子としてしまったなら,その因子は標示因子あるいは層別因子として実験をやり直すべきでしょう. さて,画面のようなデータ,5品種の水稲の収量実験(kg/10a)について,乱塊法での分散分析を行ってみましょう. 水稲5品種の収量(kg/10a)を比較する実験を行った 4ブロックある乱塊法で実験を配置した
一元配置の分散分析では もし乱塊法を採用しないで,単に一元配置の分散分析を行うと画面のような分散分析表となり,p値は0.080となって処理の効果が5%の有意水準では認められませんでした.
乱塊法の分散分析 列(品種)のp値は0.029 品種によって収量は変わる しかし,乱塊法であるので,繰り返しのない二元配置の分散分析をすれば画面の表のような結果となります.分散分析の結果から,処理間に5%の有意水準で有意差が認められました.さらにブロック間にも5%の有意水準で有意差がありましたので,ブロックにすることで実験の系統誤差をブロック間の差として,誤差から除去でき,実験精度が向上したことがわかります.