寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp
実験計画法 分散分析は実験を行った後の統計的手法. 分散分析はどのような実験を行ったのかという実験デザインと切り離せない. 実験の方法をよく吟味する必要がある.
フィッシャーの3原則 反復(replication):誤差分散を評価するために,同じ条件下で測定を繰り返す. 無作為化(randomization):系統誤差(systematic error)を偶然誤差(random error)に転化するために,処理(条件)の割り付けを無作為化する 局所管理(local control):系統誤差を除去するために,ブロックを構成して,各ブロック内では条件が均一になるよう管理する. 参考:奥野忠一・芳賀敏郎『実験計画法』培風館 p.12
反復 農場で3つの品種を育てて収穫量を比較する実験を行うとする. 3種類を1株ずつ育てても,その差は偶然にすぎないのか,品種の違いなのかわからない. 偶然変動(誤差分散)がわからなければ,差を評価できない. よって,3つの品種を,それぞれ何株か育てる必要がある.
反復だけでよいか? A A A B B B C C C 3区画に土地を分け,それぞれの土地で1種類ずつ育てる.
反復だけでよいか? 測定を繰り返すだけでは,影響に一定の方向のある系統誤差(systematic error)が混入するかもしれない. 3区画に土地を分け,それぞれの土地で1種類ずつ育てる.収穫量が違っても,種の差なのか,土地の差なのかが区別できない.これを,要因が交絡している(confound)と言う.
無作為化 特定の土地区画は,収穫量に対して,一定の方向のある誤差(系統誤差)をもたらす. ひとつの対策として,農場全体で,3つの品種をランダムに植えればよい. どの品種においても,よい土壌条件に植えられる株もあれば,そうでない条件に植えられるものもある.無作為化により,系統誤差が偶然誤差に転化される.
反復+無作為化 B C A C B A A C A A B C A A B C B B C C A B C B C B A 実験場全体に,3種類の株をランダムに植えて育てる. 反復と無作為化の原則を満たす実験デザインを 完全無作為法(completely randomized design)と呼ぶ.
局所管理 土地の違いは,同一品種での収穫量の違い(誤差分散)に入り込む. 特定の株をどこに植えるかはランダムに決めるので,土地条件は品種間で完全に公平ではない. 良い土地条件にたまたま多く植えられた品種. 土地の違いによる収穫量の変動を,誤差変動から切り離せないか? → 局所管理
農場全体を,土地条件が同一であると考えられるブロック(block)に分ける. ブロック:もともとは,農場の区画を意味する.一般には,興味の対象となっている要因以外の条件に関して均一であるような実験単位. 各ブロックで,3つの品種をランダムに植える. 無作為化を行うのは,土地条件以外の要因(日光の当たる角度など,直接に考慮されていない)の影響が系統誤差を生じさせないようにするため. ブロックの定義は,豊田『違いを見ぬく統計学』p.98
反復+無作為化+局所管理 B C A C A B A C B C B A B A C B C A 参考:奥野忠一・芳賀敏郎『実験計画法』(培風館)1.4節,1.5節 Fisherの3原則すべてを満たす実験デザインを 乱塊法(randomized block design)と呼ぶ.
乱塊法 実験を行う「場」をいくつかのブロックに分け,その中では系統誤差の影響を一定にする.系統誤差はブロック間の差となる. ブロックが実験要因のひとつとなる.ブロック因子 ブロック内で条件の割り当てをランダムにする. ブロックの例:農場の区画,装置,実験日,実験者,実験順序,参加者 被験者内デザインは参加者をブロックにした乱塊法.
BCA CAB ACB 実験への参加者それぞれを,農場実験での土地の小区画(すなわち,ブロック)と考えてみる. 参加者それぞれが,条件すべて(たとえば,A, B, C の3条件すべて)をこなす. 条件の実施順序はランダムにする.
乱塊法の応用 ラテン方格(latin square):複数のブロック因子があるとき,それらを組み合わせる. 興味ある要因およびブロック因子の水準数が同じでなければならない.下の表の各行・各列に,要因を表す記号が1回ずつ表れている. 実験者1 実験者2 実験者3 区画1 B C A 区画2 区画3 参考:豊田秀樹『違いを見ぬく統計学』ブルーバックス,p.168
完全無作為化法・乱塊法・ ラテン方格法の比較 A, B, C という3種類の処理を比較する. それぞれ3回の反復 1日あたり3回,3日間にわたって実験. 完全無作為化法 1回目 2回目 3回目 第1日 B C A 第2日 第3日 参考:奥野忠一・芳賀敏郎『実験計画法』培風館
完全無作為化法・乱塊法・ ラテン方格法の比較 乱塊法(実施日がブロック) A, B, C はどの日でも同じ回数だけ実施されている.日という系統誤差は問題でなくなる. しかし,実験順序もブロックとすべきかもしれない. 1回目 2回目 3回目 第1日 B C A 第2日 第3日
完全無作為化法・乱塊法・ ラテン方格法の比較 ラテン方格法(完備型計画) A, B, C は,どの日でも同じ回数だけ実施されている. さらに,何回目に実施されたかについても公平. 1回目 2回目 3回目 第1日 B C A 第2日 第3日
順序効果と対処 順序効果(order effect):実験水準の実施順序,あるいは,要因としていない実験要素の出現順序の効果. 順序効果への対処: カウンターバランス:可能な順序が少数の場合,それらをすべて実施して効果を相殺する.順序をブロック因子としてもよい. 無作為化:心理学実験で数多く呈示する刺激など,可能な順序が多い場合には,無作為化を行う(例:呈示順序をランダムにする)
2要因実験(被験者間デザイン) 興味ある要因が2つある実験例 訓練時間 平均 短 中 長 課題 難 y111 y211 y112 y212 各セルには2つ以上の測定値 訓練時間 平均 短 中 長 課題 難 y111 y211 y112 y212 y113 y213 易 y121 y221 y122 y222 y123 y223
参考:1要因被験者内デザイン 各セルには測定値がひとつ 要因A 平均 短 中 長 人 人1 y11 y12 y13 人2 y21 y22 ・・・
2要因実験の構造モデル 各セルにおいて測定が繰り返されている場合には,交互作用(interaction)がモデルに入る.
各セルでの標本平均
交互作用とは 交互作用は,要因の組み合わせの効果. 一方の要因の効果が,もう一方の要因の水準によって異なるとき,これは交互作用となる. 2つの要因効果の足し算では説明できない効果 一方の要因の効果が,もう一方の要因の水準によって異なるとき,これは交互作用となる.
交互作用と誤差 各セルでの繰り返しがあるため,誤差と交互作用を分離できる. 1要因被験者内デザインでの誤差(推定値) 2要因デザインでの交互作用(推定値)
グラフでの主効果 易 成 績 難 訓練時間 短 中 長
グラフでの主効果 易 成 績 難 訓練時間 短 中 長
グラフでの交互作用 易 成 績 難 訓練時間 短 中 長
グラフでの交互作用 易 成 績 難 訓練時間 短 中 長
分散分析に続く分析 要因の効果(主効果 main effect)が有意になった場合:その要因が3水準以上あるならば,どの水準間に差があるのかを調べる多重比較を行う. 交互作用が有意となった場合:一方の要因の効果が,もう一方の要因の水準ごとに異なるのだから,その水準ごとに要因効果を分析する.これは単純効果(simple effect)の分析と呼ばれる.
さらに学習すること この講義では扱わなかったが,さらに学習すべきこととして, 被験者内要因のある2要因計画(金曜日の演習で扱う) 固定効果と変量効果 枝分かれ配置 直交表
理解確認のポイント フィッシャーの3原則を説明できますか? 系統誤差と偶然誤差の違いを説明できますか? 要因の交絡とは何か,説明できますか? 完全無作為法とはどのような実験計画か,説明できますか?
乱塊法とはどのような実験計画か,説明できますか? ラテン方格法とはどのような実験計画か,説明できますか? 順序効果とは何か,説明できますか? これに対してどのような対処を行うことができるか,説明できますか?
2要因実験での構造モデルを数式で書き,式の要素を説明できますか? 2要因実験での交互作用とは何か,説明できますか? 2要因実験での主効果および交互作用は,グラフではどのように表れるかわかりますか?
交互作用を想定しない3要因実験には,ラテン方格のデザインを利用できる. 水準数はすべての要因で等しいとする. A1 水準の効果の推定に,B および C の各水準が1回ずつ用いられている.他の水準も同様. B1 B2 B3 A1 C1 C2 C3 A2 A3