寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。 (測定回数 n が増せばこの可能性は増 す。) 平均値 偶然誤差によ るばらつき v i は 測定値と平均値の差 で残差、 また、 σ は、標準誤差( Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.
1 6章 データ数不揃いの場合の分析 アンバランス型(不釣合い型)の 計画 ss2 や ss3 って何?
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
第4章補足 分散分析法入門 統計学 2010年度.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか
分散分析マスターへの道.
パネル分析について 中村さやか.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
第3章:記憶の貯蔵庫モデルと処理水準アプローチ
日本行動計量学会主催 第4回春の合宿セミナー
実証分析の手順 経済データ解析 2011年度.
反復測定データの分析 狩野裕@大阪大学 協力:SAS・SPSS
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
疫学概論 無作為化比較対照試験 Lesson 14. 無作為化臨床試験 §A. 無作為化比較対照試験 S.Harano,MD,PhD,MPH.
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
大学での講義中の スマートフォンの私的使用 ―その頻度と内容-
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第8回授業(5/31)での学習目標 一事例デザインとは? 分割区画型反復測定デザインとは? メタ・アナリシスとは?。
系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう.
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
対応のあるデータの時のt検定 重さの測定値(g) 例:
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
Study Design and Statistical Analysis
統計学の授業でのセカンド モニタとしてのiPhoneの使用
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
プログラミング基礎a 第8回 プログラムの設計 アルゴリズムとデータ構造
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
スピーキングタスクの繰り返しの効果 ―タスクの実施間隔の影響―
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
システム工学実験 品質管理 第1週目 システム工学実験
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
プログラミング基礎a 第8回 プログラムの設計 アルゴリズムとデータ構造
第4章 社会構造概念はどのように豊穣化されるか
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
岩手県立大学 ソフトウェア情報学部 教育情報システム学講座 4年 ;継田 優子
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
実習 実験の目的 現行と目標値の具体的数値を記す。 数値がわからなければ設定する。.
要因Aの差,要因Bの差を見たい 2つの要因なので二元配置分散分析の適用 要因B 水準A 水準B 水準C 要因A 水準a
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

実験計画法 分散分析は実験を行った後の統計的手法. 分散分析はどのような実験を行ったのかという実験デザインと切り離せない. 実験の方法をよく吟味する必要がある.

フィッシャーの3原則 反復(replication):誤差分散を評価するために,同じ条件下で測定を繰り返す. 無作為化(randomization):系統誤差(systematic error)を偶然誤差(random error)に転化するために,処理(条件)の割り付けを無作為化する 局所管理(local control):系統誤差を除去するために,ブロックを構成して,各ブロック内では条件が均一になるよう管理する. 参考:奥野忠一・芳賀敏郎『実験計画法』培風館 p.12

反復 農場で3つの品種を育てて収穫量を比較する実験を行うとする. 3種類を1株ずつ育てても,その差は偶然にすぎないのか,品種の違いなのかわからない. 偶然変動(誤差分散)がわからなければ,差を評価できない. よって,3つの品種を,それぞれ何株か育てる必要がある.

反復だけでよいか? A A A B B B C C C 3区画に土地を分け,それぞれの土地で1種類ずつ育てる.

反復だけでよいか? 測定を繰り返すだけでは,影響に一定の方向のある系統誤差(systematic error)が混入するかもしれない. 3区画に土地を分け,それぞれの土地で1種類ずつ育てる.収穫量が違っても,種の差なのか,土地の差なのかが区別できない.これを,要因が交絡している(confound)と言う.

無作為化 特定の土地区画は,収穫量に対して,一定の方向のある誤差(系統誤差)をもたらす. ひとつの対策として,農場全体で,3つの品種をランダムに植えればよい. どの品種においても,よい土壌条件に植えられる株もあれば,そうでない条件に植えられるものもある.無作為化により,系統誤差が偶然誤差に転化される.

反復+無作為化 B C A C B A A C A A B C A A B C B B C C A B C B C B A 実験場全体に,3種類の株をランダムに植えて育てる. 反復と無作為化の原則を満たす実験デザインを 完全無作為法(completely randomized design)と呼ぶ.

局所管理 土地の違いは,同一品種での収穫量の違い(誤差分散)に入り込む. 特定の株をどこに植えるかはランダムに決めるので,土地条件は品種間で完全に公平ではない. 良い土地条件にたまたま多く植えられた品種. 土地の違いによる収穫量の変動を,誤差変動から切り離せないか? → 局所管理

農場全体を,土地条件が同一であると考えられるブロック(block)に分ける. ブロック:もともとは,農場の区画を意味する.一般には,興味の対象となっている要因以外の条件に関して均一であるような実験単位. 各ブロックで,3つの品種をランダムに植える. 無作為化を行うのは,土地条件以外の要因(日光の当たる角度など,直接に考慮されていない)の影響が系統誤差を生じさせないようにするため. ブロックの定義は,豊田『違いを見ぬく統計学』p.98

反復+無作為化+局所管理 B C A C A B A C B C B A B A C B C A 参考:奥野忠一・芳賀敏郎『実験計画法』(培風館)1.4節,1.5節 Fisherの3原則すべてを満たす実験デザインを 乱塊法(randomized block design)と呼ぶ.

乱塊法 実験を行う「場」をいくつかのブロックに分け,その中では系統誤差の影響を一定にする.系統誤差はブロック間の差となる. ブロックが実験要因のひとつとなる.ブロック因子 ブロック内で条件の割り当てをランダムにする. ブロックの例:農場の区画,装置,実験日,実験者,実験順序,参加者 被験者内デザインは参加者をブロックにした乱塊法.

BCA CAB ACB 実験への参加者それぞれを,農場実験での土地の小区画(すなわち,ブロック)と考えてみる. 参加者それぞれが,条件すべて(たとえば,A, B, C の3条件すべて)をこなす. 条件の実施順序はランダムにする.

乱塊法の応用 ラテン方格(latin square):複数のブロック因子があるとき,それらを組み合わせる. 興味ある要因およびブロック因子の水準数が同じでなければならない.下の表の各行・各列に,要因を表す記号が1回ずつ表れている. 実験者1 実験者2 実験者3 区画1 B C A 区画2 区画3 参考:豊田秀樹『違いを見ぬく統計学』ブルーバックス,p.168

完全無作為化法・乱塊法・ ラテン方格法の比較 A, B, C という3種類の処理を比較する. それぞれ3回の反復 1日あたり3回,3日間にわたって実験. 完全無作為化法 1回目 2回目 3回目 第1日 B C A 第2日 第3日 参考:奥野忠一・芳賀敏郎『実験計画法』培風館

完全無作為化法・乱塊法・ ラテン方格法の比較 乱塊法(実施日がブロック) A, B, C はどの日でも同じ回数だけ実施されている.日という系統誤差は問題でなくなる. しかし,実験順序もブロックとすべきかもしれない. 1回目 2回目 3回目 第1日 B C A 第2日 第3日

完全無作為化法・乱塊法・ ラテン方格法の比較 ラテン方格法(完備型計画) A, B, C は,どの日でも同じ回数だけ実施されている. さらに,何回目に実施されたかについても公平. 1回目 2回目 3回目 第1日 B C A 第2日 第3日

順序効果と対処 順序効果(order effect):実験水準の実施順序,あるいは,要因としていない実験要素の出現順序の効果. 順序効果への対処: カウンターバランス:可能な順序が少数の場合,それらをすべて実施して効果を相殺する.順序をブロック因子としてもよい. 無作為化:心理学実験で数多く呈示する刺激など,可能な順序が多い場合には,無作為化を行う(例:呈示順序をランダムにする)

2要因実験(被験者間デザイン) 興味ある要因が2つある実験例 訓練時間 平均 短 中 長 課題 難 y111 y211 y112 y212 各セルには2つ以上の測定値 訓練時間 平均 短 中 長 課題 難 y111 y211 y112 y212 y113 y213 易 y121 y221 y122 y222 y123 y223

参考:1要因被験者内デザイン 各セルには測定値がひとつ 要因A 平均 短 中 長 人 人1 y11 y12 y13 人2 y21 y22 ・・・

2要因実験の構造モデル 各セルにおいて測定が繰り返されている場合には,交互作用(interaction)がモデルに入る.

各セルでの標本平均

交互作用とは 交互作用は,要因の組み合わせの効果. 一方の要因の効果が,もう一方の要因の水準によって異なるとき,これは交互作用となる. 2つの要因効果の足し算では説明できない効果 一方の要因の効果が,もう一方の要因の水準によって異なるとき,これは交互作用となる.

交互作用と誤差 各セルでの繰り返しがあるため,誤差と交互作用を分離できる. 1要因被験者内デザインでの誤差(推定値) 2要因デザインでの交互作用(推定値)

グラフでの主効果 易 成 績 難 訓練時間 短 中 長

グラフでの主効果 易 成 績 難 訓練時間 短 中 長

グラフでの交互作用 易 成 績 難 訓練時間 短 中 長

グラフでの交互作用 易 成 績 難 訓練時間 短 中 長

分散分析に続く分析 要因の効果(主効果 main effect)が有意になった場合:その要因が3水準以上あるならば,どの水準間に差があるのかを調べる多重比較を行う. 交互作用が有意となった場合:一方の要因の効果が,もう一方の要因の水準ごとに異なるのだから,その水準ごとに要因効果を分析する.これは単純効果(simple effect)の分析と呼ばれる.

さらに学習すること この講義では扱わなかったが,さらに学習すべきこととして, 被験者内要因のある2要因計画(金曜日の演習で扱う) 固定効果と変量効果 枝分かれ配置 直交表

理解確認のポイント フィッシャーの3原則を説明できますか? 系統誤差と偶然誤差の違いを説明できますか? 要因の交絡とは何か,説明できますか? 完全無作為法とはどのような実験計画か,説明できますか?

乱塊法とはどのような実験計画か,説明できますか? ラテン方格法とはどのような実験計画か,説明できますか? 順序効果とは何か,説明できますか? これに対してどのような対処を行うことができるか,説明できますか?

2要因実験での構造モデルを数式で書き,式の要素を説明できますか? 2要因実験での交互作用とは何か,説明できますか? 2要因実験での主効果および交互作用は,グラフではどのように表れるかわかりますか?

交互作用を想定しない3要因実験には,ラテン方格のデザインを利用できる. 水準数はすべての要因で等しいとする. A1 水準の効果の推定に,B および C の各水準が1回ずつ用いられている.他の水準も同様. B1 B2 B3 A1 C1 C2 C3 A2 A3