寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 6章 データ数不揃いの場合の分析 アンバランス型(不釣合い型)の 計画 ss2 や ss3 って何?
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
第6回 分散分析(第7章) Analysis of Variance
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
分散分析マスターへの道.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
Rを使用したデータ解析・グラフ描き.
RでのScheffeの多重比較.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
RでのScheffeの多重比較.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

被験者間デザイン・被験者内デザイン 他者の監視とパフォーマンスとの関係を検討した(架空)実験では,実験の参加者を各条件にランダムに割り当てた.各実験条件への参加者が異なる実験デザインを,被験者間デザイン(between-subjects design)と呼ぶ. これに対して,どの条件でも参加者が同一である実験デザインを,被験者内デザイン(within-subjects design)と呼ぶ.

デザインの例 1要因被験者間デザイン:3つのタイプライターの違いを評価するため,24人のタイピストを,それぞれのタイプライターに対して,8人ずつランダムに割り当てた. 1要因被験者内デザイン:3つのタイプライターの違いを評価するため,8人のタイピストそれぞれが,3つのタイプライターすべてでテストを行った. ホーエル『初等統計学』第11章より

データ(架空) タイプ I タイプ II タイプ III 44 40 54 39 37 50 33 28 56 53 55 43 38 45 51 66 47 49 58 60 65

被験者間デザインでの分析 変動因 平方和(SS) df 平均平方 F 級間 336 2 168.0 1.87 級内 1888 21 89.9 全体 2224 23 結論:3条件の母集団平均に差があるとは言えない. すなわち,3種類のタイプライターの間に,パフォーマンスを 左右する差があるとは言えない.

被験者内デザインでの分析 変動因 平方和 df 平均平方 F タイプライター 336 2 168.0 19.6* タイピスト 1768 7 252.6 29.5* 誤差 120 14 8.57 全体 2224 23 * p < .05 結論:3条件の母集団平均はすべて等しくはない すなわち,3種類のタイプライターの間には,パフォーマンスを 左右する差がある.

1要因被験者内デザインでは,変動因が2つ(例:「タイプライター」と「タイピスト」)ある. したがって,2要因の分散分析であるとも考えられる.第1要因の水準と第2要因の水準の組み合わせは,すべて1回ずつテストされるので,繰り返しのない二元配置法とも呼ばれる.

被験者内デザインのモデル 参加者 i の,j 番目のタイプライターでのスコアは,以下のモデルで決定されたと考える. 被験者間デザインの解析では,個人差要因は誤差の中にプールされていた. 全体の平均 + タイプライターの効果 + 個人差要因 + 誤差

被験者内デザインでの効果 全水準をこみにしたときの母集団平均を μ ,興味ある要因(例:タイプライター)の第 j 水準の母集団平均を μ.j としたとき,この水準に属することの効果 αj は, 第 i 番目の参加者の母集団平均を μi. としたとき,この参加者の効果 βi は,

帰無仮説 興味ある要因(水準数 J) 個人差要因(水準数 I) (βi の母集団分散はゼロ) 対立仮説は, 興味ある要因と同様の式で帰無仮説を表現することも可能.鷲尾『実験の計画と解析』p.80 参照. 対立仮説は, 注意:興味ある3つのタイプライターと異なり,タイピストはタイピストの母集団から無作為抽出されたと考えられるため,帰無仮説の表現が異なっている.しかし,あまり気にしないでよい.

練習問題1 1人目のタイピストの平均は46,2人目のタイピストの平均は42である.タイプライターI, II, III の平均はそれぞれ,47, 44, 53 である.全体の平均は48である.この2人の成績を,全体平均(の推定値),タイプライターの効果(同),個人差の効果(同),誤差(同)に分解せよ. タイプ I タイプ II タイプ III タイピスト1 44 40 54 2 39 37 50

全体平均 要因の効果 個人差要因 誤差

被験者内デザインにおける 平方和の分解 全平方和を,興味ある要因の平方和,個人差の平方和,誤差の平方和に分解する.

平均平方と母集団分散の推定 被験者間デザインのときと同様に,それぞれの平均平方を,対応する自由度で割ったものを考える. 興味ある要因および個人差要因に関する平均平方は,それぞれ対応する帰無仮説が正しいとき,母集団分散の不偏推定量になる. 誤差の平均平方は帰無仮説の真偽によらす,母集団分散の不偏推定量になる.

平均平方の比 1要因被験者内デザインでは,2種類の F 比を考える. 興味ある要因の平均平方 / 誤差の平均平方 個人差要因の平均平方 / 誤差の平均平方 被験者間デザインのときと同様に,これら統計量が F 分布に従うことを利用して,仮説検定を行う.平均平方と同様に,自由度も分解されることに注意.

被験者内デザインでの分析 変動因 平方和 df 平均平方 F タイプライター 336 2 168.0 19.6* タイピスト 1768 7 252.6 29.5* 誤差 120 14 8.57 全体 2224 23 * p < .05 結論:3条件の母集団平均はすべて等しくはない すなわち,3種類のタイプライターの間には,パフォーマンスを 左右する差がある.

タイプライター要因の F 統計量が有意であった.このことを,この要因の主効果(main effect)が有意であると言う. タイピスト要因の主効果も有意だった.しかし,1要因被験者内デザインの実験では,個人差に興味がないことも多い.

乱塊法 1要因被験者内デザインは,乱塊法と呼ばれるデザインのひとつである. 「実験計画法」の講義 それぞれのタイピストが3つのタイプライターを評価する順序は,ランダムにする.あるいは,カウンターバランスをとることができればなおよい. どの順序も同じ回数だけ出現するようにする.

練習問題2 工員 機械の種類 1 2 3 4 44 38 47 36 46 40 52 43 34 32 33 5 42 49 39 上のデータは,5人の工員が4種類の異なる機械を用いて生産した1日あたりの製品数である.分散分析により,機械の違いと,工員の個人差を検討せよ. (ホーエル『初等統計学』第11章,章末問題5)

練習問題2の分析を実行する R スクリプト 製品数 <- c(44,46,34,43,38, 38,40,36,38,42, 47,52,44,46,49, 36,43,32,33,39) 機械 <- factor(c(rep("m1",5), rep("m2",5), rep("m3",5), rep("m4",5))) 人 <- factor(rep(c("p1","p2","p3","p4","p5"),4)) boxplot(製品数 ~ 機械, xlab="機械", ylab="製品数") boxplot(製品数 ~ 人, xlab="人", ylab="製品数") summary(aov(製品数 ~ 機械 + Error(人/機械))) # 以下のように書いてもよい # summary(aov(製品数 ~ 機械 + 人))

箱ひげ図の出力(機械ごと)

箱ひげ図の出力(人ごと)

分散分析表の出力(1) > summary(aov(製品数 ~ 機械 + Error(人/機械))) Error: 人 Df Sum Sq Mean Sq F value Pr(>F) Residuals 4 161.5 40.37 Error: 人:機械 Df Sum Sq Mean Sq F value Pr(>F) 機械 3 338.8 112.93 18.39 8.78e-05 *** Residuals 12 73.7 6.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

分散分析表の出力(2) > summary(aov(製品数 ~ 機械 + 人)) Df Sum Sq Mean Sq F value Pr(>F) 機械 3 338.8 112.93 18.388 8.78e-05 *** 人 4 161.5 40.38 6.574 0.00485 ** Residuals 12 73.7 6.14 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 相関比(機械): 相関比(人):

データ行列の分解を確認する R スクリプト # 全体平均 grand <- mean(製品数) # データの行列 data_mat <- matrix(製品数, nrow=5, ncol=4) # 全平均を要素として持つ行列 grand_mat <- matrix(rep(grand,20), nrow=5, ncol=4) # 各列に,データ行列の列平均(機械ごとの平均)を並べた行列 colmean_mat <- matrix(rep(colMeans(data_mat),5), nrow=5, ncol=4, byrow=T) # 各行に,データ行列の行平均(工員ごとの平均)を並べた行列 rowmean_mat <- matrix(rep(rowMeans(data_mat),4), nrow=5, ncol=4) (つづく)

# 機械の効果 effect_m_mat <- colmean_mat - grand_mat # 工員の効果 effect_p_mat <- rowmean_mat - grand_mat # 誤差 error_mat <- data_mat - colmean_mat - rowmean_mat + grand_mat # データ行列の分解を確認する # data_mat # = grand_mat + effect_m_mat + effect_p_mat + error_mat

平方和の分解を確認する R スクリプト # 全平方和 SS <- sum((data_mat - grand_mat)^2) # 機械要因の平方和 SS_m <- sum(effect_m_mat^2) # 工員要因の平方和 SS_p<- sum(effect_p_mat^2) # 誤差の平方和 SS_e <- sum(error_mat^2) # 平方和の分解を確認する # SS = SS_m + SS_p + SS_e

理解確認のポイント 実験条件への参加について,1要因被験者間デザインと被験者内デザインの違いを説明できますか? 1要因被験者内デザインでの,分散分析の構造モデルを書き,式の要素を説明することができますか? この分散分析モデルに従って,データを分解することができますか?

1要因被験者内デザインでの,平方和の分解の式を書き,興味ある要因の平方和,個人差の平方和,誤差の平方和について説明できますか? それぞれの平方和の自由度がいくつになるか,わかりますか? 分散分析を実行し,分散分析表を作成することができますか?