第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
1 6章 データ数不揃いの場合の分析 アンバランス型(不釣合い型)の 計画 ss2 や ss3 って何?
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4章 統計的検定 統計学 2007年度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
第6回 分散分析(第7章) Analysis of Variance
Rによる回帰分析 高崎経済大学 宮田 庸一.
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
分散分析マスターへの道.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
母分散が既知あるいは大標本の 平均に関する統計的検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
4章までのまとめ ー 計量経済学 ー.
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
システム工学実験 品質管理 第1週目 システム工学実験
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
Rを使用したデータ解析・グラフ描き.
RでのScheffeの多重比較.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
RでのScheffeの多重比較.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
要因Aの差,要因Bの差を見たい 2つの要因なので二元配置分散分析の適用 要因B 水準A 水準B 水準C 要因A 水準a
重回帰分析入門 (第5章補足) 統計学 2007年度.
数理統計学  第12回 西 山.
Presentation transcript:

第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析 7章 分散分析:第2部 第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析

例題:表7.4 銘柄の違い 温度の違い A①冷蔵庫 A②常温 B①イカアン B②ボスビック B③ビビッテル 6 10 11 5 7 12 4    6    10    11    5    7   12    4    8    12    2    3    10    9 表7.4  ミネラルウォーターのおいしさの評定に関する実験データ

7.3.1 主効果と交互作用効果 要因: 母平均に違いをもたらす原因 要因 水準 水準: ある要因の中に含まれる個々の条件 7.3.1 主効果と交互作用効果 要因: 母平均に違いをもたらす原因      水準: ある要因の中に含まれる個々の条件 例題 では...  要因         水準 温度の違い  冷蔵、常温 銘柄の違い  イカアン、ボスビック、ビビッテル

主効果と交互作用効果 二元配置分散分析では、 主効果と交互作用効果 という2種類の効果を考える 主効果: それぞれの要因ごとの効果  主効果と交互作用効果 二元配置分散分析では、       主効果と交互作用効果 という2種類の効果を考える 主効果: それぞれの要因ごとの効果     一元配置分散分析のときに考えた効果と同じ 交互作用効果: 2つ以上の要因が組み合わされたときに生じる効果。     2つの要因の効果の単純な足し算では説明できない効果

> 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3))) 表7.7 交互作用効果のある平均値のパターンの例 表7.6 交互作用効果のない平均値のパターンの例 B1 B2 B3 A1 4 3 6 A2 6 5 8 B1 B2 B3 A1 4 3 6 A2 4 6 7 > データ1 <- c(4,3,6, 6,5,8) > 要因A <- factor(c(rep("水準A1",3),rep("水準A2",3))) > 要因B <- factor(rep(c(rep("水準B1",1),rep("水準B2",1),rep("水準B3",1)),2)) > interaction.plot(要因A,要因B,データ1) > interaction.plot(要因B,要因A,データ1) > データ2 <- c(4,3,6, 4,6,7) > interaction.plot(要因A,要因B,データ2) > interaction.plot(要因B,要因A,データ2)

表7.2 交互作用効果のない平均値のプロットの例(1) 表7.3 交互作用効果のない平均値のプロットの例(2)

表7.4 交互作用効果のある平均値のプロットの例(1) 表7.5 交互作用効果のある平均値のプロットの例(2)

7.3.2 二元配置分散分析(対応なし) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 7.3.2 二元配置分散分析(対応なし) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択       分散分析では、検定統計値としてFを利用 (3)有意水準αの決定       有意水準は5%、つまりα=0.05とする。この検定は片側検定 (4)検定統計量の実現値を求める       aov関数を用いて実現値を求める (5)帰無仮説の棄却or採択の決定

帰無仮説と対立仮説の設定 要因A(温度の違い)の主効果 要因B(銘柄の違い)の主効果 要因Aと要因Bの交互作用効果 帰無仮説H0:温度が違ってもおいしさ得点の母平均は等しい(要因A          の主効果はない) 対立仮説H1:温度が違いによっておいしさ得点の母平均は異なる(要          因A の主効果がある) 要因B(銘柄の違い)の主効果 帰無仮説H0:銘柄が違ってもおいしさ得点の母平均は等しい(要因B          の主効果はない) 対立仮説H1:銘柄が違いによっておいしさ得点の母平均は異なる(要          因B の主効果がある) 要因Aと要因Bの交互作用効果 帰無仮説H0:温度と銘柄の組み合わせに相性の良し悪しはない(要因Aと          要因Bの交互作用効果はない) 対立仮説H1:温度と銘柄の組み合わせに相性の良し悪しがある(要因Aと          要因Bの交互作用効果がある)

> summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) > 味 <- c(6,4,5,3,2,10,8,10,8,9,11,12,12,10,10,5,4,2,2,2,7,6,5,4,3,12,8,5,6,4) > 味 [1] 6 4 5 3 2 10 8 10 8 9 11 12 12 10 10 5 4 2 2 2 7 6 5 4 3 12 8 5 6 4 > 温度 <- factor(c(rep("冷蔵庫",15),rep("常温",15))) > 温度 [1] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 [11] 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 冷蔵庫 常温 常温 常温 常温 常温 [21] 常温 常温 常温 常温 常温 常温 常温 常温 常温 常温 Levels: 常温 冷蔵庫 > 銘柄 <- factor(rep(c(rep("イカアン",5),rep("ボスビック",5),rep("ビビッテル",5)),2)) > 銘柄 [1] イカアン イカアン イカアン イカアン イカアン ボスビック [7] ボスビック ボスビック ボスビック ボスビック ビビッテル ビビッテル [13] ビビッテル ビビッテル ビビッテル イカアン イカアン イカアン [19] イカアン イカアン ボスビック ボスビック ボスビック ボスビック [25] ボスビック ビビッテル ビビッテル ビビッテル ビビッテル ビビッテル Levels: イカアン ビビッテル ボスビック > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > summary(aov(味~温度+銘柄+温度:銘柄)) > 67.5000+155.000+15.000+76.000 [1] 313.5 > sum((味-mean(味))^2) #全体平方和

(5)帰無仮説の棄却or採択の決定 温度の主効果:5%水準で有意な効果がある (p = 0.0011) 銘柄の主効果:5%水準で有意な効果がある (p =0.0000016) 温度と銘柄の交互作用効果:5%水準で有意な効果はない(p =0.115) interction.plot(横軸にとる要因、もう一方の要因、平均値を求める変数) > interaction.plot(温度,銘柄,味) > interaction.plot(銘柄,温度,味)

> interaction.plot(温度,銘柄,味) 直線が完全に平行ではないので 多少の交互作用はある (が有意な差はない)

> interaction.plot(銘柄,温度,味)

7.3.3 一元配置と見なして分散分析 例題に対し、二元配置分散分析に含まれる2つの要因のうち、一方を無視して一元配置分散分析を行なってみる

一元配置vs二元配置分散分析 F値がかなり小さい 一元配置 > summary(aov(味~温度)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 7.6829 0.009797 ** Residuals 28 246.0 8.786 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 F値がかなり小さい

一元配置vs二元配置分散分析 F値がかなり小さい 一元配置 > summary(aov(味~銘柄))     Df Sum Sq Mean Sq F value Pr(>F) 銘柄 2 155.0 77.50 13.202 0.0001003 *** Residuals 27 158.5 5.87 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 二元配置 > summary(aov(味~温度*銘柄)) Df Sum Sq Mean Sq F value Pr(>F) 温度 1 67.5 67.500 21.3158 0.00011 *** 銘柄 2 155.0 77.500 24.4737 1.608e-06 *** 温度:銘柄 2 15.0 7.500 2.3684 0.11515 Residuals 24 76.0 3.167 F値がかなり小さい

一元配置vs二元配置分散分析 (平均平方和に注目) 二元配置分散分析の「銘柄」「温度:銘柄」「Residuals」の平方和を足すと 155.000 + 15.000 + 76.000 = 246.000 一元配置と見なしたときの残差の平方和と一致 このように、二元配置分散分析は  2つの要因について同時に検討するだけでなく、  残差のばらつき(平方和)を減らすことで、それぞれの要因について有意な結果が得られやすくする(検定力を高める) という利点がある

7.4二元配置分散分析(2要因とも対応あり) (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 統計的仮説検定の一般的手順のうち (1)帰無仮説と対立仮説の設定 (2)検定統計量の選択 (3)有意水準αの決定 は、対応のない二元配置分散分析のときと同じ 対応のない場合と異なるのは     検定統計量の計算方法 ここではaov関数を使う

例題:表7.8 銘柄の違い 温度の違い 同じ評定者 A①冷蔵庫 A②常温 評定者 B①イカアン B②ボスビック B③ビビッテル 6 10 村松    6    10    11    5    7   12 川崎    4    8    12 井口    2 松中    3    10 城島    9 表7.8  ミネラルウォーターのおいしさの評定に関する実験データ 同じ評定者

7.4二元配置分散分析(2要因とも対応あり) > 人1 <- factor(rep(c("村松","川崎","井口","松中","城島"),6)) > 人1 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 [29] 松中 城島 Levels: 井口 松中 城島 川崎 村松 > 数字ID1 <- factor(rep(1:5,6)) > 数字ID1 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 Levels: 1 2 3 4 5

7.4二元配置分散分析(2要因とも対応あり) summary(aov(味~温度*銘柄   +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人1+人1:温度+人1:銘柄+人1:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人1 人1:温度 人1:銘柄 人1:温度:銘柄   の4つの要素に分ける

「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果

例題:表7.9 銘柄の違い 温度の違い A①冷蔵庫 A②常温 評定者 B①イカアン B②ボスビック B③ビビッテル 6 10 11 5 7 村松    6    10  11 斉藤    5    7   12 川崎    4    8  12 和田 井口 寺原    2 松中    3  10 杉内 城島    9 新垣

7.5二元配置分散分析(1要因のみ対応あり) > A1条件 <- rep(c("村松","川崎","井口","松中","城島"),3) > A2条件 <- rep(c("斉藤","和田","寺原","杉内","新垣"),3) > 人2 <- factor(c(A1条件,A2条件)) > 人2 [1] 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 城島 村松 川崎 井口 松中 [15] 城島 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 杉内 新垣 斉藤 和田 寺原 [29] 杉内 新垣 Levels: 井口 寺原 松中 城島 新垣 杉内 斉藤 川崎 村松 和田 > 数字ID2 <- factor(c(rep(1:5,3),rep(6:10,3))) > 数字ID2 [1] 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5 6 7 8 9 10 6 7 8 [24] 9 10 6 7 8 9 10 Levels: 1 2 3 4 5 6 7 8 9 10

7.5二元配置分散分析(1要因のみ対応あり) summary(aov(味~温度*銘柄 +Error(人2:温度+人2:温度:銘柄))) 「味~温度*銘柄」までは対応のない二元配置分散分析と同じ +Error(人2:温度+人2:温度:銘柄) が追加されている 対応のない分散分析で「残差」としてまとめられていたものを 人2:温度 人2:温度:銘柄 という要因に分解 各評定者は同じ温度の条件で3種類の銘柄を飲んでいる⇒個人差の要因 だから、個人差の要因である「人2」と温度の違いの要因をあらわす「温度」が関係する組み合わせだけを指定

「温度」の主効果 「銘柄」の主効果 「温度」と「銘柄」の交互作用効果

拡張 同様に、三元配置、四元配置、...要因を増やして分析することが可能 ただし、要因の数が多いと、分析が複雑になり、結果の解釈が困難になることがあるので注意 分散分析は:基本的に平均値の比較の検定 主効果や交互作用効果の観点からデータにおける値のばらつきの分析が可能