第6回 分散分析(第7章) Analysis of Variance

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
Rによる回帰分析 高崎経済大学 宮田 庸一.
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
自己回帰モデルへの橋渡し 高崎経済大学 宮田庸一
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
2.統計的方法の基礎知識 2.1 データのまとめ方 2.2 確率分布 2.3 検定と推定 練習問題  Revised.
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
ストップウォッチの カード ストップウォッチの カード
 統計学講義 第11回     相関係数、回帰直線    決定係数.
P-Valueについて.
第5回 回帰モデル Regression Analysis
量的表現 Quantitation.
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
大規模なこと Large scale.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
部分的最小二乗回帰 Partial Least Squares Regression PLS
1.母平均の検定:小標本場合 2.母集団平均の差の検定
Rを使用したデータ解析・グラフ描き.
RでのScheffeの多重比較.
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
母分散の検定 母分散の比の検定 カイ2乗分布の応用
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
RでのScheffeの多重比較.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
Presentation transcript:

第6回 分散分析(第7章) Analysis of Variance 回帰モデルにおける分散分析 回帰式の全体的な適合度(分散分析) 平方和の分解 Decomposition of Sum of Squares 全体の散らばり=説明できた部分+残差 対応のないデータと,対応のあるデータ 個人(個体)による違いを考える

帰無仮説と対立仮説 Null Hypothesis and Alternate Hypothesis A person has headache (pain in head) Before it, he drank a glass of bad wine. Alternate Hypothesis: what is susceptive; The wine was the cause of the pain. (guilty) Null Hypothesis: Opposite to that hypothesis; The wine was not the cause of the pain. (innocent)

棄却と採択 Rejection of the Null Hypothesis When we permit the Null Hypothesis, the probability of the realized event is calculated. Calculate the probability of headache when he did not drink such a wine. If the probability is too small (smaller than your critical probability), you can reject the null-hypothesis and approve the alternate hypothesis. The wine was the cause of the pain. (guilty) If the probability is not too small, you cannot say anything. (not actively approve the null hypothesis). The wine was not the cause of the pain. (innocent)

連続変数と棄却域 Critical Value for Continuous Variable We take a continuous variable such as headache duration, we can set the critical region, more easily, based on the usual probability density. If he had headache with certain large probability, when drinking no wine, we cannot reject the Null Hypothesis. Probability Density under the Null Hypothesis 0.05 No-ache 60min Ache Duration of headache 4

F分布 (F distribution) 確率密度関数 自由度(f1,f2) のF 分布 F分布もχ2分布と関係がある。 X, Y が独立でそれぞれ自由度f1, f2 のχ2 分布に従うとき、 は自由度(f1, f2) のF 分布に従う。 したがって2 つの標本群から計算した分散の比をとると、その統計量はF 分布に従う.

 F分布表 (F distribution)

Regressed Sum of Squared 目的変数をどの程度[記述]出来たか? なる説明式がある場合 Xiによる説明式がない場合 回帰(Xiで説明 できた y から のずれ) yiの推計値 として、 平均値 y を 使うしかない Y Y 残差・誤差 X 回帰平方和 Regressed Sum of Squared 平均値周りの バラツキ(全平方和) Total Sum of Squares 決定係数 説明できた 平方和の割合 残差平方和 Error Sum of Squared

平方和(散らばり)の分解 Decomposition of Sum of Squared 全体の散らばり(Total)を分解  説明できた散らばり(Regressed)    +残りの散らばり(Error) それぞれを平方和(Sum of Squared)で評価 ST=SR+SE 帰無仮説:SRとSEは統計的に同程度のもの そのときには、Fo=VR/VEはF分布(自由度fR, fE)に従う        ただしVR=SR/fR, VE=SE/fE

回帰による記述(説明)力の検定 回帰平方和が統計的に大きな意味を持っているか? 分散分析表を作り、F検定を行って判断する。 帰無仮説:回帰平方和は誤差平方和と同程度の大きさ  (回帰式は、誤差に比べて大きな説明力はない) 対立仮説:回帰平方和は誤差平方和より大きい  (回帰式によって誤差よりもかなり大きい部分が説明できた)

回帰による記述(説明)力の検定例 帰無仮説:回帰平方和は誤差平方和と同程度の大きさ (回帰式は、誤差に比べて大きな説明力はない)→棄却  (回帰式は、誤差に比べて大きな説明力はない)→棄却 対立仮説:回帰平方和は誤差平方和より大きい  (回帰式により、誤差よりもかなり大きい部分が説明できた) Multiple R-squared: 0.9511, Adjusted R-squared: 0.9348 F-statistic: 58.37 on 2 and 6 DF, p-value: 0.0001168

7.1一元配置法(対応なし)p.159 指導法ごとに,テストの点数が異なるか? A B C D 15 9 18 14 13 8 12 7 10 6 11 3 5

変動の分解 = + 観測値 全体平均 全体変動 = + 全体変動 群間平均 群内変動(残差) A B C D 15 9 18 14 13 8 12 7 10 6 11 3 5 A B C D 10 A B C D +5 -1 +8 +4 +3 -2 +2 -3 -4 +1 -7 -5 = + 観測値 全体平均 全体変動 A B C D +5 -1 +8 +4 +3 -2 +2 -3 -4 +1 -7 -5 A B C D 4.8 -0.4 -0.8 -3.6 A B C D 0.2 -5.8 3.2 -0.8 3.4 -1.6 2.4 -2.6 0.8 -3.2 1.8 -2.2 2.8 3.6 0.6 -3.4 -1.4 -0.6 = + 全体変動 群間平均 群内変動(残差)

平方和の評価 = + 全体変動 群間平均 群内変動(残差) 平方和 322 平方和 184 平方和 138 分散16.94=322/19 A B C D +5 -1 +8 +4 +3 -2 +2 -3 -4 +1 -7 -5 A B C D 4.8 -0.4 -0.8 -3.6 A B C D 0.2 -5.8 3.2 -0.8 3.4 -1.6 2.4 -2.6 0.8 -3.2 1.8 -2.2 2.8 3.6 0.6 -3.4 -1.4 -0.6 = + 全体変動 群間平均 群内変動(残差) 平方和 322 平方和 184 平方和 138 分散16.94=322/19 分散61.3-184/3 分散8.6=138/16 自由度19=20-1 自由度3=4-1 自由度16=4(5-1) 13 F=61.33/8.625=7.11

F分布表 (F distribution) 7.11 3.24 Under the null-hypothesis, The Ratio of Variance goes beyond the observed value (7.111) with Probability smaller than 0.05. You can reject the null-hypothesis: The inter-group variation is statistically different from the inner-group. 14 7.111>F(0.05:3,16)=3.24 14

Rによる計算 aov() > 統計テスト2 [1] 15 9 18 14 18 13 8 8 12 7 10 6 11 7 12 10 7 3 5 7 > 指導法2 [1] A A A A A B B B B B C C C C C D D D D D Levels: A B C D > oneway.test(統計テスト2~指導法2,var.equal=TRUE) One-way analysis of means data: 統計テスト2 and 指導法2 F = 7.1111, num df = 3, denom df = 16, p-value = 0.002988 > summary(aov(統計テスト2~指導法2)) Df Sum Sq Mean Sq F value Pr(>F) 指導法2 3 184.000 61.333 7.1111 0.002988 ** Residuals 16 138.000 8.625 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 >

7.2一元配置法(対応あり)p.175 3科目に対する好意度の評価 学生 田中 岸 大引 吉川 荻野 7 8 9 5 6 4 1 3 2 線形代数 微分積分 確率統計 田中 岸 大引 吉川 荻野 7 8 9 5 6 4 1 3 2 16 16

変動の分解 = + 観測値 全体平均 全体変動 全体変動 = + + 条件(科目間) 個人差(個人間) (残差) 線 微 確 田 岸 大 吉 荻 7 8 9 5 6 4 1 3 2 線 微 確 田 岸 大 吉 荻 5.53 線 微 確 田 岸 大 吉 荻 1.46 2.46 3.46 -0.53 0.46 -1.53 -4.53 -2.53 -3.53 = + 観測値 全体平均 全体変動 線 微 確 田 岸 大 吉 荻 1.46 -1.53 -1.53 -1.53 0.06 線 微 確 田 岸 大 吉 荻 1.13 0.46 2.13 -2.86 -0.86 線 微 確 田 岸 大 吉 荻 -1.13 0.53 -0.13 0.86 -0.46 1.26 -0.06 -0.73 -0.26 全体変動 = + + 17 条件(科目間) 個人差(個人間) (残差)

平方和の評価 = + + 全体変動 条件(科目間) 個人差(個人間) (残差) 平方和 22.53 平方和 6.133 平方和 45.06 線 微 確 田 岸 大 吉 荻 1.46 -1.53 -1.53 -1.53 0.06 線 微 確 田 岸 大 吉 荻 1.13 0.46 2.13 -2.86 -0.86 線 微 確 田 岸 大 吉 荻 -1.13 0.53 -0.13 0.86 -0.46 1.26 -0.06 -0.73 -0.26 = + + 全体変動 条件(科目間) 個人差(個人間) (残差) 平方和 22.53 平方和 6.133 平方和 45.06 平方和 73.73 分散11.267 分散 0.767 分散11.267 自由度 14=15-1 自由度2=3-1 自由度4=5-1 自由度8=4(3-1) Fo=11.267/0.767=14.69>F(2,8,0.05)=4.64 18 Fo=11.267/0.767=14.69>F(4,8,0.05)=3.84

Rによる計算 aov() > 好意度 [1] 7 8 9 5 6 5 4 7 1 3 8 6 7 2 5 > 科目 [1] 線形代数 線形代数 線形代数 線形代数 線形代数 微分積分 微分積分 微分積分 微分積分 [10] 微分積分 確率統計 確率統計 確率統計 確率統計 確率統計 Levels: 確率統計 線形代数 微分積分 > 人 [1] 田中 岸 大引 吉川 荻野 田中 岸 大引 吉川 荻野 田中 岸 大引 吉川 荻野 Levels: 荻野 岸 吉川 大引 田中 > summary(aov(好意度~科目)) Df Sum Sq Mean Sq F value Pr(>F) 科目 2 22.533 11.267 2.6406 0.1121 Residuals 12 51.200 4.267

Rによる計算 aov() > summary(aov(好意度~人)) Df Sum Sq Mean Sq F value Pr(>F) 人 4 45.067 11.267 3.9302 0.03603 * Residuals 10 28.667 2.867 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > summary(aov(好意度~科目+人) ) Df Sum Sq Mean Sq F value Pr(>F) 科目 2 22.533 11.267 14.696 0.002095 ** 人 4 45.067 11.267 14.696 0.000931 *** Residuals 8 6.133 0.767