データ分析入門(11) 第11章 平均値の差の検定 廣野元久
本章の概要 2つの母集団の性質(平均値)の違いを標本のデータから統計的に判断する方法を紹介する JMP INによる解析手順の紹介 数学的な話は統計解析などの上位講座で 理屈は難しいけれど、イメージをしっかりつかんでほしい JMP INによる解析手順の紹介 JMP INによる解析の進め方 グラフの見方,出力された数値の解釈 第11章 平均値の差の検定 廣野元久 &高橋行雄
記号のまとめ 未知の世界:(ギリシャ文字) 現実の世界(アルファベット) 標本1 母集団1 測定された男子生徒の身長 男子生徒の身長 標本2 母集団2 女子生徒の身長 測定された女子生徒の身長 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.平均値の差の検定 1.1 平均値の差の検定とは 1.2 平均値の差の検定における仮説 1.3 t分布とt検定 1.4 棄却域の設定 1.5 両側検定と片側検定 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.1 平均値の差の検定とは(1) 量的データ(間隔・比例尺度)の2つの標本集団の平均値の差から,背後の母集団の平均値に差があるかどうかを検定する 何回か取った標本の平均値は同じではない(標本誤差) 標本の平均には,標本誤差が加わるのでリスクが生じる 母集団では A>B 標本では B<A かも 標本誤差を考慮にいれて,標本の値から妥当な判断を行う 母平均の差が小さければ,有意な差が出にくいだろうが, 母平均の差そのものは分からない 標本平均、標本平均の差の分布が分かれば 評価できる 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.1 平均値の差の検定とは(2) t分布により評価する 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.1 平均値の差の検定とは(3) 偶然のなせる技? ビッグクラス.jmpの例 標本は母集団を代表したものか? 男子生徒の平均値: 女子生徒の平均値: その差3インチは,母集団にとって本当に意味があるか? 偶然のなせる技? 違いの判る,誰もが納得するか? 統計の神様に聞いてみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄
命題を決めれば,仮説を立てる 統計的仮説 1.2 平均値の差の検定における仮説 帰無仮説Ho 2つの母集団の平均値に差がない 対立仮説H1 1.2 平均値の差の検定における仮説 命題を決めれば,仮説を立てる 統計的仮説 帰無仮説Ho 2つの母集団の平均値に差がない 男子生徒と女子生徒の身長に差がない 対立仮説H1 2つの母集団の平均値に差がある 男子生徒と女子生徒の身長に差がある 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(1) 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(2) 2つの平均値の差の検定に持ちこむための前提条件 正規性 どちらの母集団も正規分布にしたがっている(ゆるい制約) 男子生徒の身長も女子生徒の身長も正規分布にしたがっ ていると考えられる 等分散性(大標本:n1+n2>30なら無制約) 2つの母集団の分散は等しい(ややきつい制約) 男子生徒の身長と女子生徒の身長の分散は等しいと考え られる 独立性 標本に選ばれるチャンスは互いに無関係 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(3) 母集団は正規分布 母集団は正規分布 平均:0 平均:μ 分散:1 分散:σ2 標準化 標本平均の 標本抽出 ばらつき分布 標本抽出 帰無仮説のもと 誤差の修正 t分布 平均:0 分散:1 正規分布でない!! 母平均,母分散は未知 標本分散に誤差が加わる (標本数が大きいほうが正確) 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(4) 同じ母集団から 2つの標本を抽出して 平均値の差を計算 何度も繰り返した t分布: 正規分布によく似た分布 平均0、分散1 に標準化 出現率の 計算が理論的に できる 平均値の差の 標本ばらつきを 表す分布 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(5) 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(6) 平均0標準偏差0.5の母集団から,2つの標本(各n=4)を取りだし, それらの標本平均値の差と,95%信頼区間を図にした Excelの乱数を使い100回繰り返した,上の図では2/100回は 母平均が含まれない 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.3 t分布とt検定(7) 今度は,母平均の差を1.7つけて,同様のシミュレーションをした 上の図では6/100回しか母平均が区間内に入らない しかも,順序が逆転したことは1度もない これなら,母平均に違いがあると標本から 判定できるだろう 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.4 棄却域の設定(1) 帰無仮説を棄却する方法 実験なり調査は1回きりである場合が多い 1.4 棄却域の設定(1) 帰無仮説を棄却する方法 実験なり調査は1回きりである場合が多い 帰無仮説が正しいのに,それを捨てる確率(有意水準)αを決める t分布とαにより,棄却域が決まる,α=0.05が一般的 標本平均値の差から計算したt値が棄却域に入ったら 帰無仮説を棄却する 非棄却域内なら,帰無仮説を棄却できない 標本数,検定方法の見なおし後,再調査 標本数,検定方法の見なおし後,帰無仮説を採択 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.4 棄却域の設定(2) 棄却域 同じ母集団から選ばれた 2つの標本平均値の差の分布 から,全体の95%が含まれる 1.4 棄却域の設定(2) 同じ母集団から選ばれた 2つの標本平均値の差の分布 から,全体の95%が含まれる 範囲を帰無仮説の非棄却域 とすると, 5/100回しか起こらない事象は何かが変であると考える 変なのは きっと母集団が 異なるからだ!! 棄却域 帰無仮説を棄却 第11章 平均値の差の検定 廣野元久 &高橋行雄
1.5 両側検定と片側検定 検定の棄却域の設定には2つのやりかたがある 対立仮説の設定による 研究態度と知識量で決まる(調査前に決めておく) 1.5 両側検定と片側検定 検定の棄却域の設定には2つのやりかたがある 対立仮説の設定による 研究態度と知識量で決まる(調査前に決めておく) 片側検定:対立仮説 μ1>μ2 あるいはμ1<μ2 母集団の平均値の大小関係は知識的に分かっている 大小関係にしか興味がない 製品の改良でによる旧製品との比較 旧製品より改良品が悪くなるはずがない 成人の男性と女性の身長の差 一般的に男性の方が背が高いことが知られている 両側検定:対立仮説 μ1=μ2 母集団の平均値の大小関係は分かっていない(一般的) 片側検定の方が有意になりやすい 第11章 平均値の差の検定 廣野元久 &高橋行雄
2 平均値の差の検定の操作 2.1 (JMP INによる)分析の流れ 帰無仮説,対立仮説を立てる 有意水準αを決める 帰無仮説:生徒の男女の平均身長に差がない:μ1―μ2=0 対立仮説:生徒の男女の平均身長に差がある: μ1―μ2=0 この場合は,両側検定を使う 有意水準αを決める α=0.05とする 男女別の身長の分布をグラフにする Mean Diamondを描画する 平均値の差があるか視覚的に判断(Diamondの重なり具合) 平均値の差の検定結果を読む 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(1) JMPをロードする ビッグクラス.jmpをロードする クリックして 第11章 平均値の差の検定 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(2) 1.性別をクリックして 2.x説明変数を選択 6.身長が yに指定される 7.OKを選択 4.身長を 3.S性別がxに 指定される 5.y目的変数を選択 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(3) 1.男女別の身長の分布が表示される 標本全体の平均 一見すると, 男子生徒の 身長の方が 高そうである 2.ここを クリック 男性の身長の ドットプロット 3.ここを クリック 女性の身長の ドットプロット 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(4) 男子の身長の平均値 標本全体の身長の平均値 男子の95%の信頼区間 女子の身長の平均値 男子と女子の95%の信頼区間はほとんど重なっていないから 両者の平均値に差がありそうだ. 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(5) 追補参照 選択すると箱ひげ図が描画される クリックして 平均値の差の検定のグラフを描画する 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(6) この角度が90度以下のとき α=0.05で有意差あり 円をクリックして,赤と灰色 の円ができたら,有意差あり 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(7) カテゴリの値 分析に使った標本数 各グループの標本平均値 平均値の標準誤差(標準偏差) 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(8) 標本平均値の差 t値 P値:α=0.05より小さい:棄却域 帰無仮説は棄却 自由度 両側α/2ずつ 0.45 0.4 0.35 片側α 0.3 0.25 両側α/2ずつ Prob. 0.2 0.15 自由度 0.1 0.05 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 t 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(9) JMPのt-Testは両側検定 p値=0.0230であるから, 0.0230/2=0.0115 α=0.05だから 片側でも 両側でも 5%有意である 片側検定の場合には, p値を2でわり, その値とαとを比較する 第11章 平均値の差の検定 廣野元久 &高橋行雄
2.2 平均値の差の検定の操作(10) 平均値の差の検定から,両側5%で有意であるから 1)帰無仮説が棄却,対立仮説が採択された 2)2つの母平均に差があると判断された 3)つまり,男子生徒と女子生徒の身長の母平 均に差があると判断された 4)男子生徒の身長の代表値の方が女子生徒 の身長の代表値より高いことが分かった 言いたい こと (データから判断する) 第11章 平均値の差の検定 廣野元久 &高橋行雄
演習問題 第11章 平均値の差の検定 廣野元久 &高橋行雄
3.実験における平均値の差の検定 3.2 被験者のランダム割り当て 3水準以上,あるいは,多因子の場合は分散分析法(要因配置実験)がある 3.1 心理実験の例 授業では紹介しませんが良く自習のこと 3.2 被験者のランダム割り当て ランダムな割り当てを行った場合には,統計的検定の結論は実験をした標本内(被験者)でしか有効ではない 割り当ての方法が開発されている 第11章 平均値の差の検定 廣野元久 &高橋行雄
心理実験の例 第11章 平均値の差の検定 廣野元久 &高橋行雄
4. スクリプト機能 心理実験のデータの解析結果 各種のスクリプトの出し方を練習しなさい JMPを終了して、再度スクリプトを実行しなさい 第11章 平均値の差の検定 廣野元久 &高橋行雄
データの揺らぎ、臨床データの揺らぎ 高橋 行雄 第11章 平均値の差の検定 廣野元久 &高橋行雄
復習 1.3 t 分布と t 検定(1) 第11章 平均値の差の検定 廣野元久 &高橋行雄
浜田本 p82、表10 での例 第11章 平均値の差の検定 廣野元久 &高橋行雄
データの揺らぎ 何回か実験を繰り返し、 標本平均とSDの変化を体験してみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄
平均値の揺らぎ 「平均_母集団」の計算式を表示し、 「適用」をクリック グラフが連動している 揺らぎを実感してみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄
揺らぎの範囲を見切る 各群 500 例のデータが正規分布に 従うと仮定した。500例のデータの揺らぎの 範囲はどのくらいか。統計の用語で述べよ。 第11章 平均値の差の検定 廣野元久 &高橋行雄
標本の平均と標本のSD 500例のデータの標本平均も揺らぐ 500例のデータの標本SDも揺らぐ 標本平均の揺らぎはどのくらいか 5 例データの標本平均の揺らぎを見切る 5 例データの SD の揺らぎを見切る 第11章 平均値の差の検定 廣野元久 &高橋行雄
揺らぎの型、その範囲を見切る 「2変量の関係」を用いて、 100回の実験の 平均値と95%信頼区間を表示せよ。 第11章 平均値の差の検定 第11章 平均値の差の検定 廣野元久 &高橋行雄
5例ごとの平均とSD 要約統計量を用いて 500 例のデータを 5 例ごとに100回の平均とSD を算出せよ。 5 例のデータの平均値の揺らぎの範囲を統計用語で述べよ 5 例のデータの SD の揺らぎの範囲を統計用語で述べよ 第11章 平均値の差の検定 廣野元久 &高橋行雄
SD の揺らぎ 第11章 平均値の差の検定 廣野元久 &高橋行雄
再度、浜田本 p82 の結果 第11章 平均値の差の検定 廣野元久 &高橋行雄
平均値の差の検定と信頼区間 第11章 平均値の差の検定 廣野元久 &高橋行雄
平均値の差の揺らぎ 「平均とSD」をコピーして、 「2群の差の信頼区間」に張付ける 第11章 平均値の差の検定 廣野元久 &高橋行雄
張付けた結果と信頼区間の表示 第11章 平均値の差の検定 廣野元久 &高橋行雄
重ね合わせプロット 第11章 平均値の差の検定 廣野元久 &高橋行雄
平均値の差も揺らぐ 第11章 平均値の差の検定 廣野元久 &高橋行雄
平均値の差 差の95%信頼区間が 「0」を跨いでいる 実験の目的は何か? 有意差検定で「有意差なし」と同じ 100回中、何回が「有意差なし」か? 実験の目的は何か? 統計的に「有意な差」がない実験の意義は何か 統計的に「有意な差」を得るためにどうしたらよいのか 第11章 平均値の差の検定 廣野元久 &高橋行雄
実験例数を増やしてみよう 1 群 5 症例ではなく 10症例ではどうか 1 群 10 症例ではなく 20症例ではどうか 1 群 20 症例ではなく 100症例ではどうか 第11章 平均値の差の検定 廣野元久 &高橋行雄
1群 20例の場合 第11章 平均値の差の検定 廣野元久 &高橋行雄