データ分析入門(11) 第11章 平均値の差の検定 廣野元久.

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
データ分析入門(10) 第10章 クロス集計表と仮説検定 廣野元久.
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
データ分析入門(13) 第13章 主成分分析 廣野元久.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

データ分析入門(11) 第11章 平均値の差の検定 廣野元久

本章の概要 2つの母集団の性質(平均値)の違いを標本のデータから統計的に判断する方法を紹介する JMP INによる解析手順の紹介 数学的な話は統計解析などの上位講座で 理屈は難しいけれど、イメージをしっかりつかんでほしい JMP INによる解析手順の紹介 JMP INによる解析の進め方 グラフの見方,出力された数値の解釈 第11章 平均値の差の検定 廣野元久 &高橋行雄

記号のまとめ 未知の世界:(ギリシャ文字) 現実の世界(アルファベット) 標本1 母集団1 測定された男子生徒の身長 男子生徒の身長 標本2 母集団2 女子生徒の身長 測定された女子生徒の身長 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.平均値の差の検定 1.1 平均値の差の検定とは 1.2 平均値の差の検定における仮説 1.3 t分布とt検定 1.4 棄却域の設定 1.5 両側検定と片側検定 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.1 平均値の差の検定とは(1) 量的データ(間隔・比例尺度)の2つの標本集団の平均値の差から,背後の母集団の平均値に差があるかどうかを検定する 何回か取った標本の平均値は同じではない(標本誤差) 標本の平均には,標本誤差が加わるのでリスクが生じる 母集団では A>B 標本では B<A かも 標本誤差を考慮にいれて,標本の値から妥当な判断を行う 母平均の差が小さければ,有意な差が出にくいだろうが, 母平均の差そのものは分からない 標本平均、標本平均の差の分布が分かれば 評価できる 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.1 平均値の差の検定とは(2) t分布により評価する 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.1 平均値の差の検定とは(3) 偶然のなせる技? ビッグクラス.jmpの例 標本は母集団を代表したものか? 男子生徒の平均値: 女子生徒の平均値: その差3インチは,母集団にとって本当に意味があるか? 偶然のなせる技? 違いの判る,誰もが納得するか? 統計の神様に聞いてみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄

命題を決めれば,仮説を立てる 統計的仮説 1.2 平均値の差の検定における仮説 帰無仮説Ho 2つの母集団の平均値に差がない 対立仮説H1 1.2 平均値の差の検定における仮説 命題を決めれば,仮説を立てる 統計的仮説 帰無仮説Ho 2つの母集団の平均値に差がない 男子生徒と女子生徒の身長に差がない 対立仮説H1 2つの母集団の平均値に差がある 男子生徒と女子生徒の身長に差がある 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(1) 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(2) 2つの平均値の差の検定に持ちこむための前提条件 正規性 どちらの母集団も正規分布にしたがっている(ゆるい制約) 男子生徒の身長も女子生徒の身長も正規分布にしたがっ ていると考えられる 等分散性(大標本:n1+n2>30なら無制約) 2つの母集団の分散は等しい(ややきつい制約) 男子生徒の身長と女子生徒の身長の分散は等しいと考え られる 独立性 標本に選ばれるチャンスは互いに無関係 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(3) 母集団は正規分布 母集団は正規分布 平均:0 平均:μ 分散:1 分散:σ2 標準化 標本平均の 標本抽出 ばらつき分布 標本抽出 帰無仮説のもと 誤差の修正 t分布 平均:0 分散:1 正規分布でない!! 母平均,母分散は未知 標本分散に誤差が加わる (標本数が大きいほうが正確) 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(4) 同じ母集団から 2つの標本を抽出して 平均値の差を計算 何度も繰り返した t分布: 正規分布によく似た分布 平均0、分散1 に標準化 出現率の 計算が理論的に できる 平均値の差の 標本ばらつきを 表す分布 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(5) 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(6) 平均0標準偏差0.5の母集団から,2つの標本(各n=4)を取りだし, それらの標本平均値の差と,95%信頼区間を図にした Excelの乱数を使い100回繰り返した,上の図では2/100回は 母平均が含まれない 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.3 t分布とt検定(7) 今度は,母平均の差を1.7つけて,同様のシミュレーションをした 上の図では6/100回しか母平均が区間内に入らない しかも,順序が逆転したことは1度もない これなら,母平均に違いがあると標本から 判定できるだろう 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.4 棄却域の設定(1) 帰無仮説を棄却する方法 実験なり調査は1回きりである場合が多い 1.4 棄却域の設定(1) 帰無仮説を棄却する方法 実験なり調査は1回きりである場合が多い 帰無仮説が正しいのに,それを捨てる確率(有意水準)αを決める t分布とαにより,棄却域が決まる,α=0.05が一般的 標本平均値の差から計算したt値が棄却域に入ったら 帰無仮説を棄却する 非棄却域内なら,帰無仮説を棄却できない 標本数,検定方法の見なおし後,再調査 標本数,検定方法の見なおし後,帰無仮説を採択 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.4 棄却域の設定(2) 棄却域 同じ母集団から選ばれた 2つの標本平均値の差の分布 から,全体の95%が含まれる 1.4 棄却域の設定(2) 同じ母集団から選ばれた 2つの標本平均値の差の分布 から,全体の95%が含まれる 範囲を帰無仮説の非棄却域 とすると, 5/100回しか起こらない事象は何かが変であると考える 変なのは きっと母集団が 異なるからだ!! 棄却域 帰無仮説を棄却 第11章 平均値の差の検定 廣野元久 &高橋行雄

1.5 両側検定と片側検定 検定の棄却域の設定には2つのやりかたがある 対立仮説の設定による 研究態度と知識量で決まる(調査前に決めておく) 1.5 両側検定と片側検定 検定の棄却域の設定には2つのやりかたがある 対立仮説の設定による 研究態度と知識量で決まる(調査前に決めておく) 片側検定:対立仮説 μ1>μ2 あるいはμ1<μ2 母集団の平均値の大小関係は知識的に分かっている 大小関係にしか興味がない 製品の改良でによる旧製品との比較 旧製品より改良品が悪くなるはずがない 成人の男性と女性の身長の差 一般的に男性の方が背が高いことが知られている 両側検定:対立仮説 μ1=μ2 母集団の平均値の大小関係は分かっていない(一般的) 片側検定の方が有意になりやすい 第11章 平均値の差の検定 廣野元久 &高橋行雄

2 平均値の差の検定の操作 2.1 (JMP INによる)分析の流れ 帰無仮説,対立仮説を立てる 有意水準αを決める 帰無仮説:生徒の男女の平均身長に差がない:μ1―μ2=0 対立仮説:生徒の男女の平均身長に差がある: μ1―μ2=0 この場合は,両側検定を使う 有意水準αを決める α=0.05とする 男女別の身長の分布をグラフにする Mean Diamondを描画する 平均値の差があるか視覚的に判断(Diamondの重なり具合) 平均値の差の検定結果を読む 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(1) JMPをロードする ビッグクラス.jmpをロードする クリックして 第11章 平均値の差の検定 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(2) 1.性別をクリックして 2.x説明変数を選択 6.身長が yに指定される 7.OKを選択 4.身長を 3.S性別がxに 指定される 5.y目的変数を選択 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(3) 1.男女別の身長の分布が表示される 標本全体の平均 一見すると, 男子生徒の 身長の方が 高そうである 2.ここを クリック 男性の身長の ドットプロット 3.ここを クリック 女性の身長の ドットプロット 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(4) 男子の身長の平均値 標本全体の身長の平均値 男子の95%の信頼区間 女子の身長の平均値 男子と女子の95%の信頼区間はほとんど重なっていないから 両者の平均値に差がありそうだ. 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(5) 追補参照 選択すると箱ひげ図が描画される クリックして 平均値の差の検定のグラフを描画する 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(6) この角度が90度以下のとき α=0.05で有意差あり 円をクリックして,赤と灰色 の円ができたら,有意差あり 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(7) カテゴリの値 分析に使った標本数 各グループの標本平均値 平均値の標準誤差(標準偏差) 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(8) 標本平均値の差 t値 P値:α=0.05より小さい:棄却域 帰無仮説は棄却 自由度 両側α/2ずつ 0.45 0.4 0.35 片側α 0.3 0.25 両側α/2ずつ Prob. 0.2 0.15 自由度 0.1 0.05 -6 -5 -4 -3 -2 -1 1 2 3 4 5 6 t 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(9) JMPのt-Testは両側検定 p値=0.0230であるから, 0.0230/2=0.0115 α=0.05だから 片側でも 両側でも 5%有意である 片側検定の場合には, p値を2でわり, その値とαとを比較する 第11章 平均値の差の検定 廣野元久 &高橋行雄

2.2 平均値の差の検定の操作(10) 平均値の差の検定から,両側5%で有意であるから 1)帰無仮説が棄却,対立仮説が採択された 2)2つの母平均に差があると判断された 3)つまり,男子生徒と女子生徒の身長の母平 均に差があると判断された 4)男子生徒の身長の代表値の方が女子生徒 の身長の代表値より高いことが分かった 言いたい こと (データから判断する) 第11章 平均値の差の検定 廣野元久 &高橋行雄

演習問題 第11章 平均値の差の検定 廣野元久 &高橋行雄

3.実験における平均値の差の検定 3.2 被験者のランダム割り当て 3水準以上,あるいは,多因子の場合は分散分析法(要因配置実験)がある 3.1 心理実験の例 授業では紹介しませんが良く自習のこと 3.2 被験者のランダム割り当て ランダムな割り当てを行った場合には,統計的検定の結論は実験をした標本内(被験者)でしか有効ではない 割り当ての方法が開発されている 第11章 平均値の差の検定 廣野元久 &高橋行雄

心理実験の例 第11章 平均値の差の検定 廣野元久 &高橋行雄

4. スクリプト機能 心理実験のデータの解析結果 各種のスクリプトの出し方を練習しなさい JMPを終了して、再度スクリプトを実行しなさい 第11章 平均値の差の検定 廣野元久 &高橋行雄

データの揺らぎ、臨床データの揺らぎ 高橋 行雄 第11章 平均値の差の検定 廣野元久 &高橋行雄

復習 1.3 t 分布と t 検定(1) 第11章 平均値の差の検定 廣野元久 &高橋行雄

浜田本 p82、表10 での例 第11章 平均値の差の検定 廣野元久 &高橋行雄

データの揺らぎ 何回か実験を繰り返し、 標本平均とSDの変化を体験してみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄

平均値の揺らぎ 「平均_母集団」の計算式を表示し、 「適用」をクリック グラフが連動している 揺らぎを実感してみよう 第11章 平均値の差の検定 廣野元久 &高橋行雄

揺らぎの範囲を見切る 各群 500 例のデータが正規分布に 従うと仮定した。500例のデータの揺らぎの 範囲はどのくらいか。統計の用語で述べよ。 第11章 平均値の差の検定 廣野元久 &高橋行雄

標本の平均と標本のSD 500例のデータの標本平均も揺らぐ 500例のデータの標本SDも揺らぐ 標本平均の揺らぎはどのくらいか 5 例データの標本平均の揺らぎを見切る 5 例データの SD の揺らぎを見切る 第11章 平均値の差の検定 廣野元久 &高橋行雄

揺らぎの型、その範囲を見切る 「2変量の関係」を用いて、 100回の実験の 平均値と95%信頼区間を表示せよ。 第11章 平均値の差の検定 第11章 平均値の差の検定 廣野元久 &高橋行雄

5例ごとの平均とSD 要約統計量を用いて 500 例のデータを 5 例ごとに100回の平均とSD を算出せよ。 5 例のデータの平均値の揺らぎの範囲を統計用語で述べよ 5 例のデータの SD の揺らぎの範囲を統計用語で述べよ 第11章 平均値の差の検定 廣野元久 &高橋行雄

SD の揺らぎ 第11章 平均値の差の検定 廣野元久 &高橋行雄

再度、浜田本 p82 の結果 第11章 平均値の差の検定 廣野元久 &高橋行雄

平均値の差の検定と信頼区間 第11章 平均値の差の検定 廣野元久 &高橋行雄

平均値の差の揺らぎ 「平均とSD」をコピーして、 「2群の差の信頼区間」に張付ける 第11章 平均値の差の検定 廣野元久 &高橋行雄

張付けた結果と信頼区間の表示 第11章 平均値の差の検定 廣野元久 &高橋行雄

重ね合わせプロット 第11章 平均値の差の検定 廣野元久 &高橋行雄

平均値の差も揺らぐ 第11章 平均値の差の検定 廣野元久 &高橋行雄

平均値の差 差の95%信頼区間が 「0」を跨いでいる 実験の目的は何か? 有意差検定で「有意差なし」と同じ 100回中、何回が「有意差なし」か? 実験の目的は何か? 統計的に「有意な差」がない実験の意義は何か 統計的に「有意な差」を得るためにどうしたらよいのか 第11章 平均値の差の検定 廣野元久 &高橋行雄

実験例数を増やしてみよう 1 群 5 症例ではなく 10症例ではどうか 1 群 10 症例ではなく 20症例ではどうか 1 群 20 症例ではなく 100症例ではどうか 第11章 平均値の差の検定 廣野元久 &高橋行雄

1群 20例の場合 第11章 平均値の差の検定 廣野元久 &高橋行雄