統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明

Slides:



Advertisements
Similar presentations
橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
相関係数 植物生態学研究室木村 一也.
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
臨界値の算出法(Excelの場合) =normsinv( 確率 ) 下側累積確率Pr(z≦z0)に対応するz値
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
クロス集計とχ2検定 P.144.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
相関分析.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
統計学 西 山.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計処理2  t検定・分散分析.
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明 第5章 統計的仮説検定 統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明

5.1 仮説検定の必要性 相関が見られるような標本を抽出 しかし、母集団全体からデータを得たら相関係数はゼロになるかも 2017/2/28 5.1 仮説検定の必要性 相関が見られるような標本を抽出 しかし、母集団全体からデータを得たら相関係数はゼロになるかも たまたま相関が見られるような標本を抽出しただけではないか?? やはり母集団すべてのデータを集めるしかないのか・・・

仮説検定の必要性その2 データが膨大だとすべてのデータを集めるのは無理 ↓ 標本抽出をして母数の推定を行った 2017/2/28 仮説検定の必要性その2 データが膨大だとすべてのデータを集めるのは無理                       ↓      標本抽出をして母数の推定を行った 母集団に全く相関がないとしたら、抽出した標本に見られたような結果が得られる可能性は非常に小さいということを主張 統計的仮説検定は確率論に基づき、このような主張を行うための方法

統計的仮説検定の手順 手順 やること 1 2 3 4 5 母集団に関する帰無仮説と対立仮説を設定 検定統計量を選択 有意水準αの値を決定 データから検定統計量の実現値を求める 5 検定統計量の実現値が棄却域に入れば帰無仮説を棄却して、対立仮説を採択 棄却域に入らなければ、帰無仮説を採択

5.2.1 帰無仮説と対立仮説 帰無仮説 H0 対立仮説 H1 で表す 帰無仮説: 「差がない」「効果がない」という仮説 5.2.1 帰無仮説と対立仮説 帰無仮説: 「差がない」「効果がない」という仮説 母平均    ,母相関係数    ,母平均の差          というような仮説 本来主張したいこととは逆の仮説 対立仮説:帰無仮説が棄却されたときに採択される、帰無仮説とは逆の仮説   本来主張したいことを表した仮説 帰無仮説 H0 対立仮説 H1 で表す

帰無仮説と対立仮説(2) 両側検定:対立仮説が、母平均 、母相関係数 、母平均の差 の場合 対立仮説の設定により、検定は両側検定か片側検定 両側検定:対立仮説が、母平均    、母相関係数    、母平均の差      の場合 片側検定:対立仮説が、母平均    、母相関係数    、母平均の差      の場合 要するに、両側検定は 母平均の場合 μ ≠ 0 を調べるという ことは   μ > 0 と μ < 0 の両側  を調べる、   ということ

帰無仮説と対立仮説(3) 帰無仮説が正しいものとして話を進めていく 実際に得られたデータから計算された検定統計量の値によって採択を判断 帰無仮説が正しいとして  ほぼ起こり得ない値(極端):帰無仮説を棄却  あり得るような値(極端でない):帰無仮説を採択

5.2.2 検定統計量 検定統計量:統計的仮説検定のために用いられる標本統計量のこと 5.2.2 検定統計量 検定統計量:統計的仮説検定のために用いられる標本統計量のこと 検定統計量の実現値:実際のデータ(手に入った標本)を基に計算して、具体的な値のこと 検定統計量の実現値は、対立仮説に合っているほど0から離れた値を示す

5.2.3 有意水準と棄却域 対立仮説を採択するか決定するときに基準になるのが有意水準 有意水準は5%または1%に設定することが多い 5.2.3 有意水準と棄却域 対立仮説を採択するか決定するときに基準になるのが有意水準 有意水準は5%または1%に設定することが多い 帰無仮説が正しいものとして考えた時の標本分布を帰無分布という

有意水準と棄却域(2) 帰無仮説のもとで、非常に生じにくい検定統計量の値の範囲を棄却域という 採択域 : 棄却域以外の部分 臨界値 : 棄却域と採択域の境目の値 棄却域に検定統計量の実現値が入ったら、帰無仮説を棄却する

正規分布を帰無分布とした時の棄却域 臨界値 棄却域 採択域

5.2.4 統計的仮説検定の結果の報告 検定統計量の実現値が棄却域に入った場合、「差がない」という帰無仮説を棄却し、「差がある」という対立仮説を採択する。 「検定結果は5% (または1%)水準で有意である」 または 「     (または )で有意差が見られた 」 と記述する。

5.2.5 p値 p値:帰無仮説が正しいという仮定のもとで、標本から計算した検定統計量の実現値以上の値が得られる確率のこと 「     (または )で有意差が見られた」 有意水準

5.2.6 第1種の誤りと第2種の誤り 第1種の誤り:「帰無仮説が真のとき、これを棄却してしまう」誤りのこと 5.2.6 第1種の誤りと第2種の誤り 第1種の誤り:「帰無仮説が真のとき、これを棄却してしまう」誤りのこと この種の誤りを犯す確率が「有意水準」または「危険率」 第2種の誤り:「帰無仮説が偽のとき、これを採択する (棄却できない)」誤りのこと

5.2.7 検定力 検定力:帰無仮説が偽の場合、全体の確率1から第2種の誤りの確率( )を引いた確率 「第2種の誤りを犯さない確率」 5.2.7 検定力 検定力:帰無仮説が偽の場合、全体の確率1から第2種の誤りの確率(  )を引いた確率        「第2種の誤りを犯さない確率」  つまり、間違っている帰無仮説を正しく棄却できる確率のこと 

5.3 標準正規分布を用いた検定 正規母集団 から無作為に標本を抽出 する(サンプルサイズは n )と 標本平均の分布も正規分布 5.3 標準正規分布を用いた検定 正規母集団         から無作為に標本を抽出 する(サンプルサイズは n )と   標本平均の分布も正規分布   標本平均の平均は   、分散は これを標準化したものを検定統計量とする:

5.3 Rを使って > 心理学テスト <-   > 心理学テスト <-          c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15) > z分子 <- mean(心理学テスト)-12  #検定統計量の分子を計算 > z分母 <- sqrt(10/length(心理学テスト)) #検定統計量の分母 > z統計量 <- z分子/z分母 > z統計量 [1] -2.828427

 (5)帰無仮説の棄却or採択の決定 下側確率:標準正規分布に従う確率変数Zを例にとれば、 Zがある値α以下となる確率のこと --- Prob(Z ≦ α) 上側確率:標準正規分布に従う確率変数Zを例にとれば、 Zがある値αより大きくなる確率のこと--- Prob(Z > α)

検定の実際 > qnorm(0.025) #下側確率0.025となるZの値を求める [1] -1.959964 [1] 1.959964 > qnorm(0.025,lower.tail=FALSE) #上限確率0.025となるZの値を求める   棄却域を図で表す↓ > curve(dnorm(x),-3,3) > abline(v=qnorm(0.025)) > abline(v=qnorm(0.975))  求めたz統計量( -2.828427)が棄却域 に入れば帰無仮説が棄却される

pnorm関数を用いて... 求めたz統計量( -2.828427)に対してpnorm関数を用いて直接p値を求める方法もある [1] 0.002338868 > pnorm(-2.828427,lower.tail=FALSE) # 上側確率 > 2*pnorm(-2.828427,lower.tail=FALSE) # p値 [1] 0.004677737 p値が有意水準より小さい時に帰無仮説を棄却 有意水準0.005よりも小さいので 帰無仮説が棄却される

5.4 t分布を用いた検定 正規母集団からの無作為標本 母集団の分散σ2がわからない場合 が計算できないので正規分布が使えない! 5.4 t分布を用いた検定 正規母集団からの無作為標本   母集団の分散σ2がわからない場合          が計算できないので正規分布が使えない! そこで            を使う(  は標本の不偏分散の正の平方根)    これはdf=n-1のt分布に従う

5.4 t分布を用いた検定 t分布:統計学でよく利用される正規分布の形に似た、左右対称・山形の分布 自由度(df): 5.4 t分布を用いた検定 t分布:統計学でよく利用される正規分布の形に似た、左右対称・山形の分布 自由度(df):   t分布の形状を決めるもの df=8 df=2 df=0.5 df=限りなく0に近い

5.4 Rを使って > 心理学テスト <- c(13,14,7,12,10,6,8,15,4,14,9,6,10,12,5,12,8,8,12,15) > t分子 <- mean(心理学テスト)-12 #検定統計量の分子を計算 > t分母 <-sqrt(var(心理学テスト)/length(心理学テスト)) #検定統計量の分子を計算 > t統計量 <- t分子/t分母 > t統計量 [1] -2.616648 > #自由度19のt分布で下側確率0.025となるtの値を求める > qt(0.025,19) [1] -2.093024 # 自由度19のt分布で下側確率0.975となる # tの値を求める > qt(0.975,19) [1] 2.093024 > qt(0.025,19,lower.tail=FALSE) > > pt(-2.616648,19) [1] 0.00848546 > pt(-2.616648,19,lower.tail=FALSE) [1] 0.9915145 > 2*pt(2.616648,19,lower.tail=FALSE) [1] 0.01697092

5,4 続き このt検定はRで用意されている。 > t.test(心理学テスト,mu=12) One Sample t-test 5,4 続き このt検定はRで用意されている。 > t.test(心理学テスト,mu=12)   One Sample t-test    data: 心理学テスト    t = -2.6166, df = 19, p-value = 0.01697    alternative hypothesis: true mean is not equal to 12    95 percent confidence interval:    8.400225 11.599775    sample estimates:    mean of x    10

5.5 相関係数の検定 無相関検定:「母集団において相関が0である」と設定して行う検定 5.5 相関係数の検定 無相関検定:「母集団において相関が0である」と設定して行う検定 母集団相関係数(母相関)に関する検定を行うときは、標本相関係数rから次を求める

5.5 Rを使って > 統計テスト1 <- c(6,10,6,10,5,3,5,9,3,3,11,6,11,9,7,5,8,7,7,9) > 統計テスト2 <- c(10,13,8,15,8,6,9,10,7,3,18,14,18,11,12,5,7,12,7,7) > 標本相関 <- cor(統計テスト1,統計テスト2) > サンプルサイズ <- length(統計テスト1) > t分子 <- 標本相関*sqrt(サンプルサイズ-2) > t分母 <- sqrt(1-標本相関^2) > t統計量 <- t分子/t分母 > t統計量 [1] 4.805707 > qt(0.025,18) [1] -2.100922 > qt(0.975,18) [1] 2.100922 > qt(0.025,18,lower.tail=FALSE) > pt(4.805707,18,lower.tail=FALSE) [1] 7.08114e-05 > 2*pt(4.805707,18,lower.tail=FALSE) [1] 0.0001416228 >

5.5 続き この無相関検定にもRが用意されている。 Pearson's product-moment correlation 5.5 続き この無相関検定にもRが用意されている。 > cor.test(統計テスト1,統計テスト2) Pearson's product-moment correlation data: 統計テスト1 and 統計テスト2 t = 4.8057, df = 18, p-value = 0.0001416 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: 0.4596086 0.8952048 sample estimates: cor 0.749659          ピアソンの積率相関係数

5.6 独立性の検定 table関数を使ってクロス集計表に合計を足す。 統計  数  学 嫌い 好き 計 10 4 14 2 6 12 8 20

5.6 続き 独立性の検定:2つの質的変数間の連関の有意性を調べる検定 独立性の検定における検定統計量の式 5.6 続き 独立性の検定:2つの質的変数間の連関の有意性を調べる検定 カイ二乗という確率分布を利用するため、カイ二乗検定ともいう。 独立性の検定における検定統計量の式

5.6 続き 期待度数:2つの変数の間に連関がない(独立である)という帰無仮説のもとで、帰無仮説が正しければ(連関がなければ)これくらいの度数をとるだろうと期待される度数のこと

カイ二乗分布

5.6 Rを使って 統計嫌い 統計好き 計 数学嫌い 期待度数イチイチ 期待度数イチニ 14 数学好き 期待度数ニイチ 期待度数ニニ 6 12 8 20

5.6 続き > 期待度数イチイチ <-12*14/20 > 期待度数ニイチ <- 12*6/20 > 期待度数イチニ <- 8*14/20 > 期待度数ニニ <- 8*6/20 > 期待度数 <- c(期待度数イチイチ,期待度数ニイチ,期待度数イチニ,期待度数ニニ) > 観測度数 <- c(10,2,4,4) > カイ二乗要素 <- (観測度数-期待度数)^2/期待度数 > カイ二乗 <- sum(カイ二乗要素) > qchisq(0.95,1) [1] 3.841459 > qchisq(0.05,1,lower.tail=FALSE) > pchisq(2.539683,1,lower.tail=FALSE) [1] 0.1110171 > 1-pchisq(2.539683,1)

5.6 続き > 数学 <- c("嫌い","嫌い","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","嫌い","好き","嫌い","嫌い","好き","嫌い","嫌い","嫌い","嫌い") > 統計 <- c("好き","好き","好き","好き","嫌い","嫌い","嫌い","嫌い","嫌い","嫌い","好き","好き","好き","嫌い","好き","嫌い","嫌い","嫌い","嫌い","嫌い") > クロス集計表 <- table(数学,統計) > chisq.test(クロス集計表,correct=FALSE) Pearson's Chi-squared test data: クロス集計表 X-squared = 2.5397, df = 1, p-value = 0.1110 Warning message: In chisq.test(クロス集計表, correct = FALSE) : カイ自乗近似は不正確かもしれません

5.7 サンプルサイズの検定結果への影響について 5.7 サンプルサイズの検定結果への影響について 履修A 履修した 履修しない 計 文系 16 4 20 理系 12 8 28 40

比較(前のデータの10倍) 履修B 履修した 履修しない 計 文系 160 40 200 理系 120 80 280 400

5.7 続き > 履修A <- matrix(c(16,12,4,8),2,2) > rownames(履修A) <- c("文系","理系") > colnames(履修A) <- c("履修した","履修しない") > chisq.test(履修A,correct=FALSE) Pearson's Chi-squared test data: 履修A X-squared = 1.9048, df = 1, p-value = 0.1675 > 履修B <- matrix(c(160,120,40,80),2,2) > rownames(履修B) <- c("文系","理系") > colnames(履修B) <- c("履修した","履修しない") > chisq.test(履修B,correct=FALSE) data: 履修B X-squared = 19.0476, df = 1, p-value = 1.275e-05