第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
第13回授業(7/10-1) での学習内容 6月19日に宿題にした平均値の差の検定結果、及び7月3日の授業で実習した同検定結果のウェブ上での検算のやり方を学習する。 この検算の宿題は、春期定期試験の時に、今日渡す2枚目の出欠表の裏に授業中の手計算による結果と比較して、手計算の結果が正しかったかを報告する。
確率・統計Ⅱ 第7回.
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
第3章 統計的推定 (その1) 統計学 2006年度.
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
第14回(1/15)授業の学習目標 第5章平均値の差の検定、のWEB宿題のやり方 秋期試験の内容について.
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
Presentation transcript:

第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ   ーポイントファイルの中の第10回(6/12)及び第11回 (6/19)を参照のこと)  (1)平均値の差の検定の目的や意味を再確認する。  (2)平均値の差の検定の大枠を復習する。  (3)平均値の差の検定に先立つ分散の等質性の検定方     法を復習する。  (4)平均値の差の検定方法の復習をする。  (5)平均値の差の検定の再実習をする。

(1)平均値の差の検定の目的や意味ー1 心理学では、検査や実験により得られた得点に、あらかじめ設定した2つの条件間で差が見られるかどうかを検討することがよくある。 例えば、ミラーリエル錯視実験の30度30mm条件と30度45mm 条件の2条件間の錯視量に差がみられるであろうか。 あるいは、30度30mmの条件での錯視量に、男女差は見られるのであろうか。

(1)平均値の差の検定の目的や意味ー2 これらの課題を検討するための1つの客観的・実証的な方法は、既に第3章の後半で少し紹介した統計的仮説検定を行うことである。 これを行うためには、まず第1にそれぞれの条件下で実験を行い、それぞれの条件での測定値を得ることが必要である。統計学では、これを標本を収集するという。 標本は漠然と収集するのではなく、何らかの(統計的)仮説を立て、無作為に収集する必要がある。

(1)平均値の差の検定の目的や意味ー3 例えば、ミラーリエル錯視のある条件下での男子と女子の錯視量がそれぞれ Nx 人、Ny 人づつ無作為に得られたとすると、2群の標本は、一般的には、それぞれつぎのように書ける:

(1)平均値の差の検定の目的や意味ー4 一方、平均値の差の検定における仮説は、帰無 仮説と呼ばれ、両条件の母平均の平均値 μx、μy に  差がない、というものであり、これを数式で書くと次  のようになる:                                       

(1)平均値の差の検定の目的や意味ー5 とは異なり、標本が抽出されるもとの母集団での平均値に差がない、というものである点に注意が必要である。 うえの仮説は、両条件での標本の平均値に差がない、すなわち とは異なり、標本が抽出されるもとの母集団での平均値に差がない、というものである点に注意が必要である。

(2)平均値の差の検定の大枠ー1 2つの群間で平均値に違いがあるかどうかを検討する場合、データが得られるもとの母集団の特徴の違いにより、検定方法が異なる。  (1)1つの方法は、テキスト p.19 の 5.1 節の     「母集団の分布形が未知だが、母分散は既知で、標本    数が大の場合」  (2)他方は、テキスト p.20 の 5.2 節の    「母集団の分布が正規分布で、母分散は未知の場合」 この授業の演習では、後者の方法のみを学ぶ

(2)平均値の差の検定の大枠ー2 帰無仮説のもとで、さらに5.2節の条件の下では、例えばテキスト p.23 の (5.9) 式、すなわち次の量 t がどんな値を取る可能性がどれぐらいであるか、つまり t の分布が理論的にわかっている: つぎのスライドは、その分布を示す:

自由度 v の t-分布とは? -正規分布に近い y 軸対称な分布 確率 t- 分布 斜線部 1-α t - t N-1(α/2) t N-1(α/2)

(2)平均値の差の検定の大枠ー3 つまり、帰無仮説のもとでは、標本から計算され る上記の t の値が上の図の下限値以下か、上 限値以上の範囲に入る可能性は α である。 この α の値は、統計学では通常 0.05 か 0.01 を考えるのが慣習である。

(2)平均値の差の検定の大枠ー4 そこで、もし帰無仮説のもとで標本から計算され た t-値が下限値以下や上限値以上の値を取った   ならば、われわれは帰無仮説のもとでは起こり得   そうもないことが起こったとして、帰無仮説を捨て   る。統計では、帰無仮説を棄却するという。 平均値の差の検定で、帰無仮説を棄却すること   は、両条件の平均値に差があることを意味する。

(2)平均値の差の検定の大枠ー5 一方、同じく帰無仮説のもとでは、標本から計 算される上記の t の値が上の図の下限値から  上限値の範囲に入る可能性は 1-α である。 通常、ここでの α は 0.05 か 0.01 なので、1-α の値は、通常 0.95 か 0.99 である。

(2)平均値の差の検定の大枠ー6 そこで、帰無仮説のもとで、標本から計算された t-値が下限値から上限値の範囲の値を取ったな   らば、われわれは帰無仮説のもとでは起こりえそ   うなことが起こったとして、帰無仮説を受け入れ   る。統計では、帰無仮説を採択するという。 平均値の差の検定で、帰無仮説を採択すること   は、両条件の平均値に差がないことを意味する。

(2)平均値の差の検定の大枠ー7 平均値の差の検定では、2群の標本が抽出される元の集団すなわち母集団分布に正規分布が仮定される場合(テキストでは、p.20 からの 5.2 節)には、t-統計量が用いられる。 ただし、この場合、t-統計量そのものが、2つの母集団の分散(母分散)が等しいかどうかで、異なるものになることがわかっている。

(2)平均値の差の検定の大枠ー8 つまり、2群の母集団が正規分布に従うとみなされる時、われわれは平均値の差の検定に先立ち、2つの母集団の分布の分散が等しいかどうかの検定を行わないといけないのである。 この検定は、母分散の等質性の検定と呼ばれ、つぎに示す、テキスト p.21 の最上部の (5.4) 式がそのための統計量であり、F は F-分布に従うことが知られている。

F-分布の標準的な形状 F-分布の標準的な形状は、つぎのとおりである: F-分布 α/2 α/2 上側α/2%点

(2)平均値の差の検定の大枠ー9 F-分布の形は、t-分布と異なり2つの自由度により決まる。テキスト p.21 の (5.4) 式の F-分布の自由度は、テキスト p.20 の末尾の下から2行目にあるように、2群の標本のサンプル数をそれぞれ Nx, Ny とすると、

(2)平均値の差の検定の大枠ー10 結局、平均値の差の検定の一連の手順はつぎのとおり: (1)最初に、両群の分散の等質性の検定を行う。   (1)最初に、両群の分散の等質性の検定を行う。   (2)その結果、両群の分散が等しいと見なさ れる場     合は、(5.9) 式の t の値による平均値の差の検定     を行う。   (3)もし、両群の分散が等しいとみなせない場合は、     (5.10) 式の t’ の値による平均値の差の検定を行     う。

(3)平均値の差の検定に先立つ分散の等質性の検定ー1 平均値の差の検定に先立つ、分散の等質性の検定を  行うには、テキスト p.26 の上部にあるように、   (1)2組の標本の平均を、それぞれ求める。   (2)2組の標本の分散を、それぞれ求める。   (3)一般には(5.4) 式により F-値を計算する。   (4)サンプル数が共に20の場合は、テキスト p.24 の     下方の、F-検定の危険率に対応する棄却点の値     と上の F-値を比較する。

(3)平均値の差の検定に先立つ分散の等質性の検定ー2 ただし、実際のF-統計量の計算には、数表を用いる場合、通常の F-分布表の特徴から、(5.4) 式ではなく (5.5) 式を用いる、すなわち

(3)平均値の差の検定に先立つ分散の等質性の検定ー3 しかし、F は両群のサンプル数 N1 及び N2 が等しい時には、テキスト p.22 の (5.6) 式、すなわち、 となり、両群のサンプルでの標本分散の比の形に書ける。そこで、(5.6)式で計算すればよい。

(3)平均値の差の検定に先立つ分散の等質性の検定ー4 ここで、この式の分子の分散と分母の分散は、順に であるが、前者は、2群の標本での不偏分散の大きい方に対応する分散でないといけないので、注意が必要である。ただし、2群のサンプル数が等しい場合は、単純に分散の大きい方を分子に、小さい方を分母に取ればよい。

(3)平均値の差の検定に先立つ分散の等質性の検定ー5 つぎに、分散の等質性の検定を行い、つぎに平均の差の検定を行う場合、両検定の全体的危険率の考慮が必要である。 とりわけ、両母集団の分散が等しい場合には、分散の等質性の検定統計量 F と、平均値の差の通常の検定統計量 t とは、互いに独立であることが知られている(Hogg, 1961)。 この独立性が成り立つ場合には、両検定の全体的危険率は、個々の危険率を α とすると、ほぼ2倍にインフレする。

(3)平均値の差の検定に先立つ分散の等質性の検定ー6 これを避けるには、個々の検定の危険率 αは、全体の危険率を α* として、 にすればよい。これを実現するには、  (1)α* =0.05 ならば、αはおよそ 0.025 に、  (2)α*=0.01 ならば、 αはおよそ 0.005 に、 それぞれ取ればよい。

(3)平均値の差の検定に先立つ分散の等質性の検定ー7 両群の標本数が共に10の場合、標本での F-値が、つぎの棄却点の値(いずれか一方) 未満ならば、等分散仮説を採択する。この場合、分散は等しいとみなされる。

(3)平均値の差の検定に先立つ分散の等質性の検定ー8 それに対して、標本での F-値が、演習時に指定された危険率に対応する棄却点の値(いずれか一方) 以上ならば、等分散仮説を棄却する。この場合、分散は異なるとみなされる。

(4)平均値の差の検定ー1 (1)両群での分散が等しいとみなされる場合   テキスト pp.22-23 の t-統計量と対応する以下に示した自由度を計算する。  すなわち、

(4)平均値の差の検定ー2 t-統計量を計算し自由度を計算したら、標本で の t の値が、演習時に指定された危険率に対  応するつぎの棄却点の値(いずれか一方) 未満ならば、等平均仮説を採択する。この 場合、両群の平均値は等しいとみなされる。

(4)平均値の差の検定ー3 (等分散仮説採択の場合) (4)平均値の差の検定ー3     (等分散仮説採択の場合) 一方、標本での t の値が、授業中に指定された危険  率に対応するつぎの棄却点の値(いずれか一方) 以上ならば、等平均仮説を棄却する。この 場合、両群の平均値に差があることを意味す る。

(4)平均値の差の検定ー4 (2)両群の分散が異なるとみなされる場合    テキスト p.20 に書いたように、べーレンス・フィッシャー問題と呼ばれており、そのような場合に平均値の差の検定を行うこと自体に無理があると言う研究者もいる。 また、この場合、F-統計量と t’-統計量は互いに独立ではないので、2つの検定を続けて行う場合の全体としての危険率の計算は困難であり、ここでは危険率のコントロールは行わず、通常の F 分布表の制約から次善の策として、t’ 検定の危険率は α で行うこととする。

(4)平均値の差の検定ー5 両群での分散が異なるとみなされる場合は、テキスト pp.22-23 の t-統計量と対応する自由度を計算する。すなわち、

(4)平均値の差の検定ー6 つぎに、この場合の t’-分布の自由度は、テキスト p.23 の下方にいろいろな方法が紹介してあるが、その中で、SAS が標準として用いているところの     (b) Satterthwaite (1946) の方法による自由度を計算すること、すなわち:

(4)平均値の差の検定ー7 (等分散仮説棄却の場合) (4)平均値の差の検定ー7      (等分散仮説棄却の場合) t’-統計量を計算し、自由度を計算したら、最後に岩原の副読本の p.434 を開き、    (1)授業中に指定された危険率 α と    (2) (5.12) 式で計算した自由度に対応す る棄却点の値を読み取る。 標本での t’-値がこの棄却点の値未満ならば、等平均仮説を採択する。この場合、平均値の差がないことを意味する。

(4)平均値の差の検定ー8 それに対して、標本での t’-値がこの棄却点の値以上ならば、等平均仮説を棄却する。この場合、両群の平均値に差があることを意味する。

(5)平均値の差の検定の再実習 岩原テキスト末尾の乱数表から、各自のデータを抽出し、平均値の差の検定をおこなってみよう。 今日は、標本数は各群とも10とし、各自の学籍に対応する岩原テキストの乱数の位置から数えて5つ下から始まるデータを用いよ。 第1群の10個は p.445から、第2群の10個はp.446の同位置から取り出すこと。 検定の全体的危険率 α* は、0.05とせよ。