第1章 統計学の準備 ー 計量経済学 ー.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
確率・統計Ⅱ 第7回.
第3章 統計的推定 統計学 2008年度.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計学 12/13(木).
統計学  西 山.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
1変量データの記述 経済データ解析 2006年度.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1変量データの記述 (度数分布表とヒストグラム)
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

第1章 統計学の準備 ー 計量経済学 ー

第1節 平均値と分散 第2節 確率分布 1 平均値と分散 2 度数分布表 3 ヒストグラムと度数折れ線 1 確率分布 2 正規分布 第1節 平均値と分散 1 平均値と分散 2 度数分布表 3 ヒストグラムと度数折れ線 第2節 確率分布 1 確率分布 2 正規分布 (1) 正規分布 (2) 正規分布の応用例 3 t分布 (1) t分布 (2) t分布の応用 4 検定 (1) 検定 (2) 検定の方法

第1節 平均値と分散 算術平均 = 合計 ÷ 個数 1. 平均値と分散 左の表は、学生15人の1ヶ月のアルバイト収入のデータである。 第1節 平均値と分散 1. 平均値と分散 左の表は、学生15人の1ヶ月のアルバイト収入のデータである。 15人の集団を代表する値を求めたい 代表する値として平均値(算術平均)が考えられる 算術平均 = 合計 ÷ 個数

教員A 教員B 2人の教員はともに平均してチャイムの5分後に教室にくる 2人の教員の特徴を表現するために、平均だけでは不十分。 <ばらつきの尺度> 教員A チャイムの5分後に必ず教室にくる。 教員B チャイムと同時に教室にくることもあれば、10分以上遅れることもある。 2人の教員はともに平均してチャイムの5分後に教室にくる 2人の教員の特徴を表現するために、平均だけでは不十分。    →ばらつきの尺度の必要性 ばらつきの尺度として、分散や標準偏差などがある。

偏差2乗和とは、個々の値から平均を引き(これを偏差という)、 分散 = 偏差2乗和 ÷ 個数  偏差2乗和とは、個々の値から平均を引き(これを偏差という)、  その2乗し、合計したもの

合計 データ数15で割る 標準偏差  → 分散の平方根 算術平均64000を引く 2乗する

※ 2人の教員が教室に来る時間の例 (単位:分) 教員A

教員B となり、教員Bの分散の方が大きいことがわかる。 標準偏差も      である。

2.度数分布表 データをいくつかの階級に分け、その階級に入る度数を表の形でまとめたものが、度数分布表である。 ある大学の学生の1ヶ月のアルバイト収入 † その階級を代表する値を階級値という。階級の上限と下限をたして2で割った値が用いられることが多い。

算術平均=(度数×階級値)の総和÷度数の総和 <度数分布表からの算術平均、分散の導出> 度数分布表にまとめられたデータについて、算術平均と分散を求めることができる。(個々のデータが入手できず、度数分布表のみ入手できた場合に、この方法を使う。その階級に属するデータは、すべて階級値に等しいとみなす方法である。) 上のような度数分布表があったとする。   このとき、 算術平均=(度数×階級値)の総和÷度数の総和   として求められる。

分散={(階級値-算術平均)2×度数}の総和÷度数の総和   として求められる。  計算のためには、  これらの算術平均と分散は原データから求めた算術平均と分散の近似値となる。

この度数分布表から、平均値と分散を求めてみる。 元のデータから計算した値とは多少異なるが、近似値となる。

ヒストグラムにおいて縦軸に相対度数をとれば、全体の面積が1のヒストグラムとなる。 3.ヒストグラムと度数折れ線 度数分布表を棒グラフで表したもの ただし、棒どうしの間隔をつめて表す(階級は連続しているため) ヒストグラムにおいて縦軸に相対度数をとれば、全体の面積が1のヒストグラムとなる。 このヒストグラムにおいて、ある範囲(例えば55000円以上65,000円未満)の割合を求めたい場合、対応する棒の面積がこの割合となる。

第2節 確率分布 1.確率分布 確率変数 - とりうる値のそれぞれに対し、ある一定の確率が対応しているような変数のこと 第2節 確率分布 1.確率分布 確率変数 - とりうる値のそれぞれに対し、ある一定の確率が対応しているような変数のこと 確率分布 - 確率変数のとりうる値と、確率との対応関係

サイコロをふったとき、出た目をxとすると、xは1,2,3,4,5,6をある確率でとりうる。 <確率変数の例> サイコロをふったとき、出た目をxとすると、xは1,2,3,4,5,6をある確率でとりうる。 サイコロがどの目も同様に出るなら、それぞれには   という確率が対応する。 しかし、6回サイコロを振ってもすべての目が出るとは限らない。サイコロを振る回数を多くすれば、その回数は   に近づく。

一度の実験結果≠理論値 <確率分布の実験> サイコロを10回振り、1の目が出た回数をxとする。 この実験を100回繰り返す。 このxは0,1,2,…,10の値をある確率でとりうるので、確率変数である。 この実験を100回繰り返す。 理論上は次のような確率分布となる。 しかし、実際に100回実験をおこなった(コンピュータの乱数を用いる)ときの相対度数は、この理論値に一致するわけではない。 ただし、実験の回数を増やせば、理論上の値に近づく。 一度の実験結果≠理論値

1回の実験においてサイコロを振る回数を20回、50回と増やしてみる。   ⇒ ヒストグラムは正規分布に近づく  ☆ やってみよう ex1-1

2.正規分布  (1) 正規分布 サイコロを10回振る実験で1の目が1回以下しか出なかった割合(確率)は?            0.18 + 0.36 = 0.54     グラフでは0と1の棒の面積を加えたもの

1回の実験でサイコロを振る回数を20回、50回、100回…と増やすと、xのとりうる値が多くなり、ヒストグラムの横軸は細くなっていく。 実験回数を無限に増やすと、反対に棒の太さは無限に細くなっていく 棒の面積の和 → 下図のような範囲の面積

サイコロを振る回数を多くしたとき、1の目が出る回数の分布は正規分布に近づく。 算術平均 (期待値)

<正規分布の形状>  正規分布は平均値を中心とする左右対称のつりがね型の分布であり、平均μ、分散σ2の値によって、中心の位置や山の高さが変わってくる。 ※ 平均の異なる正規分布

※ 分散の異なる正規分布

<正規分布と確率> xの分布が正規分布となるとき、たとえば となる確率を求める場合、それに対応する部分の面積を求める。  となる確率を求める場合、それに対応する部分の面積を求める。  ⇒ 正規分布の平均、分散が異なるとき、どうやって面積を求めれば良い?

<標準化と標準正規分布> 平均、分散の異なる正規分布について、 という変換をおこなうと、zは平均0、分散1の正規分布(標準正規分布)となる。 平均、分散の異なる正規分布について、      という変換をおこなうと、zは平均0、分散1の正規分布(標準正規分布)となる。 このような変換を標準化という。 標準化された変数の、標準正規分布における面積が求める確率となる。 標準化 →  ☆ やってみよう ex1-2

<標準正規分布表> 標準正規分布から確率を求めるときは、標準正規分布表から求める。 この表はその部分から下側の面積(確率)をあらわしたものである。 引き算や反転を用いることによってさまざまな確率が求められる。

M大学の学生500人の中から、ランダムに50人を選んでアルバイト収入を調べ、その平均値を求める。 (2) 正規分布の応用例 母集団(M大学の学生500人)   ×  ×    標本1(50人)64000円      ×   ×     ×      ×   ×   ×    ×  ×    ×    標本2(50人) 73000円   ×  ×    標本3(50人)56000円 M大学の学生500人の中から、ランダムに50人を選んでアルバイト収入を調べ、その平均値を求める。  50人を選ぶたびにその平均値は変わってくる。  ×    ×    標本4(50人)62000円   ×  ×    標本5(50人)68000円

2011年9月4日付の朝刊各紙に掲載された野田内閣支持率を見ると、異なった結果になっている。 <野田内閣発足直後の支持率の例> 母集団(有権者1億人)   ×  ×    標本1(朝日1051人) 53%      ×   ×     ×      ×   ×   ×    ×  ×    ×    標本2(読売1100人) 65%   ×  ×    標本3(毎日1001人) 56% 2011年9月4日付の朝刊各紙に掲載された野田内閣支持率を見ると、異なった結果になっている。 同じ対象に同じ調査をおこなっても、標本によってその結果が異なる。 これが、標本の偏りである。  ×    ×    標本4(日経954人) 67%   ×  ×    標本5(共同1014人) 62%

しかし、大きく外れた値をとるわけでもない。 母平均μ 母分散σ2 標本平均x 標本分散s2 推論 母数θ 標本統計量t 標本統計量から母数を推論する(たとえば標本平均から母平均を推論)のであるが、たまたま選ばれた標本の標本統計量が母数と一致することはほとんどない。 しかし、大きく外れた値をとるわけでもない。

標本平均と母平均の関係を考えるために、次のような数値例で考えてみる。 個体数6の母集団から個体数2の標本を抜き出し、個々の標本について標本平均を計算する。

とりうるすべての標本について、標本平均を計算してみる。 その標本平均の平均を考えると、母平均に一致する。

全国規模の統計調査などを考えた場合、母集団の大きさNは非常に大きいので、 は1に近くなり、 とみなせる。 <標本平均の分散> 標本平均の分散は       となる。 全国規模の統計調査などを考えた場合、母集団の大きさNは非常に大きいので、   は1に近くなり、    とみなせる。 視聴率調査の場合、関東地区1580万世帯から600世帯を選ぶので

標本平均 の平均は母平均μに等しく、分散は となる。 <標本平均の分布> 標本平均  の平均は母平均μに等しく、分散は  となる。 算術平均μ, 分散σ2をもつ母集団からとられた大きさ n の標本の平均  の分布は、母集団の分布がどのようなものであっても、 n が大きくなるとき、正規分布 N(μ,  )に近づく。  → 中心極限定理 標準化された変数       が標準正規分布にしたがう。 † 厳密に言えば、母集団の分布が正規分布の場合には、nの大きさにかかわらず、標本平均  の分布は正規分布 N(μ,  )にしたがう。  ⇒ 正規分布の再生性

<中心極限定理の直感的解釈> 標本平均を考えると、大体母平均の近くになる。 母平均から遠く離れたところに標本平均が出ることはあまり多くない。 では、どの程度の区間を考えれば、その中に標本平均が入るのであろうか。 ⇒ 信頼区間 <信頼区間> 母平均のまわり     に標本平均の95%が含まれる。 標本平均を中心に考えると、           の範囲に母平均が含まれる可能性が高い。 これをμの95%信頼区間という。

μ × × × × とりうるすべての標本の標本平均 の95%がこの区間に含まれる 反対に、標本平均をもとに、 とりうるすべての標本の標本平均  の95%がこの区間に含まれる μ × 反対に、標本平均をもとに、 という区間を考えると、そのうち95%は母平均を区間内に含む × × ×

<母分散が既知の場合の区間推定> (例) 20歳男性の身長を調べるために、100人を標本として選んだところ、標本平均  =170であった。σ=8であるとき、母平均μの95%信頼区間を求めよ。 (解) μの95%信頼区間は     となる。

3.t分布 (1) t分布 信頼区間を求める場合、 が標準正規分布 信頼区間を求める場合、           が標準正規分布 にしたがうという性質を用いる。しかし、母平均の推定をおこなう場合に、母分散σ2が分かっているということは、あまり多くない。 (過去の調査において母分散のおおよその値が分かり、それを用いるなどの例外はあるが) 母分散σ2がわからないとき、代わりに標本分散s2を用いる。 このとき、        が自由度n-1のt分布にしたがう。

※ t分布は標準正規分布を上からつぶしたような、左右対称の形をしている。自由度が小さいほどつぶれ具合が大きく、自由度が大きいほど標準正規分布に近くなっている。 ※ 標本分散s2の代わりに標本不偏分散   を用いれば、      が自由度n-1のt分布にしたがう。

<自由度について>   自由度とは、自由に値を取ることのできる個体数のことである。   この場合は、t統計量の自由度は標本分散 s2 の分子に含まれる xi のうち、自由に値を取ることのできる個数である。   なので、x1, …, xn-1 は自由に値をとることができるが、xn は   を満たすように決められ、自由度はn-1となる。

母集団の分散が分からないとき、母平均μの95%信頼区間は、t分布の95%点をt0.95とあらわすと、  となる。   より正確には、母集団の分布が正規分布にしたがうとき、        が自由度n-1のt分布にしたがう。   しかし、母集団の分布が正規分布にしたがわない場合でも、標本の大きさがある程度大きければ、        は近似的に自由度n-1のt分布にしたがうとみなせる。

(例) 20歳女性の身長を調べるために、10人を標本として選んだところ、標本平均  =160であった。s=9であるとき、母平均μの95%信頼区間を求めよ。 (解) 自由度10-1=9のt分布のt0.95=2.262なので、 μの95%信頼区間は   となる。

視聴率について、区間推定をおこなうことができる。 しかし、関心があるのは「20%を超えたか?否か?」 4.検定  (1) 検定 視聴率について、区間推定をおこなうことができる。 しかし、関心があるのは「20%を超えたか?否か?」 この問題に答えるだけのために、いちいち信頼区間を構成するのは大変である。そこで、        H0: 視聴率が20%を超えた        H1: 視聴率が20%を超えない  という二者択一の仮説を考え、標本の情報によっていずれか一方の仮説を採択する。

検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。 検定仮説(H0) 検定したい状況を表したもの。否定されることを目的とした仮説の設定をおこなうことがあるので、帰無仮説といわれることもある。 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。   検定仮説と対立仮説は、同時に成り立つことはなく、その2つですべての状況をあらわしている。

理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらはトレードオフの関係である。 <2種類の誤り> 仮説検定には2種類の誤りがある。 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さくなるような検定であるが、これらはトレードオフの関係である。 通常は第1種の誤りを0.05などの一定の小さな値(有意水準という)以下におさえた検定をおこなう。 H0を採択 (逮捕) H1を採択 (不逮捕) H0が真 (真犯人) H1が真 (無実) 取り逃がし (第1種の誤り) 正 誤逮捕 (第2種の誤り) 正

仮説検定は次のような手順をとる。 <仮説検定の手順> <ステップ1> 仮説の設定 <ステップ2> 仮説検定に適当な統計量を選ぶ 検定仮説の採択域と棄却域を設定する <ステップ3> 統計量が採択域 統計量が棄却域 <ステップ4> H0を採択 H1を採択

仮説検定では、まず検定仮説が正しいと思ってみる。 (2) 検定の方法 仮説検定では、まず検定仮説が正しいと思ってみる。 たとえばH0: μ=70 vs. H1: μ≠70 という仮説検定をおこなう場合、  は平均70の分布にしたがうと仮定する。   を標準化したzの分布は標準正規分布となる。(母分散が分からない場合は、t分布で考える) の分布 zの分布 標準化  →

たとえば、 =75という標本平均を得たとする。 =5であったなら、 となるので、そのような標本が得られる可能性は十分にあるといえる。 の分布 zの分布 標準化  → たとえば、  =75という標本平均を得たとする。   =5であったなら、            となるので、そのような標本が得られる可能性は十分にあるといえる。    ⇒ H0が正しいという仮定は適切であったと考える。    ⇒ 検定仮説を採択

もし、z=2.4という結果が出たなら、どのように考えれば良いのであろうか。 この場合、 H0が正しいという仮定は適切ではなかったと考える。母平均は他の値(たとえばμ=85)から得られた標本と考える。   ⇒ 検定仮説を棄却し、対立仮説を採択

判定の境界値はそれぞれの統計量の分布による。 採択域と棄却域は次のように設定される。 判定の境界値はそれぞれの統計量の分布による。 統計量の分布が標準正規分布には、-1.96と1.96の間に入れば採択域、それ以外が棄却域となる。 t分布の場合にはt分布表において得られたt0.95の値を用いて、- t0.95 とt0.95の間に入れば採択域、それ以外が棄却域となる。   (自由度9であれば、t0.95=2.262なので、 -2.262と2.262の間に入れば採択域、それ以外が棄却域となる。)  † 棄却域が採択域の片側となる片側検定も考えられるが、ここでは、説明を省略する。 棄却域 採択域 棄却域

<検定の例> a) 母分散が既知の場合 次のような問題を考える。 (例) ある工場では直径5mmのねじを標準偏差0.04mmにおさまるような管理体制で製造している。製造機械の劣化によって、品質に変化が生じたかどうかを検討するために、9本を標本として選んだところ、その平均が4.97mmであった。これは品質管理上異常なしと考えて良いだろうか。

この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。 1.仮説の設定   この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」かを検定する。   検定仮説としては「品質管理上異常がない」という仮説を用いる。このとき対立仮説は「品質管理上異常がある」という仮説となり、 H0: μ=5 vs. H1: μ≠5   と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異常がある」には、「大きすぎる」と「小さすぎる」の両方が含まれ、「異常がない」という検定仮説の両側の範囲をとる)。   ※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられる。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であることの方が望ましい。   ※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5 vs. H1: μ > 5 とすることである。

この例では母分散が分かっているので、標本平均 を用いて、 2.検定統計量   この例では母分散が分かっているので、標本平均 を用いて、 を考えると、これは標準正規分布にしたがう。 3.採択域と棄却域   検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0から大きく離れていたならばこの仮定は誤りだったと考える。 zがここだったら検定仮説が正しいが zがここだったら検定仮説は誤りで、 このような分布が正しいと考える。

この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定をおこなうなら、 のとき検定仮説を採択し、                 のとき検定仮説を採択し、            または       のとき対立仮説を採択する。 † 検定仮説が正しいなら、z>1.96またはz<-1.96となるような  が選ばれる確率は5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味している。 4.統計量の計算   検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると   となる。よって        なので棄却域に入り、検定仮説を棄却し、対立仮説を採択する。 棄却域 -1.96 採択域 1.96 棄却域

母分散が未知の場合は、zの代わりに を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 b) 母分散が未知の場合   母分散が未知の場合は、zの代わりに       を考え、これが自由度n-1のt分布にしたがうことを用いて仮説検定をおこなう。 次のような問題を考える。 (例) ある科目の試験を、平均点70点となるように作成したい。そこで、26人をサンプルとして選び、問題をといてもらったところ、26人の平均点は60点、分散が625であった。試験の問題作りは成功したといえるだろうか。

(解) 1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でない」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮説を設定する。 2.検定統計量 標本平均 を用いて、 を考えると、これは自由度n-1のt分布にしたがう。 3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意水準5%の仮説検定をおこなうなら、             のとき検定仮説を採択し、       または       のとき対立仮説を採択する。 4.統計量の計算   となる。              なので検定仮説を採択する。よって問題作りは成功したといえる。