行動計量分析 Behavioral Analysis

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第1章 統計学の準備 ー 計量経済学 ー.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
行動計量分析 Behavioral Analysis
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

行動計量分析 Behavioral Analysis 第4回 推測統計学の考え方(2)       inferential statistics 母数の区間推定 interval estimation 第5章 統計的仮説検定  Statistical inference

記述統計学と推測統計学 多数データの 母集団の 数学的要約 データ ・記述 無作為 抽出 少数データの (仮想的) 標本集団 数学的要約 のデータ 確率的推測・記述

4.2 推測統計の分類(p72) 統計的推定 statistical estimation, inference 4.2 推測統計の分類(p72) 統計的推定 statistical estimation, inference 得られた統計量の実現値をもとに,母集団の確率分布を決めるパラメータ(母数)を推定 一部の中学生の実力テストの結果を用いて,日本の中学生全体の同じ実力テストの点数を推測する 日本の中学生の平均点は60点ぐらいだろう(点推定) 日本の中学生の点数は50点から70点ぐらいだろう(区間推定) 統計的検定 statistical test 母集団の性質に関する何らかの仮説の是非を,得られた統計量の実現値に基づいて判断 一部の中学生に同じテストを5年後に受験させて,次のどちらであるかを判断したい 日本の中学生の実力は5年間で変化していない 日本の中学生の実力は5年間で変化した

Population Parameters (p74図4.2)母集団と標本 母集団population 標本抽出 sampling 標本sample 記述 母数 Population Parameters (本当に知りたいもの) 母平均 母分散 母標準偏差 母相関係数 母比率 など 標本統計量 Sample Statistics (標本から計算できるもの) 標本平均 標本分散 不偏分散 標本標準偏差 標本相関係数 標本比率 など 推定 inference

4.3点推定 17歳の日本人男性全体の平均身長を知りたい(母数:母平均) 10人の17歳男性を標本として抽出し身長の計測値を得る 10個の計測値から,標本の平均値を計算する(169.3) 標本平均の値を用いて,17歳日本人男性の平均身長を推測する > 身長 <- c(165.2, 175.9, 161.7, 174.2, 172.1, 163.3, 170.9, 170.6, 168.4, 171.3) > 身長 [1] 165.2 175.9 161.7 174.2 172.1 163.3 170.9 170.6 168.4 171.3 > mean(身長) [1] 169.36

点推定量の性質 たまたま取ってきた標本から計算した値(推定値)がどのぐらい真値に近いかはよくわからない。 さまざまな標本から同じ計算方法で推定値を求める場合のその推定量の統計的な性質を考える。 1)不偏性:標本を何回も取り直して推定量を計算すると、その平均値が真値に一致する 2)一致性:標本の数を十分大きくするとその一組の(大)標本から求めた推定量が、真値以外の値をとる確率は0に近づく 3)有効性:推定量の分散が、他の方法で計算した推定量の分散よりも小さい

母平均の不偏推定量 母集団の確率分布に関係なく、標本値の単純平均値は、母平均の不偏推定量である 母集団の確率分布に関係なく、標本値の重み付き平均値は、母平均の不偏推定量である (2個目以降の標本を無視し)1個目の標本の値を推定量としても、それは不偏性を持つ 標本の中の中央値を推定量としても、それは不偏性を持つ 標本から両極端の同一個数の標本を取り除き、残りの平均値を推定量とすると、それは不偏性を持つ

演習:有効推定量としての単純平均 重み付き平均値 は不偏性を持つことを示せ 母集団からの標本値 は母分散 で  は不偏性を持つことを示せ 母集団からの標本値   は母分散   で  ばらつく。このとき、上記の重み付き平均値の分散は、        となる  この重み付き平均値の分散が最も小さくなるように重み   を定めなさい

母分散の不偏推定量(母平均既知) 母平均が既知であるなら、母分散の推定量は標本の母平均回りの分散を用いて不偏推定できる。

母分散の不偏推定量(母平均未知) 母平均が未知であるなら、標本の平均周りの分散を用いて計算する必要がある。 母分散の不偏推定量(不偏分散推定量)

点推定から区間推定へ 母平均μ母分散σ2の母集団 大きさnの標本を取り出す 標本平均(平均の点推定量)を計算 「標本平均」は母集団分布よりも中央に集まった分布に 正規母集団 N(50,10)からn=100のサンプルをとる 標本平均は正規分布に従う.                          > curve(dnorm(x,mean=50, sd=1), from=20, to=80) > curve(dnorm(x,mean=50, sd=10), add = TRUE) > hist(標本平均, freq=FALSE, add=TRUE) > 標本平均 <- numeric(length=10000) > for(i in 1:10000){ + 標本 <- rnorm(n=100,mean=50,sd=10) + 標本平均[i]<- mean(標本) + }

標準正規分布における確率 N(0,1)を標準正規分布という N(μ,σ2)に従うXの xに対する下側確率 > pnorm((49-50)/1) [1] 0.1586553 > pnorm((48-50)/1) [1] 0.02275013 N(0,1)を標準正規分布という ZがN(0,1)に従うとき Z≦zとなる確率(下側確率)を求める関数. Prob(Z≦z)=p pnorm(z) N(μ,σ2)に従うXの   xに対する下側確率  Prob(X≦x)=p pnorm((x-μ)/σ) μーσ までの 下側確率 0.158 μ-2σ までの 下側確率 0.022

標準正規分布における確率点 (p117) N(0,1)を標準正規分布という N(μ,σ2)の下側確率pの点 標準正規分布における確率点 (p117)     N(50,1)に従うXは,95%の確率でμ-1.96σ<X≦μ+1.96σの間に入る. N(0,1)を標準正規分布という 下側確率がpとなる確率の点zを求める関数. Prob(Z ≦z)=p qnorm(p) N(μ,σ2)の下側確率pの点  Prob(X≦x)=p x<μ+σqnorm(p) 下側確率 2.5% 下側確率 97.5% (μ-1.96σ) (μ+1.96σ) > curve(dnorm(x,mean=50, sd=1), from=45, to=55) > abline(v=50+qnorm(0.975)) > abline(v=50+qnorm(0.075))

母平均が異なる場合の 標本平均の分布 95%の確率で標本平均が 含まれる領域 μ=47 μ=46 μ=48 母平均μ 母平均 母平均 母平均が標本平均値に近い状況は 十分(5%以上) 起きる可能性がある 母平均が標本平均値から離れている状況は,めったに起きない(5%以下) 母平均 母平均 標本平均値 標本平均値

母平均の区間推定 (95%以上で母平均が存在する範囲) 母平均が標本平均値に近い状況は十分(5%以上)起きる可能性がある 母平均が標本平均値から離れている状況は,めったに起きない(5%以下) 母平均 母平均 標本平均値 標本平均値 5%以上の確率で起こりうる状況のうち,最も極端な2つのケースを考える 母平均が存在する範囲 標本平均値 標本平均値-1.96σ<μ≦標本平均値+1.96σ

区間推定 ある確率(たとえば95%)で母数の真値が存在する区間を求めたい 母数の真値が   のときに、ある観測統計量の確率分布を求め、「有意水準α以下の確率でしか実現しない領域」を棄却域として設定することが出来た。   統計量の実現値がこの棄却域に入り、かつ母数の真値が  である確率は、α/2以下である。 信頼区間 統計量の 確率 α/2 統計量の 確率 α/2 θ0 統計量の実現値

正規母集団の母平均の区間推定 母平均の区間推定(母分散σ2既知) (正規分布に従う)n個の標本の平均値は、平均μ分散σ2/nの正規分布に従う。 平均μを引き標準偏差     で割れば、  統計量         は標準正規分布に従い、  確率1-αでZは、-z(α/2)<Z<z(α/2)を満たす。 X

Z(0.10/2)=1.645 Z(0.05/2)=1.96 Z(0.01/2)=2.575

信頼区間の導出(続き) すなわち となる確率が1-αである。変形して、 となる確率が1-αである。具体的には、 90%信頼区間 すなわち                      となる確率が1-αである。変形して、  となる確率が1-αである。具体的には、 90%信頼区間 95%信頼区間

[例題4.3] 次の10回の引張強度の計測結果から、鉄筋の母平均の99%信頼区間を求めよ。 ただし、標準偏差を4.3とする。 52,62,54,58,65,64,60,62,59,67(X=60.3)

代表的な確率分布 母集団の性質を決める,個々の事象が発生する確率や母集団の平均値(母数)が与えられたとき, 標本値から計算された統計量が取りうる値とその発生確率の組(統計量の確率分布)を計算したい 一般にこの計算は面倒であるが,いくつかの現象については計算式がわかっている. 母集団の性質 を決める数値 (個々の事象 の確率など) 要約値(統計量) の確率分布 法則性,計算式

中心極限定理(central limit theorem) 正しく作られたサイコロをn 回振り,出た目Xi の平均値 を求める。 Y の確率分布は どのようになるか? 図1-1 に,n = 1,2, 4, 8 の時 の分布を示す。 n が大きくなると滑らかな分布になる。 このn を無限に大きくしていく

中心極限定理(central limit theorem) 確率変数X1,X2,・・・,Xn が互いに独立で全て同一の分布(平均:μ,分散:σ2)に従うとき,統計量Y = (X1 +X2 + ・・・ + Xn)/n は,n →∞ の時,平均μ ,分散σ2 /n の正規分布に従う。 この定理はもとの確率分布がどんな分布であっても成立する。従っていろいろな段階で生じる相互に独立な誤差が重なり,その和として全体の誤差が発生しているような場合,その誤差の分布は正規分布に従うことが期待される。実際,多くの現象は正規分布に従う。

正規分布(Normal Distribution) 確率密度関数 平均と分散

標準正規分布 (standard normal distribution) もとの確率変数Xが正規分布N(μ,σ2)に従うとき,新しい確率変数として,Z=(X-μ)/σを作る. このとき,確率変数Zは正規分布N(0,12)に従う. これを標準正規分布という. 確率密度関数 確率分布関数→数表(標準正規分布表)

標準正規分布表

【問題4】正規分布 あるクラスの英語の試験の平均点  は67で標準偏差   は8.5.また,数学の試験の平均点  は53で標準偏差    は12.6でした. このクラスのA君の成績は英語が75点で数学が68点でした. 英語と数学について,A君の成績よりも良い生徒の割合を計算しなさい.

【問題5】超過確率に対応する値の計算 過去の記録から,ある河川流域の年間の降雨量は,正規分布N (1500mm,(400mm)2)に従うと推定できる. この流域の90%確率年降雨量はいくらか.  すなわち,年降雨量がその値を超えない確率が90%であるような降雨量の値を求めよ.  (これを1/10年確率降雨ともいう)

χ2分布 (Chi squared distribution) 確率密度関数 自由度f のχ2 分布(カイ2乗分布) χ2 分布は正規分布と密接な関係がある。 X1,X2 ,・・・,Xf が互いに独立な標準正規分布N(0,12) に従うとき、2乗和Z = X21 +X22 + ・・・ +X2f の分布は自由度f のχ2 分布となる。 正規分布に従う変数の標本値から計算した分散(標本分散) も、χ2分布に従う。

χ2分布表 (Chi squared distribution)

t分布 (Student’s t distribution) 自由度f のt 分布 確率密度関数 t分布も正規分布と関係がある。 標準正規分布N(0, 12) に従う確率変数X と、自由度f のχ2 分布に従う確率変数Y が独立であるとき、 は自由度f のt 分布に従う。 したがって正規分布に従う変数を、標本分散で割った統計量は、t 分布に従う。

t値,t分布の名前の由来 t値を考え、t分布を発見したのは、ゴセット(William Sealy Gosset):ダブリンのギネスビールの統計技師 ギネス社が従業員の研究発表を認めていなかったため,ゴセットはスチューデント(Student)というペンネームで論文を書いた. フィッシャーがこの値と分布の重要性を認めた. スチューデントの名前から文字を取り、 「t分布」 「t値」と呼ばれるようになった (頭文字のsは標準偏差の記号として使われていた) t値のことを「スチューデントのt値」と呼ぶこともある

t分布表 (Student’s t distribution)

F分布 (F distribution) 確率密度関数 自由度(f1,f2) のF 分布 F分布もχ2分布と関係がある。 X, Y が独立でそれぞれ自由度f1, f2 のχ2 分布に従うとき、 は自由度(f1, f2) のF 分布に従う。 したがって2 つの標本群から計算した分散の比をとると、その統計量はF 分布に従う.

 F分布表 (F distribution)

【問題6】正規分布での近似 硬貨を500回投げたとき,表が200~270回出る確率を求めよ この問題は本来二項分布B(500,1/2) の分布を聞いている. この二項分布B(n,p)は,独立な二項分布B(1,p)に従うn個の変数Xiを加えたものであるから,nが十分大きければ,中心極限定理により,正規分布N(np,np(1-p))で近似できる. 標準正規分布表を用いて計算できる

正規母集団の母平均の区間推定 母平均の区間推定(母分散σ2未知) (正規分布に従う)n個の標本の平均値 と分散の不偏推定量 を用いれば、 t分布表の超過確率α/2の点を tn-1(α/2)とすれば、確率1-αでTは、-tn-1(α/2)<T<tn-1 (α/2)を満たす。 X

自由度が大きくなると、t分布は標準正規分布に近づく たとえば n-1=9に対して t(0.10/2)=1.833 t(0.05/2)=2.262 t(0.01/2)=3.250 たとえば n-1>200に対して t(0.10/2)=1.645 t(0.05/2)=1.960 t(0.01/2)=2.576 自由度が大きくなると、t分布は標準正規分布に近づく

信頼区間の導出(続き) すなわち となる確率が1-αである。変形して、 となる確率が1-αであるので、これを確率(1-α)の信頼区間と出来る すなわち                      となる確率が1-αである。変形して、  となる確率が1-αであるので、これを確率(1-α)の信頼区間と出来る 95%信頼区間

[問題4.3] 次の10回の引張強度の計測結果から、鉄筋の母平均の99%信頼区間を求めよ。 ただし、標準偏差はわからないものとする。 52,62,54,58,65,64,60,62,59,67(X=60.3)

正規母集団の母分散の区間推定 母分散の区間推定(母平均μ既知) 標本分散 から計算した統計量 が、自由度nのχ2分布に従う。 標本分散            から計算した統計量                      が、自由度nのχ2分布に従う。 χ2分布は、左右対称でないことに注意して、超過確率(1-α/2)の左側点と超過確率(α/2)の右側点を数表から読み取る。   である確率が1-αである。

信頼区間の導出(続き) すなわち                      となる確率が1-αである。変形して、  となる確率が1-αである。具体的には、 99%信頼区間

[例題4.4] 次の10回の引張強度の計測結果から、鉄筋の母分散の99%信頼区間を求めよ。 ただし、母平均をμ=65とする。 52,62,54,58,65,64,60,62,59,67(X=60.3)

正規母集団の母分散の区間推定 母分散の区間推定(母平均μ未知) 不偏分散推定量 から計算した統計量 が、自由度n-1のχ2分布に従う。 不偏分散推定量               から計算した統計量                            が、自由度n-1のχ2分布に従う。 χ2分布は、左右対称でないことに注意して、超過確率(1-α/2)の左側点と超過確率(α/2)の右側点を数表から読み取る。                        の確率が1-α。 確率1-α信頼区間

統計的仮説検定(5章)p109 標本を元に,母集団に関する何らかの仮説の真偽を確認したい. 1 母集団に対する帰無仮説と対立仮説を設定する 1 母集団に対する帰無仮説と対立仮説を設定する 2.検定統計量を選ぶ 3.有意水準の値を決める 4.データから,検定統計量の実現値を求める 5.検定統計量の実現値を棄却域と比較する (1)実現値⊂棄却域→帰無仮説を棄却,対立仮説を採択 (2)実現値⊂棄却域→帰無仮説を棄却しない(判断保留)

帰無仮説と対立仮説 帰無仮説(null hypothesis) H0:日本人の平均体重は50kgである (μ=μ0 または δ=μ-μ0=0) 対立仮説(alternative hypothesis) H1:日本人の平均体重は50kgではない (μ≠μ0 または δ=μ-μ0≠0)  両側検定 H1:日本人の平均体重は50kgより大きい (μ>μ0 または δ=μ-μ0>0) 片側検定

検定統計量と棄却域・採択域 検定のために用いる標本統計量 帰無仮説が成り立つ場合には (母数の真値を用いて) 標本統計量が従う確率分布が理論的にわかり, 確率などを計算できる 帰無仮説の下で非常に生じにくい(ある小さな確率α以下でしか生じない)値の範囲を「棄却域」という. それ以外の領域を「採択域」という 採択域 採択域 棄却域(両側) 棄却域(片側)

第1種の誤りと第2種の誤り 第一種の誤り(あわてものの誤り) 第2種の誤り(のんびりものの誤り) 帰無仮説が真のとき,これを棄却してしまう誤り 本当は差がないのに「差がある」と判断する この確率はα以下にできる 第2種の誤り(のんびりものの誤り) 帰無仮説が偽のとき,これを棄却しない誤り 本当は差があるのに「差がない」と判断する

有意水準のきめかた 各自の考え方に依存するということ エピソードがあります(真偽のほどは定かではありません) フィッシャーが推計学を開発した時、有意水準を決める段になってハタと考えた。 彼は当時30才だったが、50才までは現役で研究を続け、その後は釣りでもしながら悠々自適の余生を送ろうと常々考えていた。 そこで、 「農作物が相手だから、これから毎年1回ずつ実験をするとして、20年間に20回できることになる。 まあ、一生に一度ぐらいは間違いを犯しても、神様はお許し下さるだろう」と考え、20回に1回間違える確率として有意水準を5%にしたという。 この話を人から聞いた当のフィッシャーいわく、 「なるほど、それはうまい話だ。 実は私も、なぜ5%をよく使うのか説明を求められて困っていたんだ。 これからは、そう答えることにしよう!」 有意水準5%というのは、これくらいいい加減なものです

正規分布に従う母集団の母数に関する仮説検定 母集団が正規分布に従う場合(正規母集団)、母平均、母分散に関する仮説を検定してみよう。              平均    分散 母分散既知の場合 正規分布 χ2分布  母分散未知の場合 t分布     母分散未知で未知の母平均の同一性の検定 t 未知の母分散の同一性の検定:F

1) 母平均の検定(母分散既知)

2)母平均の検定(母分散未知)

3)母分散の検定(母平均既知)

4)2つのグループの分散の同一性の検定(母平均は未知)