ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
行動計量分析 Behavioral Analysis
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
ホーエル『初等統計学』 第5章 主要な確率分布
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
母集団平均値の区間推定 大標本の区間推定 小標本の区間推定.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回

正規分布を利用した 母平均の区間推定 正規分布からの標本抽出,あるいは中心 極限定理により, 標準正規分布では,平均 ±1.96 の範囲にあ る値が出現する確率は 0.95 である.  P {-1.96 ≦ Z ≦ +1.96}=0.95

母平均 μ の上下それぞれに, 1.96 × 標準誤差 の幅の区間を構成すれば,標本平均がこの範 囲に入る確率は 0.95 である.  標本をとっては平均値を計算することを何度も 繰り返す. 100 回の標本抽出で 95 回と期待できる. 標本平均の上下それぞれに,標準誤差の 1.96 倍の幅の区間を構成すれば,この区間が母平 均を含んでいる確率は 0.95 である.  100 回の標本抽出で 95 回と期待できる.  実際には,1度だけの標本抽出で区間推定を行 う.

95% 信頼区間, 90% 信頼区間 母集団標準偏差 σ が未知の場合  標本の大きさが大きいとき(目安として, 25 以上),標本標準偏差 s で置き換える. σ ≒ s と考えられる.  標本の大きさが小さいとき,母集団分布が正 規分布であると考えられるなら, t 分布を用い る.

スチューデントの t 分布 スチューデントの t 統計量( Student’s t- statistic ):標本平均の標準化の公式にお いて, σ を s にかえたもの.確率変数であ る. スチューデントの t 分布( Student’s t distribution ): t 統計量の理論分布.正規 分布に従う母集団から標本をとって t 値を 計算することを何度も繰り返すことをイ メージ.

標本平均の標本分布: 標本平均の標準化: 母集団分散が未知の場合, Z の「代用品」 として, 自由度 n -1 の t 分布に従う

自由度 t 統計量: 上の式で定義された t 統計量は,自由度 ( degree of freedom ) n -1 の t 分布に従う.  自由度が分布の形を決める.  ここでの自由度は,標本の大きさより1小さ い値.  t (20) のように,カッコに入れて自由度を表記 する.標本から統計量を具体的に計算したと き, t (20) =1.25 のように書く. → t 検定(第8 章)

標準正規分布と t 分布 n が大きければ, σ ≒ s なので,正規分布と ほぼ重なる. n が大きければ, σ ≒ s なので,正規分布と ほぼ重なる. t 分布の形は自由度 ( n -1 )で決まる. t 分布の形は自由度 ( n -1 )で決まる. s に含まれる誤差のため,正規分布より少し裾が広 い.

自由度 自由度の定義はいくつかあるが,理解す ることは少し難しい.  例:自由に動ける変数の数 t 分布では,背後に χ 2 (カイ2乗)分布と 呼ばれる分布がかくれており,この χ 2 分布 の自由度が受け継がれている.  もっと学習するには,例えば,『統計学入 門』(東京大学出版会) p ,永田靖 『統計的方法のしくみ』(日科技連)第 23 章 を参照のこと.

スチューデントの t 分布を利用した 母平均の区間推定 t 分布を利用した区間推定の公式は,大標 本で正規分布を利用した場合とほとんど 同じ.  t 0 の値は自由度によって異なる.  n =15 (自由度 =14 )で, 95% 信頼区間を構成 する場合, t 0 = 2.145

確 率 P 自由度 ν ・・・ 面積= P{2.145 ≦ t}=0.025 t 分布表の一部(テキスト p.296 ) 確率密度関数

P { t ≦ }=0.025 P {2.145 ≦ t }=0.025 P { ≦ t ≦ 2.145}=0.95

自由度 14 の t 分布を利用した 母平均の 95% 信頼区間

t 分布を利用した,母平均の 100(1-α) %信頼区間の構成方法 母平均を確率 1- α で含む, 100(1- α )% 信頼 区間を構成したい(例: α =0.05 のとき, 95% 信頼区間).標本の大きさは n (自由 度 ν = n-1 ) t 分布表( p.296 )で,自由度 ν (ニュー), 確率 P = α/2 に対応する数値を読み取る.  エクセルでは T.INV.2T(α, ν) と入力. 読み取った値を t 0 とすると,信頼区間は,

「スチューデント」とは? ゴセット( William Sealy Gosset )のペンネー ム.オックスフォード大学で数学と化学の学 位を取得. ギネスビール社は,新しい科学技術導入を目 指し,化学を専攻した学生を採用.ゴセット はその1人( 1899 年採用). ギネス社は機密保持のため論文発表を禁止. そのため, Student のペンネームを使用. t 分布に関する論文 The probable error of the mean は, 1908 年, Biometrica 誌に発表された. 参考:『統計学を拓いた異才たち』(日本経済新聞社)

割合 p の推定 2項分布の正規近似(第5章,第6章) n 回のベルヌーイ試行での成功回数 X n が大きいとき, X は,平均 np ,分散 npq の正規分布に従う. n が大きいとき, X / n は,平均 p ,分散 pq / n の正規分布に従う.

標本割合 X / n を標準化すると,

母集団での割合 p の 95 % 信頼区間 標本分布の標準偏差の中にある未知母数 p はどうするのか?  標本割合 X/n でおきかえ(大標本法)  母数 p を使わずにすむ方法もある(章末問題 23 )

例題(テキスト p.144 ):ある都市で,1 日に少なくとも1箱のたばこを吸う成人 男性の割合を推定する.大きさ 300 の標本 を採って調べた結果,このような喫煙者 が 36 人いた. – (1) 推定の精度 – (2) 標本の大きさの決定 – (3) 信頼区間

(1) 標本割合 x / n は,母集団での真の割合 p の推定値として,どれほど正確か? – 中心極限定理により, – 標本割合を標準化して,推定の誤差を e とお くと,

– 母集団割合 p は未知なので,標本からの点推 定値(標本割合)でおきかえると, – すなわち,推定の誤差が を超えない確 率は 0.95 である.

(3) 母集団割合 p の 95% 信頼区間,および, 90% 信頼区間を求めよ.  95% 信頼区間: [0.083, 0.157]  90% 信頼区間: [0.089, 0.151]

標本の大きさの決定 推定値の誤差: 推定値の誤差が e を超えないようにするため に必要な標本の大きさ( 95% 信頼区間の場 合)は,以下の式で計算できる.  p は標本割合 X / n でおきかえ.  標本をとる前なら, p = 1/2 としておく.そのと き n が最大になるから,実際の p が何であれ十分 な n となる.(テキスト p.146 例参照)

(2) 推定の誤差が 0.02 を超えない確率を 0.95 とするために必要な標本の大きさはいく つか.  P { e < 0.02} = 0.95 となるように n を決める.  母集団割合 p は未知なので,標本からの点 推定値(標本割合)でおきかえる.

 標本をとる前なら, p = 1/2 としておく.