確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
経済統計学 第2回 4/24 Business Statistics
数理統計学(第四回) 分散の性質と重要な法則
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
確率・統計Ⅱ 第7回.
行動計量分析 Behavioral Analysis
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学 11/08(木) 鈴木智也.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
数理統計学 第11回 西 山.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第11回 中心極限定理 と 大数の法則 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 メディア学部2009年 2009年11月26日(木).
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
Presentation transcript:

確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均 確率変数の平均(続き)、確率変数の分散 確率変数の共分散、チェビシェフの不等式 ベルヌイ試行と二項分布 二項分布(続き)、幾何分布など 二項分布の近似、ポアソン分布、正規分布 正規分布とその性質 i.i.d.の和と大数の法則 中心極限定理 統計学の基礎1(母集団と標本、確率論との関係) 統計学の基礎2(正規分布を用いた推定・検定) ここです!

統計学の基礎1 母集団と標本 統計学と確率論の関係 正規分布を用いた推定

母集団と標本 母集団 … 我々が知りたいと思う集団 全体 標本 …… 母集団について推測を行う ために抽出される一部 母集団 … 我々が知りたいと思う集団       全体 標本 …… 母集団について推測を行う       ために抽出される一部 n 個の要素を抽出するとき、大きさ n の標本という。

母集団と標本のとらえ方 母集団の要素(がもつ値)は、定まった「分布」をしている。 標本は、母集団の分布を確率分布としてもつ確率変数である。 標本が「確率変数」であるというのは、はじめは分かりにくいかもしれない。標本の抽出を抽象的に考えて、抽出される前に「抽出された値をX とする」などとしていると考えれば、試行前に「出る目の数をX とする」などとしているのと同じことであると納得できるだろう。 母集団分布の平均・分散を、それぞれ母平均・母分散 という。

母集団と標本に対する仮定 母集団の要素数は、事実上無限と考える。 標本は、無作為抽出される。 母集団は、非常に大きな数の要素からなるとするのである。これは、母集団分布として正規分布のような連続分布を利用したいためと、標本の抽出が非復元抽出(抽出した要素を戻さずに次の抽出を行う)の場合でも、各標本を独立な確率変数として取り扱うためである。  そうすると、同じ母集団から無作為に抽出された大きさnの標本は、それぞれがいずれも母集団分布と同じ確率分布に従う独立な確率変数となる。すなわち、i.i.d.となるわけである。 このとき、標本 X1, X2, …, Xn は、 i.i.d. となる。

標本に関する概念 各標本 Xi について を、標本平均と呼ぶ。 母平均をμ, 母分散をσ2 とすると、 E(Xi)=μ, V(Xi)=σ2 これは標本の平均! これは確率変数! 「標本平均」は、算術平均の形をしているが、確率変数から定義された新しい確率変数である。確率変数の平均 E と混同しないこと。 「標本平均」の平均Eは、E(Xi)=μと一致するのであった。(第5回の項目10参照) を、標本平均と呼ぶ。

統計学の基礎 母集団と標本 統計学と確率論の関係 正規分布を用いた推定

統計学と確率論の関係(設定) X1, …, Xn は i.i.d.で、 E(Xi)=μ, V(Xi)=σ2

統計学と確率論の関係(意識) 確率変数 X の確率分布から、Xの実現値を予測 X1, …, Xn は i.i.d.で、 E(Xi)=μ, V(Xi)=σ2 確率論 標本 X の値(実現値)から、X の確率分布(=母集団分布)を推測 X1, …, Xn は 母平均μ, 母分散σ2 の母集団からの標本 統計学

統計学と確率論の関係(例) 確率変数 X の確率分布から、Xの実現値を予測 サイコロを n 回投げ、出た目の数を X1, …, Xn とする。  (これらは i.i.d. となる。)  その和を X = X1+…+Xn とおく。 確率変数 X の確率分布から、Xの実現値を予測 確率論 1~6が一定の割合で含まれている無限母集団からの無作為標本を X1, …, Xn とする。  (これらは i.i.d. となる。) 標本平均を X = (X1+…+Xn ) / n とおく。 標本 X の値(実現値)から、X の確率分布(=母集団分布)を推測 統計学

統計学と確率論の関係(例) 確率論 統計学 サイコロを n 回投げ、出た目の数を X1, …, Xn とする。  (これらは i.i.d. となる。)  その和を X = X1+…+Xn とおく。 Xi の確率分布が P(Xi=r) = 1/6 であったとすると、μ= E(Xi) = 3.5, σ2 = V(Xi) ≒ 2.92  また、 E(X)=3.5n, V(X)=2.92n  X の分布も、Xi の分布からわかる。 確率論 X1, …, X16 の実際の値は次のようだった: 2, 3, 6, 3, 5, 1, 3, 2, 4, 5, 1, 1, 2, 3, 6, 1 ∴標本平均 X = 48 / 16 = 3.0 しかし Xi の確率分布(=母集団分布)はどんな分布か? 上の X の値は、ひとつの例(実現値)にすぎない。 1~6が一定の割合で含まれている無限母集団からの無作為標本を X1, …, Xn とする。  (これらは i.i.d. となる。) 標本平均を X = (X1+…+Xn ) / n とおく。 統計学

統計学と確率論の関係(例) Xi の確率分布が P(Xi=r) = 1/6 であったとすると、μ= E(Xi) = 3.5, σ2 = V(Xi) ≒ 2.92  また、 E(X)=3.5n, V(X)=2.92n  X の分布も、Xi の分布からわかる。 確率論 X1, …, X16 の実際の値は次のようだった: 2, 3, 6, 3, 5, 1, 3, 2, 4, 5, 1, 1, 2, 3, 6, 1 ∴標本平均 X = 48 / 16 = 3.0 しかし Xi の確率分布(=母集団分布)はどんな分布か? 上の X の値は、ひとつの例(実現値)にすぎない。 たとえば、P(Xi=r) = 1/6 であったとすると、 E(X) = 3.5, V(X) = 2.92/16 = 0.18 抽出例の X の実現値(3.0)は、この仮定に対しそれほど不自然ではない。 もっと具体的に、 この仮定で P(X=3.0) = ? 95% 以上か?(それなら不自然ではない) E(Sn / n) = E(Xi), V(Sn / n) = V(Xi) / n であった。 統計学

統計学の基礎 母集団と標本 統計学と確率論の関係 正規分布を用いた推定

正規分布を用いた推定 標本の大きさ n が大きいとき、標本平均 X の標準化 X* の確率分布は標準正規分布に近い。(中心極限定理) Z* が標準正規分布 N(0,1) に従うとき、 P( -1.96 < Z* < 1.96) = 0.95 P( -2.58 < Z* < 2.58) = 0.99 この2つを考え合わせると…

正規分布を用いた推定 σも不明だが、標本の標準偏差 s で代用しよう。 つまり よって 標準正規分布と思ってよいから。 n が大きければ、σ を s で代用しても、それほど違いはない。σを s で代用することの是非についてや、n が小さいときどうするか、などについては、後期に詳しく学ぶ。 よって σも不明だが、標本の標準偏差 s で代用しよう。

正規分布を用いた推定(例) 1~6が一定の割合で含まれている無限母集団からの無作為標本が次のようだった: 2, 3, 6, 3, 5, 1, 3, 2, 4, 5, 1, 1, 2, 3, 6, 1 ∴ 標本平均 X = 48 / 16 = 3.0 標本分散 s2=2.875 s≒1.696 よって n が小さいので、この例はほんとうは適切ではない(標本平均の分布を正規分布で近似できるためには、最低でもn≧25 くらいは必要。また、n が小さいと、σを s で代用することにも問題がある)。あくまでも方法の説明のための例である。 (n が小さいときの適切な方法は、後期に学ぶ。)

正規分布を用いた推定(例) × P (2.17 ≦ μ ≦3.83) = 0.95 ∴ 95%の“信頼率”で 2.17 ≦ μ ≦3.83 1~6が一定の割合で含まれている無限母集団からの無作為標本が次のようだった: 2, 3, 6, 3, 5, 1, 3, 2, 4, 5, 1, 1, 2, 3, 6, 1 ∴ 95%の“信頼率”で 2.17 ≦ μ ≦3.83 μは確率変数ではないので、P( 2.17≦μ≦3.83 ) のような書き方をしてはいけない。区間推定の正確な意味などについては、後期に学習する。 × P (2.17 ≦ μ ≦3.83) = 0.95 95% の信頼率で、母平均μは 2.17以上3.83以下と推定される。

[演習]正規分布を用いた推定 [1] あるマンモス大学の受験生の得点分布は、昨年のデータから標準偏差4点と考えられる。この受験生の母集団から大きさ36の標本をとったところ、標本平均は60点であった。 全体の平均点を95%の信頼率で推定せよ。 σ/√n = 4 / √36 = 2 / 3 ∴ P ( -1.96 ≦ (60 – μ) / (2/3) ≦ 1.96 ) = 0.95

メニューに戻る メニューへ