小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
      仮説と検定.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
確率・統計Ⅱ 第7回.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
母集団平均値の区間推定 大標本の区間推定 小標本の区間推定.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
確率と統計 年1月12日(木)講義資料B Version 4.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
Presentation transcript:

小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う t分布の形は標本分散の自由度f(ふつうf=n-1,nは標本数)によって,分布の形が決まる 自由度が無限大のt分布は 正規分布と一致する プリント「生物統計学_第6回t分布とt検定2013」P1以降を予習しながら空所を埋めていきましょう. ここでは,標本数が少ないとき,すなわち小標本に関する平均の推定と検定を学びます.まずそのような推定と検定に利用するt分布を説明します. 前々回と前回の授業では,標本が十分に大きいあるいは母分散が既知であることを条件に正規分布を用いて推定・検定しました.しかし,母集団が正規分布し,標本が小さい場合には,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて推定・検定しなければなりません.t分布は標本分散の自由度f(ふつうf=n-1)によって分布が決まります.自由度という概念はむずかしいので,ここでは説明しません.しかし,自由度は重要な概念ですので,名前ぐらいはおぼえておきましょう.最近の統計ソフトは自由度を自動的に計算してくれますが,むかしは自分で自由度を考えなければならかったものでした.標本数nが増えるとt分布は正規分布に近づき,n=∞のときに正規分布と一致します. t分布は,標本が少ないときに,標本標準偏差から母標準偏差を推定する誤差を含むので,正規分布よりばらつきの大きな分布(中央の山は低く,左右の裾は高くなる)となります.

t分布の特徴 1) 正規分布と同じように左右対称である.したがって,平均より 1) 正規分布と同じように左右対称である.したがって,平均より  大きい値あるいは小さい値を取る確率はそれぞれ0.5,0.5である. 2) 標本数nが大きくなればなるほど,t分布は正規分布に近づく.  nが無限大のときには正規分布とt分布は一致する. t分布の特徴を説明します. 1) 正規分布と同じように左右対称です.したがって,平均より大きい値あるいは小さい値を取る確率はそれぞれ0.5,0.5です. 2) 標本数nが大きくなればなるほど,t分布は正規分布に近づきます.nが無限大のときには正規分布とt分布は一致します.したがって,標本数が100以上なら正規分布との差を意識する必要がなくなります. t分布は統計学で非常によく利用される分布です.しかし,正規分布と同じようにその式は難しいので,実際の利用にはエクセルの統計に関する関数や統計ソフトを利用するのが一般的です.

t分布による母平均の区間推定 は標本平均 点推定:母平均 区間推定: それではt分布を用いて,標本から得られた標本平均を使って,母平均を区間推定する方法を学びましょう. 母分散σ2が未知であるとき,母平均μの推定方法の基本的な考え方は正規分布を用いた区間推定と同じです.つまり点推定は,標本平均をそのまま母平均の点推定に使います.つまり母平均μ=x(エックスバー,標本平均)となります. 次に区間推定を説明します.母集団が正規分布するとき,信頼率p %のときの母平均μの信頼区間は,エクセルではTINV関数を用いて計算できます.しかし,関数についてはここでは説明しません.興味のある方はエクセルの関数のヘルプなどをみてください.ここではデータをシートに代入すると計算できるようにしました(ただし100個以内のデータに限ります.100個以上のデータはエクセルの分析ツールを使う別の方法を後で説明します.) エクセルの生物統計学_授業用データ集2013の第6回t検定タブのところをみてください.測定値,信頼率を入力するだけで,信頼区間の上限と下限,および平均±信頼率p%に基づく信頼区間を自動的に計算します.

例:t分布による母平均の区間推定 A公園の桜から6本を無作為に選び,木に着く花の数を数えた.123, 156, 168, 190, 211, 234の6つのデータを得た.A公園の桜の花の数(の平均)を95%信頼区間および99%信頼区間をつけて推定せよ. それでは例題をやってみましょう. A公園の桜から6本を無作為に選び,木に着く花の数を数えました.123,156,168,190,211,234の6つのデータを得ました.A公園の桜の花の数(平均)を95%信頼区間および99%信頼区間をつけて推定しましょう. エクセルの生物統計学_授業用データ集2013の第6回t検定タブのところをみてください.測定値,信頼率を入力するだけで,信頼区間の上限と下限,および平均±信頼率p%に基づく信頼区間を自動的に計算します.6つの測定値と信頼率95%あるいは99%を入力します.

エクセルによる実際の計算 95%信頼区間をつけた区間推定値 あるいは 95%信頼率をつけた母平均の区間推定値は画面のように計算して, 138.5~222.2となります.あるいは180.3±41.8となります.どちらの表記法でもよいです. 95%信頼区間をつけた区間推定値 あるいは

エクセルによる実際の計算 99%信頼区間をつけた区間推定値 あるいは 99%信頼率をつけた母平均の区間推定値は画面のように計算して, 114.7~246.0となります.あるいは180.3±65.6となります. 99%信頼区間をつけた区間推定値 あるいは

エクセルの分析ツールを使う方法 基本統計量を選ぶ エクセルの分析ツールを使っても同じ計算ができます.まず分析ツールを起動します.分析ツール(データ分析)から基本統計量を選びます. 基本統計量を選ぶ

エクセルの分析ツールを使う方法 データの範囲を入力 信頼率を入れる 第2回の授業で学んだように基本統計量を計算します.このときに下から3つめにある「平均の信頼区間の出力」のところにチェック☑を入れます.そして,信頼率を指定します.

エクセルの分析ツールを使う方法 4.信頼区間の大きさが下の表の一番下に出力される.必要に応じて,平均からこの値を加えたり,引いたりすると,信頼区間が出る. 信頼区間の大きさが下の表の一番下に出力されます.必要に応じて,平均からこの値を加えたり,引いたりすると,信頼区間が出ます.あるいは平均±○○のところに,この値をそのまま入れてもよいです.

正規分布とt分布での区間推定の比較 1.960 2.576 95%信頼区間をつけた区間推定値 99%信頼区間をつけた区間推定値 さて,第4回の授業で学んだ正規分布を使って,平均の区間推定をした場合,95%の信頼区間の計算は1.96×標準誤差で計算できます.99%信頼率の場合は2.576×標準誤差です.t分布を使った区間推定では実は95%の信頼区間の計算は2.571×標準誤差で,99%信頼率の場合は4.032×標準誤差で計算します.つまり標本数が少ないと,標準誤差そのものが大きいことを第4回の授業では説明しましたが,さらに平均の区間推定では標準誤差にかける数字も大きくなるので,標本数が2とか3だとあまり精度よく,標本数から区間推定できません.5つくらいになるとかなり精度が高くなってきます.実験で反復を4あるいは5とするのが多いのは,それより増やしても,労力のわりにはよくならないからだということがこのことからわかります.

予習問題 M大学の学生から20人を無作為に選び,立ち幅跳びをした結果,右のデータを得た.95%信頼区間をつけて,母平均を区間推定せよ. それでは予習問題をやってみましょう.予習は「生物統計学第5回宿題と第6回のための予習2013 」の提出用タブ欄に入力して提出してください.