第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
      仮説と検定.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第1章のWEB 宿題用PPT 第1章のウェブ上での宿題のやり方をパワーポイントで詳しく説明する。
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
第13回授業(7/10-1) での学習内容 6月19日に宿題にした平均値の差の検定結果、及び7月3日の授業で実習した同検定結果のウェブ上での検算のやり方を学習する。 この検算の宿題は、春期定期試験の時に、今日渡す2枚目の出欠表の裏に授業中の手計算による結果と比較して、手計算の結果が正しかったかを報告する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
第5回授業(5/08) の目標 第1章のウェブ上での宿題のやり方の続き(ここまでで、終了)。
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
行動計量分析 Behavioral Analysis
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
母分散が既知あるいは大標本の 平均に関する統計的検定
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
第1章のWEB 宿題用PPT 第1章のウェブ上での宿題のやり方をパワーポイントで詳しく説明する。 作成すべきファイルはつぎの3つである。
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
第3章 統計的推定 (その1) 統計学 2006年度.
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。 検定と推定は、1つの関係式の見方の違いで あることを学ぶ。

第1章の WEB 宿題(5月1日分)実行上の注 意点 各自の学籍フォルダの下に作成した data フォルダの 下に、 TeraPad で 5/1 (金)の授業中に使った10個 のデータは、 basic_stat.txt なるファイル名で保存。 各自が作成した sasprog フォルダの下に、千野の HP から basic_stat.sas なる SAS プログラムを保存し、 filename 文の basic_stat.txt へのパスの一部を修正保 存する。ただし、この時は、プログラム名はもとの ままとする。 出力結果は、各自が作成した sasout フォルダの下に basic_stat.lst なるファイル名で保存。

第1章の WEB 宿題(4月24日分)実行上の 注意点 各自の data フォルダの下に既に作成したデータファ イル basic_stat.txt をコピーし、名前を basic_stat0.txt と変更したうえで、改めて TeraPad で開き、データの一部を削除・追加することにより 4/24 (金)の授業中に使った10個に変えて上書き 保存する。 各自が sasprog フォルダの下に既に作成した SAS プ ログラム basic_stat.sas をコピーし、名前を basic_stat0.sas と変更したうえで、 filename 文の basic_stat.txt へのパスの一部を修正し上書き保存す る。 basic_stat0.sas の出力結果は、各自が作成した sasout フォルダの下に basic_stat0.lst なるファイル 名で保存。

母平均の区間推定とは? (1) 標本 (sample) と母集団 (population) の違いを基 礎実験の1つであるミラーリエル錯視で考えて みよう。 例えば、30度30 mm 条件での20名の被験者 の錯視量データを X 1, X 2, …,X 20 と書けば、この データセットは、当該錯視条件における標本で ある。 この標本の特徴を記述するには、第1章で学ん だ平均、標準偏差などを計算すればよい。

母平均の区間推定とは? (2) 基礎実験では、これらの値を計算し、それらの値 をグラフにプロットし、錯視量に対して斜線分の 長さがどう影響するかを考察した(次のスライ ド)。 しかし、そこでの考察はあくまでも手にした20 個のデータ、すなわち標本についての情報のみか ら、データの特徴を記述したにすぎない。 このような特定の標本での数値の特徴ではなくて、 例えば、30度30mm条件で一般的に錯視量は どれぐらいかを推定できないだろうか。

基礎実験での考察課題の例 認知・行動領域のミラーリエル錯視実験 (1)斜線の長さ( 15mm, 30mm, 45mm )を変えた条件 下での錯視量を測定し、各条件の錯視量の平均値と SD を 計算し、「矢羽根の長さが錯視にどのような影響を及ぼ すか」を考察した。 斜線の長さ 15mm30mm45mm

母平均の区間推定とは? (3) 特定の標本での数値の特徴ではなくて、例えば、 30度30mm条件で一般的に錯視量はどれぐら いかという場合、我々は標本とそれが得られたも との数値の集まりを区別していることになる。 標本を抽出したもとの数値の集まりのことを、統 計学では母集団と呼ぶ(テキスト p.9 本文2行 目) 。 通常、母集団の数値の数は無限であると考えるこ とが多い。そのような母集団は、無限母集団 ( infinite population) と呼ばれる(テキスト p.9 本文4行目)。 このことを図式化すると、つぎのスライドのよう になる。

統計的推定・検定の基本的な考え方- 1 母集団と標本の関係 我々が手にするデー タ は、大きな数値の集ま り から抽出された標本で あ り、特定のもの。 一方、大きな数値の 集 まりから成る集団は、 母 集団と呼ばれる。検定 の 文脈では、通常、無限 母 集団が仮定される。 母集団 無作為抽出 標本

統計的推定・検定の基本的な考え方- 2 母集団の数値について の特徴を調べるには、 数値の分布(母集団分 布)を考える必要があ る。 そうなると、母集団分 布の平均(母平均)や 標準偏差(母標準偏 差)を考える必要があ る。 手にした標本から母集 団の特性を推定したり 判断したりすることを、 推定・検定と呼ぶ。 母集団 推定・検定 標本

統計的推定・検定の基本的な考え方- 3 母集団の数値について の特徴を調べるには、 数値の分布(母集団分 布)を考える必要があ る。 そうなると、母集団分 布の平均(母平均)や 標準偏差(母標準偏 差)を考える必要があ る。 手にした標本から母集 団の特性を推定したり 判断したりすることを、 推定・検定と呼ぶ。 母集団分布(理論分布) 標本の分布(度数分布) μ σ 母標準偏差 母平均 標本平均 標本標準偏差 sxsx

第3章での母平均の区間推定の考え方 ここでは、例えば10個 の標本からそれが抽出さ れたもとの集団、すなわ ち母集団の平均(母平 均)がどのぐらいになる かを推定する問題を扱う。 より具体的には、例えば 10個の標本の平均値等 から、それが得られた母 集団の平均値がある値か らある値(区間)に入る 可能性(確率)が例えば 95%である、と推論 (区間推定)する。 母集団 推定・検定 標本

母平均の推定のための2つの方法 N 個の標本 x1, x2, …,xN から、それが抽出され た母平均の区間推定する方法には、2つの方法 がある。 1つは、母集団分布は未知、母分散(母標準偏 差)は既知、標本数が大の場合である(テキス ト、 pp.9-12 )。 他方は、母集団分布が正規分布で、母分散(母 標準偏差)は未知の場合である(テキスト、 pp )。 正規分布とは、つぎのスライドにあるような対 称で釣鐘型の分布であり、統計学ではこの仮定 がこれまでは、よく用いられてきた。 この授業では、後者の場合の検定を学ぶ。

平均 μ 、分散 σ 2 の正規分布の特徴 μ,μ,μ-σ,μ-σ, μ+ σ,μ+ σ, μ +2 σ μ-2σ,μ-2σ, 34.13% 13.59% 2.15% 約7 0% 約 95%

信頼区間導出の概要(参考) -1 テキスト p.13 の (3.18) 式は、後者の場合の母平 均の区間推定の公式である。これは、どのよう にして導かれるのであろうか? その答えは、テキスト p.12 の最後から p.13 の最 初の式にある:

信頼区間導出の概要-1 この式の右辺の平均値は、平均 μ 0 の正規分布す る母集団からの N 個の標本から計算する。 この同じ平均を持つ母集団から、これとは異な る N 人の人の当該現象についてのデータを収集 すれば、少し異なる平均が得られよう。 この新たなデータの t 値を計算すると、以前と異 なる値となるだろう。つまり、 t の値は、 N 個の 標本を変えると、いろいろな値を取り得る、と 言える。

信頼区間導出の概要-2 つまり、 t は、同一母集団からの無作為サンプル であっても、標本を変えると異なる値になる。 ただし、標本を収集する前には、 t の値は決まら ない。 言い換えると、 t は標本を収集する前の段階では、 高々、それが如何なる値を取る可能性(確率) がどれ程あるか、と言えるに過ぎない。

信頼区間導出の概要-3(参 考) 実際、標本が得られた母集団の母分散が未知の 場合、平均 μ 0 なる正規分布からの N 個の標本を 用いて上記の t なる量を計算すると、 すなわち、 t は自由度 ν=N-1 の t- 分布に従う ことが証明できる。ここで、 t- 分布とは?

信頼区間導出の概要-4 (参 考) t 分布とは、テキスト p.13 の上方の (3.17) 式で表される分布で、 f(t) は任意 の t が特定の値を取る確率を表す:

自由度 v = N-1 の t- 分布の分布とは? -正規分布に近い y 軸対称な分布 t N-1 ( α/2) - t N-1 ( α/2) t t- 分布 確率 斜線部 1- α