数理統計学 西 山.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4章 統計的検定 統計学 2007年度.
数理統計学  第9回 西山.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1章 統計学の準備 ー 計量経済学 ー.
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
統計解析 第9回 第9章 正規分布、第11章 理論分布.
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
数理統計学  第8回 第2章のエクササイズ 西山.
数理統計学  第8回 西山.
統計学 12/13(木).
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
数理統計学 第11回 西 山.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
数理統計学 第4回 西山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
確率と統計 年1月12日(木)講義資料B Version 4.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
サンプリングと確率理論.
数理統計学  第12回 西 山.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

数理統計学 西 山

【まとめ】<ルートNの法則>とは? N個のサンプルをとると 合計値 平均値 1個ずつにわけてデータの特徴を確認すると、平均がμ、標準偏差がσ 正規分布を当てはめる! << 中心極限定理(データは30~100個以上が目安)

練習問題【1】 簡単のため11人満員の時の状況だけを考える 2号館に設置されているエレベーターの定員は11名であり、最大積載量は750Kgと明示されている。定員一杯のとき、平均68.2Kgだと「乗れない!」ということになる。そんなことがあるのか?統計上の観点にたって、考えるところを自由に述べなさい。 但し、上のエレベータに乗るかもしれない人たち(=母集団)の体重分布は、N(55,225)としておく。 簡単のため11人満員の時の状況だけを考える

【解答】 合計値の分析=平均値の分析 3シグマで最大値を予測しておけばよい。ないし、4シグマ。

練習問題【2】 100営業日後に200ドルを割る可能性は考慮しておくべきでしょうか? 下図はIBMの株価を1961年5月からから62年11月まで記録したものです。 (出所)Box, Jenkins, Reinsel,”Time Series Analysis” 100営業日後に200ドルを割る可能性は考慮しておくべきでしょうか?

練習問題 【3】 ある番組の視聴率は社会全体で30%である。ランダムに100人をとって「見た=1」、「見なかった=0」を聞くとします。設問に答えなさい。 データの合計値は何を表しますか? 合計値の確率分布の特徴を答えなさい。 100人の視聴率について期待値と標準偏差を答えなさい。

考え方の基本 30人はみて、70人は見ていないと回答する 視聴率は、サンプル平均値です!

今回の標本分布 0、1サンプルの母集団は? 0,1, 1, 0, 1,0,1, …. 1 ,1, 0, 0,0, …. 0,1, 1,0 1,1, ….

母集団の分布を確認します

解答 個別の値は 100人

反復実験してみると 100個の0‐1データの平均値は? この反復結果は理論どおり? 3000回データ抽出を反復しました. 最大値: 0.45 最大値: 0.45 最小値: 0.15 平均: 0.3002 分散: 2.037346e-03 標準偏差: 0.0451 サンプル誤差 この反復結果は理論どおり?

サンプルの結果のばらつきを調べてください 【3】の類題 視聴率、新聞社の行う○○支持率調査などは、概ね1000人前後のランダム・サンプル(=無作為標本)を対象にしています。調査結果に含まれる誤差はどの程度でしょう? とりあえず1000人、 社会全体の支持率等は50%として、 サンプルの結果のばらつきを調べてください

母集団はこうなっています 母集団のμとσ2はいくら?

母集団では50%の場合 ほぼ確実に、結果は47%から53%の範囲にはおさまる。 サンプル(=標本)誤差は、確率95%で3%だ。 授業はここまで 5/31 ほぼ確実に、結果は47%から53%の範囲にはおさまる。 サンプル(=標本)誤差は、確率95%で3%だ。

練習問題【4】 誤差を小さくしたい 何人かの人を無作為に選び、現在の内閣を支持するか、支持しないかを聞き、日本全体の内閣支持率を調べる。通常含まれる誤差は、1%以内としたい。最低、何人の人をアンケート対象に含めるべきか?

練習問題【4】の解答・・・未知数N 社会全体の支持率を50% と仮定すると アンケート対象を N人として

【2】の解答・・・Nを求める

50%以外の場合 いま社会全体の比率を50%でやった。 それ以外の比率を仮定するとσが小さい 2500人も必要ない 答えは2500人以上