2004年度専修大学経済学部 作間「経済統計学」講義

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
ホーエル『初等統計学』 第7章4節~5節 推定 (2) 寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp 青山学院大学社会情報学部 「統計入門」第 12 回.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
© Yukiko Abe 2012 All rights reserved
第4章 労働に関する統計 ー 経済統計 ー.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
社会調査とは何か(3) 調査対象者の選定方法
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
専修大学経済学部 作間逸雄「経済統計学」講義
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
第3章 統計的推定 統計学 2008年度.
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
統計学 12/13(木).
統計学  西 山.
統計解析 第10回 12章 標本抽出、13章 標本分布.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
【女性の労働~就業者数と失業者数の比較~】
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第4章 労働に関する統計 ー 経済統計 ー.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経営学研究科 M1年 学籍番号 speedster
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
サンプリングと確率理論.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
第4章 労働に関する統計 ー 経済統計 ー.
Presentation transcript:

2004年度専修大学経済学部 作間「経済統計学」講義 統計的推測 2004年度専修大学経済学部 作間「経済統計学」講義

統計的推測の種類 標本の観察        母集団の特徴   (標本統計量)        (母数)    例:標本平均       母平均 統計的推測の種類                  点推定          推定     区間推定             検定       

標本から母集団を推測する1 池の魚の数を数える。 とりあえず、50匹を捕まえ、尾に赤い標識をつけて逃がす。次の日、10匹捕まえたところ、そのうち2匹が標識をつけていたとする。 池の魚全体(その数をXとする)のうち、標識のついている魚の割合が今回捕まえた魚の中での割合と等しいと仮定する。 すると、2÷10=50÷Xから、X=250と推測する。

最尤法 「尤(もっと)もらしい」の「尤」である。 母比率をπとする。πをいろいろ変化させてみて、実際のデータに含まれる比率pが観察される確率が一番高くなるように、πを決める方法を最尤法という。 10匹の中に2匹に標識のついた魚がいる確率は、 この確率が最大になるように、πを選ぶのが最尤法。微分を使って計算すると、π=2/10を得る。

区間推定とは何をやるのか?(1) 「標本分布」=標本統計量(標本平均とか標本分散とか、標本の関数である確率変数)がキー。 中心極限定理によって、標本サイズ大の場合、 であることから

区間推定とは何をやるのか?(1) この式をかきかえて このように作られた区間を「信頼区間」という。

信頼区間の意味

この区間推定の問題 母集団の標準偏差(σ)が既知であることが前提されてしまっている。 標本の標準偏差(s)はわかっているだろうが、母集団の標準偏差はわかっていないのがむしろ普通の状況だろう。 その場合につかわれるのがt分布。次の確率変数tは、自由度n-1のt分布に従う。 標本標準偏差Sは、n-1で割る式による。nで割るS*だと、

正規分布とt分布 t分布の発見者は、ウィリアム・ゴセット。ゴセットは、ギネス・ビールの技術者だったので、会社の立場を考えて、“Student”というペンネームで論文を発表していたから、t分布のことをStudentのt分布とも呼ぶ。 t分布には、自由度というパラメーターがある。 自由度を無限大にすると、t分布は、正規分布に一致する。 したがって、サンプルが大きければ、σ未知でも、正規分布を使ってよいことになる。

t分布と正規分布の比較

標本から母集団を推測する2――失業率 標本の比率(割合)で母集団の対応する比率(割合)を推定しようとする典型例。 完全失業者数/労働力人口が完全失業率。 完全失業率の数字の見方を考えるには、概念がどうなっているか(「完全失業者」とは何か、「労働力人口」とは何か)を知る必要がある。また、統計的推測そのものについての理解(誤差への理解)が必要。

11月30日付『日本経済新聞』

11月30日付『日本経済新聞』

11月30日付『日本経済新聞』 有効求人倍率とは? 職業安定業務統計の用語。 「有効」とは? 求人・求職票は、他にさだめないかぎり、ふつう翌月末まで有効だから。

完全失業率のグラフ

実質消費支出の一時的高揚が景気回復を支えていた。

労働力調査について 1 調査の目的 国民の就業及び不就業の状態を明らかにすることを目的とし、昭和21年9月以降毎月実施している。 1 調査の目的 国民の就業及び不就業の状態を明らかにすることを目的とし、昭和21年9月以降毎月実施している。 2 調査方法 ・調査の対象 全国全世帯の中から、無作為に選定した約4万世帯に居住する15歳以上の者約10万人 ・調査の期日 毎月末日現在で、月末1週間における就業・不就業の状態を調査する(12月は20日から26日までの1週間) ・調査の方法   調査員が対象世帯に調査票を配布し、世帯がこれに記入、再び調査員が調査票を取集する。

労働力調査について(続) 3 調査項目 中心は、就業状態の区分 就業状態の区分 3 調査項目 中心は、就業状態の区分 就業状態の区分     ────── 調査でのとらえ方 ───────     ───── 結果表の表し方 ─────           ┌ 主に仕事         ┐           │               │           ├ 通学のかたわらに仕事   ┼………………… 従業者 ┐           │              │            │           ├ 家事などのかたわらに仕事 ┘          │          │                          │           │                            ├ 就業者 ┐ 調査期間中に少し ┤                         │ │   でも仕事をしたか │      │  │           │                          │ ├ 労働力人口 ┐           │           ┌ 仕事を休んでいた …… 休業者 ┘  │        │          │          │                      │    │           │           ├ 仕事を探していた …………… 完全失業者 ┘     ├15歳以上人口           │          │                             │          └ 仕事をしなかった ┼ 通学          ┐              │                     │           │                │                     ├ 家事         ┼ …………………… …非労働力人口  ┘                     │           │                    └ その他(高齢者など) ┘

労働力調査の用語(1) <就業状態> 15歳以上人口について,調査週間中の活動状態に基づいて次のように区分している。 <就業状態> 15歳以上人口について,調査週間中の活動状態に基づいて次のように区分している。 労働力人口:15歳以上人口のうち,就業者と完全失業者を合わせたもの 就 業 者 :従業者と休業者を合わせたもの 従 業 者:調査週間中に賃金,給料,諸手当,内職収入などの収入を伴う仕事(以下「仕事」という。)を 1時間以上した者。なお,家族従業者の場合は,無給であっても仕事をしたとする。 休 業 者:仕事を持ちながら,調査週間中少しも仕事をしなかった者のうち,1)雇用者で,給料,賃金の支払いを受けている者又は受けることになっている者 2)自営業主で,自分の経営する事業を持ったままで,その仕事を休み始めてから30日にならない者。なお,家族従業者で調査期間中に少しも仕事をしなかった者は休業に含めず,完全失業者又は非労働力人口のいずれかとしている。

労働力調査の用語(2) 失業の3条件(ILO) ①without work ②seeking work 完全失業者:次の3つの条件を満たす者 1)仕事がなくて調査週間中に少しも仕事をしなかった(就業者ではない) 2)仕事があればすぐ就くことができる 3)調査期間中に,仕事を探す活動や事業を始める準備をしていた(過去の求職活動の結果を待っている場合を含む)     非労働力人口:15歳以上人口で上記以外の者 労働力人口比率:15歳以上人口に占める労働力人口の割合 =(労働力人口÷15歳以上人口)×100 完全失業率:労働力人口に占める完全失業者の割合 =(完全失業者÷労働力人口)×100 失業の3条件(ILO) ①without work ②seeking work ③currently available for work

就業状態の調べ方 労働力(actuall)方式  短い調査期間を限定し、その期間で就業状態を決定する。「月末1週間で少しでも仕事をしましたか?」……労働力調査、国勢調査 有業者(usual)方式  期間を限定せず、ふだんの状態で就業状態を決定する「あなたはふだん収入になる仕事をしていますか?」……就業構造基本調査

労働力調査の結果の公表 ・公表期日…………………原則として調査 月の翌月末 ・結果の刊行時期 労働力調査速報………公表時 ・公表期日…………………原則として調査  月の翌月末 ・結果の刊行時期 労働力調査速報………公表時 労働力調査月報………翌々月の下旬 労働力調査年報………翌年3月

労働・雇用に関する他の月次統計 ・世帯を通じて調査するもの………………… 労働力調査(総務省) ・事業所を通じて調査するもの………………        労働力調査(総務省) ・事業所を通じて調査するもの………………        毎月勤労統計調査(厚生労働省) ・業務統計によるもの………………………… 職業安定業務統計(厚生労働省)

労働力調査の調査票

労働力調査の調査票(続)

失業率の数字には誤差はどのくらいあるのか?(単純化された計算) 誤差には、標本誤差と非標本誤差とがある。 非標本誤差は、たとえば、誤記、集計ミス等々であったり、統計環境の問題であったりする。 標本誤差は、標本をとって調査することにより発生する誤差であるが、確率分布に関する知識を使ってコントロールすることができる。

失業率の数字には誤差はどのくらいあるのか?(単純化された計算) 実際にはそうではないが、単純無作為標本抽出(*)を行なって、労働力人口7万人のサンプルを得たとしよう。 そのサンプルに含まれる人数は、「失業」を「成功」と見た場合の「二項変数」。 「失業率」は、s/n。 サンプルが大きければ、失業率p=s/nは、平均π、分散π(1-π)/nの正規分布をする。 (*)実際は、層化二段抽出。

失業率の数字には誤差はどのくらいあるのか?(単純化された計算)

失業率の数字には誤差はどのくらいあるのか?(単純化された計算) P=0.047, n=70,000として±0.001568の誤差を見ておけば、95%の割合で(100回の内95回は)正しい推定になる。  0.045432 0.047  0.048568

失業率の数字には誤差はどのくらいあるのか?(単純化された計算) 信頼区間の幅には、nが大きく影響する。 以上の結果から見て、4.7%でなく、4.70%と発表することはできそうもないことがわかる。 都道府県別失業率のように、サンプルが小さい場合、その数字の利用には注意が必要である。

謝辞 池の魚の数を数える例は、清水誠著『推測統計 はじめの一歩』(講談社ブルーバックス、2000年)のものを使わせていただきました。 池の魚の数を数える例は、清水誠著『推測統計 はじめの一歩』(講談社ブルーバックス、2000年)のものを使わせていただきました。 信頼区間の図示は、T.H.ウォナコット/R.J.ウォナコット著、国府田恒夫/田中一盛/細谷雄三訳『統計学序説』(培風館、1978年)のものです。 総務省統計局のホームページhttp://www.stat.go.jp  に掲載されているいくつかの素材をつかわせていただきました。