社会福祉調査論 第9講 母集団の推計 12月14日.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
経済統計学 第2回 4/24 Business Statistics
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
統計解析 第9回 第9章 正規分布、第11章 理論分布.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第2章補足Ⅱ 2項分布と正規分布についての補足
数理統計学  第8回 第2章のエクササイズ 西山.
数理統計学  第8回 西山.
統計学 12/13(木).
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
1変量データの記述 経済データ解析 2006年度.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
母分散の信頼区間 F分布 母分散の比の信頼区間
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
1変量データの記述 (度数分布表とヒストグラム)
第2章 統計データの記述 データについての理解 度数分布表の作成.
プログラミング論 相関
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

社会福祉調査論 第9講 母集団の推計 12月14日

社会福祉調査論 第9講 【目標】 統計の散らばりを表す指標とそれを物差しとした散らばり具合について学びます。 社会福祉調査論 第9講 【目標】 統計の散らばりを表す指標とそれを物差しとした散らばり具合について学びます。 標本のデータから母集団の比率や平均を推計することを学びます(区間推計)。

【構成】 Ⅰ.散らばり 1.標準偏差 2.標本分布 Ⅱ.母集団の推測 1.母集団の比率 2.母集団の平均値 3.標本誤差

Ⅰ.散らばり ◎範囲   たまたまの最大・最小の幅   分布の型(パターン)が分らない      ⇒  ちらばりの程度を知りたい

1.標準偏差 散らばりを考える 各データ(Xi)と平均(m)との差 偏差 Xi-m 偏差の絶対値の平均? 通常利用しない

文字の使い方 アルファベット    悉皆(関心事の全ての個体)を    扱っている場合 ギリシャ文字    抽出標本から    母集団の統計値を推測している場合

標準偏差 偏差平方=偏差×偏差 偏差平方和=偏差平方の合計 ↓ 分散=偏差平方和/個数 (偏差平方の平均)   ↓ 分散=偏差平方和/個数 (偏差平方の平均) 標準偏差=分散の平方根  σ シグマ         σ; sのギリシャ文字

σ以内の乖離    普通 中位2/3程度 σ以上の乖離    いい、悪い    上位あるいは下位 1/6(16%)程度 2σ以上の乖離    極めて上位あるいは下位 1/40(2.5%)程度

◎変動係数  標準偏差を平均で割った値     ν=σ/μ   多様な変数の物差し(尺度)の違いを超えて、ちらばり度合を見る       μ; m       ν; n

◎標準化 平均を引き標準偏差で割る    平均=0、標準偏差=1    物差しをずらし、拡大(縮小)する

2.標本分布 一様分布 同様の可能性で(一様に)でる サイコロ 1,2,3,4,5,6 Excel =RAND( ) 0~1の乱数 サイコロ =INT(RAND()*6)+1

二項分布 二種類のみの結果がでる実験を何回か行う(試行) →ベルヌーイ試行 コイントスの表・裏 サイコロで奇数・偶数、 2以下・3以上、 二種類のみの結果がでる実験を何回か行う(試行)   →ベルヌーイ試行   コイントスの表・裏   サイコロで奇数・偶数、 2以下・3以上、   紅白玉の抜出しで紅・白 この試行を何度も行った場合の度数の分布 →二項分布

ツリー図から確率を考える    試行毎に枝分かれするツリーを描く 確率の検討は、根元事象を数え上げることが基本。 各枝端に達する確率は    p^i*q^(n-i) 順列組合せから同じ結果の枝を数える

正規分布 二項分布で実験回数を増やした場合 離散的分布→連続的分布 試行回数を増やすと円滑な曲線が見えてくる     離散的分布→連続的分布 試行回数を増やすと円滑な曲線が見えてくる (正規分布、ガウス曲線、ベルカーブ)

N(平均,分散)   N(μ,σ2) N(0,1)の数表  Zテーブル   一定の範囲の結果が起こる確率を求める 現在は、Excelで直接求める    -∞~Xi の確率        NORMDIST(x,平均,標準偏差,1)

正規分布の利用例 試験の成績 受験者数 1,000人 平均点 50点 標準偏差 10点 あなたの成績 70点 あなたの凡その順位は?    受験者数 1,000人    平均点 50点    標準偏差 10点    あなたの成績 70点    あなたの凡その順位は?   左側からの累積確率     =NORMDIST(x,平均,標準偏差,1)

偏差 70-20 標準偏差の2倍   2σ 2σ~∞の確率 2.3% あなたの順位  1,000×0.023  23番目

よく使う偏差と確率 -σ~+σ 68.3% -2σ~+2σ 95.45% 右外側2.3% -1.96σ~+1.96σ 95.0% 両外側5% -σ~+σ 68.3% -2σ~+2σ 95.45%  右外側2.3% -1.96σ~+1.96σ 95.0% 両外側5% -1.645σ~+1.645σ 90.0%

Ⅱ.母集団の推測 1.母集団の比率の区間推計 ①標本の抽出(試行) Ⅱ.母集団の推測 1.母集団の比率の区間推計 ①標本の抽出(試行) 特定の事象が特定の確率で出現する抽出を一定回数繰り返す試行(二項分布の試行)  (大きな袋の中に紅白の玉があり、それを取り出し、白となる場合などを考える)

②散らばりの尺度 それぞれ標本を何個か抽出する試行での標本の白となる比率には、試行によって散らばりがある。

③抽出回数を増やした試行での 比率の変化 標本個数が多くなるほど、各試行での白の比率を描いたグラフは尖がっていく。  つまり、散らばりが少なくなっていく(全体を1とした図で見ること)。 ちなみに、この比率の分布は、正規分布となる。

④正規分布の形 他方、正規分布の標準偏差と各試行の生起確率の関係は、  ±σの幅の中に68%入る。 ±1.96*σの幅の中に95%入る。

⑤抽出調査の結果としての比率 母集団(元の集団)の比率は分からないが、仮に比率Piとして、 抽出調査で比率Pとなる確率piは、二項分布で求められる。

⑥母集団でのいろいろな比率の可能性から真の比率の推測 標本調査で比率がPとなる場合の母集団でのいろいろな比率Piに対する確率piが分かるとすれば、 母集団の真の比率がPiである可能性はpiで最も高いと考えることが妥当であろう。

⑦母集団比率とし妥当な推測した場合の確率分布 こうした前提で、母集団の真の比率Poを推測すると 標本調査の比率Pに対して(以下pと記述) 平均p、標準偏差   の正規分布が 想定される。 ただし、nは標本数。 √(p*(1-p)/n)

⑧比率の区間推計 以上の結果として、母集団での比率は、次のとおり推測される。 p±√(p*(1-p)/n)の幅の中に68%入る

2.母集団の平均値 ①標本の抽出 無作為に一定数の標本を抽出し、その測定を行う。  (例えば、大学生の身長を測定する場合などを考える。)

②散らばりの尺度 一定の標本数の測定を繰り返した場合、それぞれの平均値には散らばりがある。

③抽出数を増やした場合の平均の変化 抽出数が多くなるほど、各平均値の分布を描いたグラフは尖がっていく。 つまり、散らばりが少なくなっていく。 ちなみに、この平均値の分布は、正規分布となる。 (標本数が少ない場合(概ね30以下)は t分布を使う)

④正規分布の形 他方、正規分布の標準偏差と各平均値との関係は、  ±σの幅の中に68%入る。 ±1.96*σの幅の中に95%入る。

⑤標本測定の平均値と 母集団の平均値の関係 母集団(元の集団)の平均値は分からないが、仮に平均値Miとして、 抽出調査での平均値Miとなる確率miは、上述のとおり正規分布となる。

⑥母集団でのいろいろな平均値Miの可能性から真の平均値の推測 標本調査で平均値がMとなる場合の 母集団でのいろいろな平均値Miに対する確率miが分かるとすれば、 母集団の真の平均値がMiである可能性はmiで最も高いと考えることが妥当であろう。

⑦母集団の平均値として妥当なMを推測した場合の確率分布 こうした前提で、母集団の真の平均値Mを推測すると 標本調査の平均値Mに対して(以下mと記述)、平均m、標準偏差    の正規分布が想定される。 ただし、σは標本調査の標準偏差を援用する。 nは標本数。

⑧平均値の区間推計 以上の結果として、母集団の平均値は、次のとおり推測される。  m±σ/√(n)の幅の中に68%入る。 m±1.96*σ/√(n)の幅の中に95%入る。

標本数が少ない場合 標本数が少ない(概ね30以下の)場合、正規分布でなくt分布を使う。  標本数が少ない(概ね30以下の)場合、正規分布でなくt分布を使う。 →上記⑧でのσの係数(1あるいは1.96)に替えて、標本数と有意水準に対応する値を使う。 分母はn-1を使うこと。

3.標本誤差 標本誤差   母集団推計での平均の標準偏差 標本誤差の許容範囲から必要標本数が決められる。

時間末レポート 所持金(万円) 1 5 2 3 7 4 6 8 9 10 右表の値の標準偏差を求めなさい。

時間末レポート 1.比率の区間推計 紅白の玉が入った袋から玉をとりだす。 標本数300個、白の比率25%の場合   紅白の玉が入った袋から玉をとりだす。 標本数300個、白の比率25%の場合 袋の中の白の比率を95%の確かさで求めなさい。   2.平均の区間推計   成人男性の身長を測る。 標本数400人、平均175.0cm、標準偏差5.0cmの場合 成人男性の平均身長を95%の確かさで求めなさい。

標本数300個、白の比率25%の場合 袋の中の白の比率を95%の確かさで求めなさい。

標本数400人、平均175.0cm、標準偏差5.0cmの場合 成人男性の平均身長を95%の確かさで求めなさい。