標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第2章 1変量データの記述 統計学基礎 2011年度.
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
第3章 2変量データの記述 統計学基礎 2011年度.
第1章 記述統計の復習 統計学 2007年度.
画像処理工学 2012年2月2日 担当教員 北川 輝彦.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第3章 2変量データの記述 統計学基礎 2010年度.
第1章 記述統計の復習 統計学 2011年度.
保健統計演習(統計学 第1回) Hasimoto.
統計学 12/3(月).
代表値と散らばり.
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
担当者: 河田 正樹 年度 経済統計講義内容 担当者: 河田 正樹
行動計量分析 Behavioral Analysis
統計学 第3回 10/11 担当:鈴木智也.
統計学 10/19 鈴木智也.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
第3章補足 ローレンツ曲線とジニ係数 統計学基礎 2010年度.
社会福祉調査論 第9講 母集団の推計 12月14日.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
統計解析 第1章 データの表現.
月曜3限 1141教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1141教室 担当者: 河田 正樹
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
統計学の基礎と応用 張 南   今日の話:序   論          履修の注意事項.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
第3章 統計的推定 (その1) 統計学 2006年度.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
都市・港湾経済学(総) 国民経済計算論(商)
代表値と散らばり.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
第2章 統計データの記述 データについての理解 度数分布表の作成.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄)

全数調査と標本調査 全数調査の代表的例が「国勢調査」 センサスCensusという言葉は、全数調査を意味するが、一方で「国勢調査」のことを指す場合もある。ただし、後者を指す場合は、Population Censusといったほうがよい。 標本には、誤差がつきものである。標本誤差。 全数調査にも誤差がある。非標本誤差。 全数調査の存在意義・標本調査の存在意義。 くじ引きをするには、くじをつくらなければならない!

標本の記述統計 標本抽出(sampling)は、「無作為」(random)である必要がある。 母集団 標本 標本抽出 統計的推測 標本抽出(sampling)は、「無作為」(random)である必要がある。 標本を抽出し、記述するのは、母集団がどうなっているかを統計的に推測するためである。

度数分布表とヒストグラム 度数分布表を作るとは、もとのデータを階級値と度数との組み合わせに変換すること。 連続量(例えば、身長)と離散量(世帯の児童数) グラフによる(=幾何的)記述    度数分布表を作成し、ヒストグラムをつくる。 計算による(=算術的)記述    分布の中心・位置の指標    分布のばらつきの指標

分布の中心 分布の中心の指標     平均(mean)     メジアン(中央値、中位数)     モード(最頻値) 算術平均 幾何平均 調和平均

階級 度数 階級値 //// 5 1000 //// 4 3000 / 1 5000 // 2 7000 // 2 9000 11000 527 3 918 4 1500 5 1550 6 2057 7 2521 8 2701 9 3040 10 4079 11 7000 12 7489 13 8400 14 9771 15 10153 16 10664 17 15321 18 15918 19 27868 20 30062 階級 度数 階級値 0以上-2000未満 //// 5  1000 2000-4000 //// 4  3000 4000-6000 /  1  5000 6000-8000 //  2  7000 8000-10000 // 2  9000 10000-12000 11000 12000-14000 13000 14000-16000 15000 16000-18000 17000 18000-20000 19000 20000- //  2 28965

ヒストグラム(柱状図形)を描く

資産額、所得額などの分布(*)では、 平均>メジアン(中央値、中位数)>モード(最頻値) の順になる。 *ユニモーダルな右裾の長い分布

標本の基本統計量

母集団の基本統計量

ヒストグラム(母集団)

分布のばらつきの尺度 範囲(レンジ) 四分位範囲 平均偏差 分散 標準偏差 変動係数

分散の考え方 個々のデータと平均値との「偏差」(deviation)の絶対値がすべて0ならば、<ばらつき>はないことになる。      を偏差 という

平均偏差 差をとって絶対値をとる 平均偏差(MD)mean deviation

分散と標準偏差 分散 標準偏差

分散と標準偏差の第二の算式 別式  不偏性のため 分散 標準偏差

分散の計算

算術平均とメジアンの性質

所得不平等度とばらつきの尺度 ばらつきの尺度は、所得のばらつきの尺度としても使える。 しかし、所得不平等度の尺度として最もよく使われるのは、「ジニ係数」(1912年)である。 ジニ係数とローレンツ曲線との間には密接な関係がある。

ローレンツ曲線( M.O.Lorenz 1905年)を描く:データ 5分位階級 所得 シェア 累積所得 1963 1975 Ⅰ 7.3 8.5 Ⅱ 12.5 13.4 19.8 21.9 Ⅲ 16.6 17.2 36.4 39.1 Ⅳ 22.1 22.3 58.5 61.4 Ⅴ 41.5 38.6 100 データ「家計調査」勤労者世帯

ローレンツ曲線を描く 累積所得シェア 累積相対度数 弓形の面積 は、 完全平等のとき 0 完全不平等のとき 1/2 となる。 完全平等のとき    0 完全不平等のとき  1/2 となる。 その面積を2倍したのが、 ジニ係数。 累積所得シェア 累積相対度数

ジニ係数の計算 q(2) 台形の面積を求める q(1) p(1) p(2)

ジニ係数の計算(1963年) 1-[0.2×0.073+0.2×0.271+0.2×0.562+・・・]=0.312. 1975年のジニ係数は、0.2764