統計解析 第3章 散布度.

Slides:



Advertisements
Similar presentations
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Advertisements

1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
数理統計学  第9回 西山.
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
第1章 記述統計の復習 統計学 2007年度.
統計解析 第7回 第6章 離散確率分布.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
統計学  第7回 西 山.
統計解析 第8回 第7章 2項分布.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計解析 第9回 第9章 正規分布、第11章 理論分布.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
寺尾 敦 青山学院大学社会情報学部 社会統計 第3回:統計入門の落ち穂拾い 寺尾 敦 青山学院大学社会情報学部
統計解析 第8回 第7章 2項分布.
数理統計学  第8回 第2章のエクササイズ 西山.
統計学 第3回 10/11 担当:鈴木智也.
統計学 10/19 鈴木智也.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
統計解析 第1章 データの表現.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
1変量データの記述 経済データ解析 2006年度.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
賃金分析 -現行の賃金制度を客観的に分析する-
数理統計学 第4回 西山.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
都市・港湾経済学(総) 国民経済計算論(商)
統計学  第9回 西 山.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第6回 西山.
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
データ分布の特徴 基準化変量 歪度 尖度.
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

統計解析 第3章 散布度

今日学ぶこと 散布度 範囲 四分位範囲 平均偏差 分散、標準偏差

範囲 範囲 = 最大値 - 最小値 25人の標本の 同居家族数 1 4 6 7 3 2 18人の標本の所有土地面積 (平方メートル) 4 6 7 3 2 18人の標本の所有土地面積 (平方メートル) 309.3 430.8 189.2 71.3 228.1 139.7 17.3 427.4 264.6 172.7 54.2 128.4 528.6 54.5 63.0 289.3 102.1 279.8 所有土地面積の範囲 = 528.6 - 17.3               = 511.3 同居家族数の範囲 = 7 - 0              = 7 範囲の短所: 用いている変量は2つ

四分位範囲 25人の標本の 同居家族数 1 4 6 7 3 2 四分位範囲の短所: 用いている変量は3つ 4 6 7 3 2 四分位範囲の短所: 用いている変量は3つ 四分位範囲 = 上位四分位数 - 下位四分位数 = 3 少ない順に並べると 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 2 3 3 3 4 4 6 6 7 上位 四分位数 3 下位 四分位数 中央値 1

? ちょっと練習問題 5夫婦の子供の数 2, 0, 1, 0, 2 の範囲と四分位範囲は? 5人の所持金(万円) 2.22, 3.89, 1.07, 3.58, 1.38 ? 並び替えると 0, 0, 1, 2, 2 範囲: 2 - 0 = 2 四分位範囲: 2 - 0 = 2 並び替えると 1.07, 1.38, 2.22, 3.58, 3.89 範囲: 3.89 - 1.07 = 2.82 四分位範囲: 3.58 - 1.38 = 2.20

平均偏差 6人の標本の同居家族数 1 4 5 2 合計 = 1 + 0 + 4 + 0 + 5 + 2 = 12 4 5 2 合計 = 1 + 0 + 4 + 0 + 5 + 2 = 12 平均 = 合計 / 標本数 = 12 / 6 = 2 平均との差 平均との差の合計 = 1 + 2 + 2 + 2 + 3 + 0 = 10 |1 - 2 | = 1 |0 - 2 | = 2 |4 - 2 | = 2 |5 - 2 | = 3 |2 - 2 | = 0 平均偏差 = 平均との差の合計 / 標本数 = 10 / 6 ≒ 1.67 標本 の値 平均 標本数

分散と標準偏差 6人の標本の同居家族数 1 4 5 2 合計 = 1 + 0 + 4 + 0 + 5 + 2 = 12 4 5 2 合計 = 1 + 0 + 4 + 0 + 5 + 2 = 12 平均 = 合計 / 標本数 = 12 / 6 = 2 平均との差の2乗 (1 - 2)2 = 1 (0 - 2)2 = 4 (4 - 2)2 = 4 (5 - 2)2 = 9 (2 - 2)2 = 0 平均との差の2乗の合計 = 1 + 4 + 4 + 4 + 9 + 0 = 22 分散 = 平均との差の2乗の合計 / 標本数 = 22 / 6 ≒ 3.67 標本 の値 平均 標本数

? ちょっと練習問題 4家庭の部屋の数 6, 3, 2, 4 の平均偏差、分散、標準偏差は? 平均: (6 + 3 + 2 + 4)/4 = 15/4 = 3.75 平均偏差: (|6 - 3.75| + |3 – 3.75| + |2 – 3.75| + |4 – 3.75|)/4 = (2.25 + 0.75 + 1.75 + 0.25)/4 = 5/4 = 1.25 分散: ((6 - 3.75)2 + (3 – 3.75)2 + (2 – 3.75)2 + (4 – 3.75)2)/4 = 8.75/4 = 2.1875 = 2.19 標準偏差:√(8.75/4) = 1.479… = 1.48

度数分布表からの平均偏差の計算 30 5715 3520 所有土地面積の度数分布表 (単位は平方メートル) 級間隔 真の 級限界 級中央値 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 201-300 200.5-300.5 250.5 5 301-400 300.5-400.5 350.5 2 401-500 400.5-500.5 450.5 3 501-600 500.5-600.5 550.5 1 小計 505 1354.5 1252.5 701 1351.5 550.5 平均との 差 140 40 60 160 260 360 平均との差 の小計 1400 360 300 320 780 30 5715 3520 平均 = 値の合計 ÷ 標本数 = 5715 ÷ 30 = 190.5 所有土地面積 の合計 標本数 平均との差 の合計 平均偏差 = 平均との差の合計 ÷ 標本数 = 3520 ÷ 30 = 117.3

所有土地面積の度数分布表(単位は平方メートル) 度数分布表からの標準偏差の計算 所有土地面積の度数分布表(単位は平方メートル) 級間隔 真の級限界 級中央値 度数 1-100 0.5-100.5 50.5 10 101-200 100.5-200.5 150.5 9 201-300 200.5-300.5 250.5 5 301-400 300.5-400.5 350.5 2 401-500 400.5-500.5 450.5 3 501-600 500.5-600.5 550.5 1 小計 505 1354.5 1252.5 701 1351.5 550.5 平均との 差の2乗 1402 402 602 1602 2602 3602 平均との差 の2乗の小計 1402×10 402×9 602×5 1602×2 2602×3 3602×1 612,000 30 5715 平均 = 値の合計 ÷ 標本数 = 5715 ÷ 30 = 190.5 平均との差 の2乗の合計 分散 = 平均との差の2乗の合計 ÷ 標本数 = 612,000 ÷ 30 = 20,400 = 142.8

標準偏差は 収入で例えるならば リスク 今日省略したこと パーセンタイル 便利な計算法