藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1 章 データの整理 1.1 データの代表値. ■ 母集団と標本 観測個数 n ( または 標本の大きさ、標本サイズ、 Sample Size) n が母集団サイズに等しい時 … 全標本 または 全数調査 (census) 母集団 (population) 知りたい全体 標本 (sample) 入手した情報.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
Advanced Data Analysis 先進的データ分析法 2015 (2) 平成 27 年前期第1クウォータ科目 東京工科大学大学院 バイオニクス・情報メディア学専攻科 担当:亀田弘之.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
都道府県の 位置と名称 都道府県の 位置と名称 はじめ る. 北海道 道庁所在地は? 北海道の道庁所在地は 札幌市.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
統計解析 第3章 散布度.
数理統計学  第9回 西山.
回答と解説.
第1章 記述統計の復習 統計学 2007年度.
経済統計学 第2回 4/24 Business Statistics
データ分析入門(7) 第7章 データの操作と比較 廣野元久.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
保健統計 橋本.
第1章 記述統計の復習 統計学 2011年度.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
代表値と散らばり.
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
第1章 記述統計の復習 統計学 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
統計解析 第9回 第9章 正規分布、第11章 理論分布.
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
@Minako Wakasugi, MD, MPH, PhD
統計学 第3回 10/11 担当:鈴木智也.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
統計解析 第1章 データの表現.
1変量データの記述 経済データ解析 2006年度.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
地理情報システム論演習 地理情報システム論演習
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
【演習4】の進行(225分) ※途中休憩有り No 項目 内容 時間 1 演習についての説明 演習の進行方法について確認 5分 2
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
中澤 港 統計学第4回 中澤 港
他の平均値 幾何平均 調和平均 メデイアンとモード 平均値・メデイアン・モードの関係.
確率と統計 メディア学部2008年後期 No.3 平成20年10月16日(木).
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
疫学概論 情報の要約 Lesson 3. 情報の要約 (率、比、割合) S.Harano,MD,PhD,MPH.
analysis of survey data 堀 啓造
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
都市・港湾経済学(総) 国民経済計算論(商)
本時の目標 相対度数の意味を理解し、二つのデータを比較してその傾向を分析することができる。
代表値と散らばり.
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
数理統計学 西 山.
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
数理統計学  第6回 西山.
第2章 統計データの記述 データについての理解 度数分布表の作成.
疫学保健統計 ~テスト対策~ 群馬医療福祉大学 看護学部 2年 ○○○優衣.
地方公共団体のオープンデータ取組済み(※)数の推移
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子 2017年度日本疫学会スライドコンテスト受賞作品 基本的な統計 ーデータの記述ー 藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子 製作者:柿崎真沙子

基本的な統計 データの種類 データの要約値 データの分布を見る 割合・比・率 製作者:柿崎真沙子

統計学の基本 数値や図表で分かりやすく示す 難しい統計テクニック(分散分析、重回帰分析等々の分析統計)よりも単なる平均値や割合などの方が重要なことも 平均値や割合→記述統計 製作者:柿崎真沙子

データの種類を把握する データの種類によって、それ以降の統計処理が全く異なる 統計ソフトを利用する場合、「データの種類を決めてくれ」とソフトに要求されることも 製作者:柿崎真沙子

量的(数字で関連しない)か質的(数字上相互に関連)か データの種類 データ カテゴリー変数 順序尺度 名義尺度 連続変数 間隔尺度 比尺度 量的 順序に意味がある 順序に意味がない ある 量的(数字で関連しない)か質的(数字上相互に関連)か ない 質的 差のみ 数値の差のみに意味があるか 数値の差と比に意味があるか 差と比 製作者:柿崎真沙子

データの種類と要約値の種類 意味 例 要約値 演算 カテゴリー変数 順序尺度 大小関係にのみ意味がある 順序にも意味がある 薬効 度数 最頻値 中央値 大小の比較 名義尺度 区別することに意味がある 疾患名 血液型 演算不可 連続変数 間隔尺度 数値の差のみに意味がある 温度 日付 平均値 加法 減法 比尺度 数値の差と比に意味がある 年齢 身長 乗法 除法 製作者:柿崎真沙子

データの要約値 平均値(Mean):標本集団のデータの総和を標本数で割った値 中央値(Median):標本を大小順に並べて50%点(=中央)にあたる値 最頻値(Mode):頻度が最も高い値 製作者:柿崎真沙子

データの要約値 どんな場合もとりあえず「平均」をとっておくとよい? ちょっと脱線 製作者:柿崎真沙子

例)貯蓄現在高階級別世帯分布 (二人以上の世帯) 2015年家計調査(総務省統計局) 例)貯蓄現在高階級別世帯分布 (二人以上の世帯) 最頻値 100万円未満 平均値 1805万円 中央値 1054万円 世 帯 割 合 (%) まてー! 製作者:柿崎真沙子

平均値が意味のある状況とは データが正規分布していること(対数処理などによる正規化を含む) 平均値=中央値=最頻値 間隔尺度によるデータ データをプロットしてデータの分布を確かめる必要がある t検定や分散分析(ANOVA)は平均値に関する統計手法であり、平均値が意味のある状況にしか使えない 製作者:柿崎真沙子

正規分布とは 正規分布N (μ, σ2)と表す 平均値:μ(ミュー) 標準偏差 (SD):σ(シグマ) 標準正規分布N (1, 0)  例:平成27年国民健康・栄養調査より26-29歳の男性の身長は平均171.7cm、標準偏差(σ)6.0cmである。 この度数分布が正規分布に従うとすると図のように示される。  -3σ  -2σ  -1σ μ 1σ 2σ 3σ (152.7 159.7 165.7 171.7 177.7 183.7 189.7) 13.59% 2.15% この範囲内に 全体の68.3% 標準正規分布の場合はμ=0 標準正規分布の場合はσ=1 この範囲内に全体の95.4% 製作者:柿崎真沙子

それでは例題です 製作者:柿崎真沙子

対象者一覧(某グループ) 個人番号 生年月日 年齢 出身 卒業の有無 卒業年月日 1 20 山梨県 卒業 2 25 在籍 3 23 大阪府 活動開始年月日 卒業の有無 卒業年月日 1 1996年9月16日 20 山梨県 2014年1月1日 卒業 2016年9月30日 2 1991年7月22日 25 在籍 3 1993年10月6日 23 大阪府 4 1996年10月8日 岩手県 2015年9月30日 5 1988年6月20日 28 6 1993年7月22日 奈良県 7 1994年11月3日 22 静岡県 2015年3月30日 8 1992年10月7日 24 北海道 9 1991年12月7日 島根県 2016年3月30日 10 1998年10月4日 18 新潟県 11 1989年11月25日 27 福井県 12 1996年10月3日 愛媛県 13 山形県 14 1988年1月16日 29 秋田県 15 2000年1月6日 17 2014年6月30日 製作者:柿崎真沙子 ※架空のデータです

データの種類は何ですか データ データの種類 代表値 生年月日 生月 年齢 出身 (自分の)好き嫌い 製作者:柿崎真沙子

データの種類は何ですか データ データの種類 代表値 生年月日 間隔尺度 度数、最頻値、中央値、平均値 生月 順序尺度 度数、最頻値、中央値 年齢 比尺度 出身 名義尺度 度数、最頻値 (自分の)好き嫌い 製作者:柿崎真沙子

データを表にしてみよう! 年齢階級 度数 都道府県 生月 17 山梨県 1 18 大阪府 2 19 岩手県 3 20 奈良県 4 21 静岡県 5 22 北海道 6 23 島根県 7 24 新潟県 8 25 福井県 9 26 愛媛県 10 27 山形県 11 28 秋田県 12 29 製作者:柿崎真沙子

データを表にしてみよう! 年齢階級 度数 都道府県 生月 17 1 山梨県 3 2 18 大阪府 19 岩手県 20 奈良県 4 21 静岡県 5 22 北海道 6 23 島根県 7 24 新潟県 8 25 福井県 9 26 愛媛県 10 27 山形県 11 28 秋田県 12 29 製作者:柿崎真沙子

度数分布をグラフにしよう! 製作者:柿崎真沙子

度数分布をグラフにしよう! 製作者:柿崎真沙子 16 19 22 25 27 (年齢・歳) | | | | | 18 21 24 27 29 16 19 22 25 27 (年齢・歳) | | | | | 18 21 24 27 29 甲 近 東 中 北 中  (出身地) 信 畿 北 部 海 国  越       道 四            国 1 2 3 4 5 6 7 8 9 10 11 12 (月) 製作者:柿崎真沙子

度数分布をグラフにしよう! 製作者:柿崎真沙子 16 19 22 25 27 (年齢・歳) | | | | | 18 21 24 27 29 16 19 22 25 27 (年齢・歳) | | | | | 18 21 24 27 29 甲 近 東 中 北 中  (出身地) 信 畿 北 部 海 国  越       道 四            国 1 2 3 4 5 6 7 8 9 10 11 12 (月) 製作者:柿崎真沙子

年齢の要約値を計算してみよう! 平均値 中央値 最頻値 最小値 最大値 製作者:柿崎真沙子

年齢の要約値を計算してみよう! 平均値 中央値 最頻値 最小値 最大値 22.9 23.0 20.0と23.0 17.0 29.0 製作者:柿崎真沙子

割合、比、率 割合(proportion) 比(ratio) 率(rate) 全体の中で特定の特徴を持つものが占める部分の大きさ 異なる者同士を割り算で比較したもの 率(rate) 比の特殊な形で分母が時間になったもの 事象が生じる速さを示す指標 製作者:柿崎真沙子

割合、比、率 A B A 割合(proportion) 比(ratio) B BはAの中に含まれる B/A AとBは別物 A対B 製作者:柿崎真沙子

割合と率 (率は時間の概念を考慮に入れる) Aさん Bさん 死亡 Cさん Dさん 0ヶ月     3ヶ月     6ヶ月      9ヶ月     12ヶ月 死亡割合:2人/4人=0.5 死亡率:2人/(1+0.25+0.75+1)人年=3人年あたり2人 分母の単位は何か? 製作者:柿崎真沙子

割合、比、率 日本語としての使用方法は曖昧(英語も) 用語として決まっているので、それぞれ定義をしっかり覚えよう 打率:安打数/全打数(割合) 円周率:円の周長の直径に対する比(比) 有病率:何人中何人が病気にかかっているか(割合) 罹患率一定期間に新規に罹患した数を、その集団の人口およびその期間の長さで割る(率) 死亡率:一定期間に新規に死亡した数を、その集団の人口およびその期間の長さで割る(率) 製作者:柿崎真沙子

それでは例題です 製作者:柿崎真沙子

全体に対する割合を出そう! 都道府県 度数 割合 山梨県 3 大阪府 1 岩手県 奈良県 静岡県 北海道 島根県 新潟県 福井県 愛媛県 山形県 秋田県 2 合計 15 製作者:柿崎真沙子

全体に対する割合を出そう! 都道府県 度数 割合 山梨県 3 3/15×100=20.00% 大阪府 1 6.66% 岩手県 奈良県 静岡県 北海道 島根県 新潟県 福井県 愛媛県 山形県 秋田県 2 13.33% 合計 15 100.00% 製作者:柿崎真沙子

比を出そう! 生月 度数 比 1 2 1月:6月 6 1月:11月 7 3 夏:秋 9 10 5 11 12 製作者:柿崎真沙子

比を出そう! 月 度数 比 1 2 1月:6月 2:1 6 1月:11月 2:2=1:1 7 3 夏:秋 4:6=2:3 9 10 5 11 12 製作者:柿崎真沙子

卒業割合・卒業率をだそう! 2016年9月30日 2015年9月30日 2015年3月30日 2016年3月30日 2014年6月30日 個人番号 活動開始年月日 卒業の有無 卒業年月日 1 2014年1月1日 卒業 2016年9月30日 2 在籍 3 4 2015年9月30日 5 6 7 2015年3月30日 8 9 2016年3月30日 10 11 12 13 14 15 2014年6月30日 製作者:柿崎真沙子 ※架空のデータです

2016年12月31日時点の・・・・・ 卒業割合:6人/15人=0.4(40%) 卒業率:6人/38.5人年 卒業 卒業 卒業 7 8 9 10 11 12 13 14 15 2014.1.1 2015.1.1 2016.1.1 2016.12.31 卒業 卒業 卒業 2016年12月31日時点の・・・・・ 卒業割合:6人/15人=0.4(40%) 卒業率:6人/38.5人年 製作者:柿崎真沙子