Download presentation
Presentation is loading. Please wait.
1
保健統計演習 第3回 橋本
2
目次 先週の復習 厚生統計の定義と意味 確率 統計 率・比・割合・度 事象、試行 排反事象 独立事象 条件付き確率 母集団と標本抽出
記述統計 推測統計 統計的仮説検定
3
【復習】率,比,割合,度の原則 率 Rate 分子が分母の一部に含まれる 多くは1000倍,10万倍される.
以上は厚生労働統計での原則 率 Rate 分子が分母の一部に含まれる 多くは1000倍,10万倍される. 例 死産率=死産数/出産数(出産数=出生数+死産数)×1,000 比 Ratio 分子と分母が異なる.多くは100倍される. 例 出生性比=年間の男子出生数 / 年間の女子出生数 ×100 割合 Proportion 全体を100として,分子が何パーセントか百分率で示す 100を超えることはない. 度 Degree 2つの間隔を等間隔に目盛をつけた尺度に対する指標
4
【復習】度 degree 温度 水の氷点と沸点を100分 角度 円周を360分
温度 水の氷点と沸点を100分 角度 円周を360分 緯度 赤道を0で北極を90 経度 旧グリニッジ天文台と極を結ぶ線を基準に地球の1周を360度
5
【復習】期間合計特殊出生率 平成21年の期間合計特殊出生率 =0.0248+0.1779+。。 +0.0009=1.37
平成21年の期間合計特殊出生率 = 。。 =1.37 コホート合計特殊出生率
6
統計を作成することを目的として行われる調査
【復習】統計の定義と種類 1次統計 調査統計(国勢調査) 業務統計 加工統計 統計の種類 実際の統計調査・業務からの数値 一次統計 統計を作成することを目的として行われる調査 調査統計 全数の調査 悉皆調査 標本抽出の調査 標本調査 行政記録を基に作成される統計 業務統計 その他加工することにより作成される統計 加工統計 悉皆 しっかい
7
【復習】人口統計の種類 人口動態統計 人口静態統計
調査統計 悉皆調査 人口動態統計 人口静態統計 業務統計 一定期間に起こる人口の変化に影響する事柄の指標(1/1- 12/31の1年間) 住民票・戸籍 出生数⇒出生届 死亡数⇒死亡届 婚姻数⇒婚姻届 離婚数⇒離婚届 死産数 ⇒死産届 【方法】市町村長⇒保健所長⇒知事⇒厚労省 特定の一時点における人口数など,人口の状態を把握するための統計. 国勢調査(5年毎 10月1日)⇒統計法(基幹統計,指定統計) 常住調査 個人調査 世帯調査 【方法】国勢調査区⇒市町村⇒都道府県⇒総理府
8
【おまけ】2012年7月9日(月)から ... 外国人にも 住民票 出生届 死亡届
出生届を出せない人たち 従前は! 住民票 出生届 死亡届 出生届を出すと元夫の戸籍に入ってしまうから出していないという事情 民法722 裁判・調停中
9
【おまけ】観測値での注意事項 観測値の尺度 稠密性 ⇒ 比尺度 間隔性 ⇒ 間隔尺度 順序性⇒ 順序尺度 名義性⇒ 名義尺度
稠密性 ⇒ 比尺度 連続的 離散的 加減乗除 例) 身長 間隔性 ⇒ 間隔尺度 例 摂氏温度 加減 順序性⇒ 順序尺度 大変満足した→5,満足した→3,大変不満→1 名義性⇒ 名義尺度 例 男→1,女→2 サッカー選手の背番号
10
発生する確からしさ 事象を集合として考え,確率を「集合に『確率という測度』を割り当てる
やりかた」ととらえています。 確率
11
確率(Probability) 天気予報 予測には確率がともなう
12
【用語】試行(Trial)と事象(Evenet)
試行:人間が繰り返すことができる実験・観測の行為 サイコロを投げ、出た目を観測する 街に出て、であった人を観察 事象: 試行の結果、人間が観測できる明確な基準にもとづく事柄 例) 〇 サイコロを投げて、1の目が出る × 街に出て、イケメンに逢う
13
試行,事象,確率 事象: 6の目が出る 確率: 1/6 事象 実験 観察
14
標本空間(Sample Space) S 試行によって定まる結果の全体 起こりうるすべての集合 例)サイコロを1回、投げる
15
S A B P:確率の定義と性質 事象 1 ≧ P(A)≧0 P(S)=1 P(φ)=0
A ∩ B =φ ⇒ P(A∪B)=P(A) + P(B) A⊂ B ⇒ P(A)≦P(B) S A B
16
根元事象とは 標本空間の部分集合のうち、これ以上分割できない集合 例) サイコロ投げ この根源事象に確率を割り当てる 〇 1の目がでる
例) サイコロ投げ 〇 1の目がでる × 偶数の目が出る←なぜ? この根源事象に確率を割り当てる
17
複合事象 2つ以上の根元事象からなる事象
18
確からしさを表す指標 確率(Probability) オッズ (Odds) 事象に対して、与えられた0から1までの数値
全事象に対しての起こりやすさの率 Odds=p/(1-p) ある事象に着目し、起きる、起きないの比で与える。 0以上の正の数 最大は無限
19
P(A)=n(A)/n(S) 確率って? 全てが等しい1/6の確率でなくても確率! 決め方は自由
出る目の数 1 2 3 4 5 6 太郎 1/6 ハナコ 1/12 7/12 S ={1の目が出る, 2の目が出る, 3の目が出る, 4の目が出る, 5の目が出る, 6の目が出る} 全てが等しい1/6の確率でなくても確率! 決め方は自由 全ての根元事象が等しい確率で発生するという仮定 P(A):事象Aが発生する確率 n(A):事象Aに含まれる根源事象の数 P(A)=n(A)/n(S)
20
確率の公式 A B A B P(AUB)=P(A)+P(B) -P(A∩B)
排反事象 A∩B=φ AとBが同時に起こりえない P(A∩B)=0 A B A B
21
条件付き確率 A B B P(B|A) 事象Aが発生している状態で事象Bが起きる確率 ⇒Aが自分の世界だと考えてBが起きる確率
P(B|A)=P(A∩B)/P(A) A B B
22
条件付き確率 A B 一般の人のある疾患の有病率
病院に来ている人のある疾患の有病率 例) 一般の有病率 P(B)= 万人に2人 P(A)=30,000/200,000 P(A∩B) =80/30000 A B P(B|A)=P(A ∩B) /P(A) =80/30000÷ 30000/ = ⇐1000人中18人
23
つまり!【重要】 大病院ほど検査をシッカリしないと重大な疾病を見逃す!
24
条件付き確率 P(B|A) ある事象Aを観測したときに事象Bを観測する確率 例) A:発熱している B:風邪をひいている
25
条件付き確率の数学上の定義 𝑃(𝐴∩𝐵 とは事象A,Bを同時に起きる確率
26
条件付き確率のイメージ 事象Aの発生する確率 0.2 事象Bの発生する確率 0.05 事象A,Bの発生する確率 0.02
S:100人(全事象) A:20人(事象) S:100人(全事象) A:20人(事象) B:5人(事象) A∩B:2人
27
条件付き確率のイメージ 𝑃(𝐵|𝐴 Aが全体だと考えて,確率を計算すること 𝑃(𝐵|𝐴 =2人/ 20人 =0.1 S:100人(全事象)
B:5人(事象) A∩B:2人
28
例題 歪みのないサイコロを投げ,偶数の目が出たときに,その目が3の倍数である確率 A:偶数の目が出る B:目が3の倍数
29
例題 A={2の目が出る,4の目が出る,6の目が出る} B={3の目が出る,6の目が出る} A∩B={6の目が出る}
⇒P(A)=1/2 P(A∩B)=1/6 ゆえに P(B|A)= P(A∩B)/ P(A)=1/6÷ ½ =2/6=1/3
30
2,4,6の世界では6の1つだけ 2 4 A: 偶数の目がでる 1 5 6 3 B: 3の倍数の目がでる
31
我々の観察する世界は多くが 条件付き確率である
A:罹患 (発症) P(A):ある特定疾患に罹患する確率 ⇒非常に小さい B: 大学病院に入院する ⇒非常に小さい しかし P(A|B)が小さいという保証は 何もない!
32
実例 P(A)=0.0001 1万人1人 P(B)=0.0001 400万人(県民人口)のうち400人(病床)
P(A∩B)= 万人1人 P(B|A)=P(A∩B)/P(A)= ÷ =1/10=0.1
33
独立事象 2つの事象A,Bが独立事象であるとは 定義 P(A|B)=P(A) または P(B|A)=P(B)
34
排反と独立 排反 A∩B=φ 独立 P(A∩B)=P(A)P(B) 排反なら P(A∩B)=0 つまり排反事象であれば独立でない
独立とはA、Bの事象で発生に何ら関係の無い事 ⇒Aが起きたらBが起きない←関係あり
35
独立事象の性質 P(A∩B)= P(A)× P(B) 独立のときだけ上の式が成立する
自分の私感ですが,実際の世界で完璧に独立ということはめったにない!
36
ベルヌーイ試行 ある事象に着目し、 事象が発生するか、しないかの2通り 試行を繰り返すとき、それぞれの試行における成功の確率は不変
コイン投げ 試行 オモテ面またはウラ面 排反事象 試行を繰り返すとき、それぞれの試行における成功の確率は不変 試行を繰り返すとき、それぞれの試行での結果(事象)はお互いに独立
37
まとめ 確率 条件付き確率 P(B|A)=P(A∩B)÷P(B) 試行 事象 確率の公式 P(A∪B)=P(A)+P(B)-P(A∩B)
根元事象 複合事象 排反事象 独立事象 確率の公式 P(A∪B)=P(A)+P(B)-P(A∩B) 条件付き確率 P(B|A)=P(A∩B)÷P(B)
38
統計学を学ぶ 保健統計演習
39
保健統計の夜明け PG ホーエル 1905-2000 初等統計学 アメリカのヘルスサイエンス パイオニア的教科書
EBM,EBN Evidence Based Medicine 根拠と科学に基づいた保健医療政策
40
【おまけ】デミング博士と品質管理 Made in Japan 日本製品の品質 デミング博士 戦後米国⇒日本 日本のモノ造りに与えた影響
TQCに取り組み「品質第一」⇒「モノ造り日本」 デミング賞
41
you remember the 1950s and that “Made in Japan” meant “cheap, junky, poor quality products.”
南カルフォルニア州大学 Kristan Venegas氏の文より
42
第1章 統計的方法の性質 母集団 標本 第1節 序 母集団(Statistical Population) 観測値(observation)の源泉(source) 有限母集団 無限母集団 標本(Sample) 観測値の源泉に関する情報をえる目的で,得られた観測値の集まり
43
注意 母集団(Population)といっても 人間だけでない 科学の実験も
44
観測値での注意事項 観測値の尺度 稠密性 間隔性 順序性 名義性 連続的 離散的 大変満足した→5,満足した→3,大変不満→1
例 男→1,女→2
45
統計学の分野(分類) 記述統計 (descriptive statistics )
統計的仮説検定 testing of statistical hypothesis ) 推測統計 (inferential statistics )
46
実例 選挙の推測 血清の効果 (薬剤基準) 品質管理(Quality Control) ⇒QC⇒TQC OR
Mathematical Programming
47
推定と仮説検定 母集団の性質(特性)の推定 母集団に関する性質(特性)の仮説を検定
48
統計学でできることとできないこと 限界も知るべき がん死亡率(10万人)
電話適正利用推進協議会HPより 池 田 一 夫ら “日本におけるがん死亡の動向予測” Ann. Rep. Tokyo Metr. Inst. P.H., 55, 2004
49
統計学でできることとできないこと ⇒因果関係 ⇒関連
50
確率(Probability) 天気予報 予測には確率がともなう
51
第2章 標本データの記述 n:標本の大きさ(Size of Sample, Sample size) N:母集団の大きさ 例 母集団
第2章 標本データの記述 n:標本の大きさ(Size of Sample, Sample size) N:母集団の大きさ 例 母集団 標本抽出 標本
52
無作為抽出(Random Sampling)
標本←母集団の縮約になっていてほしい。 母集団を構成するかく要素が等しい確率で標本に選ばれること。 ⇔過去の手法 作為抽出法 有意抽出法
53
過去の手法 過去の手法? 標本を抽出で,母集団の代表と思われる標本を主観的に選択抽出方法 ⇒非科学的な方法で統計的手法は一切適用できない
54
用語の間違いの例 標本の大きさ⇒3 標本数⇒2 データ数⇒6 母集団 標本抽出 標本抽出 標本 3人 標本 3人
55
課題 ある研究者はA市の高齢者100人を調査するために20箇所の老人クラブにおもむき,5人の推薦をお願いし標本を得た。
この調査方法について意見を述べなさい。
56
【重要】記述の前に 観測値の性質 名義的な尺度 男⇒1 女⇒2 順序的尺度 大変満足した⇒5 やや満足した⇒4 普通⇒3 (離散的)
名義的な尺度 男⇒1 女⇒2 順序的尺度 大変満足した⇒5 やや満足した⇒4 普通⇒3 (離散的) 連続的(間隔変数) 間隔尺度(絶対的原点なし) 比率尺度(絶対的原点あり)
57
グラフでの表現 ヒストグラム 階級 階級値 頻度
58
実際の問題へ データの分類 グラフ表示 算術記述 平均(Mean, Average)
標準偏差(Standard Deviation),分散(Variance) 最頻値(モード Mode) 中央値(メディアン Median)
59
メタボリックシンドロームの診断基準と今後の課題
札幌医科大学医学部第2 内科 島本和明教授資料
60
第2章 標本データの記述 どのように標本を選ぶべきか? 無作為抽出 (Random Sampling)
第2章 標本データの記述 どのように標本を選ぶべきか? 作為抽出 なんら科学的な手法も使用できない 無作為抽出 (Random Sampling) 母集団を構成するどの個体も 標本に選ばれる確率が等しく なるような抽出方法 母集団 標本
61
無作為抽出で失敗した例 学生のアンケート 電話での選挙予想 老人調査 何が大切か? 母集団を構成する台帳 母集団に番号をつける
例 住民基本台帳 母集団に番号をつける
62
【解答】 老人クラブ問題 老人クラブに入会している人は健康な人たち 老人クラブは過疎地にはすくなくある程度人口がいる場所に限られる。
【解答】 老人クラブ問題 老人クラブに入会している人は健康な人たち 老人クラブは過疎地にはすくなくある程度人口がいる場所に限られる。 老人クラブの会長から推薦された人 健康 受け答えができて会の中核になる人 男性 ⇒ この調査結果は信頼できない!
63
参考 調査方法(Sample survey)
個人面接法(Interview survey) 正確で高い回収率、費用がかさむ 配布回収法(留め置き法) 調査員が配布し 後に回収 郵送法(mail survey) 回収率は30%以下 電話法(Telephone survey) インターネット調査
64
記述統計 データの縮約的記述 平均値(期待値) Average,Mean
標準偏差 Standard Deviation ⇒データが平均の周りにどれだけあつまっているか? 分散⇒標準偏差の2乗 中央値(ちゅうおうち) 最頻値(もーど) 尖度(せんど) 歪度(わいど)
65
標準偏差のイメージ 平均⇒30円 50円 10円 標準偏差=28.2842円 20円 40円 標準偏差=14.142円 30円 標準偏差=0
66
尖度のイメージ Wikipediaより
67
歪度(Skewness)のイメージ Wikipediaより
68
メディアンとモード 分布が左右に歪んでいる場合には必要な概念 左右対称な場合は平均値に一致する
69
【実習課題】 体重と身長のデータ (2つとも連続型、間隔尺度) BMIの計算 判定
70
EXCELの記述統計
71
【復習】記述統計の目的は? BMI Body Mass Index 体格指数
BMI=(体重Kg) /身長(m)^2 BMI値の18.5以上~25未満が普通
72
2017/3/8 結果の見方 新潟j県立看護大学 橋本明浩
73
算術的記述 measure of location measure of scale その他 正規分布と比較して
分布の位置に関する測度 平均、最頻値(モード)、中央値(メジアン) measure of scale 尺度に関する測度 その他 正規分布と比較して 歪度(Skewness) 尖度(Kurtosis)
74
結果の意味 平均(x): 標本平均 1/nΣixi を意味します. 標準誤差 標準偏差をnの平方根で割ったもの 標準偏差
2017/3/8 結果の意味 平均(x): 標本平均 1/nΣixi を意味します. 標準誤差 標準偏差をnの平方根で割ったもの 標準偏差 標本標準偏差を意味しています.分散の平方根です. 平均の周りの散らばりを意味しています. 中央値 データの真ん中の順位の値です.この場合は100なので,50番目と51番目の平均を計算しています. 最頻値 計算しても意味のないものを計算しています. 分析ツールでの計算結果は,離散的なデータや階級に分類されている場合等だけが意味を持ちます. 尖度 分布の裾の重さになる指標です. 歪度 左右の偏りを示します.正の場合は右に裾を引き,負の場合は左に裾を引くと言います. 分散(s2): 標本不偏分散です.二乗和を(n-1)で割った形式です. 信頼区間 正規分布近似計算で両側信頼区間です.(EXCEL2003) そうでない場合は信頼区間の半分の長さですの,平均±この数値が信頼区間です. 新潟j県立看護大学 橋本明浩
75
統計量の概念【位置尺度】 右に裾をひいた分布(歪度が正) 単峰(やま1つ)なら モード≦メジアン ≦平均が成立する
2017/3/8 統計量の概念【位置尺度】 右に裾をひいた分布(歪度が正) 単峰(やま1つ)なら モード≦メジアン ≦平均が成立する 左右対称分布の場合は3つ(平均,メジアン,モード)は一致して,歪度は0 日本人の現金(普通預金,定期預金,郵便貯金を含む) 平均所有額 1人あたり667万円 新潟j県立看護大学 橋本明浩
76
歪度 右に裾を引く 値が正となる 左に裾を引く 値は負となる 日本の森林の表層土壌のpH値 有症者発生数の推移
流行曲線の例 (北海道内で集団発生した腸管出血性大腸菌O-157感染症報告書, 北海道帯広保健所,1997) idsc.nih.go.jp/training/9kanri/14_minowa.html
77
【参考】学校保健統計 統計法(昭和22年法律第18号)による指定統計第15号⇒学校保健法⇒学校保健統計調査規則⇒学校基本調査実施要領⇒ 通達
目的 毎年実施している調査 毎年定期的に実施される健康診断の結果に基づき、小学校・中学校・高等学校及び幼稚園における児童、生徒及び幼児の発育状態並びに健康状態を明らかにすること
78
法律の仕組み 行政法で根拠とその仕組みを勉強しておきましょう。 看護師← 地方公務員、国家公務員 卒業研究で知りたい統計の結果はどこにあるのか? ⇒総務庁統計局 学校保健統計←文部科学省
79
分析ツールでのヒストグラム 知識がなくてもある程度の作業はできる 問題点 事前の準備 データ ⇒データ分析⇒ヒストグラム 度数分布表とグラフ
事前の準備 EXCELオプション⇒アドイン⇒分析ツール 区切りのデータを作成しておく データ ⇒データ分析⇒ヒストグラム 度数分布表とグラフ 問題点 データが変わったら再度分析ツールを実行しなくてはならない
80
実際に作ってみよう
81
【復習】 言葉の定義 階級(Class) 階級下限値 階級上限値 階級値(class value ・ ) 頻度(Frequency)
82
【復習】 度数分布表(連続変量の場合) 階級 階級値 度数(人) 下限値 上限値 20 22 21 1 24 23 4 26 25 28
27 データの分布の概要を数値的に把握するのに役立つ
83
【復習】度数分布表(名義的尺度の場合) 血液型 度数 A 32 B 24 O 14 AB 7 不明 3 合計 80
84
【復習】階級のとりかた 最大値,最小値 階級の数= 5-20程度 目安として 標本の大きさ 階級の数が多すぎると不規則な凸凹
階級の数= 5-20程度 目安として 標本の大きさ 30程度なら5個 10-20程度まで 階級の数が多すぎると不規則な凸凹 少なすぎると情報が失われる
85
階級の数はいくつがいいの? Sturgesの提案 階級の数=1+(log10 n / log102) =1+log2n
EXCELでは =1+ Log(標本の大きさ,2)と入力すれば計算できる スコット(Scott’s)の提案 階級の数=3.5s/ n1/3 ここでsは標本の標準偏差 EXCELでは =3*標本標準偏差/標本の大きさ^(1/3)と入力すれば計算できる FreedmanとDiaconisの提案 階級の数=2×四分位範囲/ n1/3
86
正しいヒストグラム 2.5の階級値から 階級下限値は0 階級上限値は5であることがわかる.
階級下限値は0 階級上限値は5であることがわかる. つまり 0歳以上5歳未満での死亡数は322人であることがわかる.
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.