保健統計演習 第3回 橋本.

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

保健統計演習 第3回 橋本

目次 先週の復習 厚生統計の定義と意味 確率 統計 率・比・割合・度 事象、試行 排反事象 独立事象 条件付き確率 母集団と標本抽出 記述統計 推測統計 統計的仮説検定

【復習】率,比,割合,度の原則 率 Rate 分子が分母の一部に含まれる 多くは1000倍,10万倍される. 以上は厚生労働統計での原則 率  Rate 分子が分母の一部に含まれる 多くは1000倍,10万倍される. 例 死産率=死産数/出産数(出産数=出生数+死産数)×1,000 比 Ratio 分子と分母が異なる.多くは100倍される. 例 出生性比=年間の男子出生数 / 年間の女子出生数 ×100 割合 Proportion 全体を100として,分子が何パーセントか百分率で示す 100を超えることはない. 度 Degree 2つの間隔を等間隔に目盛をつけた尺度に対する指標

【復習】度 degree 温度 水の氷点と沸点を100分 角度 円周を360分 温度  水の氷点と沸点を100分 角度  円周を360分 緯度 赤道を0で北極を90 経度 旧グリニッジ天文台と極を結ぶ線を基準に地球の1周を360度

【復習】期間合計特殊出生率 平成21年の期間合計特殊出生率 =0.0248+0.1779+。。 +0.0009=1.37 平成21年の期間合計特殊出生率 =0.0248+0.1779+。。 +0.0009=1.37 コホート合計特殊出生率

統計を作成することを目的として行われる調査 【復習】統計の定義と種類 1次統計 調査統計(国勢調査) 業務統計 加工統計 統計の種類 実際の統計調査・業務からの数値 一次統計 統計を作成することを目的として行われる調査 調査統計  全数の調査 悉皆調査 標本抽出の調査 標本調査 行政記録を基に作成される統計 業務統計 その他加工することにより作成される統計 加工統計 悉皆 しっかい

【復習】人口統計の種類 人口動態統計 人口静態統計 調査統計  悉皆調査 人口動態統計 人口静態統計 業務統計 一定期間に起こる人口の変化に影響する事柄の指標(1/1- 12/31の1年間) 住民票・戸籍 出生数⇒出生届 死亡数⇒死亡届 婚姻数⇒婚姻届 離婚数⇒離婚届 死産数 ⇒死産届 【方法】市町村長⇒保健所長⇒知事⇒厚労省 特定の一時点における人口数など,人口の状態を把握するための統計. 国勢調査(5年毎 10月1日)⇒統計法(基幹統計,指定統計) 常住調査 個人調査 世帯調査 【方法】国勢調査区⇒市町村⇒都道府県⇒総理府

【おまけ】2012年7月9日(月)から ... 外国人にも 住民票 出生届 死亡届 出生届を出せない人たち 従前は! 住民票 出生届 死亡届 出生届を出すと元夫の戸籍に入ってしまうから出していないという事情 民法722 裁判・調停中 www.sanspo.comより

【おまけ】観測値での注意事項 観測値の尺度 稠密性 ⇒ 比尺度 間隔性 ⇒ 間隔尺度 順序性⇒ 順序尺度 名義性⇒ 名義尺度 稠密性 ⇒ 比尺度 連続的 離散的 加減乗除 例) 身長 間隔性 ⇒ 間隔尺度 例 摂氏温度   加減 順序性⇒ 順序尺度 大変満足した→5,満足した→3,大変不満→1 名義性⇒ 名義尺度 例 男→1,女→2 サッカー選手の背番号

発生する確からしさ 事象を集合として考え,確率を「集合に『確率という測度』を割り当てる やりかた」ととらえています。 確率

確率(Probability) 天気予報 予測には確率がともなう

【用語】試行(Trial)と事象(Evenet) 試行:人間が繰り返すことができる実験・観測の行為 サイコロを投げ、出た目を観測する 街に出て、であった人を観察 事象: 試行の結果、人間が観測できる明確な基準にもとづく事柄 例) 〇 サイコロを投げて、1の目が出る × 街に出て、イケメンに逢う

試行,事象,確率 事象: 6の目が出る 確率: 1/6 事象 実験 観察

標本空間(Sample Space) S 試行によって定まる結果の全体 起こりうるすべての集合 例)サイコロを1回、投げる

S A B P:確率の定義と性質 事象 1 ≧ P(A)≧0 P(S)=1 P(φ)=0 A ∩ B =φ ⇒ P(A∪B)=P(A) + P(B) A⊂ B  ⇒ P(A)≦P(B) S A B

根元事象とは 標本空間の部分集合のうち、これ以上分割できない集合 例) サイコロ投げ この根源事象に確率を割り当てる 〇 1の目がでる 例) サイコロ投げ 〇 1の目がでる × 偶数の目が出る←なぜ? この根源事象に確率を割り当てる

複合事象 2つ以上の根元事象からなる事象

確からしさを表す指標 確率(Probability) オッズ (Odds) 事象に対して、与えられた0から1までの数値 全事象に対しての起こりやすさの率 Odds=p/(1-p) ある事象に着目し、起きる、起きないの比で与える。 0以上の正の数 最大は無限

P(A)=n(A)/n(S) 確率って? 全てが等しい1/6の確率でなくても確率! 決め方は自由 出る目の数 1 2 3 4 5 6 太郎 1/6 ハナコ 1/12 7/12 S ={1の目が出る, 2の目が出る, 3の目が出る, 4の目が出る, 5の目が出る, 6の目が出る} 全てが等しい1/6の確率でなくても確率! 決め方は自由 全ての根元事象が等しい確率で発生するという仮定 P(A):事象Aが発生する確率 n(A):事象Aに含まれる根源事象の数 P(A)=n(A)/n(S)

確率の公式 A B A B P(AUB)=P(A)+P(B) -P(A∩B) 排反事象 A∩B=φ AとBが同時に起こりえない P(A∩B)=0 A B A B

条件付き確率 A B B P(B|A) 事象Aが発生している状態で事象Bが起きる確率 ⇒Aが自分の世界だと考えてBが起きる確率 P(B|A)=P(A∩B)/P(A) A B B

条件付き確率 A B 一般の人のある疾患の有病率 病院に来ている人のある疾患の有病率 例) 一般の有病率 P(B)=0.00002 10万人に2人 P(A)=30,000/200,000 P(A∩B) =80/30000 A B P(B|A)=P(A ∩B) /P(A) =80/30000÷ 30000/200000 =0.0177 ⇐1000人中18人

つまり!【重要】 大病院ほど検査をシッカリしないと重大な疾病を見逃す!

条件付き確率 P(B|A) ある事象Aを観測したときに事象Bを観測する確率 例) A:発熱している B:風邪をひいている

条件付き確率の数学上の定義 𝑃(𝐴∩𝐵 とは事象A,Bを同時に起きる確率

条件付き確率のイメージ 事象Aの発生する確率 0.2 事象Bの発生する確率 0.05 事象A,Bの発生する確率 0.02 S:100人(全事象) A:20人(事象) S:100人(全事象) A:20人(事象) B:5人(事象) A∩B:2人

条件付き確率のイメージ 𝑃(𝐵|𝐴 Aが全体だと考えて,確率を計算すること 𝑃(𝐵|𝐴 =2人/ 20人 =0.1 S:100人(全事象) B:5人(事象) A∩B:2人

例題 歪みのないサイコロを投げ,偶数の目が出たときに,その目が3の倍数である確率 A:偶数の目が出る B:目が3の倍数

例題 A={2の目が出る,4の目が出る,6の目が出る} B={3の目が出る,6の目が出る} A∩B={6の目が出る} ⇒P(A)=1/2 P(A∩B)=1/6 ゆえに P(B|A)= P(A∩B)/ P(A)=1/6÷ ½    =2/6=1/3

2,4,6の世界では6の1つだけ 2 4 A: 偶数の目がでる 1 5 6 3 B: 3の倍数の目がでる

我々の観察する世界は多くが 条件付き確率である A:罹患 (発症) P(A):ある特定疾患に罹患する確率 ⇒非常に小さい  B: 大学病院に入院する ⇒非常に小さい  しかし P(A|B)が小さいという保証は 何もない!

実例 P(A)=0.0001 1万人1人 P(B)=0.0001 400万人(県民人口)のうち400人(病床) P(A∩B)= 0.00001 10万人1人 P(B|A)=P(A∩B)/P(A)= 0.00001÷ 0.0001 =1/10=0.1

独立事象 2つの事象A,Bが独立事象であるとは 定義 P(A|B)=P(A) または P(B|A)=P(B)

排反と独立 排反 A∩B=φ 独立 P(A∩B)=P(A)P(B) 排反なら P(A∩B)=0 つまり排反事象であれば独立でない 独立とはA、Bの事象で発生に何ら関係の無い事 ⇒Aが起きたらBが起きない←関係あり

独立事象の性質 P(A∩B)= P(A)× P(B) 独立のときだけ上の式が成立する 自分の私感ですが,実際の世界で完璧に独立ということはめったにない!

ベルヌーイ試行 ある事象に着目し、 事象が発生するか、しないかの2通り 試行を繰り返すとき、それぞれの試行における成功の確率は不変 コイン投げ 試行 オモテ面またはウラ面 排反事象 試行を繰り返すとき、それぞれの試行における成功の確率は不変 試行を繰り返すとき、それぞれの試行での結果(事象)はお互いに独立

まとめ 確率 条件付き確率 P(B|A)=P(A∩B)÷P(B) 試行 事象 確率の公式 P(A∪B)=P(A)+P(B)-P(A∩B) 根元事象 複合事象 排反事象 独立事象 確率の公式 P(A∪B)=P(A)+P(B)-P(A∩B) 条件付き確率 P(B|A)=P(A∩B)÷P(B)

統計学を学ぶ 保健統計演習

保健統計の夜明け PG ホーエル 1905-2000 初等統計学 アメリカのヘルスサイエンス パイオニア的教科書 EBM,EBN Evidence Based Medicine 根拠と科学に基づいた保健医療政策

【おまけ】デミング博士と品質管理 Made in Japan 日本製品の品質 デミング博士 戦後米国⇒日本 日本のモノ造りに与えた影響 TQCに取り組み「品質第一」⇒「モノ造り日本」 デミング賞

you remember the 1950s and that “Made in Japan” meant “cheap, junky, poor quality products.” 南カルフォルニア州大学 Kristan Venegas氏の文より http://rossier.usc.edu/

第1章 統計的方法の性質 母集団 標本 第1節 序 母集団(Statistical Population) 観測値(observation)の源泉(source) 有限母集団 無限母集団 標本(Sample) 観測値の源泉に関する情報をえる目的で,得られた観測値の集まり

注意 母集団(Population)といっても 人間だけでない 科学の実験も

観測値での注意事項 観測値の尺度 稠密性 間隔性 順序性 名義性 連続的 離散的 大変満足した→5,満足した→3,大変不満→1 例 男→1,女→2

統計学の分野(分類) 記述統計 (descriptive statistics ) 統計的仮説検定 testing of statistical hypothesis ) 推測統計 (inferential statistics )

実例 選挙の推測 血清の効果 (薬剤基準) 品質管理(Quality Control) ⇒QC⇒TQC OR Mathematical Programming

推定と仮説検定 母集団の性質(特性)の推定 母集団に関する性質(特性)の仮説を検定

統計学でできることとできないこと 限界も知るべき がん死亡率(10万人) 電話適正利用推進協議会HPより 池 田 一 夫ら “日本におけるがん死亡の動向予測” Ann. Rep. Tokyo Metr. Inst. P.H., 55, 2004

統計学でできることとできないこと ⇒因果関係 ⇒関連

確率(Probability) 天気予報 予測には確率がともなう

第2章 標本データの記述 n:標本の大きさ(Size of Sample, Sample size) N:母集団の大きさ 例 母集団 第2章 標本データの記述 n:標本の大きさ(Size of Sample, Sample size) N:母集団の大きさ 例 母集団 標本抽出 標本

無作為抽出(Random Sampling) 標本←母集団の縮約になっていてほしい。 母集団を構成するかく要素が等しい確率で標本に選ばれること。 ⇔過去の手法 作為抽出法 有意抽出法

過去の手法 過去の手法? 標本を抽出で,母集団の代表と思われる標本を主観的に選択抽出方法 ⇒非科学的な方法で統計的手法は一切適用できない

用語の間違いの例 標本の大きさ⇒3 標本数⇒2 データ数⇒6 母集団 標本抽出 標本抽出 標本 3人 標本 3人

課題 ある研究者はA市の高齢者100人を調査するために20箇所の老人クラブにおもむき,5人の推薦をお願いし標本を得た。 この調査方法について意見を述べなさい。

【重要】記述の前に 観測値の性質 名義的な尺度 男⇒1 女⇒2 順序的尺度 大変満足した⇒5 やや満足した⇒4 普通⇒3 (離散的) 名義的な尺度  男⇒1 女⇒2 順序的尺度  大変満足した⇒5 やや満足した⇒4  普通⇒3  (離散的) 連続的(間隔変数)  間隔尺度(絶対的原点なし)  比率尺度(絶対的原点あり)

グラフでの表現 ヒストグラム 階級 階級値 頻度

実際の問題へ データの分類 グラフ表示 算術記述 平均(Mean, Average) 標準偏差(Standard Deviation),分散(Variance) 最頻値(モード Mode) 中央値(メディアン Median)

メタボリックシンドロームの診断基準と今後の課題 札幌医科大学医学部第2 内科 島本和明教授資料 www.cwo.zaq.ne.jp/momokuri/image_animusu_etc/animus_diagnostics.pdf

第2章 標本データの記述 どのように標本を選ぶべきか? 無作為抽出 (Random Sampling) 第2章 標本データの記述 どのように標本を選ぶべきか? 作為抽出  なんら科学的な手法も使用できない 無作為抽出 (Random Sampling)  母集団を構成するどの個体も 標本に選ばれる確率が等しく なるような抽出方法 母集団 標本

無作為抽出で失敗した例 学生のアンケート 電話での選挙予想 老人調査 何が大切か? 母集団を構成する台帳 母集団に番号をつける 例 住民基本台帳 母集団に番号をつける

【解答】 老人クラブ問題 老人クラブに入会している人は健康な人たち 老人クラブは過疎地にはすくなくある程度人口がいる場所に限られる。 【解答】 老人クラブ問題 老人クラブに入会している人は健康な人たち 老人クラブは過疎地にはすくなくある程度人口がいる場所に限られる。 老人クラブの会長から推薦された人 健康 受け答えができて会の中核になる人 男性 ⇒ この調査結果は信頼できない!

参考 調査方法(Sample survey) 個人面接法(Interview survey) 正確で高い回収率、費用がかさむ 配布回収法(留め置き法) 調査員が配布し 後に回収 郵送法(mail survey) 回収率は30%以下 電話法(Telephone survey) インターネット調査

記述統計 データの縮約的記述 平均値(期待値) Average,Mean 標準偏差 Standard Deviation ⇒データが平均の周りにどれだけあつまっているか? 分散⇒標準偏差の2乗 中央値(ちゅうおうち) 最頻値(もーど) 尖度(せんど) 歪度(わいど)

標準偏差のイメージ 平均⇒30円 50円 10円 標準偏差=28.2842円 20円 40円 標準偏差=14.142円 30円 標準偏差=0

尖度のイメージ Wikipediaより

歪度(Skewness)のイメージ Wikipediaより

メディアンとモード 分布が左右に歪んでいる場合には必要な概念 左右対称な場合は平均値に一致する

【実習課題】 体重と身長のデータ (2つとも連続型、間隔尺度) BMIの計算 判定

EXCELの記述統計

【復習】記述統計の目的は? BMI Body Mass Index 体格指数 BMI=(体重Kg)   /身長(m)^2 http://wwwsoc.nii.ac.jp/jasso/ BMI値の18.5以上~25未満が普通

2017/3/8 結果の見方 新潟j県立看護大学      橋本明浩

算術的記述 measure of location measure of scale その他 正規分布と比較して 分布の位置に関する測度 平均、最頻値(モード)、中央値(メジアン) measure of scale 尺度に関する測度 その他 正規分布と比較して 歪度(Skewness) 尖度(Kurtosis)

結果の意味 平均(x): 標本平均 1/nΣixi を意味します. 標準誤差 標準偏差をnの平方根で割ったもの 標準偏差 2017/3/8 結果の意味 平均(x): 標本平均  1/nΣixi  を意味します. 標準誤差 標準偏差をnの平方根で割ったもの 標準偏差 標本標準偏差を意味しています.分散の平方根です. 平均の周りの散らばりを意味しています. 中央値 データの真ん中の順位の値です.この場合は100なので,50番目と51番目の平均を計算しています.  最頻値 計算しても意味のないものを計算しています. 分析ツールでの計算結果は,離散的なデータや階級に分類されている場合等だけが意味を持ちます. 尖度 分布の裾の重さになる指標です. 歪度 左右の偏りを示します.正の場合は右に裾を引き,負の場合は左に裾を引くと言います.  分散(s2): 標本不偏分散です.二乗和を(n-1)で割った形式です. 信頼区間 正規分布近似計算で両側信頼区間です.(EXCEL2003) そうでない場合は信頼区間の半分の長さですの,平均±この数値が信頼区間です. 新潟j県立看護大学      橋本明浩

統計量の概念【位置尺度】 右に裾をひいた分布(歪度が正) 単峰(やま1つ)なら モード≦メジアン ≦平均が成立する 2017/3/8 統計量の概念【位置尺度】 右に裾をひいた分布(歪度が正) 単峰(やま1つ)なら モード≦メジアン ≦平均が成立する 左右対称分布の場合は3つ(平均,メジアン,モード)は一致して,歪度は0 日本人の現金(普通預金,定期預金,郵便貯金を含む) 平均所有額 1人あたり667万円 新潟j県立看護大学      橋本明浩

歪度 右に裾を引く 値が正となる 左に裾を引く 値は負となる 日本の森林の表層土壌のpH値 有症者発生数の推移 流行曲線の例  (北海道内で集団発生した腸管出血性大腸菌O-157感染症報告書,   北海道帯広保健所,1997) idsc.nih.go.jp/training/9kanri/14_minowa.html

【参考】学校保健統計 統計法(昭和22年法律第18号)による指定統計第15号⇒学校保健法⇒学校保健統計調査規則⇒学校基本調査実施要領⇒ 通達 目的 毎年実施している調査 毎年定期的に実施される健康診断の結果に基づき、小学校・中学校・高等学校及び幼稚園における児童、生徒及び幼児の発育状態並びに健康状態を明らかにすること

法律の仕組み 行政法で根拠とその仕組みを勉強しておきましょう。 看護師← 地方公務員、国家公務員 卒業研究で知りたい統計の結果はどこにあるのか? ⇒総務庁統計局 http://www.stat.go.jp/ 学校保健統計←文部科学省

分析ツールでのヒストグラム 知識がなくてもある程度の作業はできる 問題点 事前の準備 データ ⇒データ分析⇒ヒストグラム 度数分布表とグラフ 事前の準備  EXCELオプション⇒アドイン⇒分析ツール 区切りのデータを作成しておく データ ⇒データ分析⇒ヒストグラム 度数分布表とグラフ 問題点 データが変わったら再度分析ツールを実行しなくてはならない

実際に作ってみよう

【復習】 言葉の定義 階級(Class) 階級下限値 階級上限値 階級値(class value ・ ) 頻度(Frequency)

【復習】 度数分布表(連続変量の場合) 階級 階級値 度数(人) 下限値 上限値 20 22 21 1 24 23 4 26 25 28 27 データの分布の概要を数値的に把握するのに役立つ

【復習】度数分布表(名義的尺度の場合) 血液型 度数 A 32 B 24 O 14 AB 7 不明 3 合計 80

【復習】階級のとりかた 最大値,最小値 階級の数= 5-20程度 目安として 標本の大きさ 階級の数が多すぎると不規則な凸凹 階級の数= 5-20程度 目安として 標本の大きさ 30程度なら5個 10-20程度まで   階級の数が多すぎると不規則な凸凹  少なすぎると情報が失われる   

階級の数はいくつがいいの? Sturgesの提案 階級の数=1+(log10 n / log102) =1+log2n EXCELでは =1+ Log(標本の大きさ,2)と入力すれば計算できる スコット(Scott’s)の提案 階級の数=3.5s/ n1/3 ここでsは標本の標準偏差 EXCELでは =3*標本標準偏差/標本の大きさ^(1/3)と入力すれば計算できる FreedmanとDiaconisの提案 階級の数=2×四分位範囲/ n1/3

正しいヒストグラム 2.5の階級値から 階級下限値は0 階級上限値は5であることがわかる.  階級下限値は0  階級上限値は5であることがわかる.  つまり 0歳以上5歳未満での死亡数は322人であることがわかる.