保健統計学第1回 「生物統計学とは?」 2007.04.6. まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が.

Slides:



Advertisements
Similar presentations
◎標本調査とその問題点 ● 何らかの情報を得たい全体集団(母 集団)から、ランダムに適当な数の標 本(サンプル)を抽出し、それに対す る調査結果から母集団に関する情報を 推定する方法 ● 全数調査(悉皆調査:国勢調査等) と比較して、費用・時間の面で極めて 効率的 ● 標本調査が十分にその機能を果たすためには.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
統計学入門2 - 後期 第 1 回 - 1 統計学入門2 講義内容の紹介 推測統計とは. 統計学入門2 - 後期 第 1 回 - 2 教科書 & 参考書 教科書 特に使用しない 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
国際ソロプチミストアメリカ 連盟理事会からの お願い クラブの声を お聞かせくださ い. SOROPTIMIST INTERNATIONAL OF THE AMERICAS 女性と女児は 私たちの支援を必要としています 取り組まなけ ればならない ことは、まだ まだありま す!
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
社会調査とは何か(3) 調査対象者の選定方法
検定 P.137.
レポートの作成 効果的な発表の仕方.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
統計学 12/3(月).
標本の記述統計 専修大学 経済学部 経済統計学(作間逸雄).
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
行動計量分析 Behavioral Analysis
統計リテラシー教育における 携帯端末の利用
調査対象の決定 (今日の目標) 1. 全数調査と標本調査の違いを理解する。 2. 標本調査の種類と特徴を理解する。 3.
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
統計リテラシー育成のための数学の指導方法に関する実践的研究
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
疫学概論 標本抽出法 Lesson 10. 標本抽出 §B. 標本抽出法 S.Harano,MD,PhD,MPH.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
経済データのダウンロードと グラフの作成 経済データ解析 2009年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
確率と統計 年1月12日(木)講義資料B Version 4.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
米国GAISEプロジェクトにおける 統計教育カリキュラムと評価方法
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
サンプリングと確率理論.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

保健統計学第1回 「生物統計学とは?」

まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が 非常に薄いとも思われかねない教科 入試でも確率以外は出題されることはほぼありません でも、企業の人から見ると「学生に学んできて欲しい」 教科の No1 なんです さらに、医療系学部では非常に重要な領域なのです 多くの皆様は「平均値」以外の概念を学んでこないま ま大学に入学してきます。平均値はしばしば用いられ ますが、これだけでいいのでしょうか?

平均値は万能か? こんな会社に入りた い? Q :ある会社の構成員全ての平均年収は 3600 万円で した。この会社に入りたいと思いますか? 確かにいいお金をくれます ね ただし最大値は 320 億円、最小値は 220 万円、最頻値 は 360 万円ですが・・・。人数の詳細はともかくとし て、これは 1 名のみが飛びぬけているような事例です (実話) 平均値がよければ全てよし・・・ではないことが分 かりましたね?まずは、平均値信仰は今すぐやめま しょう!

STAT WARS(?) “Too many people use statistics as a drunken man sues a lamppost,for support but not for illumination!” 統計学の役割とはどういうものだろうか? 酔っ払いが灯りを求めるためではなく、身体を支える ために街灯に寄りかかるかのように、統計学を用いる 人間が多過ぎる!本来は、実験結果の見通しを良くす るために用いるものなのですが・・・? 実験デザインのまずさ、解析計画の杜撰さが実験結果 を支えきれなくなって、最後に統計学に頼りに来るパ ターンが多いです。 実際の現場では如何に?

これはとある Irony (皮肉)です Statistics has been described as the science which tells you that if you lie with your head in the oven and your feet in the refrigerator, on average you’ll be comfortably warm. 平均が基準値 / 理論値に近いからOK! 統計学とは得てしてそのような学問なのだろうか? 平均よければ全てよしとしていいのかね? 平均は確かにデータの特徴を示しやすいけど・・・。 しかしそれだけでは、頭はオーブンに、足は冷蔵庫に 入っていても、身体全体で平均すれば「心地よい暖か さだ!」ってことになります。 せめてヒストグラム( = 分布の形)と基本統計量(平均、 標準偏差、最大・最小・中央値)ぐらいは見ましょう ね!

医療系における統計学とは?医療系における統計学とは? 部分から全体を推測することがほとんどです。 それを統計的推測といいます 母集団 μ (平均値),σ (標準偏差) 標本 _ 平均( x) 標準偏差( S) 標本の抽出 中世の狭い国土や自分の村ぐらいであれば全数調査ができ ますが・・・広くて大勢いる場合は全数調査は無理です! 予算や時間の関係もありますが、医学の場合は実験的な要 素もあります。できるだけ少数の患者様の様子から、全体 を推測するわけです(例:臨床試験など)

中にはこんな標本抽出法も? 本社の独自調査により、中学生の約 50 %がナイフを携 帯している事実が判明した。T県U市の中学校におけ る、生徒による教師刺殺事件で揺れる教育現場だ が・・・実際には何処の教室でも発生しかねない事件 であることが浮き彫りにされた。(A新聞見出し、 1998 年 2 月) ざわざわざわざわ・・・「大変だ」「どうしましょ う」「早急な対策が必要ですね・・・」 by N教組、 教育現場、TG大学教授? 2 月 ○ 日(月)~ 2 月 × 日(水)の昼過ぎに、原宿、渋谷、 亀戸、北千住、池袋駅前で座り込んでいた中学生を 「無作為に」抽出して聞き取り調査を行った結果だそ うです。 調査方法を確認の結果とんでもない事実 が・・・ 中学生の 2 人に 1 人がナイフを持ち歩く?

そのために注意すべき点そのために注意すべき点 標本抽出における基本的原則  単純無作為抽出法:乱数表・くじびきなどでランダム に抽出  2段階抽出・多段抽出法:母集団をいくつかのグルー プ(例えば居住地・男女等々)に分け、その後は無作為 抽出  層化抽出法:母集団の構成比率が既知の場合、それを 反映されるようにあらかじめ定められた割合で、それぞ れの群から標本を抽出する 標本は母集団の特徴を示すもの、母集団を代表しているも のでなければならないということである!つまり・・・ 先の例で言うならば、標本は中学生全体を代表していなけ ればならない!平日に学校にも行かず、繁華街の駅前で座 り込んでいる中学生は、明らかに「全体の代表」とは言え ません! → バイアスの除去!

演習 1 Selection Bias ? 反対集会に立ち止まる人々だけの意見を徴収していま せんかね?「反対だから立ち止まった」という可能性 (この方が高いと思われる)は全く無視されていない か?(時間を浪費までして賛成を訴えた 22% は何だろ うか?) サッカーくじ 77% が反対! 私たちS日本Fの会は 4 月 21 日サッカーくじの反対集 会を開催、渋谷で道行く 314 名の人々と対話した結果、 サッカーくじ反対が 77% 、賛成が 22 %となりました。こ のように国民世論としても、サッカーくじは認められて いないのです!( 1998 年 2 月 国会討論より) データでも科学的に証明されているではないか! 断固導入反対! by CF連合、ZS連合、NS協会、NP連盟・・・他

これは調査設計はともかく、実施段階における調査実 施者の手抜き、もしくは(サンプリング数はともか く)集団のBiasが考えられます。理系の女子学生 の意見を素早く徴集するには、女子学生の割合が多い 薬学部の学生に尋ねるのが一番でしょう! 演習 2 希少ゆえ・・・? 決して間違ってはいないと思うのですが・・・そうか ね? 理系の女子大生は製薬企業が大好き? 理系大学生の人気企業に関するアンケートで、男子学生 はT薬品工業が 10 位に入っていたのみですが、女子学生 はT薬品が 1 位、 3 位にもT、 5 位~ 8 位まで全て製薬会社 が占める結果となりました。男女とも 1000 人以上の学生 にアンケートを行っているのですが?

(1/365)× (1/365)×(1/365)=1/48,627,125 Question(1) 頭の体操 合っているのか? 1/365 の偶然が 3 人重なると考えれば? 1/500,000,000 の偶然? アメリカの某州で 11 日、 3 人姉妹が相次いで出産すると いう偶然が起きた。その姉妹の父親は大学のコンピュー タ学科の教授で、学生に確率を計算させたところ、何と 5千万分の 1 の確率であったという。 ではありません! 3 姉妹が相次いで出産する日は、 1 年のうち何時でも良 い訳ですから、 (1/365)× (1/365) =1/133,225 が正解です。 (アメリカの大学も色々あるってことで ^^;)

Garbage in,Garbage out :ゴミはゴミを産む。集めた データがゴミであれば、結果も所詮ゴミに過ぎない。 試験のデザインは調査例数、調査方法、検定方法など 理論に基づいて設計されたものでなければならず、後 付けによる相関・因果関係のこじつけやなどは許され るものではない。 万が一偶然に相関・因果関係が見えた場合には、それ らを検証するための調査設計を再度行う必要がある。 GIGOとは? 先の事例はマスコミ、政治団体、教育学者(?)による 調査でありました。わが国ではそれなりの authority があ るものとされているようですが・・・?その権威ある皆 様による調査はこのような結果となりました。そこで、 GIGOとは・・・? 後付け論者の得意技は、「一件何も関係が無さそうなものの 中から関係を見つけ出す・・・これをデータマイニングと申 します」。 →Data mining とは、どうでも良いデータを無秩序 に集めることではない!

To do - ならば、どうすべきなのか? - モデル構築 ・理論・仮説の決定 ・検証の条件は? ・サンプリング ・例数設計 調査・検証結果の公表 ・調査方法 ・回収率 ・欠損データの扱い ・調査票設計 ・後付でない ・計画通りに検定がなさ れている? ・追試可能?再現性は? これらは最低のルールと思われます。詳細を記載し始 めればきりがありませんが、統計調査におけるモデル 構築・検証方法には ICH 、 GCP 等々の約束事がありま す。無知ゆえのバイアスや・・・捏造などは即犯罪で す! 第 2 回に続く。計量データの解析、検定に関する考え方 について学びましょう!