Presentation is loading. Please wait.

Presentation is loading. Please wait.

保健統計学第1回 「生物統計学とは?」 2007.04.6. まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が.

Similar presentations


Presentation on theme: "保健統計学第1回 「生物統計学とは?」 2007.04.6. まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が."— Presentation transcript:

1 保健統計学第1回 「生物統計学とは?」 2007.04.6

2 まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が 非常に薄いとも思われかねない教科 入試でも確率以外は出題されることはほぼありません でも、企業の人から見ると「学生に学んできて欲しい」 教科の No1 なんです さらに、医療系学部では非常に重要な領域なのです 多くの皆様は「平均値」以外の概念を学んでこないま ま大学に入学してきます。平均値はしばしば用いられ ますが、これだけでいいのでしょうか?

3 平均値は万能か? こんな会社に入りた い? Q :ある会社の構成員全ての平均年収は 3600 万円で した。この会社に入りたいと思いますか? 確かにいいお金をくれます ね ただし最大値は 320 億円、最小値は 220 万円、最頻値 は 360 万円ですが・・・。人数の詳細はともかくとし て、これは 1 名のみが飛びぬけているような事例です (実話) 平均値がよければ全てよし・・・ではないことが分 かりましたね?まずは、平均値信仰は今すぐやめま しょう!

4 STAT WARS(?) “Too many people use statistics as a drunken man sues a lamppost,for support but not for illumination!” 統計学の役割とはどういうものだろうか? 酔っ払いが灯りを求めるためではなく、身体を支える ために街灯に寄りかかるかのように、統計学を用いる 人間が多過ぎる!本来は、実験結果の見通しを良くす るために用いるものなのですが・・・? 実験デザインのまずさ、解析計画の杜撰さが実験結果 を支えきれなくなって、最後に統計学に頼りに来るパ ターンが多いです。 実際の現場では如何に?

5 これはとある Irony (皮肉)です Statistics has been described as the science which tells you that if you lie with your head in the oven and your feet in the refrigerator, on average you’ll be comfortably warm. 平均が基準値 / 理論値に近いからOK! 統計学とは得てしてそのような学問なのだろうか? 平均よければ全てよしとしていいのかね? 平均は確かにデータの特徴を示しやすいけど・・・。 しかしそれだけでは、頭はオーブンに、足は冷蔵庫に 入っていても、身体全体で平均すれば「心地よい暖か さだ!」ってことになります。 せめてヒストグラム( = 分布の形)と基本統計量(平均、 標準偏差、最大・最小・中央値)ぐらいは見ましょう ね!

6 医療系における統計学とは?医療系における統計学とは? 部分から全体を推測することがほとんどです。 それを統計的推測といいます 母集団 μ (平均値),σ (標準偏差) 標本 _ 平均( x) 標準偏差( S) 標本の抽出 中世の狭い国土や自分の村ぐらいであれば全数調査ができ ますが・・・広くて大勢いる場合は全数調査は無理です! 予算や時間の関係もありますが、医学の場合は実験的な要 素もあります。できるだけ少数の患者様の様子から、全体 を推測するわけです(例:臨床試験など)

7 中にはこんな標本抽出法も? 本社の独自調査により、中学生の約 50 %がナイフを携 帯している事実が判明した。T県U市の中学校におけ る、生徒による教師刺殺事件で揺れる教育現場だ が・・・実際には何処の教室でも発生しかねない事件 であることが浮き彫りにされた。(A新聞見出し、 1998 年 2 月) ざわざわざわざわ・・・「大変だ」「どうしましょ う」「早急な対策が必要ですね・・・」 by N教組、 教育現場、TG大学教授? 2 月 ○ 日(月)~ 2 月 × 日(水)の昼過ぎに、原宿、渋谷、 亀戸、北千住、池袋駅前で座り込んでいた中学生を 「無作為に」抽出して聞き取り調査を行った結果だそ うです。 調査方法を確認の結果とんでもない事実 が・・・ 中学生の 2 人に 1 人がナイフを持ち歩く?

8 そのために注意すべき点そのために注意すべき点 標本抽出における基本的原則  単純無作為抽出法:乱数表・くじびきなどでランダム に抽出  2段階抽出・多段抽出法:母集団をいくつかのグルー プ(例えば居住地・男女等々)に分け、その後は無作為 抽出  層化抽出法:母集団の構成比率が既知の場合、それを 反映されるようにあらかじめ定められた割合で、それぞ れの群から標本を抽出する 標本は母集団の特徴を示すもの、母集団を代表しているも のでなければならないということである!つまり・・・ 先の例で言うならば、標本は中学生全体を代表していなけ ればならない!平日に学校にも行かず、繁華街の駅前で座 り込んでいる中学生は、明らかに「全体の代表」とは言え ません! → バイアスの除去!

9 演習 1 Selection Bias ? 反対集会に立ち止まる人々だけの意見を徴収していま せんかね?「反対だから立ち止まった」という可能性 (この方が高いと思われる)は全く無視されていない か?(時間を浪費までして賛成を訴えた 22% は何だろ うか?) サッカーくじ 77% が反対! 私たちS日本Fの会は 4 月 21 日サッカーくじの反対集 会を開催、渋谷で道行く 314 名の人々と対話した結果、 サッカーくじ反対が 77% 、賛成が 22 %となりました。こ のように国民世論としても、サッカーくじは認められて いないのです!( 1998 年 2 月 国会討論より) データでも科学的に証明されているではないか! 断固導入反対! by CF連合、ZS連合、NS協会、NP連盟・・・他

10 これは調査設計はともかく、実施段階における調査実 施者の手抜き、もしくは(サンプリング数はともか く)集団のBiasが考えられます。理系の女子学生 の意見を素早く徴集するには、女子学生の割合が多い 薬学部の学生に尋ねるのが一番でしょう! 演習 2 希少ゆえ・・・? 決して間違ってはいないと思うのですが・・・そうか ね? 理系の女子大生は製薬企業が大好き? 理系大学生の人気企業に関するアンケートで、男子学生 はT薬品工業が 10 位に入っていたのみですが、女子学生 はT薬品が 1 位、 3 位にもT、 5 位~ 8 位まで全て製薬会社 が占める結果となりました。男女とも 1000 人以上の学生 にアンケートを行っているのですが?

11 (1/365)× (1/365)×(1/365)=1/48,627,125 Question(1) 頭の体操 合っているのか? 1/365 の偶然が 3 人重なると考えれば? 1/500,000,000 の偶然? アメリカの某州で 11 日、 3 人姉妹が相次いで出産すると いう偶然が起きた。その姉妹の父親は大学のコンピュー タ学科の教授で、学生に確率を計算させたところ、何と 5千万分の 1 の確率であったという。 ではありません! 3 姉妹が相次いで出産する日は、 1 年のうち何時でも良 い訳ですから、 (1/365)× (1/365) =1/133,225 が正解です。 (アメリカの大学も色々あるってことで ^^;)

12 Garbage in,Garbage out :ゴミはゴミを産む。集めた データがゴミであれば、結果も所詮ゴミに過ぎない。 試験のデザインは調査例数、調査方法、検定方法など 理論に基づいて設計されたものでなければならず、後 付けによる相関・因果関係のこじつけやなどは許され るものではない。 万が一偶然に相関・因果関係が見えた場合には、それ らを検証するための調査設計を再度行う必要がある。 GIGOとは? 先の事例はマスコミ、政治団体、教育学者(?)による 調査でありました。わが国ではそれなりの authority があ るものとされているようですが・・・?その権威ある皆 様による調査はこのような結果となりました。そこで、 GIGOとは・・・? 後付け論者の得意技は、「一件何も関係が無さそうなものの 中から関係を見つけ出す・・・これをデータマイニングと申 します」。 →Data mining とは、どうでも良いデータを無秩序 に集めることではない!

13 To do - ならば、どうすべきなのか? - モデル構築 ・理論・仮説の決定 ・検証の条件は? ・サンプリング ・例数設計 調査・検証結果の公表 ・調査方法 ・回収率 ・欠損データの扱い ・調査票設計 ・後付でない ・計画通りに検定がなさ れている? ・追試可能?再現性は? これらは最低のルールと思われます。詳細を記載し始 めればきりがありませんが、統計調査におけるモデル 構築・検証方法には ICH 、 GCP 等々の約束事がありま す。無知ゆえのバイアスや・・・捏造などは即犯罪で す! 第 2 回に続く。計量データの解析、検定に関する考え方 について学びましょう!


Download ppt "保健統計学第1回 「生物統計学とは?」 2007.04.6. まずそれ以前に・・・統計学とは? 学習指導要領によれば、確率(順列・組み合わせや、何 かが起こり得る可能性、確からしさ等)以外の統計分野 (標準偏差、分布、統計的推測等)は、現在高等学校に おいて必修ではございません 教科書の後ろ側に追いやられている、ある意味存在感が."

Similar presentations


Ads by Google