○ × × ランダムでないとだめである かたよりの小さい集まりから,十分多くとる 十分多くとるが,かたよりの大きい集まりからとる

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
2006 年度 統計学講義内容 担当者 河田正樹
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか
社会調査とは何か(3) 調査対象者の選定方法
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
実証分析の手順 経済データ解析 2011年度.
想像しよう 大連市第16中学校 鄧妍.
統計学 12/3(月).
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
確率・統計Ⅱ 第7回.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学  第6回 西山.
調査対象の決定 (今日の目標) 1. 全数調査と標本調査の違いを理解する。 2. 標本調査の種類と特徴を理解する。 3.
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
疫学概論 標本抽出法 Lesson 10. 標本抽出 §B. 標本抽出法 S.Harano,MD,PhD,MPH.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率と統計 年1月12日(木)講義資料B Version 4.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
「選挙の大切さについて」 資料モデル 1 選挙制度の意義や目的について、選挙の歴史や制度の特徴 などを踏まえてわかりやすく説明する。
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
「おでかけ定期券」って なんだろう?.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
サンプリングと確率理論.
確率と統計 確率編- 平成20年10月29日(木).
数理統計学  第12回 西 山.
地域統計 第一回担当:小宮山.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

○ × × ランダムでないとだめである かたよりの小さい集まりから,十分多くとる 十分多くとるが,かたよりの大きい集まりからとる 第1回の授業では池にすむ魚の平均体重を調べるために,池の中の魚の一部を捕獲して,そこから推測することの是非について論じました.このように部分(統計学では標本という)から全体(母集団という)を推測することはよく行われることです.この場合,かたよりの小さい集まりから十分とらないと標本が母集団とは大きく異なってしまいます. × かたよりの小さい集まりからとるが,少ししかとらない

標本抽出はランダムに・・・(ガラガラ) しかし,無作為(ランダム)な標本抽出は簡単ではない したがって,標本をとるには無作為にとるのが理想です.イメージとしてはこのようながらがらに母集団を全部入れて,よく混ぜて,出てきた標本を調査するのがよいでしょう.しかし,無作為な標本抽出は原理的には考えられても実際に行うのは簡単ではありません.次に例をあげて考えてみましょう. しかし,無作為(ランダム)な標本抽出は簡単ではない

部分(標本)から全体(母集団)を推測 池の魚全部(母集団)について何か(体重など)知りたい しかし,全部調べないで,その一部分だけ(標本)を調べることで全体(母集団)を推測したい 部分から全体を推測するのにはどのような危険性があるか? 第1回の授業では池にすむ魚の平均体重を調べるために,池の中の魚の一部を捕獲して,そこから推測することの是非について論じました.このような池の中の魚から無作為に取り出すにはどうしたらよいでしょうか?釣り針にかかった魚を調べる・・・しかし,釣り針を仕掛ける場所によって引っかかる魚も違うでしょうし,そもそも釣り針に興味を示さない魚は除外されてしまいます.それでは網を水の中でかき回す.それでも水中の網の高さによって,そこにいる魚ばっかりあるいは水面に近い魚ばかりを捕獲するかもしれません.それでは次に 部分から全体への一般化はどれほど危険を伴うことでしょうか?以下の例を考えてみましょう.

部分(標本)から全体(母集団)を推測 例:クロールのタイムがほぼ同等であった日本人の15歳の男子40人を均等に2つのグループに分け,一方の20人に新しいクロールの教え方を適用したところ,従来の教え方を適用したグループ20人よりも50mのタイムが向上した. どこまで推論を拡張してよいか? たとえば,① 日本人の15歳の男子全体, ② 日本人の13~16歳の男子全体,③ 日本人の15歳男女とも,④ 日本人男子全体,⑤ アメリカ人の15歳の男子全体, ⑥ 砂漠に住む15歳の男子全体,⑦ すべての人間・・・ に適用できるだろうか? 部分(標本)から全体(母集団)を推測する例として,クロールのタイムがほぼ同等であった日本人の15歳の男子40人を均等に2つのグループに分け,一方の20人に新しいクロールの教え方を適用したところ,従来の教え方を適用したグループ20人よりも50mのタイムが向上したという調査結果を考えてみましょう.このような調査結果をみて,人によってはすべての人間にもこの方法が使えるはずと決めるかもしれません.極めて慎重な人はこのときの日本人の15歳の男子にしか通用しない,来年の日本男子15歳は,ますますジャンクフード依存症になって,栄養条件も異なるだろうし,エアコンなどで過保護になっているから,同じ母集団ではなく,この実験はもう来年は通用しないというかもしれません.どれが正しいかという答えは実はありません.専門家はこれまでの経験やデータの蓄積から,このぐらいの範囲まではこの実験は適用できそうだと判断しますが,専門家はふつうできるだけ広い範囲で応用できると主張したくなるので,そこに危険があるわけです.さてみなさんはこの実験がどのくらいの範囲まで適用できると思いますか.たとえば,① 日本人の15歳の男子全体, ② 日本人の13~16歳の男子全体,③ 日本人の15歳男女とも,④ 日本人男子全体,⑤ アメリカ人の15歳の男子全体, ⑥ 砂漠に住む15歳の男子全体,⑦ すべての人間・・・に適用できるでしょうか? 答えはありませんから,自由に考えてみてください.自分の答えをプリントに書いてください.次回の授業でグループで議論する材料とします.

部分(標本)から全体(母集団)を推測 例:駆け出しの研究者であるA君は宍道湖の北東の岸辺でシジミを20匹,一度に網で捕まえて,それを10匹ずつに分けた.一方に薬Aを与え,一方には対照として何も与えなかった.その結果,薬Aを与えた方が成長がよかった. どこまで推論を拡張してよいか? たとえば,① 宍道湖すべてのヤマトシジミ, ② 日本のヤマトシジミ,③ 日本のシジミ類,④ 日本の貝類, ⑤ アジアのシジミ類, ⑥ 世界の貝類,⑦ すべての生物 ⑧ 火星で陸上養殖したヤマトシジミ に適用できるだろうか? いろいろ想像してみよう. もうひとつ考えてみましょう.駆け出しの研究者であるA君は宍道湖の北東の岸辺でシジミを20匹,一度に網で捕まえて,それを10匹ずつに分けました.一方に薬Aを与え,一方には対照として何も与えませんでした.その結果,薬Aを与えた方が成長がよくなりました.この実験結果はどこまで拡張できるでしょうか?始めて研究結果を出したA君はこれ一回の実験ですべてのシジミに適用できると思い込んでいます.みなさんも研究者になったつもりで考えてみてください.たとえば,① 宍道湖すべてのヤマトシジミ,② 日本のヤマトシジミ,③ 日本のシジミ類,④ 日本の貝類,⑤ アジアのシジミ類, ⑥ 世界の貝類,⑦ すべての生物⑧ 火星で陸上養殖したヤマトシジミに適用できるだろうか? いろいろ想像してみましょう.①~⑧以外にも適用できるものがないかも考えましょう.自分の答えをプリントに書いてください.次回の授業でグループで議論する材料とします.

記述統計と推測統計 ( )統計 記述 観測値を要約し,記述するための方法 ( )統計 推測 (        )統計 記述 観測値を要約し,記述するための方法 (        )統計 推測 観測値を推定や予測をするための基礎として用いる方法. すなわちこれまでに観測されていない状況について推測する方法 統計には2種類あります.記述統計といって,観測値を要約し,記述するための方法が記述統計です.人口調査をしたり,家畜の体重を量ったりするだけでしたら,記述統計です.しかし,ふつうわたしたちは統計を使って,何か新しいことを考えるようとします.このような統計を推測統計といいます.推測統計とは,観測値を推定や予測をするための基礎として用いる方法.すなわちこれまでに観測されていない状況について推測する方法です.農学研究ではおもに推測統計に興味が置かれます.では記述統計と推測統計の違いは対象をどうとらえることによって生じるのでしょうか? 農学研究ではおもに推測統計に興味が置かれる.では記述統計と推測統計の違いは対象をどうとらえることによって生じるのか?

記述統計か推測統計か? ① 日本の人口は2004年現在,1億2千万人強である ② 日本の人口は2050年には1億人になる ① 日本の人口は2004年現在,1億2千万人強である ② 日本の人口は2050年には1億人になる ③ 大山に2007年2月1日に29cmの降雪があった ④ 大山には冬,雪が降る ではこれから述べるものは記述統計でしょうか,推測統計でしょうか.自分の考えをプリントに書き込んでください.答えあわせは次回の授業で行います.① 日本の人口は2004年現在,1億2千万人強である.これは記述統計でしょうか?あるいは推測統計でしょうか?② 日本の人口は2050年には1億人になる.③ 大山に2007年2月1日に29cmの降雪があった.④ 大山には冬,雪が降る.              ⑤ この風邪薬はよく効く. ⑤ この風邪薬はよく効く

記述統計か推測統計か? ⑥ この肥料をブロッコリーに施肥したところ, ビタミンCが50%増加した ⑥ この肥料をブロッコリーに施肥したところ,   ビタミンCが50%増加した ⑦ この肥料はブロッコリーの品質を向上させる 記述統計とは標本をまとめたり,記述したりするためのものである. これに対して推測統計は,標本に基づき,より広い母集団に対して推定,推測を行うためのものである. ⑥ この肥料をブロッコリーに施肥したところ,ビタミンCが50%増加した.⑦ この肥料はブロッコリーの品質を向上させる. 記述統計とは標本をまとめたり,記述したりするためのものであるのに対し,推測統計は,標本に基づき,より広い母集団に対して推定,推測を行うためのものです.

母集団と標本 母集団 研究の対象となっている集団,すなわちそれについての情報が求められている集団 標本 母集団  研究の対象となっている集団,すなわちそれについての情報が求められている集団 標本 母集団を代表する一部分として実際に観察されている集団 標本 母集団を代表する一部分として実際に観察されている集団 国勢調査のように母集団と標本が一致する場合もごくまれに あるが,ほとんどのばあい母集団の一部を取り出して,標本 にする. 国勢調査のように母集団と標本が一致する場合もごくまれに あるが,ほとんどのばあい母集団の一部を取り出して,標本 にする. これまでの授業でも母集団と標本ということばが出てきましたが,ここで母集団と標本の定義を述べます. 母集団とは研究の対象となっている集団,すなわちそれについての情報が求められている集団です. 標本とは母集団を代表する一部分として実際に観察されている集団です. 国勢調査のように母集団と標本がほぼ一致する場合もごくまれにありますが,ほとんどのばあい母集団の一部を取り出して,標本 にして,調査するのがふつうです.

実在母集団と仮説的無限母集団 ( 実在 )母集団 理論的にはすべてを調査することのできる母集団 日本人全員,地球上の海水すべて (    実在      )母集団 理論的にはすべてを調査することのできる母集団 日本人全員,地球上の海水すべて (   仮説的無限   )母集団 母集団に属する要素が無限にある母集団 工場で作られる製品 医薬品の効果を調べる対象であるヒト 母集団に属する要素が無限にある母集団 工場で作られる製品 母集団にも2種類あります.実在母集団といって,理論的にはすべてを調査することのできる母集団です.例えば,日本人全員,地球上の海水すべてが実在母集団の例です.地球上の海水すべてを調査することは不可能ですが,理論的には調査はできます.こうした実在母集団に対して,母集団に属する要素が無限にある母集団があります.これを仮説的無限母集団といいます.例えば,工場で作られる製品,医薬品の効果を調べる対象であるヒトは仮説的無限母集団に相当します.例えば,世論調査で今度の選挙でだれに投票するかという場合の母集団は現在の有権者だけですから,理論的には全員を調査することもできます.したがって,この場合は母集団は実在母集団です.しかし,新しい風邪薬が効くか効かないかを調べる場合,これから生まれるであろう未来の人間にも効果があるかどうかを考慮するはずです.したがって,このような場合では母集団は仮説的無限母集団になります.農業や生物学の研究ではほぼ間違いなく,研究対象は仮説的無限母集団になります. 医薬品の効果を調べる対象であるヒト 農学や生物学の対象である生物は無限母集団としてふつう 扱う 農学や生物学の対象である生物は無限母集団としてふつう 扱う

母集団と標本 ① ある市の市長選で有権者500名を対象にだれに投票するかを調査した 母集団 ( ) 標本 ( ) 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団 ② あるテレビ局の番組の視聴率について,20歳代300人に 尋ねた それでは母集団と標本,そして,母集団が実在母集団であるか,仮説的無限母集団かどうかをいくつかのケースについて考えてみましょう.自分の考えをプリントに書き込んでください.答えあわせは次回の授業で行います. ① ある市の市長選で有権者500名を対象にだれに投票するかを調査しました.母集団は何でしょうか.標本は何でしょうか?この場合,母集団は実在母集団・仮説的無限母集団のどちらでしょうか? ② あるテレビ局の番組の視聴率について,20歳代300人に尋ねました.母集団は何でしょうか.標本は何でしょうか?この場合,母集団は実在母集団・仮説的無限母集団のどちらでしょうか? 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団

母集団と標本 ③ ある食品工場では,工場排水の水質保証のために1ヶ月に6回の割合で放流口から採水して排水分析をしている 母集団 ( ) 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団 ④ 羊に与えるえさに混ぜると成長がよくなるという薬を5匹の羊に与え,調査した ③ ある食品工場では,工場排水の水質保証のために1ヶ月に6回の割合で放流口から採水して排水分析をしています 母集団は何でしょうか.標本は何でしょうか?この場合,母集団は実在母集団・仮説的無限母集団のどちらでしょうか? ④ 羊に与えるえさに混ぜると成長がよくなるという薬を5匹の羊に与え,調査しました.母集団は何でしょうか.標本は何でしょうか?この場合,母集団は実在母集団・仮説的無限母集団のどちらでしょうか? 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団

母集団と標本 ⑤ ある製薬会社は血圧を低下させる薬の候補であるAを20匹のラットに与え,効果があることを明らかにしたので,人間への応用を考えている 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団 ⑥ ある家電メーカーでは,エアコン製造ラインで種々の不良が発生している.そこで工場から200枚の基盤を選んで調べたところ,11枚の不良品を発見した ⑤ ある製薬会社は血圧を低下させる薬の候補であるAを20匹のラットに与え,効果があることを明らかにしたので人間への応用を考えています. 母集団は何でしょうか.標本は何でしょうか?この場合,母集団は実在母集団・仮説的無限母集団のどちらでしょうか? ⑥ ある家電メーカーでは,エアコン製造ラインで種々の不良が発生している.そこで工場から200枚の基盤を調べたところ,11枚の不良品を発見した. よくある誤解に母集団に対して何パーセント調べるとよいという人がいます.これは間違いです.標本数だけで(母集団が無限大であろうと),ほとんど精度が決定することが統計学で証明されています. 母集団 (                           ) 標本   (                           ) 実在母集団・仮説的無限母集団

標本から仮説的無限母集団を推測 サンプリングのパラドックス 未知の母集団なのに正しく標本を無作為抽出したとわかるのか? ある標本(患者):どのような集団にまで一般化してよいだろうか? ここでサンプリングのパラドックスについて説明します.そもそもわたしたちは未知の母集団がどうなっているかを調べるために,その母集団の一部を無作為に取り出した標本を調査します.その標本が母集団を忠実に代表している無作為抽出標本でないと問題があるのですが,そもそも中身のわかっていない母集団から無作為に抽出できるのか?という問題があります.実在母集団ならそのすべてをガラガラ抽選器に入れるようなやり方で無作為抽出することも可能かもしれません.しかし,仮説的無限母集団になりますと,標本を無作為に選んだのかどうかは難しい問題です.これを完全に解決することは不可能ですが,研究者はこのことを肝に銘じて,研究しなければならないのです.さて,逆に標本が先に決まって,母集団をあとから考えるようなケースもあります.患者がたくさん来るお医者さんの場合,自分のところに来た患者が標本です.ではその母集団は?自分の患者から導いた結論をどのような集団にまで一般化してよいのでしょうか?

標本が先にあることもある ふつうは母集団を想定してから,標本を取り出す しかし,標本が先にあって,それにふさわしい母集団を考えることもある 質問 病院にやってきた患者が標本としよう.それぞれの医者の事例についてどんな偏りが考えられるだろうか? ① 高血圧専門の医者なら・・・ ② 小児科医なら・・・  この医師は自分の標本(やってきた患者)にふさわしい母集団を考えることになる. つまりふつうは母集団を想定してから,標本を取り出すものです.しかし,標本が先にあって,それにふさわしい母集団を考えることもあります. 質問 病院にやってきた患者が標本としましょう.それぞれの医者の事例についてどんな偏りが考えられるでしょうか? ① 高血圧専門の医者なら・・・,次に② 小児科医なら・・・どうでしょうか? この医師は自分の標本(やってきた患者)にふさわしい母集団を考えることになります. 自分の答えをプリントに書いてください.次回の授業でグループで議論する材料とします.