二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
第1回 担当: 西山 統計学.
Microsoft Excel 2010 を利用した 2項分布の確率計算
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
数理統計学  第8回 第2章のエクササイズ 西山.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
数理統計学 第4回 西山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
統計処理2  t検定・分散分析.
母分散の信頼区間 F分布 母分散の比の信頼区間
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第8回 ポアソン分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率と統計 確率編- 平成20年10月29日(木).
Microsoft Excel 2010 を利用した 2項分布の確率計算
Presentation transcript:

二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例 大きさ  の標本で,事象Eの起こる確率を  とするとき, そのうち  個にEが起こる確率     は二項分布に従う 例 さいころを10回振って1の出る回数xの確率分布は二項分布に従う さいころを振って,1の出る確率は? ここでは二項分布について予習します.二項分布については基盤科目「統計学」で理解した学生は簡単に復習するだけでよいでしょう. 二項分布とは大きさnの標本で,事象Eの起こる確率をpとするとき,そのうちx個にEが起こる確率P(x)は二項分布に従う と表現されます.しかし,この定義ではたぶんまったく何のことかわからないので,実例で説明します.二項分布に従う例として,さいころを10回振って1の出る回数xの確率分布は二項分布に従います.さいころを振って,1の出る確率はいくらでしょうか?6分の1です.これは皆さんもご存じでしょう. 6分の1  (1/6)

二項分布 , 例 さいころを10回振って1の出る回数xの確率分布は二項分布に従う の二項分布になる さいころを10回振ったときに1が0回出る確率は, さいころを10回振ったときに1が3回出る確率は, さて1回さいころをふると1/6の確率で1の目が出ますが,さいころを何回も振ると1が何回出るかを考えてみましょう.これを計算する方法が二項分布です.さいころを10回振って1の出る回数xの確率分布は二項分布に従います.ここで先ほどの難しい二項分布の定義に出てきたnやpはいくらになるかといいますと,n=10,p=1/6となります.この場合,考えるのはn=10,p=1/6の二項分布なのです. さいころを10回振ったときに1が0回出る確率は,P(0)=0.162,さいころを10回振ったときに1が3回出る確率は,P(3)=0.155と計算できます. つまりP(x)の計算をパソコンがやってくれるので,難しい数式を覚える必要がありません.二項分布がわかると便利そうです. なお二項分布では母平均(母集団の平均)であるμ(ミュー)=np,母分散(母集団の分散)であるσ2(シグマ二乗) =np(1-p)となる法則があります.この法則も覚えておいてもよいでしょう. 二項分布では母平均       ,          母分散             となる

エクセルによる二項分布の計算 例 さいころを10回振って1の出る回数xの確率分布は二項分布に従う の二項分布になる さいころを10回振って1の出る回数xの確率分布は二項分布に従います.n=10,p=1/6とわかっているので,これを使って,エクセルの二項分布の関数で,さいころを10回振って,1が0~10回出現する回数をすべて計算することができます.エクセルの二項分布の関数は=BINOMDISTです.英語では二項分布をbinominal distributionというので,そこから来た関数名です.画面にあるようにエクセルで打ち込めば,確率が計算できます.一番上の計算が,さいころを10回振って,1が0回出る確率(すなわち1回も1がでない確率)が0.1615であることを示します.上から二番目の計算がさいころを10回振って,1が1回出る確率で,0.323です.こうしてみるとさいころを10回振ると1が1回だけ出る確率が一番高いことがわかります.1回さいころを振ると1が出る確率は1/6ですから10回振ると1回が一番多そうで,計算結果でもそうなりました.でも上の計算から,さいころを10回振ると1回も1がでない確率(0.1615)と3回1が出る確率(0.155)がほぼ同じです.これは以外に思うかもしれません.

二項分布 1の出る 回数 二項分布に基づく確率 0.16 1 0.32 2 0.29 3 4 0.05 5 0.01 6 7 8 9 10 さいころを10回振って1の出る回数xの 確率分布は二項分布に従う さいころを10回振って1の出る回数xの確率分布は二項分布に従います.X=0~10の場合について,計算した結果をグラフにしてみました.さいころを10回振って1が5回も出る確率も0.01でときには起こりますが,6回以上となるとほとんど起こらないことがわかります.

二項分布の練習問題 A社のチョコレートにはくじが入っていて,当たる確率は0.15である.10個買って1つも当たりが入っていない確率,ちょうど2つだけ当たりの入っている確率を求めよ. それでは練習問題をやってみましょう.A社のチョコレートにはくじが入っていて,当たる確率は0.15です.10個買って1つも当たりが入っていない確率,ちょうど2つだけ当たりの入っている確率を求めましょう.まずnはいくらか,pがいくらかがわからないとエクセルの関数を使えません.nは全部で何回くじをひいたか,pは1回当たりのくじの当たる確率です.さてnとpはいくらかを考えてみましょう.それがわかればエクセルのBINOMDIST関数に画面のように代入すれば計算できるはずです.

当たり 計算式 確率 0    1 2 3 4 5 6 7 8 9 10 0.197 0.347 0.276 0.130 0.040 0.008 0.001 0.000 n=10,p=0.15です.したがって,当たりくじの数を計算すると10本の当たりくじの中に1つも当たりくじがない確率は0.197,1つだけ当たりくじがある確率は0.347となります.それ以外の計算も自分でエクセルに代入して確かめてみましょう.こうしてみると当たる確率が0.15のくじを10回引くと1回も当たらない確率は0.197となります.つまりこのチョコレートを10個買った人が10人いたら,2人は1回も当たらない計算になります.一方,3回以上当たる確率も0.179となり,1回も当たらない確率とほぼ同じです.この結果を見て,しごく当たり前と思う人もいるでしょうし,意外におもう人もいるでしょう. 0.000 0.000 0.000

参照座標を使ったエクセルでの計算 さて1の出る回数を0から10までいちいち入力するのは面倒なので,画面のように打ち込めば簡単にできます.一番最初の計算だけ打ち込んであとはそのセルを下へコピーしてやれば,エクセルの関数の中の「B5」の部分を自動的に画面のように「B6」・・と修正してくれます.これを参照座標といいます.エクセルでは必須の知識ですから,覚えているとは思いますが,実際に利用できるようになりましょう.

二項分布の利用 ある事象が二項分布に当てはまると考えられる場合,それを利用して,いくつかの予測や推論を立てることができる (1) 確率の計算 (1) 確率の計算 例:シロクマチョコレートを買うと,20 個に1 個の割合でシロクマのぬいぐるみが当たる.どうしてもシロクマのぬいぐるみがほしいAさんはシロクマのぬいぐるみが手に入る確率を 95%以上にするにはいくつシロクマチョコレートを買えばよいか? 99%以上にするにはいくつ買えばよいか? さて二項分布を学びましたが,これが何の役に立つのでしょうか?そういう計算をすることもあるけど,めったにないんじゃない???と思うかもしれません.ある事象が二項分布に当てはまると考えられる場合,それを利用して,いくつかの予測や推論を立てることができます. 例えば確率の計算をもうちょっと応用レベルにすれば例題のような計算ができます.例:シロクマチョコレートを買うと,20 個に1 個の割合でシロクマのぬいぐるみが当たる.どうしてもシロクマのぬいぐるみがほしいAさんはシロクマのぬいぐるみが手に入る確率を95%以上にするにはいくつシロクマチョコレートを買えばよいか?99%以上にするにはいくつ買えばよいか?を計算してみましょう.

95%以上にするには・・・ 求める確率=1-(一つもシロクマのぬいぐるみが当たらない確率) 買った数 1つはぬいぐるみが当たる確率とは,求める確率=1-(一つもシロクマのぬいぐるみが当たらない確率)です. 一つもシロクマのぬいぐるみが当たらない確率は二項分布で計算できます.ぬいぐるみを買った数を増やしていって,計算してみましょう. 画面のように10個飛ばしでおおざっぱに当たりをつけて計算するとよいでしょう.その結果,59個買うと1つはぬいぐるみが当たる確率は95%以上になります.気になる人は自分で計算してみましょう. 59個買うと1つはぬいぐるみが当たる確率は95%以上になる

99%以上にするには・・・ 求める確率=1-(一つもシロクマのぬいぐるみが当たらない確率) 買った数 さらに90個買うと1つはぬいぐるみが当たる確率は99%以上になることもわかります. 90個買うと1つはぬいぐるみが当たる確率は99%以上になる

範囲で示す(統計的推定) 例:シロクマチョコレートを買うと,20個に1個の割合でシロクマのぬいぐるみが当たる.シロクマチョコレートを20個買うと,シロクマのぬいぐるみが当たる個数はいくつか? 平均すれば1個当たる  しかし,その確率は0.377であり, それほど高いわけではない 決められた確率で何個から何個まで当たると表現する.これを区間推定といい,このような範囲を信頼区間,決められた(宣言した)確率を信頼率という 次の二項分布の応用問題です.例題は,シロクマチョコレートを買うと,20個に1個の割合でシロクマのぬいぐるみが当たります.シロクマチョコレートを20個買うと,シロクマのぬいぐるみが当たる個数はいくつでしょうか?二項分布なんかつかわなくても,平均すれば1個当たるわけです.それで答えですでもいいかもしれません.しかし,二項分布を使って計算すれば,1個だけぬいぐるみが当たる確率は0.377であり,それほど高いわけではありません.そこで,決められた確率で何個から何個まで当たると表現します.これを区間推定といい,このような範囲を信頼区間,決められた(宣言した)確率を信頼率といいます.詳しくは第4回の授業で説明します.

範囲で示す 20個のシロクマチョコレートを買うと1個ぬいぐるみが当たる確率が一番高いといっても0.377の確率であり,それほど確実に起こることではない. そこで92%の確率で0個から2個当たるというように確率を宣言して,範囲で示す. 20個のシロクマチョコレートを買うと1個ぬいぐるみが当たる確率が一番高いといっても0.377の確率であり,それほど確実に起こることではありません.そこで92%の確率で0個から2個当たるというように確率を宣言して,範囲で示す.ここで92%が信頼率といわれるものです.0~2個が信頼区間というものです.73.5%の確率で 0~1個当たります.92.5%の確率で 0~2個当たります.98.4%の確率で 0~3個当たります.99.7%の確率で 0~4個当たります.さて信頼率100%出ないと困る,おれは100%のものしか信用しないとしたら,どうなるでしょうか?実は100%の確率で0~20個当たりますという答えがでます.これでは意味がないですから,信頼率100%というものは統計学では使いません. 73.5%の確率で 0~1個当たる 92.5%の確率で 0~2個当たる 98.4%の確率で 0~3個当たる 99.7%の確率で 0~4個当たる

真偽を推測する(統計的検定) 例:シロクマチョコレートを買うと,20 個に1 個の割合でシロクマのぬいぐるみが当たる.どうしてもシロクマのぬいぐるみがほしいAさんはシロクマチョコレートを50個買ったのに1つも当たらなかった.Aさんはシロクマチョコレート株式会社はうそつきだと断定した.しかし,その推論は正しいか? 自分の考えはどうか? 二項分布を使うと疑わしいことが起きたときに本当かどうかを検定することもできます.例題をみましょう.シロクマチョコレートを買うと,20 個に1 個の割合でシロクマのぬいぐるみが当たります.どうしてもシロクマのぬいぐるみがほしいAさんはシロクマチョコレートを50個買ったのに1つも当たりませんでした.Aさんはシロクマチョコレート株式会社はうそつきだと断定しました.しかし,その推論は正しいでしょうか? まず計算しないで直観で自分で考えてみましょう.うそつきな気もしますね・・・でも証拠を出さないとダメでしょう.

50個買っても1つも当たらない確率 50 個シロクマチョコレートを買っても1 つもシロクマのぬいぐるみが当たらない確率は 二項分布を利用すると(            )である. 0.077 買った数 50 個シロクマチョコレートを買っても1 つもシロクマのぬいぐるみが当たらない確率は,二項分布を利用すると画面にあるように0.077となります.つまり13回に1回,50個シロクマチョコレートを買っても1つもぬいぐるみが当たらないことが起こります.この確率は低いといえば,低いので,この会社はうそをついているのかもしれませんが,うそつきと断言するとしては,ときにはうそをついていなくても起こりそうな確率でもあります.統計的検定とはこの確率を使って判断します.一般には確率0.05以下になるとまちがいだとすることが多いですが,問題の重大さでその基準となる数値(有意水準といいます)を決めます.

幸運な人もいるし,そうでない人もいる 20 個に1 個の割合でシロクマのぬいぐるみが当たるのだから20 個買うと1 個は当たりそうにふつうの人は期待する.しかし,20 個シロクマチョコレートを買って,ぬいぐるみが少なくとも1 個当たる確率は(       )である. これほど確率が低いのは20 個シロクマチョコレートを買って,2 個以上当たる幸運な人がいるからで,その確率は(       )である. 0.642 0.264 さてなぜ50回チョコレートを買っても当たりが1つもない確率がこんなにも高いのでしょうか?20 個に1 個の割合でシロクマのぬいぐるみが当たるのだから20 個買うと1 個は当たりそうにふつうの人は期待する.しかし,20 個シロクマチョコレートを買って,ぬいぐるみが少なくとも1 個当たる確率は0.642である.すなわち3人に1人は20個買ったとしても1つも当たりが入っていません.これほど確率が低いのは20 個シロクマチョコレートを買って,2 個以上当たる幸運な人がいるからで,その確率は0.264です.幸運な人も4人に一人いるわけです.