確率の考え方の基礎 二項分布と正規分布 2006年1月25日 作成:本間聡.

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学  第9回 西山.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
経済統計学 第2回 4/24 Business Statistics
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
数理統計学 西 山.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計学  第7回 西 山.
統計解析 第8回 第7章 2項分布.
統計学 11/13(月) 担当:鈴木智也.
第1回 担当: 西山 統計学.
演習00-0 “Hello,world![改行]”を表示するプログラムを作成せよ. 1 1.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
アルゴリズムイントロダクション第5章( ) 確率論的解析
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計解析 第8回 第7章 2項分布.
統計学 11/19(月) 担当:鈴木智也.
数理統計学  第8回 第2章のエクササイズ 西山.
数理統計学  第8回 西山.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
第2章 確率と確率分布 統計学 2006年度.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
統計学  第6回 西山.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
2015年度 演習課題2 Excelによる自己評価の集計
ガウス過程による回帰 Gaussian Process Regression GPR
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
数理統計学 第4回 西山.
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
前回の練習問題.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
計測工学 -誤差、演習問題 計測工学(第6回) 2009年5月26日 Ⅱ限目.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
ベイズ最適化 Bayesian Optimization BO
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
プログラミング入門2 第13回、14回 総合演習 情報工学科 篠埜 功.
情報工学Ⅱ (第9回) 月曜4限 担当:北川 晃.
数理統計学 西 山.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
数理統計学  第6回 西山.
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
~sumii/class/proenb2009/ml6/
Cプログラミング演習 ニュートン法による方程式の求解.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
アルゴリズム ~すべてのプログラムの基礎~.
Presentation transcript:

確率の考え方の基礎 二項分布と正規分布 2006年1月25日 作成:本間聡

アウトライン 設問1:打者はヒットを打てるのか? 二項分布から正規分布へ 設問2:サイコロを170回振る. 1の目が25~35回出る確率は? 演習問題1:設問1の内容の繰り返し 二項分布から正規分布へ 設問2:サイコロを170回振る.             1の目が25~35回出る確率は? 正規分布表の使い方 演習問題2:設問2の内容の繰り返し 例題:試験で上位の人の得点を求める

設問1 打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は? その確率は1となるか?

「打率が1/3」の本質 ヒットを○,アウトを×とする. ○ 打率= ヒットを打った打席数 全打席数 成績を見ると,打率1/3と言っても, ある打者の成績 成績を見ると,打率1/3と言っても, 3打席中に必ず1本のヒットが出るわけではないことがわかる 1 2 3 4 5 6 ○ 7 8 9 10 11 12 13 14 15 16 17 18 打率= ヒットを打った打席数 全打席数 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は?

3打席で,ヒット・アウトはどのように発生するのか? 発生する事象と確率 各事象の発生確率は 1打席 2打席 3打席 × ○ 2/3× 2/3× 2/3=(2/3)3 1/3× 2/3× 2/3= (1/3) (2/3)2 2/3× 1/3× 2/3= (1/3) (2/3)2 1/3× 1/3× 2/3= (1/3)2 (2/3) 1/3× 2/3× 1/3= (1/3)2 (2/3) 2/3× 1/3× 1/3= (1/3)2 (2/3) 1/3× 1/3× 1/3= (1/3)3 ヒット・アウトになる確率 ヒット:1/3 アウト:1-1/3=2/3 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は?

3打席で少なくとも1本のヒットを打つ確率は? =1ー(1本もヒットを打たない確率) =1-(2/3)3 =0.704 つまり,3打席で少なくとも1本のヒットを打つ確率は約70% 打率1/3というのは,3打席中に必ず1本のヒットを打つことではない. データ(成績)にはばらつきがあることを頭に入れること. 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は?

ヒットになる確率p,アウトになる確率q(=1-p)とする 数学としての整理1 ヒットになる確率p,アウトになる確率q(=1-p)とする 各事象の確率 1打席 2打席 3打席 × ○ q3 pq2 p2q p3 ヒット0本の確率 q3 3C0 p0q3 ヒット1本の確率 3C1 p1q2 3pq2 ヒット2本の確率 3C2 p2q1 3p2q ヒット3本の確率 3C3 p3q0 p3 設問内容:打率が1/3のバッターがいる.3打席で少なくとも1本のヒットを打つ確率は?

数学としての整理2 1回の試行で,事柄Aの起こる確率がpの試行を独立にn回繰り返した時,事柄Aの起こる回数Xとするとその確率は P(X=k)=nCkpkqn-k (k=0,1…, n) Xに対するP(X)の分布を2項分布Bin(n,p)と呼ぶ 二項分布の大原則は,試行毎に確率が変動しない.また,事象が起こる,起こらないと事のみを対象とする. (つまりは,先の打席の問題で,二塁打,ホームランなどとは考えず,ヒットを打ったかどうかが重要)

数学としての整理3 Bin(3, 1/3) 打率が1/3のバッターがいる.p=1/3,q=2/3 3打席で0本のヒットを打つ確率は? →P(0)=3C0p0q3 = 0.296    3打席で1本のヒットを打つ確率は? →P(1)=3C1p1q2 = 0.444 3打席で2本のヒットを打つ確率は? →P(2)=3C2p2q1 = 0.222 3打席で3本のヒットを打つ確率は? →P(3)=3C3p3q0 = 0.037 Bin(3, 1/3)

MATLABで関数を定義する 自分で定義する関数はmファイルとして保存する必要がある. ファイル→新規作成→mファイル 編集画面が出てくる function[出力変数リスト]=関数名(入力引数リスト) 関数名と同じファイル名をつけて保存する 例) 「ファイル→新規作成→mファイル」で編集画面を出す.以下の文を入力する function y=test(x) h=0; for k=0:x h=h+k; end y=h ファイル名はtest.mとして保存 通常のmatlabの画面で test(3)と入力する.結果を表示する

MATLAB覚え書き Mファイル作成 Command Windowで<ファイル><新規作成><M-file>を実行する M-fileを記述する. 関数のファイルをc:\MATLABR11\WORKにセーブして実行を確認し,シャットダウン前に個人のフォルダにコピーして実行する . ↑自分でパスを設定してもよい.Webページなどを参考に

組み合わせの関数のプログラム(MATLAB) nCr を計算する関数staticC(n,r)の定義 mファイルを作成する. 新規作成→mファイル function result=staticsC(n,r) k=1; for m=0:r-1 k=k*(n-m)/(r-m); end result=k; ファイルの名前はstaticsC.mとする 約分 staticC(5,3)と打てば,5C3の結果を出力する

組み合わせの関数のプログラム(octave) Mファイルを作成せずに出来ます. ただし保存しないと,プログラム終了後 関数情報は消える nCr を計算する関数C(n,r)の定義 >>function y=staticC(n,r) k=1; for m=0:r-1 k=k*(n-m)/(r-m); end y=k; 約分 staticC(5,3)と打てば,5C3の結果を出力する カレントディレクトリにmファイルを作成すれば,matlabと同様通常の関数として使用可能. ファイルはテキストエディタで作成すること.ファイル名は関数名と同じ,拡張子はmとする

スライド9のグラフ作成のプログラム >>n=3; ←試行回数を入力 >>p=1/3; ←事象Aが起きる確率 >>q=1-p; ←事象Aが起こらない確率 >>for m=0:n ←事象Aの起きる回数X B(m+1)=staticC(n,m)*p^m*q^(n-m);  ←Xに対する発生する確率 end >>X=0:1:n; >>stem(X,B) BはP(X=k)=nCkpkqn-k (k=0,1…, n)を 計算している 試行回数を100回にした場合の結果を表示すること

演習問題1 セールスマンがある製品を売るために20件の家庭を訪問する.この製品が売れる確率は10%(p = 0.1) であるという.以下の問題に答えよ. 全く売れない確率を求めよ. 2 個売れる確率を求めよ. 3 個以上売れる確率を求めよ. サイコロを10回振る.1の目がX回出る確率P(X)を求めよ.さらにXに対するP(X)のグラフを作成せよ.

試行回数が増えるとどうなる? 打率1/3の打者の話に戻そう.スライド9を見直すと,3回の打席で1本のヒットを打つ確率が最も高い値となったが,次に高い値となったのが1本もヒットを打てない場合. 打席数を増やしたらどうなるだろうか?

試行回数が増えるとどうなる?2 試行回数に対する確率分布の形状変化 試行数nが大きくなると n/3を中心とする 対称な分布になる. →正規分布で近似される

設問2 サイコロを170回振る.             1の目が25~35回出る確率は?

設問2の一つの回答(1) スライド8より,1回の試行で,事柄Aの起こる確率がpの試行を独立にn回繰り返した時,事柄Aの起こる回数Xとするとその確率は P(X=k)=nCkpkqn-k (k=0,1…, n) 先ほどのプログラムで,1回の試行で事柄Aが起こる確率をp=1/6とし,試行回数を170として,回数X(=25~35)に対するP(X)を計算し,ぞれぞれを足し合わせる. 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は?

設問2の一つの回答(2) つまりは 約71% Bin(170,1/6) 右図のX=25~35の範囲の確率を足し合わせる 約0.709     約0.709 つまりは 約71% 確率P(X) 回数X 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は?

演習問題2 サイコロを100回振る 1. 奇数の出る回数に対する確率分布を 計算し,図示せよ. 2. 10回~20回出る確率を求めよ

演習問題追加2-2 1,2,3の数字を記したカードがそれぞれ1枚,2枚,3枚合計6枚ある.Aさんが一枚のカードを引き,そのカードの数字をXとする.次にそのカードを戻してから,Bさんが一枚のカードを引き,そのカードの数字をYとする X+Yの確率分布を求めよ

正規分布を利用する理由 試行回数が多い場合,条件となるXについてすべての確率を求め,足し合わせるのは非常に時間と労力がかかる. スライド14と17を比較すると,試行回数が多い場合は設問1,設問2の確率分布は形が非常によく似ている. →正規分布で近似

期待値と分散値: 正規分布を利用するために必要なパラメータ 正規分布に行く前に,期待値と分散値について 二項分布Bin(n,p)に従う確率変数Xの期待値と分散を求める 確率pで起こる事柄Aが,n回の試行で起こる回数がX 第i回目の試行の結果について,以下の確率変数X1,X2・・・Xnを考える 各Xi の確率分布は 事象Aが起きるか起きないかが重要で,事象自体には値はない物とする Xi 1   0 計 P p   q 1 但しq=1-p

2項分布の期待値と分散値 期待値及び分散値は 第i回目の試行の結果について,以下の確率変数X1,X2・・・Xnを考える 各Xiの期待値: 各Xiの分散値 n回試行を繰り返した場合(n倍して) 期待値及び分散値は

正規分布と確率 スライド12より試行回数nが大きくなると,期待値を中心に左右対称の確率分布になる. これは期待値E(x)=μ,分散値V(x)=σ2とした場合の正規曲線で近似される. 変曲点 変曲点 積分すると1となる μ-σ μ+σ

正規分布の特性 μ-σ μ+σ μ-2σ μ+2σ μ-3σ μ+3σ 約68%が含まれる 約95%が含まれる 約99.7%が含まれる

二項分布と正規分布の比較 サイコロを170回振った場合の1の目が出る確率について 赤:二項分布Bin(170,1/6)

正規分布の標準化(1) 正規分布N(μ,σ2)を標準正規分布N(0,1)に変換することで,より使い勝手が良くなる X Y Z μ μ-σ μ-σ μ+σ -σ σ -1 1 ②σで割って標準偏差を1とする    Z=Y/σ=(X-μ)/σ ①μだけずらして平均を0とする(Y=X-μ)

正規分布の標準化(2) 標準正規分布に変換するとは XはN(μ,σ2)に従う ZはN(1,0)に従う とすること.その場合,  期待値,分散値は→ XはN(μ,σ2)に従う ZはN(1,0)に従う 重要!

正規分布表の使用方法(1) 横軸上のメモリzから,色がついている領域の面積 I (z)を求めるものが正規分布表 z 使用例) 正規分布表よりz=1.25に対する値を探してみましょう. 縦軸より 1.2 横軸より 0.05   →青の範囲の確率は          0.3944となる z 1.25

正規分布表の使用方法(2) Zが負となる領域も含む場合 + + I (0.67) =0.2486 I (1.12) =0.3686 正に折り返して計算する z=0.67 z=1.12 合計:0.6172

設問2の解法(1) サイコロを170回振る. 1の目が25~35回出る確率は? まず,期待値E,分散値Vを求める. サイコロを170回振る.             1の目が25~35回出る確率は? まず,期待値E,分散値Vを求める. E=npより,E=28.33・・・ V=npqより,V=23.61・・・ いま求める確率はP(25≤X ≤35). より, 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は?

設問2の解法(2) + + I (0.69) =??? I (1.37) =??? 青の領域の面積を求める z=-0.69 z=1.37

設問2の解法(3) 標準正規分布表より求めた結果は? →0.668 二項分布より求めた結果は →0.709 →0.715 標準正規分布表より求めた結果は? →0.668 二項分布より求めた結果は       →0.709 試行回数が小さいと誤差が生じる. 試行回数が小さい場合は,以下のように補正値を加えると良い →0.715 試行回数が大きい場合は補正は必要ない 設問2の内容:サイコロを170回振る.1の目が25~35回出る確率は?

演習問題3 10000人を対象にテストを実施した.その結果,平均点75点(満点は100ではない).標準偏差が10点であった. 75点以上100点未満の人数を推定せよ. 60点以下の人数を推定しなさい. 点数をXとし,75-Y≦X ≦75+Yの範囲に入る確率を0.95とする.Yを求めよ

演習問題3-1 まずZ=(X-75)/10で変換 人数は10000×0.4938=4938人と推定 人数は10000×0.0668=668人と推定

2 よってY=19.6となる

演習問題4 打率0.25の打者がいる.年間500回打席がまわってくる.ヒット(ホームランも含む)を140本以上打つ確率を求めよ. 標準正規分布表を使って 余裕のある方は二項分布を使って真の値を求めよ. (計算機を使って) サイコロを360回振って,1または2の目の出る回数がX=100~120となる確率を求めよ.

追加)センター試験の例題 ある年の大学入試センター試験のある科目で,受験者数450000人の得点は,平均点65点,標準偏差20点の正規分布に従うものとする. 70~90点の受験生は,ほぼ何人と考えられるか? P(70≤X ≤90)を求めればよい →自分でやること 得点上位50000人目の得点はいくらか? 50000人目とは上位から50000/450000=0.111である. (次のスライドに解法を書いているので参照すること) 得点上位10000人目の得点はいくらか? 自分で求めること

追加)センター試験の例題の続き Xは約89点 となるので,I(Z1)=0.389より,正規分布表で 0.111 Z1 0.5-0.111 =0.389 上位 となるので,I(Z1)=0.389より,正規分布表で 条件に合うZ1の値を求める.→Z1=1.22 Xは約89点 最後にZからXの値に変換する. 設問の内容:得点上位50000人目の得点はいくらか? 50000人目とは上位から50000/450000=0.111である.