第2章確率と確率分布統計学　2006年度.

Slides:

Advertisements

Similar presentations

1 小暮研究会２第１章ベイジアンアルゴリズム２値選択ベルヌーイ試行尤度原理同一性交換可能性尤度についてのまとめ環境情報学部３年渡邊洋一.

Advertisements

5 章標本と統計量の分布湯浅直弘. 5-1 母集団と標本 ■ 母集合今までは確率的なことこれからは，確率や割合がわかっていないときに，推定することが目標．個体：実験や観測を行う 1 つの対象母集団：個体全部の集合  ・有限な場合：有限母集合 → １つの箱に入っているねじ．  ・無限な場合：無限母集合.

統計解析第 11 回第 15 章有意性検定. 今日学ぶこと仮説の設定 – 帰無仮説、対立仮説検定 – 棄却域、有意水準 – 片側検定、両側検定過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布釣り鐘形の曲線－∽から＋ ∽までの値を取る平均 mean ＝中央値 median ＝最頻値 mode 曲線より下の面積は１に等しい.

数理統計学第１回 1 数理統計学 ( 第一回）確率変数とは？浜田知久馬. 数理統計学第１回 2 世の中は不確定なことが多い決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき，確率変数によって，物事を確率的に記述できると便利なことが多い.

統計学第３回西山. 第２回のまとめ確率分布＝決まっている分布の形期待値とは平均計算平均＝合計 ÷ 個数から卒業！平均＝割合 × 値の合計同じ平均値でも同じ分散や標準偏差でも.

放射線の計算や測定における統計誤差「平均の誤差」とその応用（ 1H) 2 項分布、ポアソン分布、ガウス分布（ 1H ）最小二乗法（ 1H ）

統計学入門２関係を探る方法講義のまとめ. 今日の話変数間の関係を探るクロス集計表の検定：独立性の検定散布図、相関係数講義のまとめとキーワード「統計学入門」後の関連講義・実習社会調査士.

2 年確率の導入指導手順身の回りの生活の中の確率の話をする。 10 円玉の表と裏を確認する。本時の課題を提示する。 ( シート 4) 実験をする。準備物ワークシート、 10 円玉 ×2× 生徒数結果をエクセルに入力グラフから言えることを発表する。確率についてまとめる。教科書の練習問題をする。

統計学第２回「確率と確率分布」受講者の数学ができる程度についての度数分布図。先週のアンケート結果を， R を使って x

●母集団と標本母集団標本母数母平均、母分散無作為抽出標本データの分析（記述統計学）母集団における状態の推測（推測統計学）

数理統計学　　第９回西山.

数理統計学(第ニ回）期待値と分散浜田知久馬数理統計学第２回.

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

疫学概論二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.

経済統計学第２回４/２４ Business Statistics

確率と統計平成23年12月8日 (徐々に統計へ戻ります).

第2章確率と確率分布統計学　2010年度.

統計解析第7回第6章離散確率分布.

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

全加算回路 A, Bはそれぞれ0または1をとるとする。下位桁からの繰り上がりをC1とする。（０または１）

第1章統計学の準備ｰ計量経済学ｰ.

統計学１０/25（木）鈴木智也.

確率･統計Ⅰ 第11回 i.i.d.の和と大数の法則ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

統計解析第8回第7章 2項分布.

統計学 11/13（月）担当：鈴木智也.

統計解析第9回第9章正規分布、第11章理論分布.

確率の考え方の基礎二項分布と正規分布 2006年1月25日作成：本間聡.

アルゴリズムイントロダクション第５章( ) 確率論的解析

寺尾敦青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp

大数の法則平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>

11.確率モデル確率・・・不確実性の経済学や金融やファイナンスで重要密度関数がある場合に期待値を取る計算を中心に、紹介.

確率･統計Ⅱ 第7回.

第2章補足Ⅱ 2項分布と正規分布についての補足

統計解析第8回第7章 2項分布.

統計学 11/19（月）担当：鈴木智也.

６確率１章　確率 §３　確率の求め方　　　　　　　　（４時間）.

数理統計学　　第８回第2章のエクササイズ西山.

第3章重回帰分析ｰ計量経済学ｰ.

数理統計学　　第８回西山.

第3章重回帰分析ｰ計量経済学ｰ.

第7回二項分布（続き）、幾何分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

統計学 11/08（木）鈴木智也.

統計数理石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布

橋本保健統計演習への準備.

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

第3回確率変数の平均確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

１.標本平均の特性値２.母分散既知の標本平均の分布 3.大数法則と中心極限定理

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

応用統計学の内容推測統計学(inferential statistics) 　　連続型の確率分布　　標本分布　　統計推定　　統計的検定.

正規分布確率密度関数.

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

第3章統計的推定（その1）統計学　2006年度.

Basic Tools B4 　八田　直樹.

第２日目第１時限の学習目標順列、組み合わせ、確率の入門的知識を学ぶ。（１）順列とは？（２）組み合わせとは？（３）確率とは？

１.標本平均の特性値２.母分散既知の標本平均の分布 3.大数法則と中心極限定理

標本分散の標本分布標本分散の統計量　　　の定義　　　の性質分布表の使い方　　　分布の信頼区間　

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

様々な情報源（４章）.

第4章統計的検定（その2）統計学　2006年度.

経営学研究科 M1年学籍番号 speedster

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

物理フラクチュオマティクス論応用確率過程論 (2006年4月11日)

確率と統計2007（最終回）平成20年1月17日(木) 東京工科大学亀田弘之.

確率と統計確率編- 平成20年10月29日(木).

確率と統計確率編- 平成19年10月25日(木) 確率と統計2007.

第3章統計的推定（その2）統計学　2006年度＜修正・補足版＞.

確率統計学（データ解析学）書き込み式ノート（Ver.1）担当教員：綴木　馴.

Presentation transcript:

第2章確率と確率分布統計学　2006年度

Ⅰ 確率の定義 Ⅱ 確率の公理と計算定理 Ⅲ 確率分布 a) 先験的確率 b) 経験的確率 c) 主観的確率 a) 確率の公理 Ⅰ　確率の定義 a)　先験的確率 1)　先験的確率の定義 2)　先験的確率の誤用 b)　経験的確率 1)　経験的確率の定義 2)　経験的確率の特徴 c)　主観的確率 1)　主観的確率の定義 2)　主観的確率の特徴 Ⅱ　確率の公理と計算定理 a)　確率の公理 b)　確率の計算定理 1)　加法定理 2)　条件つき確率と乗法定理 Ⅲ　確率分布 a)　確率変数 b)　確率分布と確率密度 c)　期待値と分散 d)　2項分布 e)　正規分布 1)　標準化 2)　標準正規分布

Ⅰ 確率の定義確率－ある事象が起こるか起こらないか確実には分からないとき、その事象の起こる「確からしさ」を数値で表したもの Ⅰ　確率の定義確率　－　ある事象が起こるか起こらないか確実には分からないとき、その事象の起こる「確からしさ」を数値で表したもの確率の定義には次の3とおりの方法がある。先験的確率経験的確率主観的確率

（例1）コインを1枚投げたときに表の出る確率 a)　先験的確率（古典的確率、数学的確率などともいう）　1)　先験的確率の定義ある行動の起こりうる結果が全部でn通りあり、そのうち事象Aにあてはまる結果がa通りあるとする。それらが同様に確からしく、互いに重複しない場合、　　　　　を事象Aの確率とする。（例1）　コインを1枚投げたときに表の出る確率起こりうる結果　－　表、裏の2通り（n=2）事象A　－　表が出るあてはまる結果　－　1通り（a=1）　　　　　⇒　

（例2）サイコロを1個投げたときに5以上の目の出る確率（例2）　サイコロを1個投げたときに5以上の目の出る確率起こりうる結果　－　1,2,3,4,5,6の6通り（n=6）事象A　－　5以上の目が出るあてはまる結果　－　5,6の2通り（a=2）　　　　　⇒　これらの例では、おこりうるすべての結果が分かり、同様に確からしいとみなせるので、実験を実際におこなってみなくても、確率を評価できる。　　よって、先験的確率といわれる。

2枚のコインを同時に投げたときに少なくとも1枚が表である確率を考える。　2)　先験的確率の誤用 2枚のコインを同時に投げたときに少なくとも1枚が表である確率を考える。起こりうる結果　－　表表、表裏、裏裏の3通り（n=3）事象A　－　少なくとも1枚が表であるあてはまる結果　－　表表、表裏の2通り（a=2）　　　　　⇒　　　　　　　　　　　　「ローベルバルの過ち」といわれる問題正しくは次の通り（パスカルがこのように修正した）起こりうる結果　－　表表、表裏、裏表、裏裏の3通り（n=4）あてはまる結果　－　表表、表裏、裏表の3通り（a=3）　　　　　⇒ 起こりうる結果が「同様に確からしい」とはいえない

「雨が降る」と「雨が降らない」は同様に確からしいとはいえない。 ⇒ 先験的確率によって確率を定義することの限界明日、雨が降る確率（降水確率）起こりうる結果　－　雨が降る、雨が降らないの2通り（n=2）事象A　－　雨が降るあてはまる結果　－　1通り（a=1）　　　　　⇒ 「雨が降る」と「雨が降らない」は同様に確からしいとはいえない。　⇒　先験的確率によって確率を定義することの限界

b)　経験的確率　1)　経験的確率の定義同じ条件のもとで繰り返し十分大きい観察がおこなわれたとき、観察総数nの中で、特定の事象Aとなる場合の数がaであったならば、　　　　　を事象Aの経験的確率という。（例1）　男児の出産確率多数の出産例を観察した結果求められたもの。（例2）　降水確率同様な天気図（雲の配置など）を多数観察し、それから降水確率を求めている。

すべての結果がわからない場合でも確率を求めることができる。おこりうるすべての結果が同様に確からしいとはいえない。　2)　経験的確率の特徴すべての結果がわからない場合でも確率を求めることができる。おこりうるすべての結果が同様に確からしいとはいえない。同じ条件のもとで繰り返し十分大きい観察が不可能な事象については経験的確率が定義できない。

事象Aに対する個人の確信の度合いを数値で表したものP(A)を事象Aの主観的確率という。 c)　主観的確率　1)　主観的確率の定義事象Aに対する個人の確信の度合いを数値で表したものP(A)を事象Aの主観的確率という。（例）　春の天皇賞でディープインパクトが勝つ確率は90%である。　⇒　競馬には対戦相手、枠順、血統、騎手、馬の調子、ローテーション、馬場状態、開催競馬場などの条件がある。これら同一の条件で、繰り返し十分な観察をすることは不可能である。

主観的確率は個人の確信によって定まるので、同じ事象に対しても確率の評価は異なる。 ⇒ このことから賭けがはじめて成立する。　2)　主観的確率の特徴主観的確率は個人の確信によって定まるので、同じ事象に対しても確率の評価は異なる。　⇒　このことから賭けがはじめて成立する。 (例) 日本シリーズで千葉ロッテと阪神のどちらが勝つか。千葉ロッテに賭ける人－千葉ロッテが勝つ確率(主観的確率)が高い。阪神に賭ける人－阪神が勝つ確率(主観的確率)が高い。　この両者が存在することによって、初めて賭けが成立する。全員が「千葉ロッテが勝つ確率が高い」と思っていたら賭けは成立しない。しかし、勝つ確率が低い方に賭けることもある。それは当たった時にもらえる金額が多くなるからである。　⇒　期待値の大きさで判断している。

主観的確率経験的確率先験的確率

Ⅱ 確率の公理と計算定理 a) 確率の公理 1. どのような事象Aに対しても、確率の値は常に0と1の間の値をとる。すなわち、 Ⅱ　確率の公理と計算定理 a) 確率の公理 1. どのような事象Aに対しても、確率の値は常に0と1の間の値をとる。すなわち、 2. おこりうる事象全体の集合をSとすれば、Sの確率は1である。 3. A,B,… が同時に起こらない事象(このとき、A,B,… を排反事象という)のとき、A,B,… のいずれかが起こる確率はそれぞれの事象が起こる確率の和に等しい。すなわち

b) 確率の計算定理松中がホームランを打ち、ホークスが勝つ確率 → A1とB1がともに起きる確率である。これをA1とB1の同時確率といい、P(A1∩B1)とあらわす。（∩は「かつ」(and)を表す記号。capとよぶ。) 松中がホームランを打つかどうかに関わらず、ホークスが勝つ確率 → A1が起こるかどうかに関わらず、B1が起きる確率である。これをB1の周辺確率といい、P(B1)とあらわす。

1) 加法定理（例）ホークスが勝つか、引き分ける確率（∪は「または」(or)を表す記号。cupとよぶ。) ＜排反事象の場合＞加法定理 1) 加法定理（例）　松中がホームランを打つか、ホークスが勝つ確率（∪は「または」(or)を表す記号。cupとよぶ。) ＜排反事象の場合＞　（例）　ホークスが勝つか、引き分ける確率加法定理排反事象の場合の加法定理

2) 条件つき確率と乗法定理 P(E)>0のとき、事象Eの起こることを条件として、事象Fが起こることを、(Eを条件とする)Fの条件つき確率といい、P(F|E)であらわす。（例）　松中がホームランを打ったときに、ホークスが勝つ確率　　　　⇒　A1を条件とするB1の条件つき確率P(B1|A1)である。　　　　この条件つき確率を用いて、松中がホームランを打ち、ホークスが勝つ確率を考えると、　　とあらわすことができる。これを乗法定理という。　　よって条件つき確率P(B1|A1)は　　となる。

＜独立事象の乗法定理＞事象Eが起こっても起こらなくても事象Fの確率に変化がないとき、すなわちP(F|E) = P(F|Ec) = P(F)のとき、事象Eと事象Fは独立であるという。（ Ec はEが起こらないという状況をあらわす）　　この例で雨が降った場合の朝青龍が勝つ条件つき確率は　　雨が降らない場合の朝青龍が勝つ条件つき確率は　　となり、 P(B1|A1) = P(B1|A2) = P(B1)であることから、雨が降るか降らないかと、朝青龍が勝つか負けるかは独立である。事象Eと事象Fが独立である場合、乗法定理は　　となる。

○○○, ○○×, ○×○, ×○○, ○××, ×○×, ××○, ××× Ⅲ　確率分布 a) 確率変数サイコロを3回振る実験を考える。 1の目が出た場合を○、1の目以外が出た場合を×とあらわすと、起こりうる結果は ○○○, ○○×, ○×○, ×○○, ○××, ×○×, ××○, ××× 　の8通りである。

ここで、1の目が何回出たかによって分類するなら 2回目に振ったサイコロの目は1回目に振ったさいころの目とは独立であるので、独立事象の乗法定理が用いられる。

1の目が出た回数を x 回とし、それに対応する確率を P(x) とあらわすと、次のように整理できる。このようにとりうる値のそれぞれにある確率が対応している変数を確率変数といい、その対応関係を確率分布という。

b) 確率密度右の図のようなルーレットがある。 xは連続変数なので、0から359までの360通り以外に、42.75, 108.268 などとりうる値が無限にある。そのため、P(x=60)の確率を求めることはできない x ルーレットの針と真上とのなす角をx度とする。ここで、x=60度となる確率を考えると、

連続型確率変数の場合には、x=60といった確率を求めることはできないので、代わりにといった微小区間に入る確率を考える。この確率を確率密度という。連続型確率変数の確率分布は、確率密度を線で結んだ密度関数ｆ（ｘ）によってあらわす。（グラフの場合も、数式の場合もある）ルーレットの例の場合の密度関数は次のようになる。ｆ（ｘ） 1/360 360

c) 期待値と分散次のようなくじがあったとする。このくじを1枚購入したときに、もらえると期待できる金額はこのくじの期待値は50（円）であるという

このくじが、全部で5万本あったとすると、下のような度数分布表であらわすことができる。もらえる金額の算術平均は2500000÷50000=50（円）であり、期待値に一致する。期待値＝確率変数の算術平均

サイコロを3回振る実験で1の目が出た回数をxとするなら、xの期待値は　　となり、1の目が出る回数の期待値は0.5回である。またサイコロを6回振る実験をおこなうと　　となるので、 1の目が出る回数の期待値は　　となり、6回ふれば1の目が1回ぐらい出るという直感に一致する。

期待値は　　　　　　　　とあらわすことができる。分散は　　　　　　　　　　　　　　となる。連続型確率変数の場合は　　となる。

d) 2項分布サイコロを3回振る実験は、A（1の目が出る）かB（1の目が出ない）かという2つの結果しか起こらない試行をn回繰り返したとき、Aという結果がx回おこるということである。このようなxの確率分布は2項分布といわれる。 Aが起こる確率をp、Bが起こる確率をq(=1-p)とすると、 p(x)=nCxpxqn-x 　となる。 2項分布の期待値（平均） E(x)=np 分散　　　　　　 V(x)=npq 　となる。

期待値について考える。サイコロを3回振る実験では、n=3, p=1/6, q=5/6 であるので、E(x) = 3×1/6 = 1/2 となる。一般に確率変数xの期待値はΣxP(x)であるので、この実験では E(x) = 0×0.579+1×0.347+2×0.069+3×0.005 = 0+0.347+0.138+0.015 = 0.5 　となる。これはnpの値に等しい。

e) 正規分布 2項分布において、nを大きくしていくと、左右対称のつりがね型の分布に近づく。これが正規分布といわれる分布である。

正規分布は数学的に望ましい性質を持った分布身長や知能指数などがこの分布にしたがうといわれている。密度関数

1) 標準化 A君は、あるテストで英語が90点、数学が65点であった。　⇒　英語の方が数学より成績が良かった？？英語の平均点が80点、数学の平均点が50点だった。⇒　英語は平均点より10点高い、数学は平均点より15点高い。数学の方が良い？？英語と数学のどちらが成績が良かったのだろうか？⇒　標準化の必要性（これを応用したものが偏差値）

英語が平均80、標準偏差10の正規分布、数学が平均50、標準偏差20の正規分布にそれぞれしたがうとする。平均や分散の異なるものを比較するとき、平均や分散をそろえ、その相対的な位置によって比較しようというのが標準化の考えである。

標準化は次のような変換である。この例で、英語は(90-80)/10=1 数学は(65-50)/20=0.75 となり英語の方が成績が良いことになる。偏差値は、このzを用いて 50+10×z で求められる。この人の英語の偏差値は60、数学の偏差値は57.5である。

2) 標準正規分布正規分布にしたがう変数について、このような変換をおこなうと、標準正規分布（平均0、分散1の正規分布）になる。標準正規分布では±1の範囲に68.7%、±2の範囲に95.4%、±3の範囲に99.7%が含まれる。