第2章 確率と確率分布 統計学 2006年度.

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
数理統計学第1回 1 数理統計学 ( 第一回) 確率変数とは? 浜田知久馬. 数理統計学第1回 2 世の中は不確定なことが多い 決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき,確率変数によって,物事 を確率的に記述できると便利なことが多 い.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
2 年 確率の導入 指導手順 身の回りの生活の中の確率の話をする。 10 円玉の表と裏を確認する。 本時の課題を提示する。 ( シート 4) 実験をする。 準備物 ワークシート、 10 円玉 ×2× 生徒数 結果をエクセルに入力 グラフから言えるこ とを発表する。 確率についてまとめる。 教科書の練習問題をする。
統計学第2回 「確率と確率分布」 受講者の数学ができる程度について の 度数分布図。先週のアンケート結果 を, R を使って x
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
経済統計学 第2回 4/24 Business Statistics
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
第2章 確率と確率分布 統計学 2010年度.
統計解析 第7回 第6章 離散確率分布.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
全加算回路 A, Bはそれぞれ0または1をとるとする。 下位桁からの繰り上がりをC1とする。(0または1)
第1章 統計学の準備 ー 計量経済学 ー.
統計学 10/25(木) 鈴木智也.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計解析 第8回 第7章 2項分布.
統計学 11/13(月) 担当:鈴木智也.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
確率の考え方の基礎 二項分布と正規分布 2006年1月25日 作成:本間聡.
アルゴリズムイントロダクション第5章( ) 確率論的解析
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
11.確率モデル 確率・・・不確実性の経済学や金融やファイナンス で重要 密度関数がある場合に期待値を取る計算を中心に、紹介.
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
統計解析 第8回 第7章 2項分布.
統計学 11/19(月) 担当:鈴木智也.
6 確率 1章 確率 §3 確率の求め方         (4時間).
数理統計学  第8回 第2章のエクササイズ 西山.
第3章 重回帰分析 ー 計量経済学 ー.
数理統計学  第8回 西山.
第3章 重回帰分析 ー 計量経済学 ー.
第7回 二項分布(続き)、幾何分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
橋本 保健統計演習への準備.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
第3回 確率変数の平均 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
Basic Tools B4  八田 直樹.
第2日目第1時限の学習目標 順列、組み合わせ、確率の入門的知識を学ぶ。 (1)順列とは? (2)組み合わせとは? (3)確率とは?
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
様々な情報源(4章).
第4章 統計的検定 (その2) 統計学 2006年度.
経営学研究科 M1年 学籍番号 speedster
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
物理フラクチュオマティクス論 応用確率過程論 (2006年4月11日)
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
確率と統計 確率編- 平成20年10月29日(木).
確率と統計 確率編- 平成19年10月25日(木) 確率と統計2007.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
確率統計学 (データ解析学) 書き込み式ノート(Ver.1) 担当教員:綴木 馴.
Presentation transcript:

第2章 確率と確率分布 統計学 2006年度

Ⅰ 確率の定義 Ⅱ 確率の公理と計算定理 Ⅲ 確率分布 a) 先験的確率 b) 経験的確率 c) 主観的確率 a) 確率の公理 Ⅰ 確率の定義 a) 先験的確率 1) 先験的確率の定義 2) 先験的確率の誤用 b) 経験的確率 1) 経験的確率の定義 2) 経験的確率の特徴 c) 主観的確率 1) 主観的確率の定義 2) 主観的確率の特徴 Ⅱ 確率の公理と計算定理 a) 確率の公理 b) 確率の計算定理 1) 加法定理 2) 条件つき確率と乗法定理 Ⅲ 確率分布 a) 確率変数 b) 確率分布と確率密度 c) 期待値と分散 d) 2項分布 e) 正規分布 1) 標準化 2) 標準正規分布

Ⅰ 確率の定義 確率 - ある事象が起こるか起こらないか確実には分からないとき、その事象の起こる「確からしさ」を数値で表したもの Ⅰ 確率の定義 確率 - ある事象が起こるか起こらないか確実には分からないとき、その事象の起こる「確からしさ」を数値で表したもの 確率の定義には次の3とおりの方法がある。 先験的確率 経験的確率 主観的確率

(例1) コインを1枚投げたときに表の出る確率 a) 先験的確率(古典的確率、数学的確率などともいう)  1) 先験的確率の定義 ある行動の起こりうる結果が全部でn通りあり、そのうち事象Aにあてはまる結果がa通りあるとする。それらが同様に確からしく、互いに重複しない場合、     を事象Aの確率とする。 (例1) コインを1枚投げたときに表の出る確率 起こりうる結果 - 表、裏の2通り(n=2) 事象A - 表が出る あてはまる結果 - 1通り(a=1)      ⇒ 

(例2) サイコロを1個投げたときに5以上の目の出る確率 (例2) サイコロを1個投げたときに5以上の目の出る確率 起こりうる結果 - 1,2,3,4,5,6の6通り(n=6) 事象A - 5以上の目が出る あてはまる結果 - 5,6の2通り(a=2)      ⇒  これらの例では、おこりうるすべての結果が分かり、同様に確からしいとみなせるので、実験を実際におこなってみなくても、確率を評価できる。   よって、先験的確率といわれる。

2枚のコインを同時に投げたときに少なくとも1枚が表である確率を考える。  2) 先験的確率の誤用 2枚のコインを同時に投げたときに少なくとも1枚が表である確率を考える。 起こりうる結果 - 表表、表裏、裏裏の3通り(n=3) 事象A - 少なくとも1枚が表である あてはまる結果 - 表表、表裏の2通り(a=2)      ⇒             「ローベルバルの過ち」といわれる問題 正しくは次の通り(パスカルがこのように修正した) 起こりうる結果 - 表表、表裏、裏表、裏裏の3通り(n=4) あてはまる結果 - 表表、表裏、裏表の3通り(a=3)      ⇒ 起こりうる結果が「同様に確からしい」とはいえない

「雨が降る」と「雨が降らない」は同様に確からしいとはいえない。 ⇒ 先験的確率によって確率を定義することの限界 明日、雨が降る確率(降水確率) 起こりうる結果 - 雨が降る、雨が降らないの2通り(n=2) 事象A - 雨が降る あてはまる結果 - 1通り(a=1)      ⇒ 「雨が降る」と「雨が降らない」は同様に確からしいとはいえない。  ⇒ 先験的確率によって確率を定義することの限界

b) 経験的確率  1) 経験的確率の定義 同じ条件のもとで繰り返し十分大きい観察がおこなわれたとき、観察総数nの中で、特定の事象Aとなる場合の数がaであったならば、     を事象Aの経験的確率という。 (例1) 男児の出産確率 多数の出産例を観察した結果求められたもの。 (例2) 降水確率 同様な天気図(雲の配置など)を多数観察し、それから降水確率を求めている。

すべての結果がわからない場合でも確率を求めることができる。 おこりうるすべての結果が同様に確からしいとはいえない。  2) 経験的確率の特徴 すべての結果がわからない場合でも確率を求めることができる。 おこりうるすべての結果が同様に確からしいとはいえない。 同じ条件のもとで繰り返し十分大きい観察が不可能な事象については経験的確率が定義できない。

事象Aに対する個人の確信の度合いを数値で表したものP(A)を事象Aの主観的確率という。 c) 主観的確率  1) 主観的確率の定義 事象Aに対する個人の確信の度合いを数値で表したものP(A)を事象Aの主観的確率という。 (例) 春の天皇賞でディープインパクトが勝つ確率は90%である。  ⇒ 競馬には対戦相手、枠順、血統、騎手、馬の調子、ローテーション、馬場状態、開催競馬場などの条件がある。これら同一の条件で、繰り返し十分な観察をすることは不可能である。

主観的確率は個人の確信によって定まるので、同じ事象に対しても確率の評価は異なる。 ⇒ このことから賭けがはじめて成立する。  2) 主観的確率の特徴 主観的確率は個人の確信によって定まるので、同じ事象に対しても確率の評価は異なる。  ⇒ このことから賭けがはじめて成立する。 (例) 日本シリーズで千葉ロッテと阪神のどちらが勝つか。 千葉ロッテに賭ける人 - 千葉ロッテが勝つ確率(主観的確率)が高い。 阪神に賭ける人- 阪神が勝つ確率(主観的確率)が高い。  この両者が存在することによって、初めて賭けが成立する。 全員が「千葉ロッテが勝つ確率が高い」と思っていたら賭けは成立しない。 しかし、勝つ確率が低い方に賭けることもある。それは当たった時にもらえる金額が多くなるからである。 ⇒ 期待値の大きさで判断している。

主観的確率 経験的確率 先験的確率

Ⅱ 確率の公理と計算定理 a) 確率の公理 1. どのような事象Aに対しても、確率の値は常に0と1の間の値をとる。すなわち、 Ⅱ 確率の公理と計算定理 a) 確率の公理 1. どのような事象Aに対しても、確率の値は常に0と1の間の値をとる。すなわち、 2. おこりうる事象全体の集合をSとすれば、Sの確率は1である。 3. A,B,… が同時に起こらない事象(このとき、A,B,… を排反事象という)のとき、A,B,… のいずれかが起こる確率はそれぞれの事象が起こる確率の和に等しい。すなわち

b) 確率の計算定理 松中がホームランを打ち、ホークスが勝つ確率 → A1とB1がともに起きる確率である。これをA1とB1の同時確率といい、P(A1∩B1)とあらわす。(∩は「かつ」(and)を表す記号。capとよぶ。) 松中がホームランを打つかどうかに関わらず、ホークスが勝つ確率 → A1が起こるかどうかに関わらず、B1が起きる確率である。これをB1の周辺確率といい、P(B1)とあらわす。

1) 加法定理 (例) ホークスが勝つか、引き分ける確率 (∪は「または」(or)を表す記号。cupとよぶ。) <排反事象の場合> 加法定理 1) 加法定理 (例) 松中がホームランを打つか、ホークスが勝つ確率 (∪は「または」(or)を表す記号。cupとよぶ。) <排反事象の場合>   (例) ホークスが勝つか、引き分ける確率 加法定理 排反事象の場合の加法定理

2) 条件つき確率と乗法定理 P(E)>0のとき、事象Eの起こることを条件として、事象Fが起こることを、(Eを条件とする)Fの条件つき確率といい、P(F|E)であらわす。 (例) 松中がホームランを打ったときに、ホークスが勝つ確率     ⇒ A1を条件とするB1の条件つき確率P(B1|A1)である。     この条件つき確率を用いて、松中がホームランを打ち、ホークスが勝つ確率を考えると、   とあらわすことができる。これを乗法定理という。   よって条件つき確率P(B1|A1)は   となる。

<独立事象の乗法定理> 事象Eが起こっても起こらなくても事象Fの確率に変化がないとき、すなわちP(F|E) = P(F|Ec) = P(F)のとき、事象Eと事象Fは独立であるという。( Ec はEが起こらないという状況をあらわす)   この例で雨が降った場合の朝青龍が勝つ条件つき確率は   雨が降らない場合の朝青龍が勝つ条件つき確率は   となり、 P(B1|A1) = P(B1|A2) = P(B1)であることから、雨が降るか降らないかと、朝青龍が勝つか負けるかは独立である。 事象Eと事象Fが独立である場合、乗法定理は   となる。

○○○, ○○×, ○×○, ×○○, ○××, ×○×, ××○, ××× Ⅲ 確率分布 a) 確率変数 サイコロを3回振る実験を考える。 1の目が出た場合を○、1の目以外が出た場合を×とあらわすと、起こりうる結果は ○○○, ○○×, ○×○, ×○○, ○××, ×○×, ××○, ×××  の8通りである。

ここで、1の目が何回出たかによって分類するなら 2回目に振ったサイコロの目は1回目に振ったさいころの目と は独立であるので、独立事象の乗法定理が用いられる。

1の目が出た回数を x 回とし、それに対応する確率を P(x) とあらわすと、次のように整理できる。 このようにとりうる値のそれぞれにある確率が対応している変数を確率変数といい、その対応関係を確率分布という。

b) 確率密度 右の図のようなルーレットがある。 xは連続変数なので、0から359までの360通り以外に、42.75, 108.268 などとりうる値が無限にある。 そのため、P(x=60)の確率を求めることはできない x ルーレットの針と真上とのなす角をx度とする。ここで、x=60度となる確率を考えると、

連続型確率変数の場合には、x=60といった確率を求めることはできないので、代わりに といった微小区間に入る確率を考える。 この確率を確率密度という。 連続型確率変数の確率分布は、確率密度を線で結んだ密度関数 f(x)によってあらわす。(グラフの場合も、数式の場合もある) ルーレットの例の場合の密度関数は次のようになる。 f(x) 1/360 360

c) 期待値と分散 次のようなくじがあったとする。 このくじを1枚購入したときに、もらえると期待できる金額は このくじの期待値は50(円)であるという

このくじが、全部で5万本あったとすると、下のような度数分布表であらわすことができる。 もらえる金額の算術平均は2500000÷50000=50(円)であり、期待値に一致する。 期待値=確率変数の算術平均

サイコロを3回振る実験で1の目が出た回数をxとするなら、xの期待値は   となり、1の目が出る回数の期待値は0.5回である。 またサイコロを6回振る実験をおこなうと   となるので、 1の目が出る回数の期待値は   となり、6回ふれば1の目が1回ぐらい出るという直感に一致する。

期待値は        とあらわすことができる。 分散は              となる。 連続型確率変数の場合は   となる。

d) 2項分布 サイコロを3回振る実験は、A(1の目が出る)かB(1の目が出ない)かという2つの結果しか起こらない試行をn回繰り返したとき、Aという結果がx回おこるということである。このようなxの確率分布は2項分布といわれる。 Aが起こる確率をp、Bが起こる確率をq(=1-p)とすると、 p(x)=nCxpxqn-x   となる。 2項分布の期待値(平均) E(x)=np 分散       V(x)=npq  となる。

期待値について考える。 サイコロを3回振る実験では、n=3, p=1/6, q=5/6 であるので、E(x) = 3×1/6 = 1/2 となる。 一般に確率変数xの期待値はΣxP(x)であるので、この実験では E(x) = 0×0.579+1×0.347+2×0.069+3×0.005 = 0+0.347+0.138+0.015 = 0.5  となる。これはnpの値に等しい。

e) 正規分布 2項分布において、nを大きくしていくと、左右対称のつりがね型の分布に近づく。 これが正規分布といわれる分布である。

正規分布は数学的に望ましい性質を持った分布 身長や知能指数などがこの分布にしたがうといわれている。 密度関数

1) 標準化 A君は、あるテストで英語が90点、数学が65点であった。 ⇒ 英語の方が数学より成績が良かった?? 英語の平均点が80点、数学の平均点が50点だった。⇒ 英語は平均点より10点高い、数学は平均点より15点高い。数学の方が良い?? 英語と数学のどちらが成績が良かったのだろうか?⇒ 標準化の必要性(これを応用したものが偏差値)

英語が平均80、標準偏差10の正規分布、数学が平均50、標準偏差20の正規分布にそれぞれしたがうとする。 平均や分散の異なるものを比較するとき、平均や分散をそろえ、その相対的な位置によって比較しようというのが標準化の考えである。

標準化は次のような変換である。 この例で、英語は(90-80)/10=1 数学は(65-50)/20=0.75 となり英語の方が成績が良いことになる。 偏差値は、このzを用いて 50+10×z で求められる。この人の英語の偏差値は60、数学の偏差値は57.5である。

2) 標準正規分布 正規分布にしたがう変数について、このような変換をおこなうと、標準正規分布(平均0、分散1の正規分布)になる。 標準正規分布では±1の範囲に68.7%、±2の範囲に95.4%、±3の範囲に99.7%が含まれる。