第６章数え上げ理論と確率 B4 酒井　隆行.

第６章数え上げ理論と確率 B4 酒井　隆行

6.1 数え上げ数え上げ理論は、実際に列挙することなしに、“幾つあるか”という問に答えようとするものである。例 “nビットの数は何個あるか” “n個の異なる要素の順番付けは何通りあるか” などなど

和法則と積法則和法則２つの互いに素な集合の１つからの要素の選び方の数が、集合のサイズの和に等しい。
　２つの互いに素な集合の１つからの要素の選び方の数が、集合のサイズの和に等しい。すなわち、AとBが共通部分をもたないとき、が成り立つ。

積法則順序対の選び方の数が、最初の要素の選び方の数と２番目の要素の選び方の数との積に等しい。すなわち、AとBが２つの有限集合であるとき、が成り立つ。

文字列有限集合Sの上での文字列とは、Sの要素の文字列である。たとえば、長さ３の２進数列は次の８通りある。 000, 001, 010, 011, 100, 101, 110, 111 長さkの文字列のことをk-文字列と呼ぶことがある。文字列sの部分文字列s’とは、sの連続する要素からなる順序列をいい、k-部分文字列とは、長さkの部分文字列のことである。集合Sの上でのk-部分列は、だけ存在する。

順列有限集合Sの順列とは、Sの要素をすべて１度ずつ用いて作った順序列をいう。たとえば、 S={a,b,c}のとき、Sの順列は次の６通りである。 abc, acb, bac, bca, cab, cba Sのk-順列とは、Sの中から重複なしにk個の要素をとって並べた列のことである。集合{a,b,c,d}の2-順列は以下の１２通りである。 ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc n-集合のk-順列の数は、で与えられる。

組み合わせ n-集合のk-組み合わせとは、単にSのk-部分集合のことである。4-集合{a,b,c,d}の2-組み合わせは、以下の６通りである。 ab, ac, ad, bc, bd, cd n-集合のk-組み合わせの数は、で与えられる。

２項係数という記号(nチューズkと発音する)で、n-集合のk-組み合わせの個数を書くことにする。これらの数は2項係数としても知られている。これは、これらが２項展開の係数として現れるからである。

２項係数の上下界下界 1≤k≤nのとき、次のような下界がある。

上界 Stirlingの公式から得られる不等式k!≥(k/e)ᵏを用いると、下のような上界が得られる。

すべての0≤k≤nに対して帰納法を用いると次の上界を証明することができる。ただし、便宜上と仮定しておく。

k=λnのとき（ただし、0≤λ≤1）、上界は次のように書き直すことができる。ここで、は（２進）エントロピー関数であり、便宜上、0lg0=0と仮定しておく。

6.2 確率確率は標本空間Sによって定義されるが、これは各要素が根元事象であるような集合である。各根元事象は試行によって起こりうる結果とみなすことができる。事象とは、標本空間の部分集合のことである。事象Sは全事象と呼ばれ、事象Øは空事象と呼ばれる。A,BがA∩B＝Øを満たす事象のとき、これらは互いに素であるという。

確率公理標本空間Sに関する確率分布とは、Sの事象から次の確率公理を満たす実数への写像である。任意の事象Aに対してPr{A}≥0である。
Pr{S}=1 互いに素な任意の２つの事象Aに対して、である。より一般的には、どの２つも互いに素である任意の事象列　　　　　　　に対してが成り立つ。

離散確率分布確率分布が有限の標本空間または加算無限の標本空間上で定義されているとき、離散確率分布という。Sを標本空間としたとき、任意の事象Aに対してが成り立つ。また、Sが有限ですべての根元事象sϵSが確率分布をもつとき、Sに関する一様確率分布という。

連続一様確率分布 a≤c≤d≤bであるような任意の閉区間[c,d]に対して、連続一様確率分布は、事象[c,d]の確率をと定義する。

条件付き確率と独立性条件付き確率事象Bが起こるという条件の下での事象Aの条件付き確率はPr{B}≠0のとき、次のように定義される。

独立または、Pr{B} ≠0のときはこれと等価な条件が成り立つとき、事象A,Bは独立であるという。　　　　　　　　を事象の集合とするとき、すべての1≤i<j≤nに対してであるとき、これらの事象は対ごとに独立であるという。この集合のすべてのk-部分集合　　　　　　　　が2≤k≤nと　　　　　　　　　　に対してを満たすとき、これらは相互独立だという。

Bayesの定理（１）条件付き確率の定義より、確率が0でない２つの事象AとBに対して、次式が成り立つ。
これをPr{A|B}に関して解くと、次式を得る。　　　　　　　　　　　　　　　　　　　　　（１）さらにPr{B}は、次のように書ける。これを、（１）式に代入すると、

6.3 離散確率変数離散確率変数Xとは、有限または加算無限の標本空間Sから実数への関数である。確率変数Xと実数xに対して、事象X=xを{sϵS:X(s)=x}と定義する。したがって、である。関数は、確率変数Xの確率密度関数である。

XとYが確率変数であるとき、関数をXとYの結合確率密度関数という。yを定数とするとき、が成り立ち、同様に定数xに対して、が成り立つ。条件付き確率の定義を用いると、次式を得る。すべてのx,yに対してが成り立つとき、XとYは独立であると定義する。

確率変数の期待値離散確率変数Xの期待値とは、であり、上の和が有限か絶対収束する場合には明確に定義される。２つの確率変数の和の期待値は、それぞれの期待値の和に等しい。すなわち、E[X],E[Y]が定義されるなら、である。期待値をμと記すこともある。

Xを任意の確率変数とするとき、任意の関数g(x)は新たな確率変数g(X)を定義する。g(X)の期待値が定義されるなら、である。g(x)=axとして、aを任意の定数とするとき、が成り立つ。したがって、期待値は線形である。すなわち、が成り立つ。

２つの確率変数X,Yが独立で、それぞれに対して期待値が定義されているとき、次式が成り立つ。一般に、n個の確率変数が相互独立ならば、である。

確率変数Xが自然数N={0,1,2,…}からの値をとるとき、

分散と標準偏差平均がE[X]である確率変数Xの分散は、次のとおりである。確率変数Xの分散とaXの分散は次の関係がある。 XとYが独立な確率変数であるとき、である。一般に、n個の確率変数が対ごとに独立であれば、次式が成り立つ。確率変数Xの標準偏差はXの分散の平方根をとったものである。標準偏差をσと書いたりする。この記号を用いると分散はと記される。

6.4 幾何分布と２項分布確率pで起こる成功と、確率q=1-pで起こる失敗の２通りの結果しかないBernoulli試行を例にして、幾何分布および２項分布について考えていく。

幾何分布確率変数Xを成功を得るのに必要な試行回数とすると、k≥1に対して、が成り立つ。上を満たす確率分布を２項分布という。幾何分布の期待値は、分散は、

２項分布確率変数Xをn回の試行中の成功の回数と定義すると、が成り立つ。上の式を満たす確率分布を２項分布という。便宜上、という記号を用いる。

Xを２項分布b(k;n,p)に従う確率変数、Xᵢをi回目の試行における成功回数を表す確率変数とすると、期待値は

より、Xᵢの分散はであり、を得る。

２項分布b(k;n,p)は、kが0からnまで変化するにつれて平均値npに達するまで増加を続け、その後減少する。連続する２項の比を取ってみると、

k<(n+1)pに対してはb(k;n,p)>b(k-1;n,p)が成り立ち、k>(n+1)pに対してはb(k;n,p)<b(k-1;n,p)が成り立つ。この分布は、k=(n+1)pが整数の場合はb(k;n,p)=b(k-1;n,p)であり、よってこの分布は、k=(n+1)pとk-1=(n+1)p-1=np-qに二つの極大値を持つ。そうでないときは、np-q<k<(n+1)pという範囲にある１つの整数値kにおいてのみ極大値をとる。

補題6.1 n≥0とし、0<p<1,q=1-p,0≤k≤nとする。このとき、次式が成り立つ。

証明を用いると、

6.5　２項分布の両端部分１回の成功確率をpとするn回のBernoulli試行において、ちょうどk回成功する確率よりも、少なくともあるいは高々k回成功する確率のほうがより興味深い場合が多い。この節では、２項分布の両端部分について考える。

定理6.2 成功確率pであるn回のBernoulli試行 X：全成功回数を表す確率変数このとき、0≤k≤nに対して少なくともk回成功する確率はである。

証明 6.1の練習問題から得られた次の不等式を利用する。また、であるので、

系6.3 成功確率pであるn回のBernoulli試行 X:全成功回数を表す確率変数このとき、0≤k≤nに対して高々k回成功する確率は

定理6.4 成功確率p,失敗確率q=1-pであるn回のBernoulli試行 X:全成功回数を表す確率変数とする。このとき、0<k<npに対してk回より少なく成功する確率は

証明幾何数列の級数和を評価する。 i=1,2,…,kに対して、次式を得る。

もし、ならば、0<i≤kに対してが成り立つ。この操作を繰り返せば0≤i<kに対してが得られる。

よって、

系6.5 成功確率pであるn回のBernoulli試行 X:全成功回数を表す確率変数このとき、np<k<nに対してk回より多く成功する確率は次式で与えられる。

定理6.6 i=1,2,…,nに対するi番目の試行において成功確率がpᵢ,失敗確率がqᵢ=1- pᵢであるn回のBernoulli試行 X:全成功回数を表す確率変数 μ=E[X]とおくと、r>μに対して次式が成り立つ。

証明任意のα>0に対して関数はxに関して強い意味で増加関数であるので、が成り立つ。ここで、 αは後に決定される。Markovの不等式により、を得る。

i=1,2,…,nに対して Xᵢ:i回目のBernoulli試行が成功なら１、失敗なら０となる確率変数とすると、が成り立つ。

X-μを置き換え、確率変数Xᵢが相互独立ならば確率変数は相互独立になることから、期待値の定義から、である。

であるので、が成り立つ。よって次式を得る。

と選べば次式が成り立つ。

系6.7 成功確率p,失敗確率q=1-pであるn回のBernoulli試行このとき、r>npに対して、証明２項分布に対してE[X]=npが成り立つならばμ=npである。

6.6 確率を用いた解析例この節では３つの例を用いて確率を用いた解析例を示す。部屋にいるk人のなかで２人が同じ誕生日である確率ボールを箱に無作為に入れる場合硬貨投げにおける連続して表の出る“列”

誕生日パラドックス問題部屋にいる人のうち２人が同じ日にうまれた確率が1/2を超えるためには部屋に何人の人がいなければならないか? 準備それぞれの人に整数1,2,…,kの番号をつける。 k:人の数１年はn=365（簡単のため、うるう年はなし） bᵢ:i番目の人がうまれた日（i=1,2,…,k 1≤bᵢ≤n）誕生日は１年のn日において一様に分布していると仮定

i=1,2,…,kとr=1,2,…,nに対してが成り立つ。２人の人間iとjが同じ誕生日である確率は、誕生日の無作為な選択が独立であることに依存する。もし誕生日が独立であるならば、iの誕生日とjの誕生日がある日rである確率はとなる。

よって、部屋にいる２人の人間の誕生日が同じになる確率はである。 k人のうちの少なくとも２人の誕生日が同じになる確率は補事象を考えることにより解析できる。

K人が異なった誕生日である事象はである。ここで、Aᵢはi+1の誕生日がすべてのj≤iに対してjの誕生日と異なる事象である。すなわち、である。と書くことができるので、漸化式をえる。ここで、初期条件としてとする。

が異なるならばn日から選ばれない n-(k-1)日が存在するので、i=1,2,…,k-1に対してとなる条件確率は(n-k+1)/nである。先ほどの漸化式を繰り返し適用することにより、を得る。

によりのとき次式を得る。 k(k-1)≥2nln2のとき、k人すべての誕生日が異なる確率が1/2以下となる。よって23人以上いれば少なくとも２人の誕生日が同じになる確率が1/2以上となる。

ボールと箱同一のボールを1,2,…,bと番号付けられたb個の箱に無作為に入れるという過程を考える。ボールを入れるのは独立事象で、それぞれのボールはどの箱にも等確率で入れられる。ボールがある特定の箱に入る確率は1/bである。したがって、ボールを入れる過程は成功確率1/bのBernoulli試行の列である。

ある特定の箱に幾つのボールが入るか？特定の箱に入るボールの数は２項分布b(k;n,1/b)に従う。もしn個のボールが入れられるならば、特定の箱に入るボールの数の期待値はn/bである。

ある特定の箱にボールが１つ入るまでに平均何回ボールをなげなければならないか？
箱にボールが入るまでにボールを投げ入れる回数は確率1/bの幾何分布に従うので、成功までボールを投げ入れる平均回数は1/(1/b)=bである。

すべての箱に少なくとも１個のボールが入るまで何回ボールを投げないといけないか？
空の箱にボールが入れられると“当たり” b回当たるのに必要なボールの投げ入れ回数の平均値nを求める。 i番目の段階をi-1回目の当たりの後からi回目の当たりまでのボールの投げ入れと定義する。 i番目の段階におけるそれぞれのボールの投げ入れに対して、ボールの入ったi-1の箱とb-i+1の空の箱が存在する。よって、i番目の段階におけるすべてのボールの投げ入れに対して当たる確率は(b-i+1)/bである。

nᵢ: i番目の段階におけるボールの投げ入れ回数 b回の当たりを得るために必要な投げ入れ回数はである。それぞれの確率変数はnᵢは成功確率(b-i+1)/bの幾何分布をもつので次式を得る。

期待値の線形性からしたがって、すべての箱にボールが入るまでにはおおよそblnb回の投げ入れが必要である。

連続硬貨投げ公正な硬貨をn回投げるとする。連続して表が出る最大の列はどの程度になると期待されるかを考える。答えはまず表が連続する最大列の平均長がO(lgn)であることを証明する。 :i回目の硬貨投げから始めてk回以上表が続けて出る事象(1≤k≤nかつ1≤i≤n-k+1) 任意の事象に対してk回すべてが表となる確率はp=q=1/2の幾何分布である。

に対してである。任意の有限または加算無限の事象列について成り立つブールの不等式により、事象の和集合の確率は各事象の確率の和を超えないので、任意の位置から始めて以上表が続いて起こる確率はとなる。

したがって、任意の列が以上の長さをもつ確率は高々1/nであるので、最大列長より短くなる確率は少なくとも1-1/nである。よって平均長はで上から押さえられる。次に下界の証明を行う。

長さの列を見つける。を得る。よって、表が以上続く列の位置がiで始まらない確率は高々である。N個の硬貨投げをそれぞれが回の連続する硬貨投げからなる少なくとものグループに分けることができ、これらは互いに独立な硬貨投げになる。

これらのグループのそれぞれが長さの表が続く列にならない確率はしたがって、最大列長がを超える確率はである。最大列長の平均値は少なくともである。

第６章数え上げ理論と確率 B4 酒井　隆行.

Similar presentations

Presentation on theme: "第６章数え上げ理論と確率 B4 酒井　隆行."— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

第６章 数え上げ理論と確率 B4 酒井 隆行.

Similar presentations

Presentation on theme: "第６章 数え上げ理論と確率 B4 酒井 隆行."— Presentation transcript:

Similar presentations

About project

フィードバック

第６章数え上げ理論と確率 B4 酒井　隆行.

Presentation on theme: "第６章数え上げ理論と確率 B4 酒井　隆行."— Presentation transcript: