数理統計学(第四回) 分散の性質と重要な法則 浜田知久馬 数理統計学第4回
分散についての性質 V[X+Y]=E[(X+Y-μx-μY)2] =E[(X-μx)2+(Y-μx)2 +2 (X-μY) (Y-μY) ] = E[(X-μx)2]+ E[(Y-μY)2] +2E[(X-μx) (Y-μY)] =V[X]+V[Y]+2・Cov[X,Y] 独立のときは, V[X+Y]=V[X]+V[Y] 数理統計学第4回
分散についての性質 aは定数 V[a+X] = E[(a+X-a-μx)2] =V[X] V[aX]=E[(aX-aμx)2] =E[a(X-μx)2] =a2E[(X-μx)2] =a2 V[X] E[a+X]=a+E[X], E[aX]=a・E[X], 数理統計学第4回
分散についての性質 Z=a1X1+ a2X2+・・・+ apXp V[Z]=ΣΣaiajCov[Xi,Xj] =Σai2 V[Xi]+ΣΣ2aiajCov[Xi, Xj] i < j X1, X2, ・・・ ,Xpが互いに独立の場合 V[Z] =Σai2 V[Xi] =a12V[X1]+a22V[X2]+・・・+ ap2V[Xp] (分散の加法性) 数理統計学第4回
分散についての性質 Z=a1X1+ a2X2 V[Z]= V[a1X1+ a2X2] = E[(a1X1+ a2X2 - a1μ1- a2μ2)2] = E[(a1X1- a1μ1 + a2X2 - a1μ2)2] = E[(a1X1- a1μ1)2 ] + E[(a2X2- a2μ2)2 ] +2E[(a1X1- a1μ1)(a2X2- a2μ2) ] = a12V[X1]+a22V[X2] +2a1a2Cov[X1, X2] 数理統計学第4回
分散・共分散行列 3変数の場合 V[X1] Cov[X1, X2] Cov[X1, X3] V= Cov[X2, X1] V[X2] Cov[X2, X3] Cov[X3, X1] Cov[X3, X2] V[X3] 一般にp変数ある場合, 分散・共分散行列はp×pの対称行列になる. 数理統計学第4回
行列表現 aT=[a1,a2,・・・, ap] a:p行のベクトル xT=[X1,X2,・・・,Xp] x:p行のベクトル V:分散・共分散行列(p×p) Z=aTx V[Z]=aT Va Z=a1X1+ a2X2+ a3X3 の場合について V[Z]を書き下せ. 数理統計学第4回
Z=a1X1+ a2X2+ a3X3の分散 Z=a1X1+ a2X2+ a3X3 V[Z]=aT Va =a12V[X1]+ a1a2Cov[X1,X2]+ a1a3Cov[X1,X3] +a2a1Cov[X2,X1]+ a22V[X2]+a2a3Cov[X2,X3] +a3a1Cov[X3,X1]+ a3a2Cov[X3,X2]+ a32V[X3] 数理統計学第4回
共分散の計算 Z1=a1X1+ a2X2+ ・・・+a3X3=aTx Z2=b1X1+b2X2+ ・・・+b3X3=bTx のとき Cov[Z1,Z2]= Cov[aTx,bTx] =ΣaibjCov[Xi,Xj] =aT Vb V[Z1]=Cov[aTx,aTx] =aT Va 数理統計学第4回
共分散の計算 Z1=a1X1+ a2X2+ a3X3 Z1=b1X1+ b2X2+ b3X3 Cov[Z1,Z2]=aT Vb =a1b1V[X1]+ a1b2Cov[X1,X2]+ a1b3Cov[X1,X3] +a2b1Cov[X2,X1]+ a2b2V[X2]+a2b3Cov[X2,X3] +a3b1Cov[X3,X1]+ a3b2Cov[X3,X2]+ a3b3V[X3] 数理統計学第4回
分散の加法性の応用 平均値の分散は? X1, X2, ・・・ ,Xnが互いに独立に分散σ2の 分布にしたがうとき 数理統計学第4回
分散の加法性の応用 E[X]=0,V[X]=32=9 E[Y]=0,V[Y]=42=16 でかつXとYが独立のとき X+Yの期待値と分散は? 数理統計学第4回
乱数による確認実験 data data; do i=1 to 1000; x=3*rannor(5963); y=4*rannor(5963); z1=x+y;z2=x-y;output; end; proc means mean var std maxdec=2;run; 数理統計学第4回
要約統計量 変数 平均値 分散 標準偏差 --------------------------------- 変数 平均値 分散 標準偏差 --------------------------------- x 0.05 8.72 2.95 y -0.05 16.07 4.01 z1 0.01 25.95 5.09 z2 0.10 23.65 4.86 ---------------------------------- 数理統計学第4回
演習問題 X1,X2,・・・,X6が確率変数でそれぞれ 独立に正規分布N(μ,σ2)に従っているとき,1)~7)の期待値と分散を示せ. 0) Xi: 解答例 期待値μ,分散σ2 数理統計学第4回
演習問題 数理統計学第4回
中心極限定理 Central Limit Theorem 多くの分布が一山分布になるのはなぜだろうか? 例)センター入試,身長,血圧 中心:分布の中心,平均値は 極限:nを大きくすると 正規分布にしたがう. 「和や平均値の分布は山型の分布にしたがう」 数理統計学第4回
平均値の2つの性質とSE 1)平均値の分散(バラツキ)は生データの1/N,標準偏差に直せば1/√Nになる. 2)Nがある程度大きくなれば,平均値の分布は正規分布になる. 数理統計学第4回
乱数実験 A)0,1の一様分布(0~1の間を等しい確率でとる)にしたがう乱数を1万個発生さる. B)一様分布にしたがう乱数を4万個発生させ,4個づつ組にして平均値を計1万個計算する. C)一様分布にしたがう乱数を9万個発生させ,9個づつ組にして1万個の平均値を計算する. 数理統計学第4回
生データのヒストグラム A 0.00 0.30 0.60 0.90 Y1 200 400 度 数 数理統計学第4回
4個の平均のヒストグラム B 0.00 0.30 0.60 0.90 Y4 500 1000 度 数 数理統計学第4回
9個の平均のヒストグラム C 0.00 0.30 0.60 0.90 Y9 500 1000 1500 度 数 数理統計学第4回
実験結果のまとめ 平均値 標準偏差 分散 A)生データ 0.499 0.289 0.0838 平均値 標準偏差 分散 A)生データ 0.499 0.289 0.0838 B)4個の平均 0.499 0.144 0.0206 C)9個の平均 0.500 0.095 0.00906 数理統計学第4回
大数の法則(law of large numbers) 平均値はnを大きくすると,真の値に収束する. 平均値→E(X)=μ (n→∞) limP(|平均値-μ|≧ε)=0 n→∞ マルコフの不等式(Markov’s inequality) チェビシェフの不等式(Chebyshev’s inequality) 数理統計学第4回
マルコフの不等式 X≧0:非負の確率変数 c>0:正の定数 P(X ≧c)≦E(X)/c 例)交通事故による死亡が10を越える確率は? Y=0 if X<c c if X ≧ c 常にY≦Xなので→ E(Y)≦E(X) E(Y)=0×P(Y=0)+c×P(Y=c)=c×P(X ≧ c) E(Y)=c×P(X ≧ c) ≦E(X) 数理統計学第4回
マルコフの不等式 Y=X Y c c X 数理統計学第4回
マルコフの不等式の応用 宝くじで1等2億円が当たる確率は? X:宝くじの賞金金額 P(X ≧ 2億円) E(X)=150円,c= 2億円 = 150円/ 2億円=1/133万 正確な確率は1/500万 数理統計学第4回
チェビシェフの不等式 E(X)=μ,V(X)=σ2 P(|X-μ| ≧c)≦σ2/c2 Y=( X-μ)2とおいてマルコフの不等式を適用 P(Y ≧c2 )≦E(Y)/c2 = σ2 /c2 Y ≧c2 ⇔ |X-μ| ≧c なので P(Y ≧c2 ) =P(|X-μ| ≧c) 数理統計学第4回
チェビシェフの不等式の意味 σ2=1のとき c チェビシェフの上限 正規分布 1 1 0.32 2 0.25(1/22) 0.05 c チェビシェフの上限 正規分布 1 1 0.32 2 0.25(1/22) 0.05 3 0.11(1/32) 0.003 4 0.06(1/42) <0.0001 数理統計学第4回
日本人身長の例(浜田世代) 男性 平均:170.1 SD:5.6 単位(cm) 平均±SD :164.5~175.7 数理統計学第4回
日本人身長の例(浜田世代) 女性 平均:157.3 SD:5.0 単位(cm) 平均±SD :152.3~162.3 数理統計学第4回
大数の法則 にチェビシェフの不等式を適用すると n→∞のとき右辺は0に収束するから 数理統計学第4回