数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回
確率変数の特性量 期待値E[X]:Xがしたがう確率分布の平均 分散V[X]:Xのバラツキ度合 標準偏差:√分散 これらは,どのように計算し,どのような意味を持つのだろうか. 数理統計学第2回
年末ジャンボ宝くじの期待値 1枚300円×1000万本=30億円 年末ジャンボ宝くじの期待値 1枚300円×1000万本=30億円 1等:2億円×2本=4億円 1等前後賞:5千万円×4本=2億円 1等組違い賞:10万円×198本=1980万円 2等:1千万円×3本=3千万円 3等:100万円×40本=4千万円 4等:1万円×1000本=1000万円 5等:3000円×10万本=3億円 6等:300円×100万本=3億 さよなら20世紀賞:5万円×3千本=1億5千万円 賞金合計総額:14億4980万円。 期待値: 14億4980万円/1000万=144.98円 数理統計学第2回
数理統計学第2回
期待値計算の操作 1枚くじをかったときの賞金金額(確率変数) n本の宝くじ,a通りの起こり得る場合(賞金) 度数 f1 f2 ・・・ fa 相対度数 p1 p2 ・・・ pa xi/n 数理統計学第2回
確率変数Xの期待値 E[X]:期待値(expected value) Σx・p(x) 離散分布 E[X]= ∫x・f(x)dx 連続分布 期待値の公式 E[a1X1+ a2X2+・・・+ anXn] =a1 E[X1]+ a2 E[X2]+・・・+ an E[Xn] 宝くじを5枚買ったときの期待値は? 数理統計学第2回
人はなぜ宝くじを 買うのだろうか? 夢を買うため? 2本に1本300円当たる宝くじを買う人が いるだろうか? 一攫千金狙い 期待値は145円だが,SDは95053円 300円で10万円弱のバラツキの期待感 数理統計学第2回
宝くじの購入理由 http://www.takarakuji.nippon-net.ne.jp/data2.html#4 数理統計学第2回
分散 平均値μ=E[X]からどれくらい離れた点にばらつくか? (X-μ)2 の期待値:V[X]=E[(X-μ)2] =E[X2]-2μE[X]+μ2 = E[X2]-μ2 Σ(x-μ)2・p(x) 離散分布 V [X]= ∫(x-μ)2・f(x)dx 連続分布 数理統計学第2回
期待値の計算例(二項分布) 数理統計学第2回
疑問点 Σは0からnまでのはず,1からnまででいいのか? 二項分布(4,p)の場合 0・4C0p0(1-p)4 0 0・4C0p0(1-p)4 0 +1・4C1p1(1-p)3 + 4p1(1-p)3 E[X]= +2・4C2p2(1-p)2 = +12p2(1-p)2 +3・4C3p3(1-p)1 +12p3(1-p)1 +4・4C4p4(1-p)0 + 4p4(1-p)0 数理統計学第2回
疑問点の続き 期待値計算にはx=0の項は寄与しない. 黒字は{p+(1-p)}3なので1 4p・ p0(1-p)3 4p・3C0p0(1-p)3 E[X]=+ 4p・3p1(1-p)2 = + 4p・3C1p1(1-p)2 + 4p・3p2(1-p)1 + 4p・3C2p2(1-p)1 + 4p・ p3(1-p)0 + 4p・3C3p3(1-p)0 =4p 期待値計算にはx=0の項は寄与しない. 黒字は{p+(1-p)}3なので1 数理統計学第2回
分散の計算例(二項分布) 数理統計学第2回
期待値・分散の計算例(一様分布) f(x)=1 (0≦x≦1) =0 (x<0, x>1) f(x)=1 (0≦x≦1) =0 (x<0, x>1) E[X]=∫xf(x) dx= ∫01xdx=[x2/2] 01 =1/2-0=1/2 V[X]=E[X2]-μ2 =∫x2dx-1/4 =[x3/3] 01-1/4 = 1/3-0-1/4=1/12 数理統計学第2回
モーメント 原点周りのk次のモーメントμ(ミュー) 離散分布:μk=Σxk・p(x) 連続分布:μk=∫xk・f(x)dx 平均周りのk次のモーメントν(ニュー) 離散分布:ν k=Σ(x- μ1)k・p(x) 連続分布:νk=∫(x- μ1)k・f(x)dx 数理統計学第2回
代表的なモーメント統計量 μ1 :平均 ν2 :分散 β1 = ν3/σ3:歪度(ワイド) skewness ν2 :分散 β1 = ν3/σ3:歪度(ワイド) skewness β2 = ν4/σ4 -3 :尖度(センド) kurtosis 正規分布: μ1=μ, ν2= σ2 , β1=0, β2=0 二項分布: μ1=nπ, ν2=nπ(1ーπ) 数理統計学第2回
積率母関数 モーメント統計量を求めることは簡単ではない. 積率母関数M(θ):moment generating function モーメントを計算するための道具 離散分布: M(θ)=E[eθx]= Σ eθx・p(x) 連続分布: M(θ)=E[eθx]= ∫ eθx・f(x)dx 数理統計学第2回
マクローリン展開 関数 f(x) の x=a におけるテイラー展開 数理統計学第2回
テイラー展開において、特に a=0 としたときの級数をマクローリン展開という。 数理統計学第2回
f(x)= eθxの微分 f(x)= eθx ⇒ f(0)= e0 =1 f'(x)=θeθx ⇒ f'(0)=θe0=θ ・・・ fk(x)=θk eθx ⇒ fk(0)=θke0=θk 数理統計学第2回
積率母関数とモーメント 数理統計学第2回
積率母関数 (1)M(θ)を1階微分してθ=0とすると, E[X](期待値)が得られる. (2)M(θ)を2階微分してθ=0とすると, (3)M(θ)をk階微分してθ=0とすると, E[Xk]が得られる. 積率母関数を用いれば,原点周りのモーメントが 容易に計算できる. 数理統計学第2回
正規分布の例 数理統計学第2回
正規分布の例 数理統計学第2回
正規分布のモーメント M(θ)=exp(μθ+σ2θ2/2) M’(θ)=(μ+ σ2θ) exp(μθ+σ2θ2/2) V[X]=E[X2]- E[X] 2 = σ2 +μ2 - μ2 = σ2 数理統計学第2回
2項分布の例 数理統計学第2回
2項分布の例 数理統計学第2回
演習問題1 Xが1,2,・・・,10までの値を等しく0.1の確率でとる確率変数であるとする. 1)確率関数 2)累積分布関数 3)期待値 4)原点周りの2次のモーメント 5)分散 6)標準偏差 7)メディアン を求めよ. 数理統計学第2回
演習問題2 1.Y=X 2 は確率変数と考えられるか. 2.Yの確率関数と分布関数を示すこと 3.Yの期待値,分散,標準偏差は? 4.E[Y]をXの特性量を用いて 表すと 確率変数の関数はまた確率変数となる 数理統計学第2回
SASでのサイコロの目の発生 一様分布を用いてもいいが, RANTBL(seed,p1,..pi,..pn) returns a random variate from a tabled probability 数理統計学第2回
サイコロの目の発生プログラム例 data data; do i=1 to 1000; y=rantbl(4989,1/6,1/6,1/6,1/6,1/6,1/6); output; end; proc freq;tables y; run; 数理統計学第2回
データの平均と分布の平均 平均 データの平均 x = (x1 + x2 +…+ xn)/n 分布の平均 m = ∫x f(x) dx 平均という統計量X = (X1 + X2 + … + Xn) / n 経験分布(nが大きい世界で,母集団分布をデータの分布で近似する)という概念を導入すると上の二つは同じになる.3番目はその統計量版(確率変数版) 数理統計学第2回