数理統計学(第五回) 統計的推測とは? 浜田知久馬 数理統計学第5回.

Slides:



Advertisements
Similar presentations
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
Advertisements

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
数理統計学第1回 1 数理統計学 ( 第一回) 確率変数とは? 浜田知久馬. 数理統計学第1回 2 世の中は不確定なことが多い 決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき,確率変数によって,物事 を確率的に記述できると便利なことが多 い.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学(第七回) 線形模型とは? 浜田知久馬 数理統計学第7回.
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回.
一般化線形モデル(GLM) generalized linear Models
数理統計学(第四回) 分散の性質と重要な法則
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
数理統計学(第八回) 統計的仮説検定とは?
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第2章 単純回帰分析 ー 計量経済学 ー.
Bassモデルにおける 最尤法を用いたパラメータ推定
アルゴリズムイントロダクション第5章( ) 確率論的解析
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
11.確率モデル 確率・・・不確実性の経済学や金融やファイナンス で重要 密度関数がある場合に期待値を取る計算を中心に、紹介.
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計解析 第10回 12章 標本抽出、13章 標本分布.
統計学 11/08(木) 鈴木智也.
統計数理 石川顕一 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
数理統計学(第六回) 最尤推定とは? 浜田知久馬 数理統計学第6回.
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
ガウス過程による回帰 Gaussian Process Regression GPR
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
応用数理工学特論 期末発表 西口健太郎 渡邉崇充
相関分析.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規分布確率密度関数.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
第3章 統計的推定 (その1) 統計学 2006年度.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
Basic Tools B4  八田 直樹.
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
数理統計学 西 山.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
経営学研究科 M1年 学籍番号 speedster
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
統計現象 高嶋 隆一 6/26/2019.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

数理統計学(第五回) 統計的推測とは? 浜田知久馬 数理統計学第5回

確率分布 数理統計学で確率分布を勉強. 確率分布は便利 確率分布がわかれば,様々な事象を確率的に記述できる.(同時,周辺,条件付) 確率分布は母数によって定まる. 母数をどう求めればよいのか? 数理統計学第5回

推定の問題 ある目的で,ある確率変数Yをn回観測し, 標本Y=(Y1, Y2,・・・, Yn)を得る.  「分布を規定する母数は未知である」 「標本Yの実現値yに基づいて未知母数の真の値がいくらであるか評価,断定する問題を「推定の問題」という. 数理統計学第5回

ダーウィンの植物の丈の データ(単位インチ) ───────────────────────────────  No.自家受精  他家受精 No.自家受精  他家受精   1   17.375    23.5    9  16.5   18.25   2   20.375    12     10  18    21.625   3   20      21 11  18.25    23.25   4   20      22 12  18    21   5   18.375    19.125 13  12.75    22.125   6   18.625    21.5 14  15.5    23   7   18.625    22.125 15  18    12   8   15.25     20.375  平均  17.708    20.192 標準偏差  2.024    3.617 数理統計学第5回

数理統計学第5回

母数推定の前提 自家受精群と他家受精群に別々の正規分布をあてはめ n個(n=15)の確率変数Yiが互いに独立に同一の正規分布にしたがう Y1 ,Y2 ,Y3 ,・・・,Yn ~N(μ,σ2) i.i.d.(independent identically distributed) 数理統計学第5回

点推定 一つの答え方: 観測変数 Y の統計量 t(Y) を一つ用意  ある未知母数 b の真の値を推定したいという問題を考える. 一つの答え方:  観測変数 Y の統計量 t(Y) を一つ用意  観測値がデータ y として得られたら,そのデータを代入して得られる関数値 t(y) が    「母数 b の真の値である」 と断定 このような方式を「(点)推定」estimation と言う, 数理統計学第5回

推定と推定量  推定に使う関数 t(Y) を「推定量」 estimator,データを代入して得られる値 t(y) を「推定値」 estimate という. 推定の問題において,数理統計学が問題にすることは,どんなやり方が良いかである. どんな推定量が良い推定量? 数理統計学第5回

区間推定 別の答え方 2つの統計量tL(Y), tU(Y)を用意する. Yの実現値yを得たら,それを代入して得られる値tL(y)~tU(y)の範囲に真の値があるとする. このような形式を「区間推定」  interval estimationという. 数理統計学第5回

良い推定量の規準 不偏性とは?分散最小性とは? 良さを議論するには規準 criterion が必要 一つの視点: 定性的,資格条件を限定しておいて,その中である規準量が最大(あるいは最小)となるものを良いものとする. たとえば? 定性的条件:不偏性,線形性 定量的規準:分散最小性 不偏性とは?分散最小性とは? 数理統計学第5回

精度, 偏り,正確さ 不偏で精密 偏りあるけど精密 不偏だけど精密でない    偏りありかつ                    精密でない 数理統計学第5回

点推定の良さの基準 βの推定量bがあるとする. 推定量の良さの基準で最も一般的なのは平均二乗誤差(Mean Square Error:MSE) MSE=E[(b-β)2] = E[(b-β)2]= E[(b-E[b]-β+E[b])2] = E[(b-E[b])2]+ E[(E[b]-β)2]  +2(E[b]-β) E[b-E[b]]   数理統計学第5回

MSE MSE=E[(b-E[b])2]+ E[(E[b]-β)2] V[b] bias 推定量の分散 推定量の偏り     推定量の分散 推定量の偏り 両方を同時に最適化できるか? 分散を0 → 常にb=0  V[b]=0       数理統計学第5回

推定での方法論的課題 どんな推定量が良い推定量? 定性的条件,例えば 不偏性=期待値が未知母数に一致 線形性=推定量がYの線形式を  不偏性=期待値が未知母数に一致  線形性=推定量がYの線形式を  満たすものの中で ある規準量,例えば分散を最小(最良,有効)にするものを良いとする⇒最良線形不偏推定量 数理統計学第5回

最良線形不偏推定量を求める方法はあるか? 一般的な方法はない.  存在しないことも多い. 原理的に良い推定量を導きやすい原理は?  ・最尤法  ・最小2乗法  ・モーメント法 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 不偏推定量の分散の下限についての不等式 (不偏推定量の分散はこれより小さくならない) θを不偏推定量とすると V[θ]≧1/I I:フイッシャーの情報量(Fisher information) 等号が成り立つ場合は,不偏推定量の中で 分散が最小(有効)となる. ^ ^ 数理統計学第5回

証明にあたって利用すること 不偏推定量の定義 E[θ(Y)]=θ 確率密度関数の和は1 ∫f(y,θ) dy=1 ^ 不偏推定量の定義 E[θ(Y)]=θ 確率密度関数の和は1  ∫f(y,θ) dy=1 E[B]=0のとき, E[A・B]=Cov [A,B] ,V[B]= E[B2]    {Cov [A,B] = E[A・B]-E[A] E[B]} 4) 5)微分と積分の交換可能性 6) Cov [A,B]≦V[A] V[B]   相関係数の絶対値は1を越えない 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 不偏であるためにはθが1単位増加すれば期待値も1増加する 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 積分と微分の交換可能性,傾きの期待値は0 θを動かしても確率密度の和は不変 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 数理統計学第5回

クラメル・ラオ(Cramer-Rao)の不等式 不偏推定量θの分散が, V[θ]=1/I を満たせば, θは 一様最小分散不偏推定量 (Uniformly Minimum Variance Unbiased estimator, UMVU) である. ^ ^ ^ 数理統計学第5回

2項分布の場合 数理統計学第5回

2項分布の場合 数理統計学第5回

最尤法(Maximum Likelihood method) 確率が最大の母数の値は,観測値Yの関数  これを未知母数の推定量とする. 最尤法,得られる推定量が最尤推定量  確率が最大になるように推定  (MLE:Maximum Likelihood Estimator) 数理統計学第5回

最小二乗法 観測変数Yの値と,モデルから予測される差の2乗和を最小にする母数の値を推定量とする方法 Σ(Yi-β0-β1Xi)2 を最小にするようにβ0とβ1を推定 数理統計学第5回

最小2乗法の模式図 × Y=β0+β1X Y X X × × 数理統計学第5回 X

モーメント法 分布のモーメントを,次数の低い方から未知母数の数pだけ求め,それを対応する標本モーメントと等しいとおき,母数の推定量を構成する方法を“モーメント法”(moment method)という 分布の期待値=データの平均 E[X]=μ :Σxi/N 分布の2次モーメント=データの2乗和 E[X2]=μ2 +σ2 :Σxi2/N 数理統計学第5回

用語 最尤原理(maximum likelihood principle) 最尤法(maximum likelihood method) 最尤推定量(maximum likelihood estimator) 尤度(likelihood) 対数尤度(log likelihood) Fisherの情報量(Fisher's information) 数理統計学第5回

尤度,最尤推定量,Fisherの情報量 尤度(likelihood) :尤(もっともらし)さの程度 を確率で評価した指標         を確率で評価した指標 最尤推定量:尤度が最大になるように母数       を推定する原理 Fisherの情報量:最尤推定量の推定精度を         測る指標      数理統計学第5回

最尤推定の例 コインを10回投げて7回表が出たとする. このような事象が起きる確率は? 確率分布として 2項分布B(n=10,π)を仮定すると p=10Cyπy(1-π)10-y 確率pは母数πの関数である.確率を母数の関数と考えたのが尤度(L:likelihood) 確率関数:πを固定したyの関数 尤度関数: yを固定したπの関数  数理統計学第5回

最らしいπは?    π 確率 1 0.1 0.00001 2 0.2 0.00079 3 0.3 0.00900 4 0.4 0.04247 5 0.5 0.11719 6 0.6 0.21499 7 0.7 0.26683 8 0.8 0.20133 9 0.9 0.05740 数理統計学第5回

尤度の計算プログラム data q6; do phi=0.10 to 0.90 by 0.02; l=10*9*8/(3*2*1)*phi**7*(1-phi)**3; output;end; proc gplot; plot l*phi/href=0.7; symbol1 i=spline v=none h=4 w=4; run; 数理統計学第5回

πの関数の尤度 数理統計学第5回

最尤推定 尤度(L)を最大にするように母数を求める. 尤度の最大化 ⇒ 対数尤度の最大化 母数空間の全てのπについてLを計算するか? 尤度の最大化 ⇒ 対数尤度の最大化 母数空間の全てのπについてLを計算するか? 山の頂上では傾き0 対数尤度をπで微分して導関数を求め, 導関数が0になるπを求める. 数理統計学第5回

西遊記 ひたすら西を目指す. 数理統計学第5回

最尤法 ひたすら山の頂上を目指す. 数理統計学第5回

山の頂上にいるのは? 数理統計学第5回

最尤推定量の誘導1 数理統計学第5回

最尤推定量の誘導2 数理統計学第5回

コインを100回投げて70回表 が出たときの尤度 数理統計学第5回

演習問題 ポアソン分布の推測 ポアソン分布の確率関数p(x)は, p(x)=λx・exp(-λ)/x! 演習問題 ポアソン分布の推測 ポアソン分布の確率関数p(x)は, p(x)=λx・exp(-λ)/x! となる.λが母数であり,xは確率変数の実現値で0、1、2・・・の値をとるものとする. 1)λ=1のとき,Xが1以上の値をとる確率を計算せよ.ヒント exp(1)=2.718 2)お年玉付年賀状の当たり数がx=5となった.当たり数の分布にポアソン分布を仮定して,このようなデータが得られた場合の尤度と対数尤度を計算せよ. 3)対数尤度を,λで微分せよ.また1次微分関数の値が0になるようにλを求めよ. 数理統計学第5回