統計学 11/08(木) 鈴木智也
今日の講義 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 ←ここ! 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し 確率論入門 確率変数と確率分布 ←ここ! 第3部 推測統計:データから全体像を推測
復習:確率とは ある事象が起こるか否か分らない時、その結果が起こる可能性を示す測度のこと。 事象 A の確率を P(A) と表すとすると、 ①確率 P(A) は必ず非負である: P(A)≥0 ②必ず起こる事象の確率は1である。 例:サイコロを振って3の目が出る確率は? ⇒目の出方は6通り。3の目が出るのは、そのうちの一つ。⇒1/6の確率。
キーワード①:確率変数とは 取り得る値(実現値)が複数あり、それぞれの値を取る確率が決まっている変数。 例:サイコロを振って出る目の数値(X) 実現値(xi):1,2,3,4,5,6 どの値を取る確率も1/6。 ☆確率変数 X が xi という値を取る確率を P(X=xi) または、単に P(xi) と表記する。
キーワード②:確率分布とは 確率変数 X が取り得る全ての実現値について、対応する確率の散らばりのこと。 それを表すものが、確率分布表。 (例)サイコロで出る目の値の確率分布表 xi 1 2 3 4 5 6 P(xi) 1/6
確率変数を記述する① ☆平均値(「期待値」と呼ぶ) 確率変数 X が、平均して、どの位の値を取るものと期待できるだろうか? ↑確率で加重して平均を取っている。 注: E は期待(Expectation)を意味する。
確率変数を記述する② ☆分散 確率変数 X の実現値の散らばり具合を表す。 ↑ここでも、確率で加重している。 注: V は分散(Variance)を表す。
確率変数を記述する③ ☆標準偏差 注)表記上の慣習(ギリシャ文字) μ(ミュー小):アルファベットのmに対応 ⇒平均(mean)を表す。 σ(シグマ小):アルファベットのsに対応 ⇒標準偏差(standard deviation)を表す。
経済分析での確率変数の例 株式投資の収益率 株価は変動する⇒投資収益率は確率変数 Q:もし投資収益率の確率分布が次のようならば、収益率の期待値はいくつ? ⇒確率分布が未知の時は、データから相対頻度を算出し、それで代用する。 収益率 0.1 0.2 0.4 0.5 0.8 確率(%) 10 20 30
連続型確率変数 ここまでの確率変数 X はとびとびの値だけを取り得ると仮定した。←離散型確率変数 しかし、ある範囲内でどんな値でも取り得る確率変数もある。←連続型確率変数 Q:連続型確率変数の例を考えてみよう。
連続型と離散型の違い ☆離散型の場合 ・X の取る値自体に確率が対応。 ・確率関数 P(X=xi) を定義できる。 ☆連続型の場合
連続型確率変数の場合の確率 連続型確率変数の場合、確率密度関数を導入する: f(x) X が a から b までの値を取る確率は、 注:積分(∫)は総和(∑)に対応している。 Q:図示して考えてみよ。
連続型確率変数の記述 X が -∞ から ∞ までの値を取るならば、 ☆平均(「期待値」と呼ぶ) ☆分散 ☆標準偏差
代表的な確率分布(正規分布) ☆正規分布 (Normal Distribution) ・確率密度関数は(覚えなくてもよいが) ・図示すると、釣鐘型をしていて、平均値に関して左右対称である。
標準正規分布 ・N(μ, σ2) に従う変数 X は、N(0, 1)に従う標準化変量 Z=(X-μ)/σに変換できる。 重要:正規分布は統計学で最も基本的な確率分布であり、この講義後半で集中的に使う t -分布も正規分布の派生である。
正規分布の重要な性質 確率変数XがN(μ,σ2)に従うとき、 ☆P(μ-1.96σ≦X≦μ+1.96σ)=0.95