経済統計学 第2回 4/24 Business Statistics 鈴木智也 紫英館 304号室 Office Hour:月曜日 第2講時
前回のポイント 「記述統計」と「推測統計」。 この講義で扱うのは、推測統計。 標本(サンプル)データから標本統計量を計算し、母集団の持つ規則性(母集団パラメータ)を推測する。 ⇒推測統計を学ぶ前に、記述統計の復習。
記述統計の復習(1) ☆(母集団)平均 X が m 通りの値を取りうる時、大体どれ位の値になるかの指標。
記述統計の復習(2) ☆(母集団)分散 X が概ね平均値からどのくらい離れているかを表す指標。(散らばり具合を記述) Q:なぜ二乗しているのかを考えてみよう。
記述統計の復習(3) ☆(母集団)標準偏差 これも散らばり具合を表す指標。 注:分散は二乗を取って計算しているので、元々の単位(例:兆円)とは異なる。 ⇒分散の平方根を取って、標準化し、元の単位に戻す。
記述統計と推測統計の対応 n個の標本データから母集団特性値を推測 ☆標本平均 ☆標本分散 ☆標本標準偏差
注:一般的な表記方法 母集団特性値はギリシア文字で表すのが通例。 平均:μ(ミュー) 標準偏差:σ(シグマ) 平均:μ(ミュー) 標準偏差:σ(シグマ) 標本統計量は通常、アルファベットで表す。 小文字のσは小文字のs に相当。 母集団標準偏差 σ ⇔ 標本標準偏差 s
ここから前回の続き 推測統計では、サンプルを取って、母集団の規則性(特性値)を推測する。 サンプルをどう取るかで、標本統計量の値は変わってくる。 標本統計量には、取り得る値が複数あり、事前にはどの値を取るのか分からない。 ⇒標本統計量は「確率変数」である。
そもそも確率とは? ある事象が起こるか否か分らない時、その結果が起こる可能性を示す測度のこと。 事象 A の確率を P(A) と表すとすると、 ①確率 P(A) は必ず非負である: P(A)≥0 ②必ず起こる事象の確率は1である。 ③事象 A と B が同時には起こり得ない場合、A または B が起こる確率は、P(A)+P(B) 。
確率の具体例 サイコロを振って、3の目が出る確率は? ⇒目の出方は、全部で6通り。3の目が出るのは、そのうちの一つ。⇒1/6の確率。 じゃんけんでグーを出して勝つ確率は? ⇒相手がチョキなら勝ち、グーならあいこ、パーなら負け、の三通り。⇒1/3の確率。
確率変数とは 取り得る値(実現値)が複数あり、それぞれの値を取る確率が決まっている変数。 例:サイコロを振って出る目の数値(X) 実現値(xi):1,2,3,4,5,6 どの値を取る確率も1/6。 ☆確率変数 X が xi という値を取る確率を P(X=xi) または、単に P(xi) と表記する。
確率分布とは 確率変数 X が取り得る全ての実現値について、対応する確率の散らばりのこと。 それを表すものが、確率分布表。 (例)サイコロで出る目の値の確率分布表 xi 1 2 3 4 5 6 P(xi) 1/6
確率変数を「記述」しよう ① ☆平均値(「期待値」と呼ぶ) 確率変数 X が、平均して、どの位の値を取るものと期待できるだろうか? 確率変数を「記述」しよう ① ☆平均値(「期待値」と呼ぶ) 確率変数 X が、平均して、どの位の値を取るものと期待できるだろうか? ↑確率で加重して平均を取っている。 注: E は期待(Expectation)を意味する。
確率変数を「記述」しよう ② ☆分散 確率変数 X の実現値の散らばり具合を表す。 ↑ここでも、確率で加重している。 確率変数を「記述」しよう ② ☆分散 確率変数 X の実現値の散らばり具合を表す。 ↑ここでも、確率で加重している。 注: V は分散(Variance)を表す。
確率変数を「記述」しよう ③ ☆標準偏差 理解の為の重要ポイント 確率変数を「記述」しよう ③ ☆標準偏差 理解の為の重要ポイント 母集団の平均、分散、標準偏差と、確率変数の平均、分散、標準偏差のそれぞれの相似性に注目せよ。
経済分析での確率変数の例 株式投資の収益率 株価は変動する⇒投資収益率は確率変数 Q:もし投資収益率の確率分布が次のようならば、収益率の期待値はいくつ? 収益率 0.1 0.2 0.4 0.5 0.8 確率(%) 10 20 30
確率分布が分らない場合は? 過去のデータから「相対頻度」を調べて、代用。 例えば、過去12ヶ月間の収益率が 0.2, 0.4, 0.1, 0.3, 0.1, 0.3, 0.5, 0.2, 0.1, 0.2, 0.3, 0.2 だったとする。その場合、相対頻度は、 収益率 0.1 0.2 0.3 0.4 0.5 相対頻度 3/12 4/12 1/12
連続型確率変数 ここまでの確率変数 X はとびとびの値だけを取り得ると仮定した。←離散型確率変数 しかし、ある範囲内でどんな値でも取り得る確率変数もある。←連続型確率変数 例:ある時点で、時計の秒針が、中心から十二時の部分を結ぶ線と、成す角度は0度から360度まであり得る。(分布を図示せよ)
連続型確率変数(続) ☆離散型の場合 ・X の取る値自体に確率が対応。 ・確率関数 P(X=xi) を定義できる。 ☆連続型の場合
連続型確率変数(続々) 連続型確率変数の場合、確率密度関数を導入する: f(x) X が a から b までの値を取る確率は、 注:積分(∫)は総和(∑)に対応している。 Q:図示して考えてみよ。
連続型確率変数を「記述」する X が -∞ から ∞ までの値を取るならば、 ☆平均(「期待値」と呼ぶ) ☆分散 ☆標準偏差
代表的な確率分布 ☆正規分布 (Normal Distribution) ・確率密度関数は(覚えなくてもよいが) ・図示すると、釣鐘型をしていて、平均値に関して左右対称である。
代表的な確率分布(続) ・N(μ, σ2) に従う変数 X は、N(0, 1)に従う標準化変量 Z=(X-μ)/σに変換できる。 重要:標本平均は正規分布に従うことが知られている(次々回に詳説)。 *今週で準備は終り、来週から本題入り。