統計学 12/3(月)
講義全体の構成 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し ↑中間試験はここまで ↓今日からここ。 第1部 記述統計:データの特性を記述 第2部 確率論:推測統計への橋渡し ↑中間試験はここまで ↓今日からここ。 第3部 推測統計:データから全体像を推測
記述統計と推測統計 記述統計: データ自体の規則性が対象 ↑↓ 推測統計:データを生み出すものが対象 例:このクラスでの試験を行った場合、 記述統計:結果を(平均や分散で)分析。 推測統計:結果を基に真の学力を調査。
推測統計4つのキーワード ①母集団:我々の関心の対象(全体像) ②母集団特性値(パラメータ): 母集団の特徴を数値化したもの ③標本(サンプル):我々の観察対象(一部) ④標本統計量:標本から計算される統計量 ⇒一部を観察し、全体像を推測する。
推測統計の例 ① ☆政治:内閣支持率調査 母集団:有権者全体 標本:インタビューされた人達 母集団特性値:有権者全体の内閣支持率 推測統計の例 ① ☆政治:内閣支持率調査 母集団:有権者全体 標本:インタビューされた人達 母集団特性値:有権者全体の内閣支持率 標本統計量:インタビューされた人達の間 での内閣支持率 ⇒まずは有権者にインタビューする。
推測統計の例 ② ☆環境:標識再捕獲による生息数調査 母集団特性値 ある地域に住む特定生物の生息数 標本統計量 推測統計の例 ② ☆環境:標識再捕獲による生息数調査 母集団特性値 ある地域に住む特定生物の生息数 標本統計量 捕獲した生物の中にいる、標識をつけた個体の割合から推定した生息数 ⇒まずはその生物に標識をつける。
標本調査:推測統計の第一歩 推測統計を行うには、まずは標本を採ってこなくてはならない(標本調査)。 標本をどう採るかで、標本統計量の値は変わる。 ⇒標本は、母集団を正しく代表するようなもの(代表的標本)でなければならない。
標本抽出論 もし標本調査に偏りがあれば、それは母集団を正しく代表しない。 例)中日スポーツ新聞が、読者を対象に、プロ野球の人気球団を調査したら? ⇒中日ドラゴンズの人気が、全国民を対象にした調査結果よりも、高く出ることが予想される。⇒標本に偏りがある。
標本抽出論(続) 偏りのない標本調査は当たり前?珍しい? 例)ある年の自民党政権への支持率 Y新聞(やや保守):49.4% A新聞(やや革新):41.0% どちらを信じればよい?
標本抽出論(続々) ☆無作為抽出(Random Sampling) 母集団を構成するどの個体についても、それが標本に選ばれる機会(確率)が同じであるようにする方法。[例:くじ引き] ⇒新聞の内閣支持率調査は、自社の読者を対象にしていれば、無作為抽出ではない。
標本統計量 調査した標本から、標本統計量を計算する。 推定したい母集団パラメータが 平均ならば、標本平均 分散ならば、標本分散 何かの比率ならば、標本比率。
標本平均
標本平均の平均値 標本平均は大体どのくらいの値? ⇒期待値を取る(付論参照)
標本平均の分散 標本平均はどれくらい値が散らばる? ⇒分散を取る(付論参照)
重要:中心極限定理
標準化(復習) 正規分布に従う変数の標準化
付論:期待オペレーター X、Yは確率変数、c は定数。