土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之
基本的な考え方 統計量の分布 (分布形は既知) 個別の標本の側から見ると... 標本 (実現値)
1.母平均の区間推定(母分散がわかっているとき) 必要な値 標本平均値 母分散 標本数 n は標準正規分布N(0,1)に従う.
信頼区間 分散 の 正規分布
2.母平均の区間推定(母分散がわからないとき) 必要な値 標本平均値 不偏分散 標本数 n は自由度n-1のt分布に従う
3.母分散の区間推定(母平均がわかっているとき) 必要な値 標本数 n 母平均 は自由度nのカイ2乗分布に従う
4.母分散の区間推定(母平均がわからないとき) 必要な値 標本数 n 標本平均値 は自由度n-1のカイ2乗分布に従う
二項母集団の場合(P86,P89例題5.1の2) 母比率の推定 は標準正規分布N(0,1)に従う.
本日の内容 パラメータの妥当性を検定する手法 (統計的検定)について説明する. 1.帰無仮説(Null Hypothesis) 2.有意水準(Level of Significance) 3.第1種・第2種の過誤(type I and II errors) 4.クロス集計の独立性検定(カイ2乗検定)
・期待値 ・信頼区間 結果の予測 確率モデル ・パラメータ推定 ・妥当性検証(検定) 観測データ パラメータ推定:母数(平均,分散,比率等)の値を推測する. 検定(statistical test):母数が仮定した値かどうかを検討する. どちらも統計量の確率分布を利用
統計的検定が必要とされる状況の例(1) 1.局所的な地震災害が全国に及ぼす影響を知るために, 被災地からやや離れたA県内のある地点における高速 道路の交通量を測定した.地震前の平均は50000台/日 であったが,地震後10日間の平均は49500台/日であった. 交通量が減少したといえるか? 2.地球温暖化の影響で,異常気象が増加するといわれる. ある地域において,過去10年間の平均年降水量は, 50年前に比べて500mm増加したという.降水量が増加 したといえるか?
統計的検定が必要とされる状況の例(2) 3.A市では,B市と比較して交通事故対策を重視 している.A市における人口当たり交通事故 発生率は0.1%,B市においては0.2%である. A市の交通事故対策は,交通事故の減少に 寄与しているのか? 「違い」があるか否かの判断基準を提供する 環境の変化 存在の有無を明らかにする 政策の効果
仮説検定の手順(P87)(両側検定「仮説より大きいか小さいか?」 の場合) 1.帰無仮説(Null Hypothesis)H0をたてる. 2. H0を検定するための統計量(パラメータ推定の場合と同じ)T を選び,その分布を特定する. 3.有意水準αを決め, となる を求める. 4.標本データの下でのTを求める. 5. であればH0を棄却,そうでなければ 棄却せず. あわせてα
仮説検定の手順 (片側検定「仮説よりも小さいか?」の場合) 1.帰無仮説(Null Hypothesis)H0をたてる. 2. H0を検定するための統計量(パラメータ推定の場合と同じ)T を選び,その分布を特定する. 3.有意水準αを決め, となる を求める. 4.標本データの下でのTを求める. 5. であればH0を棄却,そうでなければ 棄却せず. α
仮説検定の手順(片側検定「仮説より大きいか」の場合) 1.帰無仮説(Null Hypothesis)H0をたてる. 2. H0を検定するための統計量(パラメータ推定の場合と同じ)T を選び,その分布を特定する. 3.有意水準αを決め, となる を求める. 4.標本データの下でのTを求める. 5. であればH0を棄却,そうでなければ 棄却せず. α
第1種の過誤(Type I Error) 帰無仮説H0が正しいにも関わらず,棄却してしまう誤り 確率α 第2種の過誤(Type II Error) 帰無仮説H0が誤りであるにも関わらず,棄却しない誤り 確率β αを小さくすると βが大きくなってしまう β 第2種の過誤 α 第1種の過誤
1.母平均の検定(母分散がわかっているとき) 必要な値 標本平均値 母分散 標本数 n 有意水準 の下で, 1.帰無仮説:「母平均は である.」 2. (標準正規分布N(0,1)に従う.) を求める 3.正規分布表から
2.母平均の検定(母分散がわからないとき) 必要な値 標本平均値 不偏分散 標本数 n 有意水準 の下で, 1.帰無仮説:「母平均は である.」 2. (自由度n-1のt分布に従う) 3.自由度(n-1)のt分布表から を求める
3.母分散の検定(母平均がわかっているとき) 必要な値 標本数 n 母平均 有意水準 の下で, 1.帰無仮説:「母分散は である.」 2. (自由度nのカイ2乗分布に従う) 3.自由度nのカイ2乗分布表から を求める
4.母分散の検定(母平均がわからないとき) 必要な値 標本数 n 標本平均値 有意水準 の下で, 1.帰無仮説:「母分散は である.」 2. (自由度n-1のカイ2乗分布に従う) 3.自由度nのカイ2乗分布表から を求める