計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
講義概要 0.研究計画 (proposal) の手順 1.研究計画とデータの対応2.データの収集、利用3.データのチェック、検討 4.データの分析 --- 統計手法の利用 参考文献統計ソフトの案内
0.研究計画 (proposal) の手順
0-1 .何を明らかにしたいの か? <研究課題> 一般的な問い (general question) 一般的な問い (general question) 具体的な問い (specific questions) 具体的な問い (specific questions)
0-2 .その問題を明らかにする ことにどういう意義があるの か? <研究意義、問題意識> 既存研究との関連 既存研究との関連 --- これまでの学問的蓄積への貢献 個人的、社会的、政策的関心等 個人的、社会的、政策的関心等
0-3 .その問題をどのように明 らかにするのか? <研究方法> 研究対象、研究方法の選択 研究対象、研究方法の選択 実行可能性と正当化 実行可能性と正当化 --- なぜ上記の選択を行ったのか --- 「位置づけ」の明確化
0-4 .どのような結果が予想さ れるのか? <研究内容> 研究仮説の設定 研究仮説の設定 どこまでやれば、当初提示した「研究 課題」に答えたことになるのか どこまでやれば、当初提示した「研究 課題」に答えたことになるのか
1.研究計画とデータの対応
1-1 .研究課題の解明や理論仮 説の検証に必要な変数が含ま れているか 研究課題とデータの調査対象、時期、 内容等との整合性 研究課題とデータの調査対象、時期、 内容等との整合性 被説明変数、説明変数はそれぞれ何か 被説明変数、説明変数はそれぞれ何か データでわかること、わからないこと データでわかること、わからないこと
1-2 .データ上の変数と理論変 数の関連はどうか、どのよう な測定尺度を用いるか データ解釈の多義性( context 依存性) データ解釈の多義性( context 依存性) 主観と客観(共通尺度設定の困難さ) 主観と客観(共通尺度設定の困難さ) 意識と行動 意識と行動
2.データの収集、利用
2-1 .自分でデータを集める 調査対象の選定、協力獲得 調査対象の選定、協力獲得 調査票の設計 調査票の設計 調査票の配布、回収、点検 調査票の配布、回収、点検 使用する統計ソフトに応じたデータの 入力 使用する統計ソフトに応じたデータの 入力
2-2 .既存データを利用する 官庁統計調査の結果報告書 官庁統計調査の結果報告書 各種統計調査の個票データ ( マイクロ・ データ ) --- 日本では「統計法」の制約 各種統計調査の個票データ ( マイクロ・ データ ) --- 日本では「統計法」の制約 *東大社研データ・アーカイブ *東大社研データ・アーカイブ東大社研データ・アーカイブ *ミシガン大学データ・アーカイブ *ミシガン大学データ・アーカイブミシガン大学データ・アーカイブ 各種業務統計の利用 ( 企業の人事データ 等 ) 各種業務統計の利用 ( 企業の人事データ 等 ) 使用する統計ソフトに応じたデータの 変換 使用する統計ソフトに応じたデータの 変換
3.データのチェック、検討
3-1 .サンプルの特性 調査対象、抽出法 調査対象、抽出法 サンプル・サイズ、回収率 サンプル・サイズ、回収率 標本誤差と非標本誤差 標本誤差と非標本誤差 サンプル・セレクション・バイアス サンプル・セレクション・バイアス
3-2 .欠損値、誤記入値、異常 値 変数の特性値 ( 特に最大値・最小値 ) 、分 布状況をチェック 変数の特性値 ( 特に最大値・最小値 ) 、分 布状況をチェック サンプルから除外、または置き換え サンプルから除外、または置き換え
3-3 .各変数の特性値、変数間 の相関関係 データの特徴を掴んだり、モデル推計 に用いる変数の選択に有効 データの特徴を掴んだり、モデル推計 に用いる変数の選択に有効 データ・マイニング、プリテスト --- pros and cons データ・マイニング、プリテスト --- pros and cons
4 .データの分析 --- 統計手法 の利用
4-1 .記述統計 --- サンプル・ データの「縮約」 代表値 ( 平均、最大・最小値、 n 分位数、 中位数、最頻値 ) 代表値 ( 平均、最大・最小値、 n 分位数、 中位数、最頻値 ) ばらつき ( 標準偏差、範囲、変動係数、 n 分位分散係数 ) ばらつき ( 標準偏差、範囲、変動係数、 n 分位分散係数 ) ゆがみ ( 歪度 ) ゆがみ ( 歪度 ) 相関係数 相関係数 グラフの活用 グラフの活用
4-2 .推測統計 --- サンプル・ データから「真の特性」を推 測 確率論が基礎 確率論が基礎 母集団の分布、標本、標本平均の分布 母集団の分布、標本、標本平均の分布 それぞれの特性値 ( 平均と分散 ) それぞれの特性値 ( 平均と分散 ) 推定 ( 点推定、区間推定、標準誤差 ) 推定 ( 点推定、区間推定、標準誤差 ) 検定 ( 帰無仮説と対立仮説、 p- 値 ) 検定 ( 帰無仮説と対立仮説、 p- 値 ) ランダム・サンプリング、ランダム・ アサインメントの重要性 ランダム・サンプリング、ランダム・ アサインメントの重要性
4-3 .応用例 クロス集計表 クロス集計表 平均値の差の検定 平均値の差の検定 線形回帰分析 線形回帰分析 プロビット・モデル プロビット・モデル ・ ・ ・ ・ ・ ・
参考文献 統計ソフトの案内 エクセル統計 2000 エクセル統計 2000 エクセル統計 2000 エクセル統計 2000 SPSS SPSS SPSS STATA STATA STATA ・ ・ ・ ・ ・ ・