SPSS 入門 麻生良文
内容 データの読み込み テキストファイル Exelファイル 記述統計 グラフ 回帰分析
データの読み込み wage1.raw というファイルを読み込む wage1.des, wage1.raw をテキスト・エディター(メモ帳など)で開く wage1.des データセットの説明 wage1.raw データセット本体(本体に変数名は含まれていない) wage1.raw:wage, educ, … など 24の変数,526個のオブザベーションからなるデータであることがわかる データセット本体の先頭行に変数名を含めておくと便利(他の統計ソフトを利用する場合には特に)
wage1.des の内容
wage1.raw の内容
wage1.desの変数名をwage1.rawの先頭行に挿入:この段階では変数名の途中に改行が入っている
改行を取り除いて変数名を1行に直す。適当な名前をつけて保存する。 変数名とデータの桁をそろえておくと読み込みのときに失敗が少ない。 (SPSSでは,桁を揃えて固定書式でないとうまく読み込めなかった)
メニューから「ファイル」「テキストデータの読み込み」を選択 次のような画面が表れるのでガイドにしたがって進む
csvファイルの場合には「自由書式」を選択。 ここでは「固定書式を選択」 ファイルの先頭行には変数名が含まれていた
ファイルの先頭行は変数名であるため
データの読み込み成功 スプレッドシートのような画面が表れる(データビュー)
educ(教育年数)はスケール変数に直しておく 変数ビューの画面
Excelファイルの読み込み wage1.xlsを開く
Excelファイルの読み込みwage1.xlsを開く 先頭行に変数名を記入(wage1.desからコピーしてくるなどして) 名前をつけて保存する
Excelデータの読み込み SPSSの起動 最初にファイルを開くためのダイアログボックスが表れる。「別の種類のファイルを開く」を選択して,ファイルを開かないで起動する ファイルテキストデータの読み込み 「ファイルの種類」でExcelの拡張子を選択する 読みたいファイルを選択 後はテキストファイルの読み込みと同様 (右のような画面が表れる) Excelのワークシート上でデータの範囲をコピーして,SPSSのデータビューの画面上で貼り付けても,データの読み込みは可能 ただし,変数名まではうまくインポートできなかった
変数の記述統計 メニューから 「記述統計」「記述統計」とたどる 記述統計量を求めたい変数を選択 左側のボックスで変数を選択して,マウスでクリックすると選択できる
記述統計の出力結果
グラフを描く ヒストグラム メニューから「グラフ」「図表ビルダー」
変数の平均値を比較 メニューからグラフレガシーダイアログ棒とたどっていく
箱ひげ図(BoxPlot) メニューから グラフレガシーダイアローグ箱ひげ図単純,変数ごとの集計定義 を選択して変数を選択 4分位点 中央値(50%点) 複数のデータの大まかな分布を知りたいときに便利
散布図 グラフレガシーダイアローグ散布図/ドット単純な散布図 とたどり,x軸とy軸の変数を指定
wage, educ, exper,tenureの撒布図行列 メニューから グラフレガシーダイアログ散布図/ドット行列散布図 とたどって,変数を指定する 左は,wage, educ ,exper, tenureの行列散布図(散布図行列)
相関係数 メニューから 分析相関2変量 を選択して変数を指定
回帰分析 次のようなモデルを考える i:オブザーベーションを表す添え字 i=1,2,…,n yi : 被説明変数(従属変数) x1i, x2i,..., xki : 説明変数(独立変数) ui: 誤差項 観測されたデータからa,b1,b2,..,bkを推定 理論モデルの統計的検証 事実の解明(複数の要因でyを説明) 推定方法 最小二乗法(OLS),最尤法(ML)など
回帰分析 メニューから 分析回帰線型 を選択 従属変数(被説明変数)と独立変数(説明変数)を左のボックスから選択
回帰分析の出力結果 推定された係数の値
変数の作成・加工 実際の分析では,統計データをさらに加工して分析することが通常 理論モデルの概念に合うような変数が必要 消費関数の形状 所得(Y)と貯蓄(S)のデータから貯蓄率(S/Y)を作成 所得から税負担や社会保険料負担を引いて可処分所得を求める 名目所得を物価指数で割り,実質所得で分析する 恒常所得と変動所得に分解 世帯構成員一人当たりの所得,子供・高齢者の調整 消費関数の形状 C=a+bY C =a + b1*Y + b2* Y2 (所得の2次関数) log(C)=a + b log(Y) (対数線形) あらかじめ,どの関数形が正しいかはわからない場合が多い
wage log(wage)を作成 メニューから 「変換」「変数の計算」を選択 右の画面の「目標変数」に新変数名を記入: lnwage 数式に計算式を記入: LN(wage) 「関数」から数学関数を選択してもよい 注意: SPSSでは自然対数はLN(), 常用対数はLG10() 論理式を用いた代入もできる 例) x= (y>100) y>100ならx=1, otherwise x=0
対数変換された賃金(lnwage)のヒストグラム
グラフの利用 回帰分析の前に,まずデータのチェック 変数の大まかな傾向をみる 回帰分析と散布図の違い 記述統計 ヒストグラム,散布図 データの誤入力 回帰分析と散布図の違い 回帰分析(重回帰分析):複数の要因 xとyの散布図:他の変数の影響はコントロールされていない
このグラフはE-Viewsで作成したもの 時系列データの分析 Philips.rawを読み込む フィリップス曲線 インフレ率と失業率の推移 このグラフはE-Viewsで作成したもの
付属のデータを活用してSPSSに慣れる サンプル・データ Helpの活用 SPSSの実行プログラムの入っているディレクトリー(フォルダー) Ver19では,通常は, C:\program files\ibm\spss\statistics\19\samples 以下のフォルダーに入っている Helpの活用