Windows 環境から SAS を使う 長野 祐一郎 1. データのダウンロード 2. データの加工 3. プログラムの作成 4.TeraTerm によるプログラムの実行 5. 処理結果の確認 6.SAS のデータ処理を概観 今回の授業では、 Windows 環境で作成されたデータを UNIX 環境に移動し、 SAS によって処理する方法を学ぶ。 1. テキストエディタ( TeraPad )により、文字コード・改行コードの変更ができるようになる。 2.Windows 用端末エミュレータ( TeraTerm )により、 Windows 環境から UNIX を使えるようになる。 3.SAS から出力された統計処理結果を Windows 環境で閲覧できるようになる。 今回の授業では、 Windows 環境で作成されたデータを UNIX 環境に移動し、 SAS によって処理する方法を学ぶ。 1. テキストエディタ( TeraPad )により、文字コード・改行コードの変更ができるようになる。 2.Windows 用端末エミュレータ( TeraTerm )により、 Windows 環境から UNIX を使えるようになる。 3.SAS から出力された統計処理結果を Windows 環境で閲覧できるようになる。
LETS.csv を開いて中身を確認す る 大学生男女 56 人分の恋愛の類型に関する測定結 果である。 Eros 等の意味するところは次ページを参照のこ と。 より、「 LETS 測定結果」を左クリックし、ダイアログ で「ファイルを保存する」を選び、デスクトップにサンプルデータを保存する。 サンプルデータのダウンロード
恋愛の類型 高校生~大学生(平均 18.4 歳 148 名の平均値) Lee(1974) は、文学や哲学書をベースに恋愛に関する記述を集め、さらに実際の調査にも基づき、恋愛 には 6 種類の基本類型が存在することを確かめた。これらは、松井ら( 1990 )により、日本語化されてい る。 平均を基準として、 +1SD 以上・・・高すぎる +-1SD 以内・・・普通 -1SD 以下・・・低すぎる となる。
TeraPad で LETS.csv を開く TeraPad を起動したら、ウィンドウに LETS.csv をドラッグアンドドロップする。 すると左記のように、データが表示される。 CSV ファイルとは、カンマで区 切られた、ただのテキストファイルであることがわかる。 文字コードと改行コードを UNIX に合わ せて変更する ファイルメニューから、「文字 / 改行コード指定保存」を 選び、 文字コードは EUC 、改行コードは LF 、としておく。このよ うに変更すると、 Windows で作成したテキストファイル を UNIX で扱う事ができるようになる。その際、 1 行目の 「 age,sex ・・・」を消しておくようにする。 正しく変更されると、ウィンドウの右下 に「 EUC 」「 LF 」の文字が表示される。
TeraPad で LETS.sas を作成する TeraPad を起動し、左記のようにプログラムを入力する。保存 する際、ファイル名は「 LETS.sas 」とし、 LETS.csv と同様に文 字コードは EUC 、改行コードは LF 、としておく。 UNIX 環境へデータを移動する UNIX のディレクトリに「 LETS 」というフォルダを新たに作 成し、 LETS.csv および LETS.sas を移動する。
TeraTerm を起動する Host は、 vigotsky.hum.u-bunkyo.ac.jp とする。 Service は、 SSH を選択する。 ユーザーネームとパスワードを UNIX 環境使 用時と同様に入力する。すると、ログインが 完了し、通常端末エミュレータで見ているの と同様の画面が表示される。
LETS.sas を実行する 1. ディレクトリ LETS に移動する。 2.ls でディレクトリリストを見る( LETS.csv と LETS.sas があるは ず)。 3.sas LETS.sas と入力し、作成したプログラムを実行する。 4.ls でディレクトリリストを見る。 LETS.log と LETS.lst が作成されているはず。 LETS.lst を確認する TeraPad を起動し、作成された LETS.lst をドラッグアンドドロップする。 下記のように、平均、標準偏差などの計算結果を TeraPad 上で確認す ることができる。
SAS LETS.sas LETS.csv LETS.log LETS.lst SAS がプログラムを実行するイメージ図 入力 プログラムとデータを SAS に食わせる 処理 SAS がプログラムにしたがって データを分析 出力 分析結果を lst ファイ ルに出力 必要に応じて上記の処理を繰り返す。 TeraPad でプログラムを修正し、 TeraTerm でプログラ ムを実行すると、出力結果 (LETS.lst) の内容が変化す る。今後は、必要に応じて、プログラムの処理を書 き換えて行く事になる。 左記のように、 by sex; を追加したプログラムを実行 すると出力結果はどのようになるだろうか?
データを並べ替える データを全て選択したら、データタブの並べ替 えアイコンを選択し、ダイアログから最優先さ れるキーを sex に設定し、並べ替える。
平均と SD (標準偏差)を計算す る 全体平均と女性・男性の各平均値を算出する。 同様に、 SD も算出し、左図のように表にまとめ る。 平均の式 =average( 範囲選択 ) SD の式 =stdev( 範囲選択 )
棒グラフを描く 平均データを選択したら、挿入タブからグラフ を選び、さらに 2D 縦棒を選択し、棒グラフを描 く。 さらに、グラフを選択した状態で、レイアウト タブから、誤差範囲を選択し、その他の誤差範 囲オプションを選び、エラーバーを設定する。 ファイルを保存する ファイルタブから「名前を付けて保存」を選択 し、デスクトップに「 Excel ブック」形式で保存 する(「ファイルの種類」を一番上の「 Excel ブック」 にして保存する)。 このようにする事で、ファイル名が 「 LETS.xlsx 」となり、グラフや計算式等がデー タと一緒に保存される( csv 形式のままだと、グ ラフ等のデータは保存されないので注意)。