調査法B (心理カウンセリング学科・カウンセリング研究コース) 第2講 2008年10月10日 担当:岡田佳子
先週の感想より 統計が苦手なので、統計の箇所は丁寧に解説してほしい・・・ ⇒という要望が多かったので、今日は、少し統計的なことの復習をしながら、「調査」というものについて考えてみたいと思います。
第2講 母集団と標本・ サンプリングの方法
今日の授業の予定 記述統計と推測統計の復習 (母集団と標本) サンプリングの方法
記述統計と推測統計の復習 (母集団と標本)
データ解析の流れ データの記述 (記述統計) 統計的推測 (推測統計) ⇒検定・推定 (t検定・分散分析・・・等) データの収集 データの記述 (記述統計) 統計的推測 (推測統計) ⇒検定・推定 (t検定・分散分析・・・等) ⇒度数分布、平均値、標準偏差、相関・・・等
記述統計と推測統計の違い 記述統計と推測統計の実例 (うん年前の私の修論より)
私の卒業論文より 中学生のストレスを調査(550人の中学生にアンケートを実施) この1週間の間に,次のような状態をどのくらい経験しましたか. 1.まったくなかった,2.たまにあった,3.しばしばあった,4.大体いつもあった, の中からひとつだけ選んで数字に○をつけて下さい まったくなかった あった たまに しばしばあった 大体いつもあった 1.ゆううつだ 1 2 3 4 2.気分が沈む 3.不安を感じる 4.いらいらする 5.はらがたつ 6.泣きたい気分だ 7.気がめいる 8.むなしい感じがする ・・・・・
中学校の校長先生に「結果を報告してください」と言われた時・・・ データそのまま(row data)・・・550人分 ・・これだけ見てもなんにもわからない ⇒記述統計
記述統計ってなに? ひとことで言うと「データを要約すること」 ⇒度数分布、平均値、分散、相関係数といった数値要約の指標を用いてデータを記述する ⇒データから最大限の情報を獲得する
度数分布・平均値(1)
平均値(2) 性別や学年でストレスの度合いは違うんじゃないかな(仮説)? 男女、学年ごとにストレス得点の平均値を出して比べてみる 今回データをとった550人では、1,2年生より3年生の方が怒りの平均値が高い 今回データを取った550人では、男子より女子の方が怒りの平均値が高い
グラフで表現する
ここまでが「記述統計」の話だった 復習OK?
でもちょっと待って!! 私の卒業論文のタイトルは 「中学生のストレスに関する研究」 “日本の中学生全般”について研究したい でも、550人のデータを集計して記述統計出しても 「今回データをとらせてもらった550人の中学生のストレスに関する研究」 “データをとらせてもらった550人”についてしか研究できていない!
記述統計はデータをとらせてもらった学校の校長先生に「おたくの学校の生徒さんのストレスは~~といった特徴がありますよ」と報告する場合にはよい しかし、「中学生(全般)のストレスには~~といった特徴がある」といった議論はできない 別の中学生550人に調査したら、結果が異なるかもしれない
たまたまじゃない? 1,2年生より3年生の方がイライラしているのは、この学校の3年生がたまたま荒れている学年でイライラしている子が多かったのでは? この学校の地域が特別受験熱が熱い地域だからじゃない? 男子より女子の方がイライラしているのは、この学校の女子がたまたまストレスが溜まっている子が多かっただけでは? このような可能性に対して、記述統計だけではなにも言えない。 かといって、日本の中学生全員に調査することは時間的にもお金的にも不可能に近い
そこで「推測統計」の出番
記述統計と推測統計 記述統計 数量的データを整理要約し、そのデータが表す集団の性質を出来るだけ簡潔に、また明確に記述表現して、伝えることを可能にすることが目的 推測統計 得られた標本から母集団についての推測を行うことが目的 サンプリング 得られた標本 そのデータが表す集団 550名 全中学生 (母集団) 推定・検定
手元にあるデータの背後にある、さらに大きな対象(母集団)について推測することを試みる 記述統計は・・・ 550人分のデータの度数分布を求めたり、平均や標準偏差を求めたり・・・ 手元にあるデータについて、そこだけを対象とした分析 手元のデータの中だけで完結した分析 推測統計は・・・ 手元にあるデータの背後にある、さらに大きな対象(母集団)について推測することを試みる
記述統計と推測統計(つづき) 知りたいこと 手元のデータ(標本) 一部をサンプリング 千葉の中学生 550人 母集団 (日本の全中学生) 真の平均 ? (神のみぞ知る) 推測統計 550人の平均から母集団の平均を推測する 記述統計 手元のデータから計算される 平均・標準偏差・・・
標本調査の身近な例 (推測統計の考え方を使った調査) 内閣支持率 「私、聞かれた覚えないけど?」 ⇒有権者全員を調査対象として調査するのは時間的にもお金的にも無理 ⇒統計の理論を用いて、サンプリング ⇒有権者の一部(サンプル)に調査して「支持率は○%でした」と報告 テレビの視聴率 「うちのテレビに何の機械もついてないけど?」 ⇒関東の場合、たった600世帯のデータから視聴率を出している ⇒600世帯は統計の理論を用いて、サンプリング ※例外 国勢調査(=全数調査)
サンプリングの方法について見ていきましょう サンプリングって大事 標本調査の結果から出来るだけ正確に母集団の姿を推定するには・・・ いかに、母集団を代表するサンプリングが行えるか・・・が大切 いかに、偏りのないミニチュアが作れるか? そこで・・・ サンプリングの方法について見ていきましょう
サンプリングの方法
調査の手順
調査対象者を定義する 調査目的や方法に応じて調査対象の範囲を決める 例)子どものストレスを調査する 調査目的や方法に応じて調査対象の範囲を決める 例)子どものストレスを調査する ・子どもとは?小学生?中学生?高校生も含む?⇒中学生 ・学校に来ていない生徒は含めるのか?⇒通学している生徒に限定 ・中高一貫校や私立も含めるのか?⇒高校受験のある公立校に限定…など
母集団を決める 母集団 調査で情報を得たいと考えている対象者全員 例)日本全国の中学生/東京の中学生/○○中学校の生徒
調査対象者を決める サンプリング方法を決める 1.全集調査か標本調査か? 全数調査 母集団の構成員全員から調査する方法 標本調査 母集団から一部の人々を取り出し、それらを対象者として調査し、その結果から母集団の姿を推定する方法 サンプル(標本):取り出された一部の対象 サンプリング(標本抽出):サンプルを取り出すこと
全数調査・標本調査の例 全数調査の例 教師が自分の学級のストレスの実体を知りたい、管理職が自分の職場のストレスの実態を知りたい 国勢調査(母集団の規模が大きい全数調査。例外的) 標本調査の例 日本の公立中学に通う中学生のストレスを知りたい ⇒全国から1000名の中学生をサンプリングし ⇒1000名の結果から日本の全中学生の姿を推定
2.無作為抽出法か有意抽出法か? 無作為抽出法 有意抽出法 *「母集団をできるだけ代表するようなサンプル」を抽出するために… 調査者の主観が入らないようにランダムにサンプリング ⇒調査結果から母集団の姿を統計的に推定可能 有意抽出法 調査者が主観的に選び出す方法(数学的裏づけなし) ⇒調査結果から母集団の姿を統計的に推定不可能 (結果を過度に一般化することは避けなければならない)
無作為抽出の方法
無作為抽出のために必要なもの 母集団構成員のリスト(サンプリング台帳) 例)住民基本台帳・選挙人名簿 電話帳・同窓会名簿・企業などの名簿
無作為抽出の方法 母集団から直接サンプルを抽出する方法 ・単純無作為抽出法 ・系統抽出法 大規模な母集団からサンプリングする方法 ・多段抽出法 ・層化抽出法 母集団がかなり大きい場合 ・層化2段抽出法(層化抽出と2段抽出の組合せ)
具体例で考えてみましょう 長野県の○○市の中学1年生を対象に学校ストレスの調査をしたい。 サンプリングしたい人数:約100名程度 学校の構成(架空) 中学校9校(1年生21学級・生徒数636名) 小規模校(1学年2学級以下):5校 中規模校(1学年3学級以上):4校
単純無作為抽出法 636名全員分の名簿を用意 ↓ 1番から通し番号をつける 乱数表などを用いて100人分抽出 1.○○○○ 2. ○○○○ 3. ○○○○ 4. ○○○○ 100. ○○○○ 636. ○○○○ 636名全員分の名簿を用意 ↓ 1番から通し番号をつける 乱数表などを用いて100人分抽出 ・・・・・・・ ・・・・
系統抽出法 636名全員分の名簿を用意 ↓ 1番から通し番号をつける 1番目のサンプルをランダムに定める 一定の周期で100人分抽出 1.○○○○ 2. ○○○○ 3. ○○○○ 4. ○○○○ 100. ○○○○ 636. ○○○○ 6人 ・・・・・・・ 6人 ・・・・
多段抽出法 第1段階 第2段階 D組(32名) B組(34名) A組(33名) 9校から無作為に3校選ぶ 1学級ずつ無作為に選ぶ 約100名 各学級全員を調査する
2:1 層化抽出法 4校・416名 5校・220名 学校規模で層化 70名 37名 中規模校 小規模校 学校規模が学校ストレスに影響する要因であった場合 学校規模で層化 中規模校 小規模校 4校・416名 2:1 5校・220名 名簿を用いて それぞれ 1/6を系統抽出 70名 37名 約100名
層化2段抽出法 学校規模で層化 第1段階 第2段階 D組(32名) E組(30名) A組(33名) B組(30名) 中規模校 小規模校 各層から無作為に2校抽出 第2段階 D組(32名) E組(30名) A組(33名) B組(30名) 1学級ずつ無作為に選ぶ 約120名
有意抽出の方法
有意抽出法 割り当て法:考え方は層化抽出と同じだが、主観でやる。 典型法:主観で典型的なメンバーを選ぶ。 縁故法:友だちにお願い。自分の生徒にお願い。 募集法:新聞などを使って募集。 便乗法:塾のセミナーに来た母親に、子どものソーシャルスキルの調査を依頼。 偶然法:駅で電車を待っている人、街を歩いている人。
演習 大学生の調査(実習や卒論)では、「有意抽出法」を用いることが多いです。 確かに、調査対象へのアクセスが容易で、費用・労力・時間が少なく、台帳も必要ないので便利ですが、注意点を十分に押さえておくことが重要です。 有意抽出法を用いる場合の注意点を話し合ってみましょう。
有意抽出法を用いる場合の注意 本来は「統計的検定が適用できるのは無作為抽出されたサンプルだけ」であることを忘れずに。 なるべく母集団を代表するように抽出する 結果を過度に一般化することは避ける。 以下の点に注意 母集団と仮定しているものは何か? 抽出されたサンプルはそれを代表しているか? 得られた調査結果をどの範囲に適用したいのか? もちろん、無作為抽出が可能であればできるだけそれを用いた方がよい。