Download presentation
Presentation is loading. Please wait.
1
社会統計学Ic・統計科学I 第六回 ~仮説検証~
社会統計学Ic・統計科学I 第六回 ~仮説検証~ 伊東 啓 いとう ひろむ
2
キャビネット一覧をクリック
3
講義連絡用キャビネット(教員・学生共用)をクリック
4
キャビネットファイル・フォルダを検索する で「統計」で検索
キャビネットファイル・フォルダを検索する で「統計」で検索 「統計学」 で検索
5
今日のないよう「仮説検証」 仮説検証は、今後学ぶ 「χ2検定」、「t検定」、「分散分析」 といった「検定」の基礎となる
6
仮説検証とは何か 白黒ハッキリさせなければならない問題に直面したとき、問題に対して答えを出す方法の1つ 例) 問題:
「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」
7
仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説の設定 仮説:
正しいか否かの判断対象となる、母集団の性質について述べた文章のこと
8
仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説:
「自社のブランドAは、ライバル企業のブランドBよりも顧客の好意度が高い」 サンプルデータを使って正しいかどうか確かめる
9
仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説:
「自社のブランドAは、ライバル企業のブランドBよりも顧客の好意度が高い」 仮説がデータによって裏づけられたとき、 答え:
10
仮説検証のイメージ 正しい 正しくない サンプル・データによる裏付け 仮説 母集団
11
仮説検証 仮説の設定、サンプル・データによる検証を通して、ある事柄が正しいか否かを示す方法 サンプル・データによる検証の方法「検定」 検定:
複数の数値間の大小や差異に関する問題に答えを出すための方法
12
仮説検証と検定 例 問題: 「新しいテレビCMのA案とB案ではどちらの方が視聴者の好感度が高いか?」 答え: 「A案のほうが高い」
仮説検証と検定 例 問題: 「新しいテレビCMのA案とB案ではどちらの方が視聴者の好感度が高いか?」 答え: 「A案のほうが高い」 「B案のほうが高い」 「2つの案の間で差が無い」
13
仮説検証と検定 例 問題: 「ブランドAに対する評価は男女間で差があるか?」 答え: 「男女間で差がある」 「男女間で差が無い」
14
検定 つまり検定とは… 複数の数値のうちどれが大きいか(小さいか) 複数の数値間で差があるか(ないか)
を統計的に判断するために使用される方法
15
仮説検証の手順 ①仮説を設定する ②仮説が正しいことをサンプル・データで示す
16
仮説検証の手順 問題: 「自社ブランドAとライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」
①仮説を設定する(設定すべき仮説は2種類) 帰無仮説:本当に言いたいことの否定 対立仮説:本当に言いたいこと
17
仮説検証の手順 問題: 「自社ブランドAとライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」
帰無仮説:本当に言いたいことの否定 「ブランドAとBとでは顧客の好意度に差が無い」 対立仮説:本当に言いたいこと 「ブランドAはBよりも顧客の好意度が高い」
18
仮説検証の手順 対立仮説:本当に言いたいこと 「ブランドAはBよりも顧客の好意度が高い」 対立仮説が正しいことをサンプル・データによって示す
Ⅰ帰無仮説が正しいと言う前提に立つ Ⅱ帰無仮説が正しくないことをサンプル・データによって示す Ⅲ結果として対立仮説が正しいことを明らかにする
19
仮説検証の手順 帰無仮説 (本当に言いたいことの否定) 「Aの値とBの値との間で差が無い」 対立仮説 (本当に言いたいこと)
「Aの値はBの値より大きい」 「Aの値とBの値との間で差がある」
20
仮説検証の手順 例)母集団(顧客)からサンプル50人を抽出し、調査票で 「あなたはブランドAとBではどちらが好きですか?」
「ブランドAの方が好き」という人が1人だけ ⇒その人が偶然「ブランドAの方が好き」に過ぎない ⇒帰無仮説が正しいと言える
21
仮説検証の手順 例)母集団(顧客)からサンプル50人を抽出し、調査票で 「あなたはブランドAとBではどちらが好きですか?」
「ブランドAの方が好き」という人が2人 ⇒その2人が偶然「ブランドAの方が好き」に過ぎない ⇒帰無仮説が依然正しいと言える
22
帰無仮説が正しい確率が高い 帰無仮説の主張に反するサンプル・データが少ないとき ⇒それらのサンプル・データが発生したことは単なる
「偶然」だと考えられる ⇒帰無仮説が正しいと言う確率が高い
23
その逆は? 逆に 「ブランドAの方が好き」が10、20、30人…となれば? ⇒それらの人たちが偶然「ブランドAの方が好き」とは考えにくい
⇒帰無仮説が正しいと言いにくくなる
24
帰無仮説が正しい確率が低い 収集したサンプル・データが帰無仮説の主張に反して偏っているとき ⇒帰無仮説が正しいという確率は低い
25
判定 「ブランドAの方が好き」という人が少ないとき 帰無仮説: 「ブランドAとブランドBとでは顧客の好意度に差が無い」 →「正しい」
対立仮説 「ブランドAはブランドBよりも顧客の好意度が高い」 →「正しくない」
26
判定 「ブランドAの方が好き」という人が多いとき 帰無仮説: 「ブランドAとブランドBとでは顧客の好意度に差が無い」 →「正しくない」
対立仮説 「ブランドAはブランドBよりも顧客の好意度が高い」 →「正しい」
27
有意確率・有意水準 実際の判定では、 帰無仮説が正しい確率「有意確率(p)」を求め、 Pが十分低いとき:
帰無仮説が「正しくない」、対立仮説が「正しい」 Pが高いとき: 帰無仮説が「正しい」、対立仮説が「正しくない」 p有意水準は、5%もしくは1%に設定されることが多い
28
判定時の言葉遣い 帰無仮説が正しくないと判定:【棄却する】 対立仮説が正しいと判定:【採択する・支持する】 なんで?
「証明された」はダメなの?
29
判定時の言葉遣い 帰無仮説「ブランドAとBでは顧客の好意度に差がない」 が否定されたとする
対立仮説「ブランドAはBよりも顧客の好意度が高い」 が正しいと言えるが、 集めたサンプル・データを見る限りにおいて、対立仮説がとりあえず正しいと言えるに留まる
30
判定時の言葉遣い 新たにサンプル・データを集めたときに、 「どちらのブランドも同じくらい好き」
という人が偶然とはいえないくらい多く見つかってしまうと、 「ブランドAはBよりも顧客の好意度が高い」 は嘘になってしまう… 強い言い方「証明した」ではなく、控えめな「支持された」 を使おう
31
なんでこんな面倒なことを? 正しいことを、正しいと直接調べればいいのでは? 対立仮説だけ設定して証明すればいいのでは?
32
なんでこんな面倒なことを? 例)OO社がCMにタレントAを起用しようとする Aは男性に人気だが、女性にはイマイチ人気がない
消費者への好感度調査をして、男女間でAに対する人気に差があるか調べることにした 仮説:「タレントAは男女間で人気の差がある」
33
なんでこんな面倒なことを? 仮説:「タレントAは男女間で人気の差がある」 これを証明することは不可能に近い… 「差がある」って言っても、
「極めて大きな差がある」「大きな差がある」「中程度の差がある」「少し…」「極僅かだが…」… と程度は無限にある
34
なんでこんな面倒なことを? 「差がある」ことを証明するには、それらを裏付ける例を無限に集めなければならない そこで
35
なんでこんな面倒なことを? ①あえて言いたい事の否定を言ってみる 「タレントAは男女間で人気の差がない」(帰無仮説)
②もしAが好きという男性が多く居て、それが偶然でなければ、少なくとも は正しくないとハッキリ言える ③そうであれば、帰無仮説の否定である 「タレントAは男女間で人気の差がある」(対立仮説) がとりあえず正しいと言える
36
なんでこんな面倒なことを? なぜなら、 「差が無い」 という状態はたった1つしかないから これを否定すれば、「差がある」が正しいと言えるから
言いたい事を裏付ける例を無限に集めることを避けるための工夫⇒一見回りくどい手順
37
判定 正しい判定 帰無仮説が真のとき、帰無仮説を棄却しない 差があるときに、差がないと判定しない 対立仮説が真のとき、帰無仮説を棄却する
差があるときに、差があると判定する
38
誤った判定 誤った判定 帰無仮説が真であるのに、帰無仮説を棄却する 差がないのに、差があると判定してしまう誤り 第1種の誤り
対立仮説が真であるのに、帰無仮説を棄却しない 差があるときに、差があると判定しない誤り 第2種の誤り
39
有意水準は、5%もしくは1%に設定されることが多い 有意水準:第1種の誤りをおかす確率「危険率」
帰無仮説を棄却しない 帰無仮説を棄却する 帰無仮説が真 正しい判定 誤った判定 (第1種の誤り) 対立仮説が真 (第2種の誤り) 有意水準は、5%もしくは1%に設定されることが多い 有意水準:第1種の誤りをおかす確率「危険率」
40
片側検定 複数の数値間に大小関係があるかないかを明らかにする あらかじめどちらかの数値がもう一方より大きいをことが分かっているときにつかう
例)クーポンを配ると来客数が増加するが、統計的にそれは正しいのか? 対立仮説「AはBよりも大きい・多い・高い」など
41
両側検定 複数の数値間に差があるかないかのみ明らかにする あらかじめ大小関係がわからないときに使う
例)タレントAの人気は東京と大阪で差があるか? 対立仮説「AとB間に差がある」
42
検定は今後学ぶ 仮説検証は、今後学ぶ 「χ2検定」、「t検定」、「分散分析」 の基礎となる
43
引用、参考 1からのマーケティング分析 恩藏直人・冨田健司 数字で語る 社会統計学入門 ハンス・ザイゼル わかりやすい統計学 松原 望
数字で語る 社会統計学入門 ハンス・ザイゼル わかりやすい統計学 松原 望 総務省統計局
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.