社会統計学Ic・統計科学I 第六回 ~仮説検証~

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
4. 統計的検定 ( ダイジェスト版 ) 保健統計 2014 年度. Ⅰ 仮説検定の考え方 次のような問題を考える。 2014 年のセンター試験、英語の平均点は 119 点であった。 T 高校では 3 年生全員がセンター試験を受験したが、受験生の中から 25 人を選んで調査したところ、その平均点は.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
第4章 統計的検定 統計学 2007年度.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
第4章補足 分散分析法入門 統計学 2010年度.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
検定 P.137.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
4. 統計的検定 保健統計 2009年度.
テーマ 自殺 ~なぜ地域差が出るのか~ 村瀬ゼミ.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
確率・統計Ⅱ 第7回.
貧困と出産の関係.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
統計学 西 山.
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
統計処理2  t検定・分散分析.
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第12回 西 山.
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

社会統計学Ic・統計科学I 第六回 ~仮説検証~ 社会統計学Ic・統計科学I 第六回 ~仮説検証~ 伊東 啓 いとう ひろむ

キャビネット一覧をクリック

講義連絡用キャビネット(教員・学生共用)をクリック

キャビネットファイル・フォルダを検索する で「統計」で検索 キャビネットファイル・フォルダを検索する で「統計」で検索 「統計学」 で検索

今日のないよう「仮説検証」 仮説検証は、今後学ぶ 「χ2検定」、「t検定」、「分散分析」 といった「検定」の基礎となる

仮説検証とは何か 白黒ハッキリさせなければならない問題に直面したとき、問題に対して答えを出す方法の1つ 例) 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」

仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説の設定 仮説: 正しいか否かの判断対象となる、母集団の性質について述べた文章のこと

仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説: 「自社のブランドAは、ライバル企業のブランドBよりも顧客の好意度が高い」 サンプルデータを使って正しいかどうか確かめる

仮説検証とは何か 問題: 「自社のブランドAと、ライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 仮説: 「自社のブランドAは、ライバル企業のブランドBよりも顧客の好意度が高い」 仮説がデータによって裏づけられたとき、 答え:

仮説検証のイメージ 正しい 正しくない サンプル・データによる裏付け 仮説 母集団

仮説検証 仮説の設定、サンプル・データによる検証を通して、ある事柄が正しいか否かを示す方法 サンプル・データによる検証の方法「検定」 検定: 複数の数値間の大小や差異に関する問題に答えを出すための方法

仮説検証と検定 例 問題: 「新しいテレビCMのA案とB案ではどちらの方が視聴者の好感度が高いか?」 答え: 「A案のほうが高い」 仮説検証と検定 例 問題: 「新しいテレビCMのA案とB案ではどちらの方が視聴者の好感度が高いか?」 答え: 「A案のほうが高い」 「B案のほうが高い」 「2つの案の間で差が無い」

仮説検証と検定 例 問題: 「ブランドAに対する評価は男女間で差があるか?」 答え: 「男女間で差がある」 「男女間で差が無い」

検定 つまり検定とは… 複数の数値のうちどれが大きいか(小さいか) 複数の数値間で差があるか(ないか) を統計的に判断するために使用される方法

仮説検証の手順 ①仮説を設定する ②仮説が正しいことをサンプル・データで示す

仮説検証の手順 問題: 「自社ブランドAとライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 ①仮説を設定する(設定すべき仮説は2種類) 帰無仮説:本当に言いたいことの否定 対立仮説:本当に言いたいこと

仮説検証の手順 問題: 「自社ブランドAとライバル企業のブランドBとでは、どちらの方が顧客からの評価が高いか?」 帰無仮説:本当に言いたいことの否定 「ブランドAとBとでは顧客の好意度に差が無い」 対立仮説:本当に言いたいこと 「ブランドAはBよりも顧客の好意度が高い」

仮説検証の手順 対立仮説:本当に言いたいこと 「ブランドAはBよりも顧客の好意度が高い」 対立仮説が正しいことをサンプル・データによって示す Ⅰ帰無仮説が正しいと言う前提に立つ Ⅱ帰無仮説が正しくないことをサンプル・データによって示す Ⅲ結果として対立仮説が正しいことを明らかにする

仮説検証の手順 帰無仮説 (本当に言いたいことの否定) 「Aの値とBの値との間で差が無い」 対立仮説 (本当に言いたいこと) 「Aの値はBの値より大きい」 「Aの値とBの値との間で差がある」

仮説検証の手順 例)母集団(顧客)からサンプル50人を抽出し、調査票で 「あなたはブランドAとBではどちらが好きですか?」 「ブランドAの方が好き」という人が1人だけ ⇒その人が偶然「ブランドAの方が好き」に過ぎない ⇒帰無仮説が正しいと言える

仮説検証の手順 例)母集団(顧客)からサンプル50人を抽出し、調査票で 「あなたはブランドAとBではどちらが好きですか?」 「ブランドAの方が好き」という人が2人 ⇒その2人が偶然「ブランドAの方が好き」に過ぎない ⇒帰無仮説が依然正しいと言える

帰無仮説が正しい確率が高い 帰無仮説の主張に反するサンプル・データが少ないとき ⇒それらのサンプル・データが発生したことは単なる 「偶然」だと考えられる ⇒帰無仮説が正しいと言う確率が高い

その逆は? 逆に 「ブランドAの方が好き」が10、20、30人…となれば? ⇒それらの人たちが偶然「ブランドAの方が好き」とは考えにくい ⇒帰無仮説が正しいと言いにくくなる

帰無仮説が正しい確率が低い 収集したサンプル・データが帰無仮説の主張に反して偏っているとき ⇒帰無仮説が正しいという確率は低い

判定 「ブランドAの方が好き」という人が少ないとき 帰無仮説: 「ブランドAとブランドBとでは顧客の好意度に差が無い」 →「正しい」 対立仮説 「ブランドAはブランドBよりも顧客の好意度が高い」 →「正しくない」

判定 「ブランドAの方が好き」という人が多いとき 帰無仮説: 「ブランドAとブランドBとでは顧客の好意度に差が無い」 →「正しくない」 対立仮説 「ブランドAはブランドBよりも顧客の好意度が高い」 →「正しい」

有意確率・有意水準 実際の判定では、 帰無仮説が正しい確率「有意確率(p)」を求め、 Pが十分低いとき: 帰無仮説が「正しくない」、対立仮説が「正しい」 Pが高いとき: 帰無仮説が「正しい」、対立仮説が「正しくない」 p有意水準は、5%もしくは1%に設定されることが多い

判定時の言葉遣い 帰無仮説が正しくないと判定:【棄却する】 対立仮説が正しいと判定:【採択する・支持する】 なんで? 「証明された」はダメなの?

判定時の言葉遣い 帰無仮説「ブランドAとBでは顧客の好意度に差がない」 が否定されたとする 対立仮説「ブランドAはBよりも顧客の好意度が高い」 が正しいと言えるが、 集めたサンプル・データを見る限りにおいて、対立仮説がとりあえず正しいと言えるに留まる

判定時の言葉遣い 新たにサンプル・データを集めたときに、 「どちらのブランドも同じくらい好き」 という人が偶然とはいえないくらい多く見つかってしまうと、 「ブランドAはBよりも顧客の好意度が高い」 は嘘になってしまう… 強い言い方「証明した」ではなく、控えめな「支持された」 を使おう

なんでこんな面倒なことを? 正しいことを、正しいと直接調べればいいのでは? 対立仮説だけ設定して証明すればいいのでは?

なんでこんな面倒なことを? 例)OO社がCMにタレントAを起用しようとする Aは男性に人気だが、女性にはイマイチ人気がない 消費者への好感度調査をして、男女間でAに対する人気に差があるか調べることにした 仮説:「タレントAは男女間で人気の差がある」

なんでこんな面倒なことを? 仮説:「タレントAは男女間で人気の差がある」 これを証明することは不可能に近い… 「差がある」って言っても、 「極めて大きな差がある」「大きな差がある」「中程度の差がある」「少し…」「極僅かだが…」… と程度は無限にある

なんでこんな面倒なことを? 「差がある」ことを証明するには、それらを裏付ける例を無限に集めなければならない そこで

なんでこんな面倒なことを? ①あえて言いたい事の否定を言ってみる 「タレントAは男女間で人気の差がない」(帰無仮説) ②もしAが好きという男性が多く居て、それが偶然でなければ、少なくとも は正しくないとハッキリ言える ③そうであれば、帰無仮説の否定である 「タレントAは男女間で人気の差がある」(対立仮説) がとりあえず正しいと言える

なんでこんな面倒なことを? なぜなら、 「差が無い」 という状態はたった1つしかないから これを否定すれば、「差がある」が正しいと言えるから 言いたい事を裏付ける例を無限に集めることを避けるための工夫⇒一見回りくどい手順

判定 正しい判定 帰無仮説が真のとき、帰無仮説を棄却しない 差があるときに、差がないと判定しない 対立仮説が真のとき、帰無仮説を棄却する 差があるときに、差があると判定する

誤った判定 誤った判定 帰無仮説が真であるのに、帰無仮説を棄却する 差がないのに、差があると判定してしまう誤り 第1種の誤り 対立仮説が真であるのに、帰無仮説を棄却しない 差があるときに、差があると判定しない誤り 第2種の誤り

有意水準は、5%もしくは1%に設定されることが多い 有意水準:第1種の誤りをおかす確率「危険率」 帰無仮説を棄却しない 帰無仮説を棄却する 帰無仮説が真 正しい判定 誤った判定 (第1種の誤り) 対立仮説が真 (第2種の誤り) 有意水準は、5%もしくは1%に設定されることが多い 有意水準:第1種の誤りをおかす確率「危険率」

片側検定 複数の数値間に大小関係があるかないかを明らかにする あらかじめどちらかの数値がもう一方より大きいをことが分かっているときにつかう 例)クーポンを配ると来客数が増加するが、統計的にそれは正しいのか? 対立仮説「AはBよりも大きい・多い・高い」など

両側検定 複数の数値間に差があるかないかのみ明らかにする あらかじめ大小関係がわからないときに使う 例)タレントAの人気は東京と大阪で差があるか? 対立仮説「AとB間に差がある」

検定は今後学ぶ 仮説検証は、今後学ぶ 「χ2検定」、「t検定」、「分散分析」 の基礎となる

引用、参考 1からのマーケティング分析 恩藏直人・冨田健司 数字で語る 社会統計学入門 ハンス・ザイゼル わかりやすい統計学 松原 望 数字で語る 社会統計学入門 ハンス・ザイゼル わかりやすい統計学 松原 望 総務省統計局 http://www.stat.go.jp/teacher/index.htm