第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
Maximal likelihood 法に基づく Matched filter について 田越秀行(阪大理) LCGT コヒーレンス解析 WG 修正 Ref: Finn, PRD63, (2001) Pai, Dhurandhar, Bose, PRD64,
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第2回授業 (10/2)の学習目標 第5章平均値の差の検定の復習を行う。 (詳細を復習したい者は、千野のWEB頁の春学期パワ
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
重回帰分析入門 経済データ解析 2009年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
第13回授業(7/10-1) での学習内容 6月19日に宿題にした平均値の差の検定結果、及び7月3日の授業で実習した同検定結果のウェブ上での検算のやり方を学習する。 この検算の宿題は、春期定期試験の時に、今日渡す2枚目の出欠表の裏に授業中の手計算による結果と比較して、手計算の結果が正しかったかを報告する。
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
母分散が既知あるいは大標本の 平均に関する統計的検定
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
心理統計学 II 第8回(11/20) 授業の目標 相関係数の検定のWEB宿題のやり方
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第2日目第1時限の学習目標 順列、組み合わせ、確率の入門的知識を学ぶ。 (1)順列とは? (2)組み合わせとは? (3)確率とは?
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
1.母平均の検定:小標本場合 2.母集団平均の差の検定
analysis of survey data 堀 啓造
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表分析補遺 。堀 啓造(香川大学経済学部) 2003年5月.
クロス表とχ2検定.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習 2変量間の連関の強さの統計的有意性検定の理論と方法を学ぶ。 第1日目第3時限での演習(3)で使ったデータのカイ2乗統計量(イエーツの修正済み)を用いて、当該カイ2乗統計量の統計的有意性検定の演習を行う。

カイ2乗統計量の統計的有意性検定(1) 連関のカイ2乗統計量の復習 カイ2乗統計量の統計的有意性検定(1)     連関のカイ2乗統計量の復習 第1日目第3時限のスライドを見て、2つの名義尺度間の連関のカイ2乗統計量について復習をしよう。

カイ2乗統計量の統計的有意性検定(2) カイ2乗統計量の理論分布(1) カイ2乗統計量の統計的有意性検定(2)    カイ2乗統計量の理論分布(1) 既に述べた、一般の r ×s 分割表の場合の(ピアソンの)カイ2乗統計量 は、2変量間に関連がない、という帰無仮説のもと で、近似的に自由度 ν=(r-1)(s-1) なるカイ2乗分布に従うことがわかっている。

カイ2乗統計量の統計的有意性検定(3) カイ2乗統計量の理論分布(2)(参考) カイ2乗統計量の統計的有意性検定(3)   カイ2乗統計量の理論分布(2)(参考) それでは、一般に、自由度 ν のカイ2乗分布とは、どんな分布であろうか。この理論分布(密度関数)は、つぎのように書かれる:

カイ2乗統計量の統計的有意性検定(4) カイ2乗統計量の理論分布(3)(参考) カイ2乗統計量の統計的有意性検定(4)   カイ2乗統計量の理論分布(3)(参考) ここで、Γ(ν/2) はガンマ関数と呼ばれ、次式で定義される:

カイ2乗統計量の統計的有意性検定(5) カイ2乗統計量の理論分布(3)(参考) カイ2乗統計量の統計的有意性検定(5)  カイ2乗統計量の理論分布(3)(参考) 自由度2以下のカイ2乗分布は、単調な減少関数となる。 一方、自由度が2より大きい場合のカイ2乗分布は右のような図となる。 確率 ν-2 x

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(1) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(1) つぎに、第1日目に計算した永平寺データの「性と坐禅指導の評価」間の関連性のカイ2乗統計量をもとに、当該2変量間には統計的に有意な関連がみられるかどうかを見てみよう。 そのためには、まず当該分割表の行数が2、列数が3であることを思い出し、カイ2乗分布の自由度が、ν=(2-1)(3-1)=2 となることに注意しよう。 さらに、既に第1日目に見せたように、このデータの期待度数はすべて5以上なのでイエーツの修正は不要であることにも注意しよう。

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(2) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(2) もし統計ソフトを利用しないならば、つぎのようなカイ2乗分布の棄却点についての数値表を見て、検定の危険率と上記自由度に対応する棄却点の値を読みとり、上記カイ2乗統計量と比較し、 カイ2乗統計量の値が、棄却点の値以上ならば、帰無仮説を棄却する。このことは、性と坐禅の評価の間には有意な関連があることを意味する。 そうでなく、カイ2乗統計量の値が、棄却点の値未満ならば、帰無仮説を採択する。このことは、性と坐禅の評価の間には有意な関連が見られないことを意味する。

自由度 ν の χ2-分布の棄却点の値の読み取り方 α のこと p ν   0.90 0.80 … 0.05 0.01 1 .016 .064 3.841 6.635 2 .211 .446 5.991 9.210 3 .584 1.649 7.815 11.345 ∶ 30 20.599 23.364 43.773 50.892

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(3) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(3) この表を見ると、明らかにデータから計算されるカイ2乗統計量の値から、性と坐禅の評価の間には少なくとも1%水準で統計的に有意な関連があると言える。 一方、国際的な統計ソフトの1つである SAS の出力を見ると、以下のようになり、両者の間には1%以上の高い水準で、性と坐禅の評価の間には少なくとも1%水準で統計的に有意な関連があることがわかる。

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(4) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(4) Statistic DF Value Prob Chi-Square 2 17.889 0.000 Likelihood Ratio Chi-square 20.400 Statistic の項の Chi-square の項が、ピアソンのカイ二乗検定結果、Likelihood …の項が、尤度比カイ二乗検定結果である。 通常は、ピアソンのカイ二乗検定の p 値を見る。この例からは、両変数間には1パーセント以上の高い水準で有意な関連性があることがわかる。

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(5) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(5) いずれにせよ、性と坐禅の評価の間には統計的に有意な関連があることがわかったので、最後に我々は第1日目に示した各セルの実度数、期待度数、セルカイ2乗値を見ながら、どのセルに両変量間の関連性の特徴が顕著に表れているのかを検討すると良い。 その際、注意すべきは、われわれは各セルの実度数のみで当該セルの度数の多少を論じてはいけない、ということである。なぜならば、実度数は各行や各列の合計(すなわち周辺度数)に依存しており、周辺度数の異なる行や列の実度数の単純な比較は問題があるからである。

性と坐禅指導の評価間の分割表情報 厳し 過ぎた 適当 もっと 厳しく 計 男 27 22.0 1.13 275 292.6 1.06 75  過ぎた 適当 もっと 厳しく  計 男   27 22.0 1.13 275 292.6 1.06 75 62.3 2.57 377 女 3 8.00 3.12 124 106.4 2.93 10 22.66 7.07 137 30 399 85 514 実度数 期待度数 セルカイ二乗

カイ2乗統計量の統計的有意性検定(5) 永平寺データの例での有意性検定(6) カイ2乗統計量の統計的有意性検定(5)  永平寺データの例での有意性検定(6) この表のセルのうち、赤印で示したのは、各セルのセルカイ2乗値の相対的に大きいもの3つである。 これらのセルは、当該分割表のカイ2乗値に対して大きく貢献しているセルであるので、これらのセルの特徴を見ることは、上記目的に合致する。 これらの各セルについて、各セルの実度数が多いか少ないかは、各セルの期待度数と比較すればよい。 例えば、女子で(坐禅指導を厳しすぎたとする)者(3名)は、(期待度数 8 名ほどに比べて)少なかったと言える。

演習9 演習(2)で作成し、演習(3)で計算した各自の2×2分割表(性と向性)間の分割表のカイ2乗統計量を用いて、性と向性の間の関連性に有無の検定を行え。 帰無仮説の採択または棄却を、さきほどのカイ2乗統計量の棄却点の値を読み取り、決定せよ。 この場合、カイ2乗統計量の自由度は、幾つか。 最後に、統計ソフト SAS を用いて、検算をしてみよう。