第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
1 変量データの記述 (度数分布表とヒストグラム) 経済データ解析 2009 年度後 期. あるクラスのテストの点数が次のように なっていたとする。 このように出席番号と点数が並んでいるものだけでは、 このクラスの特徴がわかりづらい。 → このクラスの特徴がわかるような工夫が必要 → このクラスの特徴がわかるような工夫が必要.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
統計学 第3回 西山. 第2回のまとめ 確率分布=決まっている分布の 形 期待値とは平均計算 平均=合計 ÷ 個数から卒業! 平均=割合 × 値の合計 同じ平均値でも 同じ分散や標準偏差でも.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
MS-EXCEL、 OpenCalcを 用いた表計算
統計解析 第3章 散布度.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
ローレンツ曲線とジニ係数 度数分布表の応用 ローレンツ曲線の意味 ローレンツ曲線の作成 ジニ係数.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計解析 第7回 第6章 離散確率分布.
第3章 2変量データの記述 統計学基礎 2010年度.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
計算値が表の値より小さいので「異なるとは言えない」。
統計学 第3回 10/11 担当:鈴木智也.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
1変量データの記述 経済データ解析 2006年度.
(ラプラス変換の復習) 教科書には相当する章はない
analysis of survey data 第3回 香川大学経済学部 堀 啓造
論理回路 第8回
analysis of survey data 第2回 堀 啓造
心理統計学 II 第8回(11/20) 授業の目標 相関係数の検定のWEB宿題のやり方
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
6. ラプラス変換.
第2日目第1時限の学習目標 順列、組み合わせ、確率の入門的知識を学ぶ。 (1)順列とは? (2)組み合わせとは? (3)確率とは?
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
中澤 港 統計学第4回 中澤 港
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
pp-wave上の共変的超弦の場 における低エネルギー作用
analysis of survey data 堀 啓造
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
4. システムの安定性.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
本時の目標 相対度数の意味を理解し、二つのデータを比較してその傾向を分析することができる。
データ解析 静岡大学工学部 安藤和敏
クロス表とχ2検定.
度数分布表における平均・分散 (第1章 記述統計の復習 補足)
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
解析学 ー第9〜10回ー 2019/5/12.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
第2章 統計データの記述 データについての理解 度数分布表の作成.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
データ分布の特徴 基準化変量 歪度 尖度.
回帰分析入門 経済データ解析 2011年度.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1    カイ二乗統計量とその修正法について学ぶ。     (1)r×s 分割表の場合     (2)2×2 分割表の場合      

2変量データを手にした時の 分布の特徴の記述-8 2変量データを手にした時の        分布の特徴の記述-8 この授業では、これらのうち、   (1)名義尺度レベルの対データの場合の代表的な連関の関連性の検討のための統計量であるピアソンのカイ2乗統計量と、   (2)間隔尺度レベル以上の対データの場合の代表的な2変量間の関連性の指標である共分散及び相関係数 についてのみ、簡単に触れる。

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(1) 表中、黒色の f は度数を表す。 青色の f は行や列それぞれの合計で、 f1•, f2•, …, fr•, 及び f•1, f•2, …, f•s は、すべて周辺度数と呼ばれる。 B1 B2 … Bs 計 A1 f11 f12 f1s f1• A2 f21 f22 f2s f2• : Ar fr1 fr2 frs fr• f•1 f•2 f•s N

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(2)

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(3) カイ二乗統計量における、f は実度数、g は期待度数と呼ばれる。 定義式から明らかなように、カイ二乗統計量は、分割表の各セルの実際に観測される度数 f と両属性間に関連がない時に期待される度数 g の差を二乗し、それを期待度数 g で除したものの総和である。

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(4) 例えば、右表の実度数   3 に対する期待度数は、 厳し過ぎた  適当 もっと厳しく  計 男 27 275 75 377 女  3 124 10 137 計 30 399 85 514 と計算される。

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(5) すなわち、女子で 「厳し過ぎた」 と思った学生の実際の度数(実度数)3名に対して、(2つの属性間に関連がみられないと仮定した時)このセルに期待される度数(期待度数)は、およそ     8 (=7.996)、   ということである。 厳し 過ぎた  適当 もっと厳しく  計 男 27 275 75 377 女  3 124 10 137 計 30 399 85 514

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(6)  同様に、右表の実度数 75 に対する期待度数は、 厳し 過ぎた  適当 もっと厳しく  計 男 27 275 75 377 女  3 124 10 137 計 30 399 85 514 と計算される。

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(7) 最後に、「性と坐禅指導の評価」間の関連性のカイ2乗統計量を計算するために、まず各セルの実度数から期待度数とセルカイ2乗を計算すると、つぎのような表になる。 これをもとに、 「性と坐禅指導の評価」間の関連性のカイ2乗統計量を計算してみよう。

性と坐禅指導の評価間の分割表情報 厳し 過ぎた 適当 もっと 厳しく 計 男 27 22.0 1.13 275 292.6 1.06 75  過ぎた 適当 もっと 厳しく  計 男   27 22.0 1.13 275 292.6 1.06 75 62.3 2.57 377 女 3 8.00 3.12 124 106.4 2.93 10 22.66 7.07 137 30 399 85 514 実度数 期待度数 セルカイ二乗

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(8) うえの情報から、性と坐禅指導の評価の間の関連性のカイ2乗統計量を計算すると、定義より、

基本的な2変量統計量ー1 r×s 分割表の場合のカイ二乗統計量(9) 先の時限で既に紹介した、クラメールの V、チュプロウの T、ピアソンの一致係数 C は、上記カイ二乗統計量を少し修正したもので、つぎのように書ける。ここで、φ2=χ2/N とする:

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(1) 基本的な2変量統計量ー1  2×2 分割表の場合のカイ二乗統計量(1) 一般の r×s 分割表に対して、2×2 分割表の一般形を示すと、右の表のようになる。 ここで、セル内の度数は、fij のような形でなく、簡単に a, b, c, d と書くとする。 A/B B1 B2 計 A1 a b a+b A2 c d c+d a+c b+d N

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(2) 基本的な2変量統計量ー1  2×2 分割表の場合のカイ二乗統計量(2) 2×2 分割表の場合、r×s 分割表のカイ二乗統計量は、より簡単な形に書くことができる。これが、つぎに示す統計量である:

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(3) 基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(3) イエーツの修正法   一般に分割表では、セル内のいずれか1つでも期待度数が5以下のものが存在するときは、カイ二乗分布が歪むことをイエーツ(Yates, 1934) が示した。 この歪みの補正は、イエーツの連続性の補正 (Yates’ correction of continuity) と呼ばれる。

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(4) 基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(4) 2×2分割表の場合のイエーツの修正は、つぎのとおり。 すなわち、上記カイ二乗の分子のカッコ内 ad-b c を、

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(5) 基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(5) 例えば、右の表の分割表では、カイ二乗値を計算する前に、各セルの期待度数を計算すると、右の赤印の数値となる。 明らかに、この分割表には、期待度数が5以下のセルがある。 A/B B1 B2 計 A1 3 4.05 6 4.95 9 A2 5 6.05 11 20

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(6) 基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(6) そこで、カイ2乗値は、次のようにイエーツの修正を施す必要がある: すなわち、まず ad-bc を計算すると、a=3、b=6、c=6、d=5 なので、-21となる。一方、N/2=20/2=10 である。そこで、

基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(7) 基本的な2変量統計量ー1 2×2 分割表の場合のカイ二乗統計量(7) そこで、われわれは、イエーツに従い、通常の2×2分割表のカイ二乗値の計算式の分子のカッコ内の ad-bc の代わりに、 としなければならない、すなわち

セル内の期待度数が少ない場合の対処法-2(一般の分割表の場合) 一般の r×c 分割表の場合の、(連続性の)補正方法としては、SAS Institute (1990, p.339) は Fienberg (1977, p.21) のつぎの公式をあげている: ここで、上のカイ二乗統計量の自由度は、補正 前と同一である。

演習(3) 2時限目に作成した、2×2分割表を用いて、イエーツの修正後のカイ二乗統計量を計算せよ。 計算が終わったら、SAS プログラムで計算があっているかどうかを確認しよう。