keyword クロス集計表 (教科書:47ページ~54ページ,77ページ~81ページ) 観測度数と期待度数 相対度数 独立性

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
社会福祉調査論 第 8 講 統計の基本的整理 12 月7日. 【目標】 量的調査の集計方法、結果の示し方につ いて、基礎的な手法を習得する。 統計値を捉えるための諸指標を理解する。
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
MS-EXCEL、 OpenCalcを 用いた表計算
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ解析基礎 2. 度数分布と特性値 keyword データの要約 度数分布表,ヒストグラム 分布の中心を表す基本統計量
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
統計解析 第7回 第6章 離散確率分布.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
検定 P.137.
実証分析の手順 経済データ解析 2011年度.
統計学 第3回 「データの尺度・データの図示」
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
データ分析2 1.平均値の比較のタイプ 2.対応のあるt検定 3.対応のないt検定 4.3つの以上のグループの差を調べる 5.参考文献
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
確率・統計Ⅱ 第7回.
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
マーケティング・リサーチ.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
12月4日 伊藤 早紀 重回帰分析.
1変量データの記述 経済データ解析 2006年度.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
analysis of survey data 第2回 堀 啓造
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
地理情報システム論演習 地理情報システム論演習
相関分析.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
keyword クロス集計表 (教科書:47ページ~54ページ,77ページ~81ページ) 観測度数と期待度数 相対度数 独立性
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
(昨年度のオープンコースウェア) 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
analysis of survey data 堀 啓造
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
クロス表分析補遺 。堀 啓造(香川大学経済学部) 2003年5月.
クロス表とχ2検定.
疫学概論 頻度と分布 Lesson 9. 頻度と分布 §A. 頻度または度数 S.Harano,MD,PhD,MPH.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報の集約 記述統計 記述統計とは、収集したデータの分布を明らかにする事により、データの示す傾向や性質を要約することです。データを収集してもそこから情報を読み取らなければ意味はありません。特に膨大な量のデータになれば読みやすい形にまとめて要約する必要があります。
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

keyword クロス集計表 (教科書:47ページ~54ページ,77ページ~81ページ) 観測度数と期待度数 相対度数 独立性 データ解析基礎 6.クロス集計表の関係分析 keyword クロス集計表  (教科書:47ページ~54ページ,77ページ~81ページ) 観測度数と期待度数 相対度数 独立性

復習:統計データの構造 データ解析では調査項目のことを変量と呼ぶ. 質的変量 量的変量(連続的変量) 名義尺度:名前,性別 順序尺度:好きなもの順位など 量的変量(連続的変量) 間隔尺度:温度,成績など 比例尺度:距離,重量,金額など

復習:質的変量の集計 質的変量のデータをどうまとめるか? 単純集計 クロス集計

単純集計とクロス集計 単純集計とは・・・ 複数の項目(変量)について調査が行われた場合,一つ一つの項目を切り離して捉え,それらの度数分布を求めるもの クロス集計とは・・・ 二つ以上の項目に着目し,各項目の取る値のすべての組合せについて,その数(度数)を数え上げ,表にまとめたもの. 質的変数(項目)間の関係を探ることが出来る.

復習:単純集計 頭部損傷の集計表 ヘルメット着用の有無の集計表

復習:クロス集計表 頭部損傷とヘルメット着用の有無のクロス集計表 例えば, (頭部損傷=有,ヘルメット着用=着用) ⇒ 17人 (頭部損傷=有,ヘルメット着用=着用) ⇒  17人 (頭部損傷=無,ヘルメット着用=非着用) ⇒  428人

クロス集計表:用語 頭部損傷とヘルメット着用の有無のクロス集計表 セル 周辺度数 項目

単純集計とクロス集計 -出世は実力によるけど,その速度は人並み NHKで放送されたクイズ番組での質問 質問1 「あなたのこれまでの昇進の主な要因は何ですか」 質問2 「あなたのこれまでの昇進の速度は周囲に比べて速いですか遅いですか」 に対して,回答の集計は次の表になった.

単純集計とクロス集計 -出世は実力によるけど,その速度は人並み 表1:中堅サラリーマン100人が答えた自分の昇進についての自己評価 回答結果の批評として・・・ 「自分の出世は実力によるけど,その速度は人並みと考えている人が多い」 質問1と質問2で回答数が一番多かった項目を重ね合わせた結果が上の批評をなった.本当か?

単純集計とクロス集計 -出世は実力によるけど,その速度は人並み 質問1と質問2からクロス集計表を作成した場合を想定して,観測度数(セル)の発生パターンを考えてみた. 表2:2つの質問項目の間で推測される関連の構造(例) 「自分の出世は実力,その速度は人並みと考えている人が多い」といえるか?

単純集計とクロス集計 -出世は実力によるけど,その速度は人並み アナウンサーが犯した誤り 質問1の最頻度の項目と質問2の最頻度の項目の交わった場所⇒ (質問1,質問2)の最頻度と考えていた 最頻度項目 (昇進の主要因)→実力 (昇進の速度)→人並み 1.&2.から(質問1,質問2)→(実力,人並み) 項目相互間の独立性の問題に関連する この論理は現実に成り立たない!!

項目相互間の独立性(従属性) 統計的独立とは・・・ クロス集計表において,2つの項目間の間にまったく関係のない状態 量的な項目間の場合・・・「相関係数がない」に相当 クロス集計表を解析する際に,統計的独立性を調べることは重要 個々の項目について度数分布をいくら眺めても見えない情報も,クロス集計表から得られれることがある

例題:クロス集計表の構造 32人について,関東出身者と関西出身者のうどんつゆの好みについてのデータを調べ,クラス集計表を作成した. 出身地とつゆの好みには,何か関連がありように見えるが・・・ 表:出身地とめんつゆの好みの関係

例題:クロス集計表の構造 出身地とうどんつゆの好みにまったく関係がない(統計的独立である)場合のクロス集計表 表:出身地とめんつゆの好みの関係 このクロス集計表のセルを期待度数と呼ぶ

例題:クロス集計表の構造 出身地とめんつゆの好みが完全に従属している場合(統計的に独立でない場合)のクロス集計表 表:出身地とめんつゆの好みの関係 このクロス集計表のセルを期待度数と呼ぶ

統計的独立の構造1 統計的独立性が成り立つ= 各行内でみた度数の分布(割合)が一定である 関東: 8:12=2:3 表:出身地とめんつゆの好みの関係 関東: 8:12=2:3 関西: 12:18=2:3

統計的独立の構造2 統計的に完全従属性が成り立つ= 対角成分が1以上で非対角成分が0,または 非対角成分が0で非対角成分が1以上 表:出身地とめんつゆの好みの関係 「関東」ならば「醤油系」,「関西」ならば「だし系」

クロス集計表の構造-2 統計的仮説 [従属性]出身地によりつゆの好みで好き嫌いの傾向がある. [独立性]出身地とつゆの好みは関係ない. [均一性]出身地に関係なく,つゆの好みに傾向がある.

クロス集計表の構造-2 仮説1-独立性 仮説2-従属性 仮説3-均一性

三元クロス集計表の解析 調査項目が3つある場合は,三元クロス集計表による解析が不可欠であるが,一般にはあまり認識されていない. 社会調査では,単純集計の解析後に2元集計表の解析で項目間の関係を調べて終わっているものがある. 3つの項目が関与している現象の中に,2つの項目間のクロス集計表を眺めても,それだけでは見えてこない関係がある.

例題:低学歴層ほど保守的? 「高年齢層ほど保守的であると同時に,低学歴層ほど保守的」ということが次のクロス集計表から言えるか? 表1:年齢と保守性のクロス集計表 表2:学歴と保守性のクロス集計表

例題:低学歴層ほど保守的? 仮説「1)高年齢層ほど保守的であると同時に,2)低学歴層ほど保守的」を検証するためには,三元クロス集計表を用いなければならない!! 表: 学歴と年齢,保守性のクロス集計表

例題:低学歴層ほど保守的? 学歴 年齢 保守性

例題:低学歴層ほど保守的? 仮説「高年齢層ほど保守的であると同時に,低学歴層ほど保守的」を検証 「保守性」の層(弱,中,強)によって,「年齢」と「学歴」のクロス集計表が統計的に同じであるか否かを検証

例題:低学歴層ほど保守的? 「保守性」の層ごとで, 「学歴」と「年齢」の傾向が違うようである. 「保守性」の層ごとで,「学歴」と「年齢」には関連性があると考えられる.

例題:低学歴層ほど保守的? 統計的仮説検定をおこない,項目間の相互関連性を検証 学歴は保守性に直接影響しない!! 年齢 学歴 保守性 モデル選択 学歴は保守性に直接影響しない!!

死刑判決の例 殺人を犯した被告の死刑判決に対する人種の影響を調査した 結果である. 以下の表は 674 人は,1976~1987年にフロリダで殺人罪として 起訴された人で,複数の殺人を犯した人も含まれている. 表:死刑判決と加害者のクロス集計表 人種による違いはないように見えるが・・・

死刑判決の例 表:死刑判決と被害者,加害者のクロス集計表 割合的には,人種による違いはあるようである. ただし,犯罪の内容がわからないので,実際に人種による差別があったかどうかはわからない.

サリドマイド病とは・・・ サリドマイド剤と呼ばれる睡眠・鎮静剤が,(旧)西ドイツのグリューネンタル社によって開発され,1957年以降,世界各国で販売されました. 日本での主な販売会社の大日本製薬は「クセにならない安全なイソミン錠」などのうたい文句で売られました. 同剤を妊娠初期に服用した母親から,手足などに異常のある子供が次々に誕生しました. その数は,世界15カ国で合計6千人以上と推定されています.この事実をつきとめたレンツ博士の報告により,世界の大部分の国では販売が中止されました. 日本では,大日本製薬が「レンツ報告は科学性に乏しい」などとして,その後9ヶ月間売り続け,被害者を倍に増やしてしまった.

サリドマイド問題 (レンツ博士らが行った調査結果の一部) 以下の表は,いわゆる奇形児を産んだ母親にサリドマイド剤(TH)剤を服用したかどうかを聞き取り調査した結果である. 両群(2つのグループ)の母親のTH剤服用率に差があるか? ⇒ 統計的問題 母親のサリドマイド剤服用と奇形児のクロス集計表

サリドマイド問題 データの採り方・・・ 奇形児を産んだ母親と非奇形児を産んだ母親にサリドマイド剤(TH)剤を服用したかどうかを聞き取り調査 このデータをどう読むか? 母親のサリドマイド剤服用と奇形児のクロス集計表

サリドマイド問題

まとめ 単純集計とクロス集計 単純集計:各調査項目ごとで度数などを調べる クロス集計:二つ以上の項目に着目し,項目間の関係を探る. クロス集計表の構造 項目相互間の独立性(従属性)