統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.

Slides:



Advertisements
Similar presentations
統計学の基礎 -何を学ぶか。 何ができるようになるか-. データとは何か 母集団と標本(サンプル)、データの関係 統計的方法を用いることにより、統計量から母数について どれほどのことが言えるか、知ることができる。 2.
Advertisements

第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 - 後期 第 1 回 - 1 統計学入門2 講義内容の紹介 推測統計とは. 統計学入門2 - 後期 第 1 回 - 2 教科書 & 参考書 教科書 特に使用しない 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計学 11/08(木) 鈴木智也.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
クロス集計とχ2検定 P.144.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
地理情報システム論演習 地理情報システム論演習
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
データ解析 静岡大学工学部 安藤和敏
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第3章 統計的推定 (その1) 統計学 2006年度.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
analysis of survey data 堀 啓造
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
クロス表とχ2検定.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
回帰分析入門 経済データ解析 2011年度.
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

統計学入門2 関係を探る方法 講義のまとめ

今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士

多変量データ

データの型と関連を探る道具 質的・質的 ・・・ クロス集計表 量的・量的 ・・・ 散布図・相関係 数 質的・量的 ・・・ 条件付分布 グループ別 平均 相関比

クロス集計表の例

クロス集計表

条件付き分布 2つの変数 X, Y があり、 X = x となる場 合にのみ Y の分布を考えたとき、その分 布を X = x があたえられたときの Y の条件付き分布という

条件付き分布 変数 X X=B が与えられたときの、 Y の条件付き分布

周辺分布

同時分布

独立 2つの変数が独立であれば、 周辺分布は、いかなる条件付き分布 とも 同じになる

クロス集計表

クロス集計表 :() 内は %

クロス集計表

練習問題:独立になるように...

積事象の確率 P ( AB) = P ( A) P(B|A ) = P ( B) P(A|B) P(A|B) : B の下での A の条件付確率 P(B|A) : A の下での B の条件付確率

事象 A と B が独立 P(AB) = P(A) P(B) P(A|B) = P(A) P(B|A) = P(B)

独立期待度数

独立であるという仮定の下での (i,j) セルの確率

独立性の検定 観測度数と独立期待度数の比較 ただし、

独立性の検定 観測度数と独立期待度数の比較 独立であるという前提で計算された値と どの程度離れているかを評価する

p 値の計算と検定結果 検定統計量の分布は、自由度 (a-1)(b-1) の  2 分布  2 分布の分布点を求める関数 =CHIDIST(  2, df) p 値を設定された有意水準 ( 通常は 5%) と 比較し、 p 値が小さい場合は独立でない と判断する

量的データの関連を探る 散布図 相関係数 (-1 から 1 の範囲の値 ) 直線的な関係を表す尺度 符号 ・・・ 関係の向き 絶対値 ・・・ 関係の強さ

散布図 ( x i, y i ) xixi yiyi X Y

散布図 点の散らばり具合をみて、変数間の関 連を探る

相関係数 2 つの量的変数の直線的関係の 向き (符号) 強さ (絶対値) をあらわす

Excel での相関係数の計算 ワークシート関数 (X と Y の相関を求める ) =CORREL(X の配列,Y の配列 ) 分析ツール

分析ツール : 相関 入力範囲に分析するデータの範囲を指定 3 つ以上の変数を指定することも可能

相関係数の解釈上の注意点 相関があっても因果があるとは限らな い 非線形の関係は表現できない 第 3 の変数の存在を意識すること 外れ値に対し、頑健でない

確認のための演習 ITLS の下記のページにアクセスして、 頑健性のなさをチェックしてみよう! u.ac.jp/~itls/JAVA/java_ss/1746e/ u.ac.jp/~itls/JAVA/java_ss/1746e/ 注意:アプレットの下の方に提示されている coefficient of determination は、相関係数の2乗の値

量的データと質的データの関 連 一般的な方法 質的データが与えられた下での、連続デー タの条件付分布を比較する 条件付分布が同じであれば ( 似ていれば ) 、 無関係であると判断する

層別グラフ

データの型と関連を探る道具 質的・質的 ・・・ クロス集計表 量的・量的 ・・・ 散布図・相関係 数 質的・量的 ・・・ 条件付分布 グループ別 平均 相関比

3つ以上変数がある場合の分 析 多変量解析 2・3年次以降の関連科目 社会調査法 データサイエンス 社会調査実習 多変量解析 (オペレーションズ・リサーチ)

講義のまとめ:キーワード 確率と分布 2項分布、正規分布( * ) 母集団と標本 標本分布 (*) 統計的推定 標本誤差 (*) 推定 点推定、区間推定 (*) 信頼区間、信頼度 統計的検定 2種類の過誤 (*) 有意水準 (*) 有意確率(p値) (*) 平均と比率の検定

社会調査士 2003 年度 認定機構 設立 社会調査士資格認定機構 指定された科目の単位習得と卒業が資 格取得の条件

必要とされる科目 社会調査法 A, B 統計学入門 (1), (2) データサイエンス・多変量解析から 1 科 目 社会調査実習