寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp.

Slides:



Advertisements
Similar presentations
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
Advertisements

2 - 1.オートフィルを使う  連続データの自動作成 ・月の名前 ・連番(連続データ) フィルハンドルを ダブルクリック → 自動認識 マウスポインタが変わる.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータ演習 Excel 入門 岡田孝・山下雅啓 Excel の機能は膨大 その中のごく一部を紹介 表計算機能 – データの入力、表の作成、計算など グラフ機能 – 棒グラフ、円グラフなどグラフ作成 データベース機能 – 並べ替え(ソート)、検索、抽出など マクロ機能 – VBA で自動化したマクロを作成可能.
第5章 JMPのインストールと基本操作 廣野元久
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
SPSS操作入門 よい卒業研究をめざして 橋本明浩.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
プログラミング言語としてのR 情報知能学科 白井 英俊.
実証分析の手順 経済データ解析 2011年度.
Microsoft Excel 2010 を利用した 2項分布の確率計算
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
統計学の授業でのセカンド モニタとしてのiPhoneの使用
学校教育と脳科学 討論 寺尾 敦 青山学院大学社会情報学部.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
情報知能学科「アルゴリズムとデータ構造」
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
寺尾 敦 青山学院大学社会情報学部 社会統計 第3回:統計入門の落ち穂拾い 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 統計教育における 携帯端末の利用 寺尾 敦 青山学院大学社会情報学部
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計リテラシー教育における 携帯端末の利用
計算値が表の値より小さいので「異なるとは言えない」。
シミュレーション物理7 乱数.
寺尾 敦 青山学院大学社会情報学部 社会統計 第4回:分割表の分析(第4章) 寺尾 敦 青山学院大学社会情報学部
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 社会統計 第8回:多重比較 寺尾 敦 青山学院大学社会情報学部
統計学の授業でのセカンド モニタとしてのiPhoneの使用
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
心理統計学 II 第8回(11/20) 授業の目標 相関係数の検定のWEB宿題のやり方
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
地理情報システム論演習 地理情報システム論演習
離婚が出生数に与える影響 -都道府県データを用いた計量分析
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
情報管理論 2018/11/9 情報分析の道具 2018/11/9 情報分析の道具 情報分析の道具.
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第1日目第1時限の学習目標 平成22年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第14章 モデルの結合 修士2年 山川佳洋.
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
関数の再帰呼び出しとは ハノイの塔 リダイレクト レポート課題
社会統計 第11回 多重分割表分析の論理(第10章)
RでのScheffeの多重比較.
統計学の授業でのセカンド モニタとしてのiPhoneの使用
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
第12回 GISで地域変化を捉える 地理的変化を見る 地理的変化を捉える 地理的変化を分析する 地理的変化を予測する.
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
クロス表分析補遺 。堀 啓造(香川大学経済学部) 2003年5月.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
RでのScheffeの多重比較.
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
Microsoft Excel 2010 を利用した 2項分布の確率計算
平成22年度    計 量 心 理 学  a.
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
第1日目第1時限の学習目標 平成21年度「教育統計」の学習内容の概要を知る。 尺度の4水準の例とそれらの特色の概要を学ぶ。
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
Presentation transcript:

寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp R での連関測度の計算方法 寺尾 敦 青山学院大学社会情報学部 atsushi@si.aoyama.ac.jp

講義で使用しているテキスト(ボーンシュテット & ノーキ)で学習した分割表の連関測度を,R で計算するには?

名義尺度での連関係数 最適予測係数(Guttman’s lambda) rapportパッケージをインストールし,lambda.test関数を使う. 表9.1 信仰する宗教と校内礼拝の否認判決に対する意見のクロス表 宗教 合計 判決に プロテスタント カトリック その他 賛成 338 (36.1%) 178 (42.1%) 114 (63.3%) 630 (41.1%) 反対 598 (63.9%) 245 (57.9%) 58 (33.7%) 901 (58.9%) 936 (100.0%) 423 (100.0%) 172 (100.0%) 1531 (100.0%) ボーンシュテット & ノーキ『社会統計学』第9章

コード table9_1 <- matrix(c(338,598,178,245,114,58), nrow=2, ncol=3, dimnames=list(判決 = c("賛成", "反対"), 宗教 = c("プロテスタント","カトリック", "その他"))) table9_1 # クロス集計表を出力 lambda.test(table9_1,0) # Guttman's lambda (Goodman & Kruskal's lambda) # 第2引数 # 0: 行変数と列変数の両方に対してラムダを計算 # 1: 行変数から列変数を予測する(行ごとに最頻値に注目) # 2: 列変数から行変数を予測する(列ごとに最頻値に注目)

出力 > table9_1 # クロス集計表を出力 宗教 判決 プロテスタント カトリック その他 賛成 338 178 114 反対 598 245 58 > > lambda.test(table9_1,0) $row [1] 0 $col [1] 0.08888889

順序尺度での連関測度 グッドマン=クラスカルの γ ケンドールの順位相関係数 τb 分割表に対して,青木繁伸先生のウェブにある,グッドマン・クラスカルのガンマを計算する関数を利用する. ケンドールの順位相関係数 τb 分割表に対して,青木繁伸先生のウェブにある,ケンドールのτb を計算する関数を利用する. 個票データ(講義テキスト9.3参照)の場合には,cor 関数を使って method = “kendall” オプションをつける(テキストp.127).

実習 ボーンシュテット & ノーキの表9.2を行列として入力し,グッドマン=クラスカルの γ とケンドールの順位相関係数 をそれぞれ計算する.青木先生が用意した関数 gamma2, tau.b を使う. round 関数を使って適当なところでまるめてよい テキストではそれぞれ 0.349 と 0.233 である.実習で得られた数値は符号が異なる.なぜか?

表9.2と操作仮説 性差別禁止の支持 性役割態度:「女性は家を守るべき」という意見に 強く賛成 賛成 反対 強く反対 強く支持 34 91 104 39 やや支持 89 281 200 27 やや反対 33 116 41 9 49 55 11 2 H1:女性は家にいて家事をすべきだという意見に反対 する人ほど,性差別禁止の法可決をより強く支持する.

順序尺度での連関測度 スチュアートの順位相関係数 τc ソマーズの係数 dyx 分割表に対して電卓を使うように計算を実行するか,自分で関数を定義する(それほどむずかしくない).

順位データの連関測度 スピアマンの順位相関係数 ρs 個票データに対して,cor 関数を使って method = “spearman” オプションをつける(テキストp.127). もともと順位が記録されている個票データならば,そのままピアソンの相関係数を計算すればよい.オプションをつける必要はない.

実習 テキスト第5章練習問題 (3) に取り組む.

2 * 2 表での連関測度 ユールの連関係数 Q ファイ係数 分割表から対角要素の積を計算して(テキストp.216-217),その和(分母)と差(分子)を使う. 青木繁伸先生のウェブにある,グッドマン・クラスカルのガンマを計算する関数を利用する. ファイ係数 方法1:個票データで2値のコード化(テキストp.67, p.233)をして,cor 関数を使う. 方法2:分割表に対して,パッケージ vcd のassocstats 関数を用いる.ピアソンの一致性係数 C とクラメルの V も出力される.

2 * 2 表での連関指数計算方法 オッズ・条件つきオッズ オッズ比 分割表から必要な要素を抜き出して計算する(テキストp.216-217) 分割表に対して,パッケージ vcd のoddsratio 関数を用いる.log=FALSE オプションをつける. 参考:藤井良宜『カテゴリカルデータ解析』(共立出版)第4章 Fisher の直接確率法(関数は fisher.test)では,オッズ比が出力される.

実習 ボーンシュテット & ノーキ『社会統計学』第9章問題の15に取り組む.Q,ファイ,オッズ比を計算.人口動態と地域のクロス表(1960-70年の63都市データ). 人口動態 減少・不変 増加 計 地域 西部 4 10 14 西部以外 30 19 49 34 29 63