12月4日 伊藤 早紀 重回帰分析.

Slides:



Advertisements
Similar presentations
環境経済論 第 7 回目 ヘドニック・アプローチ. Court (米国自動車工業会 ) による自動車 価格変化の研究、 1939 – 自動車価格とさまざまな特性(馬力、長さな ど)との数量的関係 – 財の諸特性が快楽( hedonic pleasure )を生 み出すと考える – ヘドニック要因で説明される価格(又はその.
Advertisements

はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
グラフィカル多変量解析 ----目で見る共分散構造分析----
EXCELで学ぶマーケティング統計 第4章 経営学研究科 M1  真島 健.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
  個人投資家向け株式分析   と予測システム A1グループ  劉 チュン.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
Excelによる統計分析のための ワークシート開発
重回帰分析入門 経済データ解析 2009年度.
実証分析の手順 経済データ解析 2011年度.
大学院に向けての学習の進め方 〔注意〕 *この資料は、「このとおり学習すれば合格する」と保証するものではありません。 *筆記試験以外に「面接試験」があります。「筆記試験の成績さえ良ければ合格する」ということではありません。 *「ここに掲載しているテキストから試験問題が出題される」という意味ではありません。
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
第1日目第2時限の学習目標 基本的な1変量統計量(その2)について学ぶ。 尺度水準と適切な統計量との関連を整理する。
第5章 回帰分析の諸問題(2) ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2011年度.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
回帰分析.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
マーケティング・リサーチ.
第5章 回帰分析入門 統計学 2006年度.
回帰分析/多変量分析 1月18日.
マーケティング 第2部 マーケティング・リサーチ
データ分析基礎c(2012年以降入学) 情報編集基礎c(2011年以前入学)
環境計画数理 佐野可寸志 オフィスアワー 木曜昼休み.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
データ解析 静岡大学工学部 安藤和敏
4章までのまとめ ー 計量経済学 ー.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
データ解析 静岡大学工学部 安藤和敏
予測に用いる数学 2004/05/07 ide.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
尺度化について 狩野 裕 大阪大学人間科学部.
再討論 狩野裕 (大阪大学人間科学部).
部分的最小二乗回帰 Partial Least Squares Regression PLS
analysis of survey data 堀 啓造
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
データ解析 静岡大学工学部 安藤和敏
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
情報コミュニケーション入門b 第9回 表計算ソフト入門(3)
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
回帰分析入門 経済データ解析 2011年度.
Presentation transcript:

12月4日 伊藤 早紀 重回帰分析

多変量解析 ここまでみてきた解析方法は,ひとつもしくはごく少数の変数を扱うものであった。 しかし心理学では,一度に多くの変数を用いて調査分析を行うことが多い。 多くの変数を全体的にまたは同時に分析する方法が,多変量解析である。

数量化III類 コレスポンデンス(対応)分析 何をするか? 尺度水準は? 多変量解析の手法  従属変数  (基準変数,目的変数)    独立変数   (説明変数)  1つの変数を 複数の変数から 予測・説明・判別する 量的データ  量的データ  重回帰分析  質的データ  数量化I類 質的データ 判別分析 数量化II類 複数の変数間の 関連性を検討する 圧縮・整理する 因子分析 主成分分析 クラスター分析 数量化III類 コレスポンデンス(対応)分析 多変量解析の手法 ・因果関係(独立変数と従属変数)の存在を仮定しているか否か ・質的データ:名義尺度・順序尺度   量的データ:間隔尺度・比率尺度

尺度水準について 名義尺度 質的データ 順序尺度 間隔尺度 量的データ 比率尺度 (比例尺度) 尺度の水準 特徴 目的 例 単なるレッテルや記号として数字を用いている 同一のものや同種のものに同じ記号を割り当てる 同一性を示す 等価の決定 (分類) (命名) (符号化) 学籍番号 電話番号 背番号  など 質的データ 順序尺度 測定値間の大小関係のみを表す 大小や高低などの順位関係は明らかだが,その「差異」は表現しない 同一性・順序性を示す 大小関係を決定する (順序づけ) 成績の順位  など 間隔尺度 順位の概念の他に,「値の間隔」という概念が加わる 大小関係だけでなく,その差や和にも意味がある 同一性・順序性・加法性を示す 間隔または差の等価性を決定する (等間隔なめもりづけ) 温度 (摂氏,華氏) 知能指数 テストの得点  など 量的データ 比率尺度 (比例尺度) 原点0(ゼロ)が一義的に決まっている 測定値間の倍数関係(比)を問題にすることが可能 間隔尺度に原点を加えたもの 同一性・順序性・加法性・等比性を示す 比率の等価法を決定する (絶対原点からの等間隔なめもりづけ) 長さ 重さ 絶対温度  など 尺度水準について

たとえば 動機づけ尺度と原因帰属尺度の得点から試験の得点を予測する。 血糖値,血圧,体温から病気であるか否かを予測する。 分析の目的 → 予測すること 従属変数は試験の得点 → 量的データ 独立変数は動機づけ尺度と原因帰属尺度 → 量的データ では分析方法は? →重回帰分析 血糖値,血圧,体温から病気であるか否かを予測する。 従属変数は病気であるか否か → 質的データ 独立変数は血糖値,血圧,体温 → 量的データ では分析方法は? →判別分析

注意点 独立変数間のデータの質をそろえる 予測する際の独立変数間のデータ,関連性を検討する際の 変数群のデータの質・レベルをそろえる 予測する際の独立変数間のデータ,関連性を検討する際の 変数群のデータの質・レベルをそろえる たとえば,質的データと量的データが混在した独立変数で,何かを予測することはできない。 その場合,一般的には精度の低い質的データに量的データをそろえる (例)動機づけ尺度得点によって     「高群」「中群」「低群」に分けるなど ダミー変数を用いる場合もある (例)男を「1」,女を「0」とするなど

注意点 独立変数間に相関関係が高い変数を使用しない 「因果関係がある」というためには 独立変数間の相関が高い場合には,本来取り得ないような結果となる場合がある。 たとえば,2つの独立変数間の相関が高い場合には,わざわざその2つを別個のものとして扱う必要はないかもしれない。 これはどのような理論を仮定しているかにもよる。 「因果関係がある」というためには 少なくとも以下の3点を満たす必要がある 独立変数が従属変数よりも時間的に先行していること 理論的な観点からも因果の関係に必然性と整合性があること 他の変数の影響をのぞいても,2つの変数の間に共変関係があること

回帰分析 とは 相関を調べるだけでは、因果関係があるとは判断できない。 2つの変数間に因果関係が想定される時には,回帰分析を用いる。 (YをXで説明するのが回帰,YとXの間の関連を表すのが相関) 2つの変数間に因果関係が想定される時には,回帰分析を用いる。 1つの従属変数(基準変数;量的データ)を1つの独立変数(説明変数;量的データ)から予測・説明する,と仮定した際に,回帰分析(単回帰分析という)を使用する。 また回帰分析は,ある変数(X)からある変数(Y)を予測するという意味をもつ。 Y=aX+b(aとbの値を求めることにより,XからYを予測することができる) なおこの式で表されるように回帰分析は,XとYが直線的な関係であることが前提となるので注意

重回帰分析とは 1つの従属変数(基準変数;量的データ)を    複数の独立変数(説明変数;量的データ)から   予測・説明する,と仮定した際に用いる統計手法 各独立変数が従属変数に及ぼす影響の向きと大きさ 標準偏回帰係数(β)という 独立変数全体が従属変数を予測・説明する程度 決定係数(R2)という

練習 ある大学の授業で,授業の評価をするために授業の難易度,私語の程度,授業の理解度,授業の全体的な評価について調査を行った。 番号 難易度 私語 理解度 評価 1 4 7 5 2 8 3 6 9 10 11 12 13 14 15 16 17 18 19 20 練習 ある大学の授業で,授業の評価をするために授業の難易度,私語の程度,授業の理解度,授業の全体的な評価について調査を行った。 「難易度」「私語」「理解度」によって,授業の全体的な評価がどの程度説明できるのかを検討したい。

Rコマンダーでの操作 「統計量」→「モデルへの適合」→「線形回帰」 目的変数:評価 説明変数:難易度、私語、理解度

結果 決定係数(R2) 全体(決定係数)の有意性 「難易度」「私語」「理解度」はともに授業全体の評価に有意な影響を及ぼしていることがわかる。 「評価」に対して  負の影響力 →正の影響力 決定係数(R2) 全体(決定係数)の有意性 「難易度」「私語」「理解度」はともに授業全体の評価に有意な影響を及ぼしていることがわかる。 問題点:Rコマンダーで重回帰分析すると標準化偏回帰係数が出ない

補足 疑似相関 相関係数と標準偏回帰係数を比較した際,それらが同符号で,ともに有意な値をとっていれば,その相関関係は因果関係と認めることも可能となる 相関係数は有意であるにもかかわらず,標準偏回帰係数が0に近くなる場合がある。 そのような関係にある場合,その相関は疑似相関である可能性がある。 抑制変数 従属変数との相関が低いにもかかわらず,標準偏回帰係数が有意になり,単純相関では隠れていた因果関係が見えてくることがある。このような独立変数を抑制変数という。 調整変数 被調査者を年齢や性別で分類してみると,変数間の相関関係がかなり異なってくる場合がある。 群ごとに別の因果関係を想定して分析してみると,全被調査者で分析した時と比べて,より説明力の高い結果が得られる場合がある。 このような場合,分類するための性別や年齢などの変数を調整変数という。

補足 多重共線性 相関係数と標準偏回帰係数が異符号で,しかもそれぞれが有意になる場合がある。 独立変数間の相関が高すぎる場合に,このような現象が生じることがある。 独立変数間に直線的な関係があることを多重共線性というが,独立変数間の相関が非常に高い場合にも近似的な多重共線性が発生する。 多重共線性が発生すると,回帰係数が完全には推定できなかったり,結果が求まっても信頼性が低いものになったりする。 相互相関が高い変数が独立変数の中に共存していることは,重回帰分析という手法を用いる上で不適切であると考えておく このような場合の対処方法としては 少なくとも1つの独立変数を削除する 独立変数をまとめる(独立変数に対して因子分析や主成分分析を行い,合成する) ただし,再度理論から仮定した因果モデルを考慮し直す必要もある。

参考・引用 心理データ解析Basic http://www.f.waseda.jp/oshio.at/edu/data_b/top.html