階層線形モデル(Hierarchical Linear Modeling, HLM)の概要と適用例

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
Example 8 種類のチーズの塩分量 : m = 325 Q 3 = 340 m Q 1 = Q3Q3Q3Q3 Q1Q1Q1Q1.
SPSS 入門 麻生良文.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
GLMプロシジャを利用した 反復測定データの解析
logistic regression をしたい場合の STATISTICA2000のアプリケーションの使い方について
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ分析入門(12) 第12章 単回帰分析 廣野元久.
科学技術振興機構 (現所属は統計数理研究所) 尾崎幸謙
平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析1 分割法タイプのデータ
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
【MedR】第12回 東京大学医学系研究科 特任助教 倉橋一成.
日本行動計量学会主催 第4回春の合宿セミナー
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
データ分析2 1.平均値の比較のタイプ 2.対応のあるt検定 3.対応のないt検定 4.3つの以上のグループの差を調べる 5.参考文献
Bassモデルにおける 最尤法を用いたパラメータ推定
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
タレントの魅力測定とその分析.
初歩的情報リテラシーと アンケート集計のためのExcel・SPSS講座
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
回帰分析.
貧困と出産の関係.
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
第6章 数量化I類.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
主成分分析                     結城  隆   .
ワークショップ ユーザーとメーカーの公開相談会
需要の価格弾力性 価格の変化率と需要の変化率の比.
2015年度 演習課題2 Excelによる自己評価の集計
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
柿原論文へのコメント 東京学芸大学教育学部 鈴木 亘.
離婚が出生数に与える影響 -都道府県データを用いた計量分析
ガウス過程による回帰 Gaussian Process Regression GPR
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
4章までのまとめ ー 計量経済学 ー.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
最小自乗法.
潜在変数に交互作用がある 構造方程式モデル(共分散構造モデル): 二段階最小二乗推定値
主成分分析 Principal Component Analysis PCA
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
大学生における援助要請行動の 調査研究.
部分的最小二乗回帰 Partial Least Squares Regression PLS
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
回帰分析(Regression Analysis)
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
森 裕一(岡山理科大学) 山本義郎(岡山大学自然科学研究科) 渡谷真吾,尾高好政(倉敷芸術科学大学) 垂水共之,田中 豊(岡山大学)
回帰分析入門 経済データ解析 2011年度.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

階層線形モデル(Hierarchical Linear Modeling, HLM)の概要と適用例 東京大学大学院教育学研究科 日本学術振興会 村山 航

はじめに:アイリス・データ 一般的な対処策は? ⇒ 層別相関 rセトサ=0.74 rバーシカラー=0.53 r全体= -0.21 Fisherのデータ(豊田・前田・柳井, 1992) rセトサ=0.74 rバーシカラー=0.53 r全体= -0.21 一般的な対処策は? ⇒ 層別相関

よくあるデータ例:複数学校のデータ よくある分析 ⇒ 全体をプールした回帰分析 全体どころか,どの単一の学校も反映していない結果になる可能性 遂行目標 総合模試の成績 学校1 全体 学校2 学校3 よくある分析 ⇒ 全体をプールした回帰分析 全体どころか,どの単一の学校も反映していない結果になる可能性

どうすればいいのか 素朴なアイディア 各学校ごとに回帰係数を求め,切片と回帰係数の平均値や分散を求める a の平均と分散 b の平均と分散 が求められる

階層線形モデルの基本的な式 一般化して数式にすると(確率変数導入・notation変更) レベル1のモデル式 レベル2のモデル式 学校 j の i 番目の人の値 レベル1のモデル式 各学校ごとの切片と傾き 傾きの各学校特有の値 レベル2のモデル式 傾きの(学校間の)平均値 切片の学校間分散 傾きの学校間分散 上記の効果をすべて除いたときの誤差分散

結果の解釈 独立変数をSES,従属変数を成績とした上で先ほどのモデルを適用した例(Raudenbush & Bryk, 2002より改変) 解釈してみよう!

モデルの拡張 モデルは柔軟に構成可能 特に有用な拡張:切片や傾きの学校間分散を予測する変数を投入することができる レベル1は同じ 切片や傾きの学校間の違いを予測しようとする変数(例: 学校の平均クラスサイズ) ここで なら?(仮想例) このとき,予測力のあるWを投入すると学校間分散は減少する:Wによる分散説明率を算出可能 例) (前頁参照)が に変化したとき,分散説明率は

留意点1: 学校ごとの回帰分析との違い HLMによって推定される学校ごとの切片・回帰係数(Empirical Bayes)は,次の3つの要素で構造化される 学校ごとに回帰分析をして推定した切片・回帰係数(OLS) 全体(他校)の情報を使って推定した切片・回帰係数( ) 学校ごとに推定した切片・回帰係数の信頼性 一種の信頼性係数 全体の情報をもとに算出した切片・回帰係数の推定値 HLMによる学校ごとの切片・回帰係数の推定値(Empirical Bayes) 学校ごとに回帰分析をしたときの推定値(OLS)

全体平均に収縮し,分散が小さくなっている(特に信頼性の低い“傾き”が) Raudenbush & Bryk(2002)より 全体平均に収縮し,分散が小さくなっている(特に信頼性の低い“傾き”が)

留意点2: センタリングについて HLMでは独立変数をセンタリングすることが多い 切片に意味を持たせるため:通常の回帰分析にも当該 場合によっては多重共線性の回避にも寄与(Cronbach, 1987) 2種類のセンタリング方法が存在:切片( )に影響 Grand Mean Centering 全学校の平均値を用いて独立変数をセンタリング Group Mean Centering 各学校ごとに,その学校の平均値を用いてセンタリング

Grand Mean Centering: は独立変数が全学校の平均値のときの, の期待値.一種の調整平均. Group Mean Centering: は独立変数が各学校の平均値のときの, の期待値.各学校での の期待値. 学校1 学校2 学校1の 学校2の 学校1の 学校2の 全体 平均 学校1 平均 学校2 平均 Group Mean Centering Grand Mean Centering 共分散分析のように独立変数を調整した平均値差に興味があるとき以外は,Group Mean Centeringが無難 共分散分析のように独立変数を調整した群間の平均値差に 興味があるとき以外は,Group Mean Centeringが無難

HLMを適用した論文を読んでみる ※ 従属変数は援助要請行動の回避(avoidance of help-seeking) Ryan, Gheen, & Midgley (1998). Journal of Educational Psychology

HLMを自分で実行してみる HLM(Bryk, Raudenbush & Congton, 1996; 現在はver6まで) 長所:モデルの組み立て・センタリングが簡単で初心者向け.アドバンスドなモデルも扱える. 短所:データの変換ができない.HLMに特化しているので他の分析への移行ができない. SAS(proc mixedプロシジャを用いて分析) 長所:SASによるデータ加工・他分析とあわせて使える.SASユーザにとってはかなり使いやすい. 短所:もともとHLMに特化したプロシジャではないため,アドバンスドなモデルは扱えないのも多い.モデルの式をプログラムするときも,やや慣れがいる.

HLMの使い方(概要) データの準備 1レベル1ファイル:どのレベルもカラム指定になる 最初のカラムは必ずID(必ず昇順で入力)

HLMの使い方(概要) SSMファイル(十分統計量のファイル)の作成 あとのモデル作成は比較的簡単にできる File→SSM→New→ASCII input レベルごとにData Formatや変数の数などを入力 Data Formatの入力が少しややこしい:Fortran形式. (A3, 4X, 5F6.1)など “Make SSM”でファイルを作成.“Check Stats”で基本統計量を確認し,読み込みミスがないかを確認. あとのモデル作成は比較的簡単にできる IDが3桁 スペースが4桁 6桁(うち1桁が小数点以下)の変数が5回繰り返される(スペース・小数点も1桁に数えられる)

←SSMファイルの作成 モデルの作成→

SASによるHLMプロシジャ(概要) 詳しくはSinger(1998)を参照のこと データファイル http://gseweb.harvard.edu/~faculty/singer/ に論文あり データファイル レベル1のオブザベーションごとに打ち込む.レベル2の変数もここに組み込まれる. school size motive score sex … 232 16 3 11 1 … 232 16 4 16 1 … 232 16 4 13 2 … … 193 38 1 13 1 … 193 38 5 20 1 … 193 38 4 18 2 … 193 38 4 17 2 … 313 26 3 16 1 … …

SASによるHLMプロシジャ(概要) 事前準備:分析する2レベルのモデルを結合しておく 例 固定効果と変量効果に分けて結合 固定効果

SASによるHLMプロシジャ(概要) proc mixedプロシジャを用いて表現 以下大文字はデータセットにおける変数名 固定効果 変量効果 固定効果の独立変数を指定.ただし切片(γ00は指定しなくてよい) proc mixed noclprint covtest noitprint; class SCHOOL; model SCORE = MOTIVE/solution ddfm=bw notest; random intercept MOTIVE/sub=SCHOOL type=un; レベル2の単位となる変数を指定 変量効果の独立変数を指定.切片(u0j)は“intercept”と記す.rijは指定しなくてよい.

参考文献など ・Raudenbush, S. W. & Bryk, A. S. (2002). Hierarchical linear models: Applications and data analysis methods (2nd ed.). Newbury Park, CA: Sage. ・Singer, J. D. (1998). Using SAS PROC MIXED to fit multivariate models, hierarchical models, and individual growth models. Journal of Educational and Behavioral Statistics, 24, 323-355. ・2003年度夏学期南風原朝和先生の授業 ・2000・2003年度杉澤武俊さんのレジュメ(HLM・SASによる分析の方法について) ・村山航 (2005). 主体的・内発的な意欲は必ず望ましい結果をもたらすのか 東京大学大学院教育学研究科比較教育社会学コース(編) 「首都圏の私立中学生の生活・意識・行動に関する調査」研究報告書, pp78-88.  ・Ryan, A. M., Gheen, M. H., & Midgley, C. (1998). Why do some students avoid asking for help? An examination of the interplay among students’ academic efficacy, teachers’ social-emotional role, and the classroom goal structure. Journal of Educational Psychology, 90, 528-535.

ご清聴ありがとうございました 分かりにくかったと思いますので,何かご質問などありましたら,murakou@orion.ocn.ne.jp まで連絡をお願いします.