SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
1 徹底討論「主成分分析 vs 因子分析」 主成分分析は因子分析ではない ! 狩野裕 (大阪大学) 日本行動計量学会第 30 回大会 於:多摩大学.
グラフィカル多変量解析 ----目で見る共分散構造分析----
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
パネル分析について 中村さやか.
9. 主成分分析 Principal Component Analysis (PCA)
データ解析 静岡大学工学部 安藤和敏
相関係数 植物生態学研究室木村 一也.
攻撃性尺度の分析:小学生vs中学生Ⅱ ---- 多母集団の同時分析&男女間の平均を調整 ----
第1回 担当: 西山 統計学.
第37回日本看護研究学会学術集会 シンポジウムII 20011/8/8(月)(デブの日)14:40~16:40 中山和弘(聖路加看護大学)
分布の非正規性を利用した行動遺伝モデル開発
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
主成分分析                     結城  隆   .
ワークショップ ユーザーとメーカーの公開相談会
構造方程式モデリング(SEM) Structural Equation Modeling.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
ガウス過程による回帰 Gaussian Process Regression GPR
13.1 パス解析 (1) 標準偏回帰係数 変数の標準化.
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
 統計学講義 第11回     相関係数、回帰直線    決定係数.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
指標の数と信頼性・ 内容的妥当性 指標の数は多いほうがよい.
独立成分分析 (ICA:Independent Component Analysis )
主成分分析 Principal Component Analysis PCA
東京工科大学 コンピュータサイエンス学部 亀田弘之
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
Black Litterman Modelによる最適化
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
4. システムの安定性.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
データ解析 静岡大学工学部 安藤和敏
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
子どもの性格は生まれつき? ー性格の決定因と発達ー
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
プログラミング論 相関
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
回帰分析入門 経済データ解析 2011年度.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際 前川研 PD 村山 航

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

ある特性の分散(個人差)を規定するもの 外向性 環境 遺伝子 共有環境 表現型 (phenotype) 非共有環境 +測定 誤差 “A set” of genes 相加型・非相加型(エンドウマメ) 共有環境 家庭の雰囲気 居住環境など 外向性 非共有環境 家庭外の交友関係など 表現型 (phenotype) 環境 +測定 誤差

SEM による表現 外向性 Vp2 = a2 + c2 + e2 遺伝子 (additive gene: A) a * 潜在変数の分散は1に固定 共有環境 (common environment: C) c 外向性 表現型 (phenotype) 非共有環境 (random environment: E) e データから代入 解けない! (識別不定) 方程式1つ パラメータ3つ (a,c,e) Vp2 = a2 + c2 + e2

兄弟からデータを取ってみる 兄 A 表現型 C E 弟 A Vp2 = a2 + c2 + e2 表現型 C この値は biometrical model によって得られる(後述)。 0.5 1.0 弟 表現型 A C a c e E Vp2 = a2 + c2 + e2 Cov = 0.5a2 + c2 まだ解けない!

一卵性双生児 (Monozygotic twins) からデータを取ってみる 表現型 A C a c e 兄 E 一卵性双生児だから遺伝子は同一(後述) 1.0 1.0 表現型 弟 A C a c e E Vp2 = a2 + c2 + e2 Cov = a2 + c2 ・ e は算出可能 ・ a と c が分離不能

あわせてみる Vp2 = a2 + c2 + e2 Covbros = 0.5a2 + c2 兄 A Covmz = a2 + c2 表現型 0.5/1.0 方程式3つ → 解けた! 1.0 表現型 弟 A C a c e E しかし… 兄弟と一卵性双生児だと全員に共通する「共有環境」の意味が不明確

一卵性双生児と二卵性双生児 (dizygotic twins) からデータを取る 表現型 A C a c e 兄 E 二卵性双生児は 遺伝的には兄弟と同じ 1.0/0.5 1.0 Vp2 = a2 + c2 + e2 Covdz = 0.5a2 + c2 Covmz = a2 + c2 表現型 弟 A C a c e E やはり方程式が解け,かつ「共有環境」も等質

まとめると 一卵性双生児と二卵性双生児のデータを両方用いることで,ある表現型に対する,遺伝,共有環境,非共有環境の効果を分離することができる 統計的には共分散構造分析の多母集団解析を用いて解を推定する 実際的には,3つの効果を同時推定するモデル (ACE モデル)と,CE モデル,AE モデル,E モデルの適合度 (e.g., AIC) を比較し,最もよいモデルを選ぶ。 Note1: ACE モデルも飽和モデルではない(すべての表現型分散が等しいという仮定が入っているため) Note2: 測定誤差は E に含まれる

行列による共分散構造 ΣMZ = ΣDZ = a2 + c2 + e2 a2 + c2 a2 + c2 + e2 a2 + c2 + e2 ふたご間の相関を目で見るだけでも,遺伝の効果は推測できる

単変量遺伝分析の実際 調査対象:首都圏に住む 13-18 歳のふたご 908 組 MZ男男:221 組 MZ女女:301 組 DZ男男:88組 DZ女女:99組 DZ男女:199組 調査の詳細:首都圏ふたごプロジェクト (TOTCOP: http://www.totcop.jp/index.html) 分析に使用

ここで取り上げる項目例 教科ごとの好き嫌いと成績(自己報告) 授業の予習・復習 数学の認知的な学習方略 数学:「数学ではよい成績を取っている」「数学が好きである」 英語:上に同じ 総合学習:上に同じ 授業の予習・復習 「学校の授業の予習・復習をする」 数学の認知的な学習方略 「数学の勉強をしていて,教科書,ノート,参考書などを読むとき『なぜ間違えたのか』『これから間違えないようにするにはどうしたらいいのか』などということについて考える」など

結果1:最適モデル ACEのdf ACE CE AE E 数学・成績 数学・好き 英語・成績 英語・好き 総合・成績 総合・好き 予習・復習 1335 1230.2 1240.4 1228.2 1353.5 数学・好き 1334 1297.0 1312.6 1295.0 1461.0 英語・成績 1336 1175.0 1199.8 1173.0 1338.1 英語・好き 1241.6 1251.1 1239.6 1355.0 総合・成績 1306 770.1 771.5 768.5 844.5 総合・好き 1325 1051.9 1051.6 1050.7 1113.8 予習・復習 1330 1073.4 1071.5 1075.4 1133.1 学習方略 1332 684.3 692.6 682.3 778.2

結果2:遺伝率の推定 (a2/[a2+c2+e2]) 数学・成績 47% - 53% 数学・好き 52% 48% 英語・成績 英語・好き 44% 56% 総合・成績 38% 62% 総合・好き 34% 65% 予習・復習 42% 58% 学習方略 41% 59% 全体として遺伝の効果が強い

注意点 「遺伝の効果」は個人差を説明する効果 できれば性別ごとに分けて分析するのがよい モデルの前提を脅かす要因 遺伝に既定されていても,個人差がなければ効果はでない (例:「指を5本にする遺伝子」) できれば性別ごとに分けて分析するのがよい 二卵性双生児のopposite sexペアは除去 モデルの前提を脅かす要因 遺伝要因と環境要因の相関 (G-E correlation) 人は自分の遺伝にあった環境を選ぶ・作るかも いい遺伝の家族はいい環境にいるかも ⇒ 正の相関はAを overestimate させる

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

なぜDZの遺伝間相関は0.5なのか なぜMZの遺伝間相関は1なのか。赤の他人は? ⇒ 生物測定学 (biometrical) モデルによる定式化 以下の話の前提 ある遺伝子座1つの効果を考える 遺伝子座には2つの対立遺伝子Aとaだけ関与 遺伝の効果は相加的:A が1つ増えると表現型(たとえば身長)は d だけ大きくなる。 遺伝子型 AA Aa aa 表現型 d 0 -d

A の遺伝子頻度を u, a の遺伝子頻度を v とする 交配がランダムだとすると,次の世代は A: u a: v AA: u2 Aa: uv aa: v2 1世代後の遺伝子頻度 A: u2 + ½ uv + ½ uv = u2 + uv = u (u+v) = u a: v2 + ½ uv + ½ uv = v2 + uv = v (u+v) = v u + v = 1 変化しない!

前の表より,遺伝子型の頻度は,どの世代でも 従って,表現型の(遺伝による)平均と分散は 遺伝子型 AA Aa aa 頻度 u2 2uv v2 表現型 d 0 -d μ = u2 d + 2uv x 0 + v2 (-d) = (u+d)(u-v)d = (u-v)d σ2 = u2[d – (u-v)d]2 +2uv[ 0 – (u-v)d]2 + v2[-d – (u-v)d]2 = … = 2uvd2

表現型の遺伝による2者間の共分散は (X1i – μ) (X2i – μ) を 頻度で重み付けして足すと,MZ, DZ, unrelated それぞれの表現型の遺伝による共分散が分かる

よって相関は,これを標準偏差(先述)で割って MZ: 2uvd2/ 2uvd2 = 1 DZ: uvd2/ 2uvd2 = 0.5 共分散の計算結果 Cov (MZ) = 2uvd2 Cov (DZ) = uvd2 Cov (unrelated) = 0 よって相関は,これを標準偏差(先述)で割って MZ: 2uvd2/ 2uvd2 = 1 DZ: uvd2/ 2uvd2 = 0.5 Unrelated = 0/2uvd2 = 0 遺伝子座が複数あったとしても計算結果は同じ(メンデルの独立の法則より) モデルで仮定した値と一致!

非相加遺伝子 (dominance: D) ある遺伝子の効果が別の遺伝子の効果によって変わってくること (e.g. エンドウマメの皺) 非相加効果は,下図における h で表現可能 h を組み込んで,先ほどのモデルからDZの表現型の遺伝による相関を計算すると,0.25 となる MZ は 1, unrelated は 0 aa Aa AA h -d d

ADCE モデル A D 表現型 C E A Vp2 = a2 + c2 + d2 + e2 D 非相加遺伝の効果も組み込んだモデル 共通環境で養育された双子データだけだと識別不定 解が不安定になりやすい 以降では,ACE モデルだけを取り扱う A a d D 1.0/0.5 表現型 c C e E 1.0/0.25 A a Vp2 = a2 + c2 + d2 + e2 d D 1.0 Covdz = .5a2 + .25d2+ c2 表現型 Covmz = a2 + d2 + c2 c C e E

注意点 DZ における遺伝の効果の相関が 0.5 (or 0.25) である背後には,「ランダム交配」の前提 エンドウマメはランダムだった 人間なら,遺伝子が似ている人ほど結婚しやすいかも: Assortative mating (同類交配) Assortative mating が存在:A のDZにおける相関は実際は 0.5 以上になり,それを 0.5 として分析してしまうことで,C の効果がoverestimate される。

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

General sex-limitation model 行動遺伝学における 2 タイプの性差 1:遺伝や環境の効果の大きさに性差があるか 2:どちらの性別にも同じ遺伝子セット(もしくは共有環境)が影響を与えているのか この両方を1つのモデルで検討 ポイント:これまで使わなかった opposite sex の DZ のデータを用いる

モデル 表現型(女) A C E A C E A 表現型(男) DZ opposite sex ペア ⇒ 5群の多母集団分析 0.5 1.0 af cf C E ef A C E A 影響力に性差を仮定 am cm em a’m 男性に特殊な遺伝の効果を仮定 (共有環境の効果でもいいが,どちらか1つにしないと識別できない) 表現型(男) DZ opposite sex ペア MZ male, MZ female, DZ male, DZ female も同じようにモデル構築 ⇒ 5群の多母集団分析

共分散構造 Vmale = am2 + cm2 + em2 + a’m2 異なる性別間では分散が違っていてもよい! Vfemale = af2 + cf2 + ef2 CovDZm-f = 0.5amaf + cmcf CovDZmale = 0.5am2 + cm2 + 0.5a’m2 CovDZfemale = 0.5af2 + cf2 CovMZmale = am2 + cm2 + a’m2 CovMZfemale = af2 + cf2 異なる性別間では分散が違っていてもよい! Opposite sex DZ の相関が,Same sex DZ の相関よりも弱ければ,特殊遺伝子があることを示唆

サブモデル Common effects sex-limitation model a’m の効果を 0 にしたもの General sex-limitation model より自由度1減 Scalar effects sex-limitation model Common effects sex-limitation model の制約をさらに強め,効果の性差はあるが,遺伝・環境の効果の割合は変わらないようにしたもの Common effects sex-limitation model より自由度2減

* Scalar effects sex-limitation model 0.5 1.0 A C E A C E 同一 a c e a c e L(女) L(男) 効果を スケーリング 1 k 表現型(女) 表現型(男)

さらなる発展モデル 性別を「環境」と考えると,環境によって遺伝や環境の効果が変わってくるモデルになる ⇒ 一種の G X E interaction モデル ただし,環境が性別のように二値変数の場合にしか使えない 連続量の場合の G X E interaction model に関しては後述

Sex-limitation model の実際 自己概念 「数学の授業の内容を理解できる自身がある」 「数学の授業の内容を身につけることができていると感じている」 男ペア 0.38 0.19 女ペア 0.47 0.41 MZ DZ 双子間相関 男女ペア 0.17 ← 遺伝? ← 共有環境?

モデル比較 df AIC Am Cm Em Am’ Af Cf Ef General Common1 Common2 Common3 1704 828.3 38% 2% 61% 0% 10% 36% 53% Common1 1705 826.3 - Common2 1706 824.9 40% 60% 20% 28% Common3 826.8 33% 7% 46% 54% Common4 1707 829.0 男性は遺伝の効果が,女性は共有環境の効果が大きい

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

2変量の場合 = 方程式3つにパラメータ9つ ⇒ 解が求まらない! X1 = a1A1 + c1C1 + e1E1 V(X1) = a12 + c12 + e12 V(X2) = a22 + c22 + e22 Cov(X1, X2) = a1a2 Cor (A1,A2) + c1c2 Cor (C1,C2) + e1e2 Cor (E1,E2) = a12 + c12 + e12 潜在変数の分散を1にしてあるので,相関になる A,C,E間の共分散は 0 置き換え 共分散も遺伝要因・環境要因に分割可能 V(X1) Cov(X1,X2) V(X2) a12 + c12 + e12 a12 + c12 + e12 a22 + c22 + e22 = データから代入 方程式3つにパラメータ9つ ⇒ 解が求まらない!

パス図で書くと(遺伝相関モデル) A1 X1 C1 E1 A2 X2 C2 E2 a1 c1 e1 Cor(A1,A2) Cor(C1,C2) A2 a2 c2 Cor(E1,E2) X2 C2 e2 E2 * ふたご間ではなく,「1人」のパス図である点に注意!

ふたごを使ってみる 「ふたご間」の分散と共分散が求まる CovMZ(X1) = a12 + c12 + e12 CovMZ(X1, X2) = a12 + c12 + e12 CovDZ(X1) = 0.5a12 + c12 CovDZ(X2) = 0.5a22 + c22 CovDZ(X1, X2) = 0.5a12 + c12 方程式はさきほどとあわせて合計9つ,パラメータは9つ ⇒ 解が求まる!

分散共分散構造を改めてきちんと書くと 双子1 双子2 x1 x2 x1 x2 x1 x2 a12 + c12 + e12 a12 + c12 + e12 a22 + c22 + e22 a12 + c12 a12 + c12 a12 + c12 + e12 a12 + c12 a22 + c22 a12 + c12 + e12 a22 + c22 + e22 双子1 Sym. MZ 双子2 a12 + c12 + e12 a12 + c12 + e12 a22 + c22 + e22 0.5a12 + c12 0.5a12 + c12 a12 + c12 + e12 0.5a12 + c12 0.5a22 + c22 a12 + c12 + e12 a22 + c22 + e22 双子1 x1 x2 Sym. DZ 双子2

行列による簡略化 = A = C = E MZ DZ a12 a12 a12 a22 c12 c12 c12 c22 e12 e12 A + C A + C + E MZ A + C + E 0.5A + C A + C + E DZ

パス図で書くと A1 A1 X1 C1 C1 X1 E1 E1 A2 A2 X2 C2 C2 X2 E2 E2 1.0/0.5 ふたご1 ふたご2 A1 1.0 A1 a1 a1 c1 c1 X1 C1 C1 X1 e1 e1 Cor(A1,A2) E1 E1 Cor(C1,C2) A2 A2 a2 a2 1.0/0.5 c2 c2 X2 C2 C2 X2 Cor(E1,E2) e2 e2 E2 E2 1.0

コレスキー分解 A, C, E 行列が正定値でないといけないが(分散共分散行列なので),往々にしてそれが満たされない したがって,下記のコレスキー分解で下三角行列の値を推定してから,A, C, E の値を求める。このようにして求めた A, C, E は必ず正定値 A = PP’, C = QQ’, E = RR’ (P, Q, R は下三角行列) PP’ + QQ’ + RR PP’ + QQ’ PP’ + QQ’ + RR’ MZ PP’ + QQ’ + RR’ 0.5PP’ + QQ’ PP’ + QQ’ + RR’ DZ

以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる) Cor (A1,A2), Cor (C1,C2), Cor (E1, E2) は得られたパラメータをもとに算出可能 遺伝相関の意味:同じセットの遺伝子が,複数の表現型に影響を与えている(多面発現: pleiotropy) ただし他の解釈も可能 遺伝相関:Cor (A1, A2) = a12/a11a22 共有環境相関:Cor (C1, C2) = c12/c11c22 非共有環境相関:Cor (E1, E2) = e12/e11e12

さらなる発展モデル1 独立経路 (independent pathway) モデル より制約の強いモデル 遺伝相関,環境相関のそれぞれに因子分析を実施したモデル さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能

A X1 C X2 X3 E モデル図 (双子の片側のみ) A1 X1, X2, X3 を単一の遺伝・環境因子で説明 C1 E1 A2 C2

さらなる発展モデル2 共通経路 (common pathway) モデル 独立経路モデルより制約の強いモデル 表現型を単一の因子が説明し,それが遺伝要因・環境要因に分割される さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能

f 独立経路モデルとの意味的な違いは難しい? X1 A X2 C E X3 モデル図 (双子の片側のみ) A1 C1 E1 A2 C2 E2

多変量遺伝分析の実際 努力に対する信念,努力量,そして成績の関係 単変量遺伝解析の結果 努力に対する信念:「勉強をいっしょうけんめい努力すれば,学校でいい点数をとることができると思う」 学校での勉強時間 学校での総合的な成績(自己報告) 単変量遺伝解析の結果 努力に対する信念,学校での総合的な成績 ⇒ AE 学校での勉強時間 ⇒ ACE よって,C をコレスキー分解した下三角行列に制約を入れ,A や E だけに変数間の相関があるモデルを検討

結果 信念 1 努力量 .11 1 成績 .15 .20 1 表現型相関 A C E 信念 33% - 67% 信念 1 努力量 .11 1 成績 .15 .20 1 表現型相関 A C E 信念 33% - 67% 努力量 47% 22% 31% 成績 62% - 38% 分散説明率 信念 1 努力量 .30 1 成績 .25 .31 1 遺伝相関 信念 1 努力量 .01 1 成績 .16 .10 1 非共有環境相関

目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model 発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

G x E interaction モデルとは 遺伝と環境の効果は,ある状況下にいる人や,パーソナリティを持った人によって違うかもしれない Sex limitation モデルはその例の1つ 連続量の場合だとどうか? 遺伝と環境の効果に影響を与える変数を調整変数 (moderator variable) と呼ぶ

モデル図 A 表現型 C E A 表現型 C E M1: 1人目の調整変数の値 M2: 2人目の調整変数の値 a + t x M1 c + u x M1 表現型 C 1.0/0.5 e + v x M1 E M1 1.0 M2 a + t x M2 A c + u x M2 表現型 C e + v x M2 E ※ 基本は単純な(潜在変数を含んだ)交互作用モデル

共分散構造 Vp12 = (a + s M1)2 + (c + t M1)2 + (e + uM1)2 Covmz = (a + sM1)(a + sM2) + (c + tM1)(c + tM2) Covdz = 0.5 (a + sM1)(a + sM2) + (c + tM1)(c + tM2) Mx だとこれをこのままプログラムに代入すればよい → 1人1人について尤度を算出して最大化している?

注意点 モデル比較をしながら,不必要なパラメータは除去 調整変数によって因子負荷が線形的に変化するモデルなので,分散成分は非線形に変化する 結果を視覚化するソフトが http://statgen.iop.kcl.ac.uk/gxe/ にある ここでプロットされるのはあくまでも分散成分であり,「分散説明率」は新たにスケールしなおす必要がある:結果としてまったく違った見え方になる可能性あり 両端部分は,サンプル数が少ないので,不安定であることを意識する必要性

G x E interaction モデルの実際 クラスサイズによって総合学習の成績における遺伝の分散成分は変わってくるのか? df AIC ACE - TUV 1224 704.72 ACE - TV 1225 705.28 ACE - TU 704.32 ACE - UV 704.48 AE - TV 1226 692.39 AE - T 1227 703.23 AE - V 702.02 AE 1228 706.26

パラメータ値 A - 0.0784 E 1.2688 T 0.0127 V -0.0151 このまま解釈するのは難しい

プロットすると一目瞭然 E A クラスサイズが大きいと遺伝の寄与が増える!

ただし調整変数の分布には注意 このようなクラスはほとんどない E A

参考文献など Web上で無料で手に入るテキスト G x E interaction について Neale, M. C. & Maes, H. H. M. (2002). Methodology for genetic studies of twins and families: http://ibgwww.colorado. edu/workshop2006/cdrom/HTML/book2004a.pdf G x E interaction について Purcell S (2002). Variance components models for gene-environment interaction in twin analysis. Twin Research, 5, 554-571. 今回紹介しなかった direction of causation analysis の話 Heath, A. C, Kessler, R. C., Neale, M. C., Hewitt, J. K., Eaves, L. J., & Kendler, K. S. (1993). Testing hypotheses about direction of causation using cross-sectional family data. Behavior Genetics, 23, 29-50.