Presentation is loading. Please wait.

Presentation is loading. Please wait.

SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際

Similar presentations


Presentation on theme: "SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際"— Presentation transcript:

1 SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際
前川研 PD 村山 航

2 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

3 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

4 ある特性の分散(個人差)を規定するもの 外向性 環境 遺伝子 共有環境 表現型 (phenotype) 非共有環境 +測定 誤差
“A set” of genes 相加型・非相加型(エンドウマメ) 共有環境 家庭の雰囲気 居住環境など 外向性 非共有環境 家庭外の交友関係など 表現型 (phenotype) 環境 +測定 誤差

5 SEM による表現 外向性 Vp2 = a2 + c2 + e2 遺伝子 (additive gene: A) a
* 潜在変数の分散は1に固定 共有環境 (common environment: C) c 外向性 表現型 (phenotype) 非共有環境 (random environment: E) e データから代入 解けない! (識別不定) 方程式1つ パラメータ3つ (a,c,e) Vp2 = a2 + c2 + e2

6 兄弟からデータを取ってみる 兄 A 表現型 C E 弟 A Vp2 = a2 + c2 + e2 表現型 C
この値は biometrical model によって得られる(後述)。 0.5 1.0 表現型 A C a c e E Vp2 = a2 + c2 + e2 Cov = 0.5a2 + c2 まだ解けない!

7 一卵性双生児 (Monozygotic twins) からデータを取ってみる
表現型 A C a c e E 一卵性双生児だから遺伝子は同一(後述) 1.0 1.0 表現型 A C a c e E Vp2 = a2 + c2 + e2 Cov = a2 + c2 ・ e は算出可能 ・ a と c が分離不能

8 あわせてみる Vp2 = a2 + c2 + e2 Covbros = 0.5a2 + c2 兄 A Covmz = a2 + c2 表現型
0.5/1.0 方程式3つ → 解けた! 1.0 表現型 A C a c e E しかし… 兄弟と一卵性双生児だと全員に共通する「共有環境」の意味が不明確

9 一卵性双生児と二卵性双生児 (dizygotic twins) からデータを取る
表現型 A C a c e E 二卵性双生児は 遺伝的には兄弟と同じ 1.0/0.5 1.0 Vp2 = a2 + c2 + e2 Covdz = 0.5a2 + c2 Covmz = a2 + c2 表現型 A C a c e E やはり方程式が解け,かつ「共有環境」も等質

10 まとめると 一卵性双生児と二卵性双生児のデータを両方用いることで,ある表現型に対する,遺伝,共有環境,非共有環境の効果を分離することができる
統計的には共分散構造分析の多母集団解析を用いて解を推定する 実際的には,3つの効果を同時推定するモデル (ACE モデル)と,CE モデル,AE モデル,E モデルの適合度 (e.g., AIC) を比較し,最もよいモデルを選ぶ。 Note1: ACE モデルも飽和モデルではない(すべての表現型分散が等しいという仮定が入っているため) Note2: 測定誤差は E に含まれる

11 行列による共分散構造 ΣMZ = ΣDZ = a2 + c2 + e2 a2 + c2 a2 + c2 + e2 a2 + c2 + e2
ふたご間の相関を目で見るだけでも,遺伝の効果は推測できる

12 単変量遺伝分析の実際 調査対象:首都圏に住む 13-18 歳のふたご 908 組 MZ男男:221 組 MZ女女:301 組
DZ男男:88組 DZ女女:99組 DZ男女:199組 調査の詳細:首都圏ふたごプロジェクト (TOTCOP: 分析に使用

13 ここで取り上げる項目例 教科ごとの好き嫌いと成績(自己報告) 授業の予習・復習 数学の認知的な学習方略
数学:「数学ではよい成績を取っている」「数学が好きである」 英語:上に同じ 総合学習:上に同じ 授業の予習・復習 「学校の授業の予習・復習をする」 数学の認知的な学習方略 「数学の勉強をしていて,教科書,ノート,参考書などを読むとき『なぜ間違えたのか』『これから間違えないようにするにはどうしたらいいのか』などということについて考える」など

14 結果1:最適モデル ACEのdf ACE CE AE E 数学・成績 数学・好き 英語・成績 英語・好き 総合・成績 総合・好き 予習・復習
1335 1230.2 1240.4 1228.2 1353.5 数学・好き 1334 1297.0 1312.6 1295.0 1461.0 英語・成績 1336 1175.0 1199.8 1173.0 1338.1 英語・好き 1241.6 1251.1 1239.6 1355.0 総合・成績 1306 770.1 771.5 768.5 844.5 総合・好き 1325 1051.9 1051.6 1050.7 1113.8 予習・復習 1330 1073.4 1071.5 1075.4 1133.1 学習方略 1332 684.3 692.6 682.3 778.2

15 結果2:遺伝率の推定 (a2/[a2+c2+e2])
数学・成績 47% - 53% 数学・好き 52% 48% 英語・成績 英語・好き 44% 56% 総合・成績 38% 62% 総合・好き 34% 65% 予習・復習 42% 58% 学習方略 41% 59% 全体として遺伝の効果が強い

16 注意点 「遺伝の効果」は個人差を説明する効果 できれば性別ごとに分けて分析するのがよい モデルの前提を脅かす要因
遺伝に既定されていても,個人差がなければ効果はでない (例:「指を5本にする遺伝子」) できれば性別ごとに分けて分析するのがよい 二卵性双生児のopposite sexペアは除去 モデルの前提を脅かす要因 遺伝要因と環境要因の相関 (G-E correlation) 人は自分の遺伝にあった環境を選ぶ・作るかも いい遺伝の家族はいい環境にいるかも ⇒ 正の相関はAを overestimate させる

17 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

18 なぜDZの遺伝間相関は0.5なのか なぜMZの遺伝間相関は1なのか。赤の他人は?
⇒ 生物測定学 (biometrical) モデルによる定式化 以下の話の前提 ある遺伝子座1つの効果を考える 遺伝子座には2つの対立遺伝子Aとaだけ関与 遺伝の効果は相加的:A が1つ増えると表現型(たとえば身長)は d だけ大きくなる。 遺伝子型 AA Aa aa 表現型 d 0 -d

19 A の遺伝子頻度を u, a の遺伝子頻度を v とする 交配がランダムだとすると,次の世代は A: u a: v
AA: u2 Aa: uv aa: v2 1世代後の遺伝子頻度 A: u2 + ½ uv + ½ uv = u2 + uv = u (u+v) = u a: v2 + ½ uv + ½ uv = v2 + uv = v (u+v) = v u + v = 1 変化しない!

20 前の表より,遺伝子型の頻度は,どの世代でも
従って,表現型の(遺伝による)平均と分散は 遺伝子型 AA Aa aa 頻度 u2 2uv v2 表現型 d 0 -d μ = u2 d + 2uv x 0 + v2 (-d) = (u+d)(u-v)d = (u-v)d σ2 = u2[d – (u-v)d]2 +2uv[ 0 – (u-v)d]2 + v2[-d – (u-v)d] = … = 2uvd2

21 表現型の遺伝による2者間の共分散は (X1i – μ) (X2i – μ) を 頻度で重み付けして足すと,MZ, DZ, unrelated それぞれの表現型の遺伝による共分散が分かる

22 よって相関は,これを標準偏差(先述)で割って MZ: 2uvd2/ 2uvd2 = 1 DZ: uvd2/ 2uvd2 = 0.5
共分散の計算結果 Cov (MZ) = 2uvd2 Cov (DZ) = uvd2 Cov (unrelated) = 0 よって相関は,これを標準偏差(先述)で割って MZ: 2uvd2/ 2uvd2 = 1 DZ: uvd2/ 2uvd2 = 0.5 Unrelated = 0/2uvd2 = 0 遺伝子座が複数あったとしても計算結果は同じ(メンデルの独立の法則より) モデルで仮定した値と一致!

23 非相加遺伝子 (dominance: D) ある遺伝子の効果が別の遺伝子の効果によって変わってくること (e.g. エンドウマメの皺)
非相加効果は,下図における h で表現可能 h を組み込んで,先ほどのモデルからDZの表現型の遺伝による相関を計算すると,0.25 となる MZ は 1, unrelated は 0 aa Aa AA h -d d

24 ADCE モデル A D 表現型 C E A Vp2 = a2 + c2 + d2 + e2 D
非相加遺伝の効果も組み込んだモデル 共通環境で養育された双子データだけだと識別不定 解が不安定になりやすい 以降では,ACE モデルだけを取り扱う A a d D 1.0/0.5 表現型 c C e E 1.0/0.25 A a Vp2 = a2 + c2 + d2 + e2 d D 1.0 Covdz = .5a d2+ c2 表現型 Covmz = a2 + d2 + c2 c C e E

25 注意点 DZ における遺伝の効果の相関が 0.5 (or 0.25) である背後には,「ランダム交配」の前提 エンドウマメはランダムだった
人間なら,遺伝子が似ている人ほど結婚しやすいかも: Assortative mating (同類交配) Assortative mating が存在:A のDZにおける相関は実際は 0.5 以上になり,それを 0.5 として分析してしまうことで,C の効果がoverestimate される。

26 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

27 General sex-limitation model
行動遺伝学における 2 タイプの性差 1:遺伝や環境の効果の大きさに性差があるか 2:どちらの性別にも同じ遺伝子セット(もしくは共有環境)が影響を与えているのか この両方を1つのモデルで検討 ポイント:これまで使わなかった opposite sex の DZ のデータを用いる

28 モデル 表現型(女) A C E A C E A 表現型(男) DZ opposite sex ペア ⇒ 5群の多母集団分析 0.5 1.0
af cf C E ef A C E A 影響力に性差を仮定 am cm em a’m 男性に特殊な遺伝の効果を仮定 (共有環境の効果でもいいが,どちらか1つにしないと識別できない) 表現型(男) DZ opposite sex ペア MZ male, MZ female, DZ male, DZ female も同じようにモデル構築 ⇒ 5群の多母集団分析

29 共分散構造 Vmale = am2 + cm2 + em2 + a’m2 異なる性別間では分散が違っていてもよい!
Vfemale = af2 + cf2 + ef2 CovDZm-f = 0.5amaf + cmcf CovDZmale = 0.5am2 + cm a’m2 CovDZfemale = 0.5af2 + cf2 CovMZmale = am2 + cm2 + a’m2 CovMZfemale = af2 + cf2 異なる性別間では分散が違っていてもよい! Opposite sex DZ の相関が,Same sex DZ の相関よりも弱ければ,特殊遺伝子があることを示唆

30 サブモデル Common effects sex-limitation model
a’m の効果を 0 にしたもの General sex-limitation model より自由度1減 Scalar effects sex-limitation model Common effects sex-limitation model の制約をさらに強め,効果の性差はあるが,遺伝・環境の効果の割合は変わらないようにしたもの Common effects sex-limitation model より自由度2減

31 * Scalar effects sex-limitation model
0.5 1.0 A C E A C E 同一 a c e a c e L(女) L(男) 効果を スケーリング 1 k 表現型(女) 表現型(男)

32 さらなる発展モデル 性別を「環境」と考えると,環境によって遺伝や環境の効果が変わってくるモデルになる
⇒ 一種の G X E interaction モデル ただし,環境が性別のように二値変数の場合にしか使えない 連続量の場合の G X E interaction model に関しては後述

33 Sex-limitation model の実際
自己概念 「数学の授業の内容を理解できる自身がある」 「数学の授業の内容を身につけることができていると感じている」 男ペア 女ペア MZ DZ 双子間相関 男女ペア ← 遺伝? ← 共有環境?

34 モデル比較 df AIC Am Cm Em Am’ Af Cf Ef General Common1 Common2 Common3
1704 828.3 38% 2% 61% 0% 10% 36% 53% Common1 1705 826.3 - Common2 1706 824.9 40% 60% 20% 28% Common3 826.8 33% 7% 46% 54% Common4 1707 829.0 男性は遺伝の効果が,女性は共有環境の効果が大きい

35 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

36 2変量の場合 = 方程式3つにパラメータ9つ ⇒ 解が求まらない! X1 = a1A1 + c1C1 + e1E1
V(X1) = a12 + c12 + e12 V(X2) = a22 + c22 + e22 Cov(X1, X2) = a1a2 Cor (A1,A2) + c1c2 Cor (C1,C2) + e1e2 Cor (E1,E2) = a12 + c12 + e12 潜在変数の分散を1にしてあるので,相関になる A,C,E間の共分散は 0 置き換え 共分散も遺伝要因・環境要因に分割可能 V(X1) Cov(X1,X2) V(X2) a12 + c12 + e12 a12 + c12 + e12 a22 + c22 + e22 = データから代入 方程式3つにパラメータ9つ ⇒ 解が求まらない!

37 パス図で書くと(遺伝相関モデル) A1 X1 C1 E1 A2 X2 C2 E2 a1 c1 e1 Cor(A1,A2)
Cor(C1,C2) A2 a2 c2 Cor(E1,E2) X2 C2 e2 E2 * ふたご間ではなく,「1人」のパス図である点に注意!

38 ふたごを使ってみる 「ふたご間」の分散と共分散が求まる CovMZ(X1) = a12 + c12 + e12
CovMZ(X1, X2) = a12 + c12 + e12 CovDZ(X1) = 0.5a12 + c12 CovDZ(X2) = 0.5a22 + c22 CovDZ(X1, X2) = 0.5a12 + c12 方程式はさきほどとあわせて合計9つ,パラメータは9つ ⇒ 解が求まる!

39 分散共分散構造を改めてきちんと書くと 双子1 双子2 x1 x2 x1 x2 x1 x2 a12 + c12 + e12
a12 + c12 + e12 a22 + c22 + e22 a12 + c a12 + c a12 + c12 + e12 a12 + c a22 + c a12 + c12 + e12 a22 + c22 + e22 双子1 Sym MZ 双子2 a12 + c12 + e12 a12 + c12 + e12 a22 + c22 + e22 0.5a12 + c a12 + c a12 + c12 + e12 0.5a12 + c a22 + c a12 + c12 + e12 a22 + c22 + e22 双子1 x1 x2 Sym DZ 双子2

40 行列による簡略化 = A = C = E MZ DZ a12 a12 a12 a22 c12 c12 c12 c22 e12 e12
A + C A + C + E MZ A + C + E 0.5A + C A + C + E DZ

41 パス図で書くと A1 A1 X1 C1 C1 X1 E1 E1 A2 A2 X2 C2 C2 X2 E2 E2 1.0/0.5 ふたご1
ふたご2 A1 1.0 A1 a1 a1 c1 c1 X1 C1 C1 X1 e1 e1 Cor(A1,A2) E1 E1 Cor(C1,C2) A2 A2 a2 a2 1.0/0.5 c2 c2 X2 C2 C2 X2 Cor(E1,E2) e2 e2 E2 E2 1.0

42 コレスキー分解 A, C, E 行列が正定値でないといけないが(分散共分散行列なので),往々にしてそれが満たされない
したがって,下記のコレスキー分解で下三角行列の値を推定してから,A, C, E の値を求める。このようにして求めた A, C, E は必ず正定値 A = PP’, C = QQ’, E = RR’ (P, Q, R は下三角行列) PP’ + QQ’ + RR PP’ + QQ’ PP’ + QQ’ + RR’ MZ PP’ + QQ’ + RR’ 0.5PP’ + QQ’ PP’ + QQ’ + RR’ DZ

43 以上の2変量モデルは,容易に多変量に拡張可能(行列による共分散構造はまったく同じ式になる)
Cor (A1,A2), Cor (C1,C2), Cor (E1, E2) は得られたパラメータをもとに算出可能 遺伝相関の意味:同じセットの遺伝子が,複数の表現型に影響を与えている(多面発現: pleiotropy) ただし他の解釈も可能 遺伝相関:Cor (A1, A2) = a12/a11a22 共有環境相関:Cor (C1, C2) = c12/c11c22 非共有環境相関:Cor (E1, E2) = e12/e11e12

44 さらなる発展モデル1 独立経路 (independent pathway) モデル より制約の強いモデル
遺伝相関,環境相関のそれぞれに因子分析を実施したモデル さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能

45 A X1 C X2 X3 E モデル図 (双子の片側のみ) A1 X1, X2, X3 を単一の遺伝・環境因子で説明 C1 E1 A2 C2

46 さらなる発展モデル2 共通経路 (common pathway) モデル 独立経路モデルより制約の強いモデル
表現型を単一の因子が説明し,それが遺伝要因・環境要因に分割される さらに個々の変数の独自因子も遺伝要因と環境要因に分割可能

47 f 独立経路モデルとの意味的な違いは難しい? X1 A X2 C E X3 モデル図 (双子の片側のみ) A1 C1 E1 A2 C2 E2

48 多変量遺伝分析の実際 努力に対する信念,努力量,そして成績の関係 単変量遺伝解析の結果
努力に対する信念:「勉強をいっしょうけんめい努力すれば,学校でいい点数をとることができると思う」 学校での勉強時間 学校での総合的な成績(自己報告) 単変量遺伝解析の結果 努力に対する信念,学校での総合的な成績 ⇒ AE 学校での勉強時間 ⇒ ACE よって,C をコレスキー分解した下三角行列に制約を入れ,A や E だけに変数間の相関があるモデルを検討

49 結果 信念 1 努力量 .11 1 成績 .15 .20 1 表現型相関 A C E 信念 33% - 67%
信念 努力量 成績 表現型相関 A C E 信念 % % 努力量 47% % 31% 成績 % % 分散説明率 信念 努力量 成績 遺伝相関 信念 努力量 成績 非共有環境相関

50 目次 基本的な考え方(単変量遺伝分析) 生物測定学モデルによる遺伝子相関の算出 発展モデル1:Sex limitation model
発展モデル2:多変量遺伝分析モデル 発展モデル3:G X E interaction モデル

51 G x E interaction モデルとは 遺伝と環境の効果は,ある状況下にいる人や,パーソナリティを持った人によって違うかもしれない
Sex limitation モデルはその例の1つ 連続量の場合だとどうか? 遺伝と環境の効果に影響を与える変数を調整変数 (moderator variable) と呼ぶ

52 モデル図 A 表現型 C E A 表現型 C E M1: 1人目の調整変数の値 M2: 2人目の調整変数の値 a + t x M1
c + u x M1 表現型 C 1.0/0.5 e + v x M1 E M1 1.0 M2 a + t x M2 A c + u x M2 表現型 C e + v x M2 E ※ 基本は単純な(潜在変数を含んだ)交互作用モデル

53 共分散構造 Vp12 = (a + s M1)2 + (c + t M1)2 + (e + uM1)2
Covmz = (a + sM1)(a + sM2) + (c + tM1)(c + tM2) Covdz = 0.5 (a + sM1)(a + sM2) + (c + tM1)(c + tM2) Mx だとこれをこのままプログラムに代入すればよい → 1人1人について尤度を算出して最大化している?

54 注意点 モデル比較をしながら,不必要なパラメータは除去 調整変数によって因子負荷が線形的に変化するモデルなので,分散成分は非線形に変化する
結果を視覚化するソフトが にある ここでプロットされるのはあくまでも分散成分であり,「分散説明率」は新たにスケールしなおす必要がある:結果としてまったく違った見え方になる可能性あり 両端部分は,サンプル数が少ないので,不安定であることを意識する必要性

55

56 G x E interaction モデルの実際
クラスサイズによって総合学習の成績における遺伝の分散成分は変わってくるのか? df AIC ACE - TUV 1224 704.72 ACE - TV 1225 705.28 ACE - TU 704.32 ACE - UV 704.48 AE - TV 1226 692.39 AE - T 1227 703.23 AE - V 702.02 AE 1228 706.26

57 パラメータ値 A E T V このまま解釈するのは難しい

58 プロットすると一目瞭然 E A クラスサイズが大きいと遺伝の寄与が増える!

59 ただし調整変数の分布には注意 このようなクラスはほとんどない E A

60 参考文献など Web上で無料で手に入るテキスト G x E interaction について
Neale, M. C. & Maes, H. H. M. (2002). Methodology for genetic studies of twins and families: edu/workshop2006/cdrom/HTML/book2004a.pdf G x E interaction について Purcell S (2002). Variance components models for gene-environment interaction in twin analysis. Twin Research, 5, 今回紹介しなかった direction of causation analysis の話 Heath, A. C, Kessler, R. C., Neale, M. C., Hewitt, J. K., Eaves, L. J., & Kendler, K. S. (1993). Testing hypotheses about direction of causation using cross-sectional family data. Behavior Genetics, 23,


Download ppt "SEM による行動遺伝学 (behavioral genetics) 解析の理論と実際"

Similar presentations


Ads by Google