Download presentation
Presentation is loading. Please wait.
1
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
連鎖不平衡 と 連鎖不平衡ありのデータ作成 法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
2
マイクロサテライト と 一塩基多型 SNP
3
ジェノタイプの多様性が大事 同一人物判定 偶然に同じジェノタイプが出現する確率 Π=P1^2 + … + Pk^2
-[tex:P_k = 1-(P_ P_{k-1})] -[tex:\Pi=P_1^ P_k^2=P_1^2+...+P_{k-1}^2 + (1-(P_1+...+P_{k-1}))^2] -[tex:\frac{\partial \Pi}{\partial P_i} = 2P_i + (-1) * 2*(1-(P_1+...+P_{k-1})] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(P_1+...+P_{k-1} + P_i -1)] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(1-P_k + P_i-1)=2(P_i-P_k)]
4
ジェノタイプの多様性が大事 同一人物判定 偶然に同じジェノタイプが出現する確率 Π=P1^2 + … + Pk^2
-[tex:P_k = 1-(P_ P_{k-1})] -[tex:\Pi=P_1^ P_k^2=P_1^2+...+P_{k-1}^2 + (1-(P_1+...+P_{k-1}))^2] -[tex:\frac{\partial \Pi}{\partial P_i} = 2P_i + (-1) * 2*(1-(P_1+...+P_{k-1})] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(P_1+...+P_{k-1} + P_i -1)] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(1-P_k + P_i-1)=2(P_i-P_k)] 偏微分
5
ジェノタイプの多様性が大事 同一人物判定 偶然に同じジェノタイプが出現する確率 Π=P1^2 + … + Pk^2
-[tex:P_k = 1-(P_ P_{k-1})] -[tex:\Pi=P_1^ P_k^2=P_1^2+...+P_{k-1}^2 + (1-(P_1+...+P_{k-1}))^2] -[tex:\frac{\partial \Pi}{\partial P_i} = 2P_i + (-1) * 2*(1-(P_1+...+P_{k-1})] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(P_1+...+P_{k-1} + P_i -1)] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(1-P_k + P_i-1)=2(P_i-P_k)] P1=P2=…=Pk = 1/kのときにΠは最小になる
6
ジェノタイプの多様性が大事 ジェノタイプ数 k すべてのジェノタイプの頻度が等しい (1/k)
Π=P1^2 + … + Pk^2 = (1/k)^2+…+(1/k)^2 = ? -[tex:P_k = 1-(P_ P_{k-1})] -[tex:\Pi=P_1^ P_k^2=P_1^2+...+P_{k-1}^2 + (1-(P_1+...+P_{k-1}))^2] -[tex:\frac{\partial \Pi}{\partial P_i} = 2P_i + (-1) * 2*(1-(P_1+...+P_{k-1})] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(P_1+...+P_{k-1} + P_i -1)] -[tex:\frac{\partial \Pi}{\partial P_i} = 2(1-P_k + P_i-1)=2(P_i-P_k)]
7
アレル数と ディプロイド・ジェノタイプ数 SNPのアレル数 2 MSのアレル数 r H: Homo ? H: hetero ?
k = r + r(r-1)/2 = ? H h 組み合わせ
8
Hardy-Weinberg 平衡(HWE)
アレルの組み合わせが独立に決まる状態 アレル数 r アレル頻度 Q1,Q2,…,Qr ジェノタイプ頻度 Qi^2 2Qi Qj
9
練習問題 アレル数 r=2 (SNP)で、アレル頻度が等しいときに、 の値は? ただし、HWEを仮定せよ r を一般化すると?
偶然に同じジェノタイプが出現する確率 Π=P1^2 + … + Pk^2 の値は? ただし、HWEを仮定せよ r を一般化すると? (1/r)^2 がr通り (2(1/r)^2) がr(r-1)/2通り r (1/r)^4 + r(r-1)/2 (2(1/r)^2)^2 = 1/r^3 + 2(r-1)/r^3 = (2r-1)/r^3 In case of r=2, 3/8
10
家系データ と マイクロサテライトマーカー 連鎖解析ではMSを使う
11
ヘテロが大事 組み換えが起きている場所がわかるから
12
ヘテロの割合が最大 ホモの割合が最小 偶然に同一ジェノタイプが出る確率と同じ考え方 Π=P1^2 + … + Pk^2
すべてのアレル頻度が等しいときに ホモ割合は最小になる
13
練習問題 アレル数rの座位について、アレル頻度が均等であるときのヘテロ接合体の割合を求めよ ただし、HWEを仮定せよ 1- 1/r
14
マーカーとしての「力」 偶然に一致する確率が低い ヘテロ・ジェノタイプの割合が高い アレル数が多いとよい アレル頻度が均等な方がよい
15
SNP 数は多いしゲノム全体に存在する
16
ぎっしり並んだマーカーの 共有具合で血縁推定
17
SNPのアレル数は r=2 SNPを使ってアレル数を増やす ハプロタイプ
18
ぎっしり並んだマーカーの 共有具合で血縁推定
どんな推定法がよいか? 推定法がよくワークするかどうかはどうやって判断するか?
19
ぎっしり並んだSNPの ジェノタイプデータを シミュレーションして シミュレーションデータで うまくワークすることを 確かめたい 手法評価をするときの定番
20
よくできた SNPジェノタイプデータ と そこからの家系データ とは
21
ハプロタイプデータを作る (A,a) - (B,b) – (C,c) (ABC,abc) と (ABC, ABc, abc) とは違う
何が? (ABC, ABc, abc) と (ABC, AbC, abc) とは違う
22
A B C A B C A B C a b c a b c a b c (ABC,abc) (ABC, ABc, abc)
23
A B C A B C A B C a b c a b c a b c (ABC,abc) (ABC, ABc, abc)
「斜め」は交叉・組み換えの歴史(後述)
24
異同の区別がつくならば 同じものは作れる 似ているものは、それだけでは作れない
25
「似ている」とは 比較尺度が必要 似ている 似ていない
26
ハプロタイプの評価尺度 連鎖不平衡係数
27
連鎖不平衡 2SNPの場合 独立と非独立 「独立」な状態は1つ 「非独立」な状態はいろいろ
「非独立」な状態の中にも「もっとも独立から遠い」状態がある
28
B b A P(AB) P(Ab) P(A) a P(aB) P(ab) P(a) P(B) P(b) 1
D = P(AB) – P(A) P(B)
29
2SNPの独立 と 分割表
30
連鎖不平衡係数 r2, D’ D = P(AB) – P(A) P(B)
31
2SNPの連鎖不平衡 歴史 変異と交差・組み換え・遺伝的浮動
32
多数のSNPの 連鎖不平衡パターン SNPペアがたくさん。ペアワイズLDインデックスを色表現する
33
ハプロタイプを シミュレーションするとは 同一ではないが、似たようなパターンを作る 「似ている」かどうかを判断するには
パターンが似ているかどうかを測る尺度、が必要
34
連鎖不平衡 多SNPの場合 パターンを読む
35
連鎖不平衡 何が把握できて 何が把握できないのか
バリアント箇所とその組み合わせ 個々の多バリアントのアレル頻度 バリアント・ペア バリアント・トリオ バリアント・カルテット …
36
複雑怪奇なLDの評価尺度 答えは、まだ、ない
37
とはいえ やってみるしかない
38
色々な方法 大きく分けて 前方シミュレーション・後方シミュレーション 用途別 予測 歴史推定 統計手法のバリデーション用
39
色々な方法 決め手に欠ける からこそ たくさんの方法がある Population Simulation
LD structure Simulation GenomeSIM -> GenomeSIMLA SIMLA : Familial data HAP-sample : resampling hapmap data Genome MaCS SimuGWAS Biochem Genet. 2011 Jun;49(5-6): doi: /s x. Epub 2011 Jan 14. Simulating linkage disequilibrium structures in a human population for SNP association studies. Nat Rev Genet. 2012 Jan 10;13(2): doi: /nrg3130. Computer simulations: tools for population and evolutionary genetics.
40
現実データから リ・サンプリング そして 家系データ作成 交叉・組み換えシミュレーション
現実データから リ・サンプリング そして 家系データ作成 交叉・組み換えシミュレーション
41
交叉・組み換え 1 モルガンは 1 回の減数分裂において 1 回の乗換えが期待できる距離として定義されますが、よく用いられる 1 cM とは 100 回の減数分裂で 1 回の交叉が起こることが期待される距離です。
42
交叉・組み換え どうやって交叉・組み換えシミュレーションする?
Polymorphic Variation in Human Meiotic Recombination Am J Hum Genet Mar; 80(3): 526–530.
43
まとめ SNPの位置づけ ハプロタイプ ハプロタイプ・パターンの評価尺度 ハプロタイプのシミュレーション作成とその「良さ」の評価方法
未解決問題がたくさん
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.