遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング

Slides:



Advertisements
Similar presentations
第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
Advertisements

統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
初めてサテライトラボを利用する学生は1-4のステップが必要です。
How to Measure Genetic Heterogeneity
HLA マイナー組織適合性抗原 ナチュラル・キラー(NK)細胞 IPA/ NIMAコンセプト
DEPTとは? n-butyl methacrylateの13C-NMRおよびDEPT135スペクトル
RNA i (RNA interference).
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
Paper from PVLDB vol.7 (To appear in VLDB 2014)
リスクの把握と自己管理(ロードマップ) 安価なゲノム解析技術 (固定リスクの把握) 塩基配列情報
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
電子物性第1 第6回 ー原子の結合と結晶ー 電子物性第1スライド6-1 目次 2 はじめに 3 原子の結合と分子 4 イオン結合
SNPを用いたホールゲノム 疾患感受性遺伝子探索 ~関節リウマチでの経験と花粉症への展開~
分子医学の急進展:遺伝子を中心として.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
関節リウマチ感受性遺伝子 FCRL3 (Fc receptor-like3) の同定
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
銀河物理学特論 I: 講義1-1:近傍宇宙の銀河の 統計的性質 Kauffmann et al
生命情報科学人材養成コンソーシアム バイオインフォマティクス実習コース 遺伝医学
分割表 Contingency table.
薬理学研究科 のための 遺伝的多様性 11/02/2013 医学研究科 統計遺伝学分野 山田
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
統計遺伝学 講義 Sep 26 (Mon, 13:00-15:00) Overview of this lecture series in Japanese with basics on population genetics. (a) What does statistical genetics handle.
M022 ゲノム科学と医療 統計遺伝学分野 2010/11/18,25 山田 亮
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
法数学勉強会 2016年4月会 京都大学(医)統計遺伝学分野 山田 亮
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
分子生物情報学(2) 配列のマルチプルアライメント法
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
遺伝統計学 集中講義 (4) SNPによる領域の評価
東日本大震災におけるご遺体身元確認と行方不明家族捜索のためのDNA鑑定
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
統計処理2  t検定・分散分析.
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
遺伝を表現するための言葉 Glossary for genetics
遺伝性疾患・先天性疾患  染色体・遺伝子の異常とその分類  遺伝性疾患  先天性疾患.
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
Genetic Statistics Lectures (4) Evaluation of a region with SNPs
Genetic Statistics Lectures (2) Linkage disequilibrium(LD) LD mapping
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
資料: 報道発表資料 気象庁マグニチュード算出方法の改訂について。
森美賀子 山田亮 小林香子 川井田礼美 山本一彦
クロス表とχ2検定.
遺伝関係のグラフ Hereditary graphs
法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮
親子鑑定に見る尤度比を 角度を変えて眺めてみる
短い部分文字列の ミスマッチトレランスを 高速計算するアルゴリズム
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
村石悠介・橋口岳史 農学部資源生物科学科1回生
薬理学研究科 のための 遺伝的多様性 11/02/2013 医学研究科 統計遺伝学分野 山田
MOIRCSサイエンスゼミ 銀河団銀河のMorphology-Density Relation
バイオ特許 2002.12.04.
遺伝を表現するための言葉 Glossary for genetics
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
分割表 Contingency table.
遺伝統計学 集中講義 (6) 終わりに.
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
MAUI Project 2009 インターネットにおける近接性
2008年度 情報数理 ~ 授業紹介 ~.
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング

Sub-microscopic variants ヒトゲノムサイズ 1 10 102 103 104 105 106 107 108 109 1010 Sub-microscopic variants Microscopic variants Structural variants SNP ♂♀ 置換型多型 挿入欠失型 CNV リピート型 向きの多型(逆位) 位置の多型(転座)

Status IV 4ハプロタイプ D’<1,r^2<1 Status III 3ハプロタイプ D’=1,r^2<1 Recombination Drift Nh : Number of haplotype alleles Ns : Number of polymorphic sites Monophyletic mutation Status III 3ハプロタイプ D’=1,r^2<1 Birth of SNP pairs Status II-B 2ハプロタイプ D’=1,r^2=1 Status II-A SNP1個 Nh=2,Ns=1 Figure 1 Five statuses of nucleotide pairs. Statuses II-B, III and IV are circled by solid line and colored, indicating that they are observed as polymorphic pairs. Statuses I and II are circled by dashed line, indicating that they are not counted by conventional SNP assays. Four types of arrows represent genetic events that changes status of nucleotide pairs. Nh and Ns represnt number of haplotypes and number of SNPs, respectively. Death of SNP pairs Status I SNPなし Nh=1,Ns=0

SNPとは Single Nucleotide Polymorphism(1塩基多型) 最も高密度に分布する遺伝子多型 タイピングが容易 ゲノムワイドに約100-1000塩基対に1個の 密度で分布 タイピングが容易 大量・高速タイピングに適する

ヒトゲノムの多様性 DNA配列はどのくらい違うか 母 由来染色体 1 父 由来染色体 2本のゲノムの違いは、平均1000塩基に1箇所の違い ゲノム全長では30億塩基対中に、約300万箇所の違い

1 人数が増えると、多型箇所が増える 1

多民族で比較するとさらに個人差の箇所は増える→~100塩基に一箇所・・・~3000万箇所 1 多民族で比較するとさらに個人差の箇所は増える→~100塩基に一箇所・・・~3000万箇所 1

連鎖平衡 ハプロタイプのアリル頻度が、構成するSNPアレルの頻度の積で求められる状態 SNPAのアリル頻度がpA, pa (pA+pa=1) SNPBのアリル頻度がqB, qb (qB+qb=1) ハプロタイプ ABのアリル頻度:pA x pB ハプロタイプ Abのアリル頻度 : pA x pb ハプロタイプ aBのアリル頻度 : pa x pB ハプロタイプ abのアリル頻度 : pa x pb

連鎖不平衡とは 「連鎖」が 「平衡」に 達していない 連鎖不平衡とは 「連鎖」が 「平衡」に 達していない いつかは「昔」からの連鎖は崩れて、「平衡」に達する 連鎖不平衡インデックス(0は平衡・1は最大) D’ r^2

Absolute disequilibrium P(A) 1-P(A) Haplotype AB Haplotype Ab Haplotype aB Haplotype ab 連鎖平衡 P(A)xP(B) P(A)x(1-P(B)) (1-P(A))xP(B) (1-P(A)x(1-P(B)) Absolute disequilibrium P(A) 1-P(A) Complete disequilibrium P(B)-P(A) 1-P(B)

Absolute disequilibrium 1 Δ2 連鎖平衡 Absolute disequilibrium 1 Complete disequilibrium 0より大、1未満

古い多型ペアの間ほど、組み換えが起こりやすい Status IV 4ハプロタイプ D’<1,r^2<1 Recombination Drift Nh : Number of haplotype alleles Ns : Number of polymorphic sites Monophyletic mutation Status III 3ハプロタイプ D’=1,r^2<1 Birth of SNP pairs 距離が遠いほど、組み換えが起こりやすい 古い多型ペアの間ほど、組み換えが起こりやすい Status II-B 2ハプロタイプ D’=1,r^2=1 Status II-A SNP1個 Nh=2,Ns=1 Figure 1 Five statuses of nucleotide pairs. Statuses II-B, III and IV are circled by solid line and colored, indicating that they are observed as polymorphic pairs. Statuses I and II are circled by dashed line, indicating that they are not counted by conventional SNP assays. Four types of arrows represent genetic events that changes status of nucleotide pairs. Nh and Ns represnt number of haplotypes and number of SNPs, respectively. Death of SNP pairs Status I SNPなし Nh=1,Ns=0

LD インデックスの共通点と差異 距離 時間

近いSNP同士には強いLD 例外も挟まる

連鎖不平衡ブロックは時間とともに小さくなる 同じ範囲を調べるのにたくさんのマーカーが必要になる 原因遺伝子のある場所がより正確になる 過去 現在 連鎖不平衡ブロックは時間とともに小さくなる 同じ範囲を調べるのにたくさんのマーカーが必要になる 原因遺伝子のある場所がより正確になる

連鎖不平衡マッピングの原理 SNPでのタイピング・検定は、その近くのLDにあるSNPでのタイピング結果・検定結果と似ている。

LDマッピングの原理 すべての隣接する塩基間で連鎖が平衡に達していれば、SNPはマーカーにはなりえない 組み換えが多く発生した箇所 SNPがマーカーとして機能しうる範囲 snp 組み換えが一様であれば、マーカーが検出できる範囲もまた一様 LDマッピングとは、 ゲノム上にある、SNPをマーカーとして、RA関連多型を検出すること SNPマーカーが真の関連多型を検出することができるのは、連鎖不平衡と呼ばれる関係がSNPマーカーと真の関連多型との間に存在するからである。 その関係があるのは、日本人の歴史において、蓄積された組み換えの数がある程度限定されていて、粗密があるから。 たとえば: 上段は、組み換えが非常に沢山おきてしまっていたら、LDはまったくなく、SNPをマーカーにして検出不能 中断は、ある程度少ない数の組み換えが、均等におきた場合→検出可能。 だけど、これは、真実ではない。 真実は下段。 限定された数の組み換えが、あるところでは密にあるところでは疎におきたのが真実で、それにより、LDの広がりはゲノム上の場所によりまちまちであり、したがって、真の関連多型を検出することのできるSNPの持つ役割もゲノムの位置によりまちまちである。 このLDの広がりが、LDブロックといわれるもので、LDブロックの中にある関連多型は、同じブロック上のSNPを調べることで検出可能である、 これがLDマッピング。 snp 実際には、組み換えが多かった部位は局在している 真の疾患ローカス

LDマッピングの手順 SNP 遺伝子 ブロック A C G T G G G T A C C G T T C C T G G C C G G G T C G C G A C T A G A G C T C G C G A C G C G A C G G C G G G T G T A C A C G T T C C A A C A G G T C G C G T C G A A C T C G C G T A C C ハプロタイプ &htSNP

サンプリングバイアス 観測した関連が及ぶ範囲はどこまでか? 観測した関連は最強か?

片方のSNPのアリル頻度を固定 D’を固定

2SNP 9ジェノタイプ ケース・コントロール ~LDがあると検定結果が似ることの確認~ “連鎖不平衡.xls” データの作成 個別SNPの検定 ハプロタイプの推定 連鎖不平衡係数の算出