遺伝統計学 集中講義 (4) SNPによる領域の評価

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
CMU2005 海外エンジニアリングワークショップ参加報告書 1 「真の要求を見極めろ!」: teamB 要求定義をどう捉えるか ● 要求定義とは何か? 製品には、顧客の望むことを正しく反映させる必要がある。 そのために必要なものが要求仕様である。 すなわち、要求仕様とは、顧客と製品を結ぶものであり、これを作ることが要求定義である。
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
Drosophila solexa Tag analysis 2/25
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
A-2資料⑤ 職業レディネス・テスト 第3版 実施手順.
ひでき 平成17年4月12日 「日本教」モデルを ネットワーク分析する ひでき 平成17年4月12日.
プログラミング言語としてのR 情報知能学科 白井 英俊.
HLA マイナー組織適合性抗原 ナチュラル・キラー(NK)細胞 IPA/ NIMAコンセプト
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
RNA i (RNA interference).
アルゴリズムとプログラミング (Algorithms and Programming)
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
応用情報処理V 第1回 プログラミングとは何か 2004年9月27日.
リスクの把握と自己管理(ロードマップ) 安価なゲノム解析技術 (固定リスクの把握) 塩基配列情報
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
統計学 12/13(木).
統計学 第3回 10/11 担当:鈴木智也.
電子物性第1 第6回 ー原子の結合と結晶ー 電子物性第1スライド6-1 目次 2 はじめに 3 原子の結合と分子 4 イオン結合
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
SNPを用いたホールゲノム 疾患感受性遺伝子探索 ~関節リウマチでの経験と花粉症への展開~
新規配信先リスト登録 配信実行及び経過確認 配信状況確認 メルマガ関連(オプション)
応用情報処理V 第1回 プログラミングとは何か 2003年9月29日.
LogStructuredFileSystem Servey
インフレはなぜ止まらないのか?.
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
長岡技科大オープンハウス 岐阜高専4年電子制御工学科 森 永二郎.
分割表 Contingency table.
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
統計遺伝学 講義 Sep 26 (Mon, 13:00-15:00) Overview of this lecture series in Japanese with basics on population genetics. (a) What does statistical genetics handle.
In situ cosmogenic seminar
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
法数学勉強会 2016年4月会 京都大学(医)統計遺伝学分野 山田 亮
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
相互調整によるエージェントのクラスタ化: コンピュータシミュレーションによる検討
オブジェクト指向言語論 第八回 知能情報学部 新田直也.
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
Genetic Statistics Lectures (4) Evaluation of a region with SNPs
Genetic Statistics Lectures (2) Linkage disequilibrium(LD) LD mapping
川口 喬久 川上 弘人 山田 亮 関根 章博 中村 祐輔 山本 一彦 角田 達彦 理化学研究所 遺伝子多型研究センター
森美賀子 山田亮 小林香子 川井田礼美 山本一彦
クロス表とχ2検定.
オブジェクトの協調動作を用いた オブジェクト指向プログラム実行履歴分割手法
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ ハミング距離 ~.
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング
人工知能特論II 第8回 二宮 崇.
バイオ特許 2002.12.04.
疫学概論 方法論的問題点(患者対照研究) Lesson 13. 患者対照研究 §B. 方法論的問題点 S.Harano,MD,PhD,MPH.
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
システムとソフトウェア評価: 標準化の目的と必要性
1. 糖尿病の患者さんは 血圧が高くなりやすい 2. 糖尿病に高血圧が併発して 合併症が早く進行する 3. 血圧コントロールの 目標と方法
散らばり 本時の目標 資料の傾向をみるときは、代表値だけでなく散らばりを考える必要があることを理解する。
議論の前提 ある人獣共通感染症は、野生動物が感染源となって直接又は媒介動物を通じて人に感染を起こす。
分割表 Contingency table.
遺伝統計学 集中講義 (6) 終わりに.
ソフトウェア工学 知能情報学部 新田直也.
医療科学B演習のおさらい 杏林大学医学図書館 医療科学B.
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
2008年度 情報数理 ~ 授業紹介 ~.
2012年度 情報数理 ~ 授業紹介 ~.
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

遺伝統計学 集中講義 (4) SNPによる領域の評価

LDマッピングで関連多型を見つけたら・・・ あるマーカーに観測した関連が及ぶ範囲はどこまでか? 観測した関連は最強か?LDの関係にある多型に最強の関連があるのか?

サンプリングバイアス 観測した関連が及ぶ範囲はどこまでか? 観測した関連は最強か?

LD インデックスの共通点と差異 距離 時間

片方のSNPのアリル頻度を固定 D’を固定

LD評価の基礎はペアワイズ

連鎖不平衡ブロックは時間とともに小さくなる 同じ範囲を調べるのにたくさんのマーカーが必要になる 原因遺伝子のある場所がより正確になる 過去 現在 連鎖不平衡ブロックは時間とともに小さくなる 同じ範囲を調べるのにたくさんのマーカーが必要になる 原因遺伝子のある場所がより正確になる

LDマッピングの原理 すべての隣接する塩基間で連鎖が平衡に達していれば、SNPはマーカーにはなりえない 組み換えが多く発生した箇所 SNPがマーカーとして機能しうる範囲 snp 組み換えが一様であれば、マーカーが検出できる範囲もまた一様 LDマッピングとは、 ゲノム上にある、SNPをマーカーとして、RA関連多型を検出すること SNPマーカーが真の関連多型を検出することができるのは、連鎖不平衡と呼ばれる関係がSNPマーカーと真の関連多型との間に存在するからである。 その関係があるのは、日本人の歴史において、蓄積された組み換えの数がある程度限定されていて、粗密があるから。 たとえば: 上段は、組み換えが非常に沢山おきてしまっていたら、LDはまったくなく、SNPをマーカーにして検出不能 中断は、ある程度少ない数の組み換えが、均等におきた場合→検出可能。 だけど、これは、真実ではない。 真実は下段。 限定された数の組み換えが、あるところでは密にあるところでは疎におきたのが真実で、それにより、LDの広がりはゲノム上の場所によりまちまちであり、したがって、真の関連多型を検出することのできるSNPの持つ役割もゲノムの位置によりまちまちである。 このLDの広がりが、LDブロックといわれるもので、LDブロックの中にある関連多型は、同じブロック上のSNPを調べることで検出可能である、 これがLDマッピング。 snp 実際には、組み換えが多かった部位は局在している 真の疾患ローカス

LDマッピングの手順 SNP 遺伝子 ブロック A C G T G G G T A C C G T T C C T G G C C G G G T C G C G A C T A G A G C T C G C G A C G C G A C G G C G G G T G T A C A C G T T C C A A C A G G T C G C G T C G A A C T C G C G T A C C ハプロタイプ &htSNP

LDブロックという考え方 実在か? 実在でないとしても、区切りたい

ブロックの基礎 LDブロックとは、LDの強い領域単位 LDの強さの捉え方 ペアワイズLD 関連の評価 ペアワイズLD オッズ比(関連の強さ(関連があるとしたら)) p値(関連がないと信じにくい程度) ペアワイズLD LDインデックス(LDの強さ(LEがあるとしたら)) LD-LOD(LEがないと信じにくい程度) 10^(-LOD) ~p

LDブロックに基づく標的の決め方 本物はどこ? SNP 遺伝子 ブロック A C G T G G G T A C C G T T C C T G G C C G G G T C G C G A C T A G A G C T C G C G A C G C G A C G G C G G G T G T A C A C G T T C C A A C A G G T C G C G T C G A A C T C G C G T A C C ハプロタイプ &htSNP

ブロックの再評価 ブロック内にある多型をリストアップする どの多型がリスクの源かわからない。多型の組合せ(ハプロタイプ)が源かもしれない ブロック内の多型は全部タイピングしなくてもよい タグSNP ハプロタイプ-タグSNP タグ-SNP

ハプロタイプの推定 なぜ推定するか

EMアルゴリズム EM推定 LODの計算 LDインデックスの計算 エクセル “3-5-2-3-1-2SNPLD_LOD_10000.xls” “3-3-2-3-9LDindex.xls”

ブロック内多型 多型のリスト ハプロタイプ タグSNP ・・・どれを検定する? 「正しい方法」は未決定 個々のSNP? 個々のハプロタイプ? ハプロタイプの組合せ? 個々のSNPもハプロタイプの組み合わせ方の1方法 「正しい方法」は未決定

Haploview インストール サンプルで実行 ファイルを見よう