Golden State Killer Case ~GEDmatch~ 法数学勉強会 2018/10/13 京都大学(院)医学研究科統計遺伝学分野 山田 亮
Golden State Killer Case
私は誰?プロジェクト (Non-profit DNA Doe Project)と同じ手法 養子が生物学的親を知りたいという希 望をかなえるためのプロジェクト https://dnadoeproject.org/ https://www.facebook.com/DNADoeProject/
何をしたか 現場試料のDNAシークエンシング GEDmatchで血縁候補者リストを入手し、現場試料DNAの持ち主 と思われる個人(容疑者)を特定・限定 特定・限定された容疑者のdiscarded DNAを入手し現場試料DNA との一致を確認(GEDmatch上で?それ以外の方法で?)
これを可能にした技術 古いDNA・分解の進んだDNAでも、全ゲノムシークエンシング して配列を決めることができるようになった ネアンデルタール人の全ゲノムシークエンス 全ゲノムシークエンシング結果から、GEDmatchが受け付ける入 力フォーマット(23andMeなどの出力)を作成することができる ようになった
Ancient DNA sequencing Am J Hum Genet. 2013 Nov 7; 93(5): 852–864. Pulling out the 1%: Whole-Genome Capture for the Targeted Enrichment of Ancient DNA Sequencing Libraries マップ率 1.2 % が 59 %に改善 SNP コール (100万リード) 平均13280 SNPs (217 – 73266) が、 平 均50723 SNPs (3062-147243) に改善 Proc Natl Acad Sci U S A. 2014 Feb 18; 111(7): 2401.
Ancient DNA Sequencing
GEDmatchとは SNPを使う 多くの人が自分のSNP情報(23andMeなどの)を自発的に登録する http://smithplanet.com/stuff/gedmatch.htm GEDmatchとは SNPを使う 多くの人が自分のSNP情報(23andMeなどの)を自発的に登録する 染色体の共有セグメントの総計をcM単位で算出する 共有セグメント総計 cM を用いて、2者の血縁の強さを大まか に推定する 登録者の間に巨大な家系図ができる 血縁関係にありそうな人のリストを返してくれる
セグメントごとに情報が返ってくる The larger the segment (more SNPs and higher cM) of matching markers/base pairs, the more likely it is IBD (you share a common ancestor) rather than IBS (just matching by chance). Matching segments smaller than 7cM or 700 SNPs have a high likelihood of being IBS, so they should be considered questionable. Matches smaller than 3cM or 300SNPs should be highly suspect and rarely used alone for genetic genealogy.
血縁関係らしい人のリストが返ってくる The large table will list your matches in order of Total cM overlap. Most everyone on the list (especially those near the top) will be related to you... somehow. The report also displays the largest cM segment amount you share. The Gen column provides a rough estimate of the number of generations between you and the Most Recent Common Ancestor (MRCA) you and that match both share - 1 for parent-child, 2 for 2 generations (grandparent-grandchild), etc.
同一人物かも調べられる One-to-one Compare The One-to-one compare utility allows you to look for chromosome segment matches between two people. You can run this utility by selecting 'One-to-one' compare on the homepage and entering the kit #s for the people you want to compare, or by clicking the "A" link on the One-to-many report. The default settings will generally suffice for most matches, though I prefer to enable the Show graphic bar for each Chromosome?option to give a more visual presentation of the segment overlaps.
共有cMで血縁関係推定
Autosomal DNA match
Autosomal DNA match 同じ値が入っている箱を捜せ!
共有cMの分布をみてみよう Shared cM Project The Shared cM Project is a collaborative data collection and analysis project created to understand the ranges of shared centimorgans associated with various known relationships. For this update, total shared cM data for more than 25,000 known relationships were provided. https://thegeneticgenealogist.com/wp-content/uploads/2017/08/Shared_cM_Project_2017.pdf https://thegeneticgenealogist.com/2017/08/26/august-2017-update-to-the-shared-cm-project/
いろいろな会社のデータを統合して評価 2つ前のスライドの数字と比較せよ!
Autosomal DNA match thresholds https://isogg.org/wiki/Autosomal_DNA_match_thresholds Autosomal DNA match thresholds 結構、簡単な方法でShared Segmentsを決めている 強みは「理論」ではなくて「多量の事実」 23andMeの場合 最大セグメント基準 7cM以上、700SNPs以上 最大セグメント基準を満たすか、血縁であることを前提の比較の場合 には、5cM以上、700SNPs以上 連続一致からのエラーは300SNPsあたり、1エラー(逆ホモ)まで許す(少 なくとも1アレル共有のセグメントを探しているので、エラーとは逆 ホモ):この基準だと、ミスは1%程度 血縁者人数の上限設定もある
参考リンク ニュース記事 DNA Doe project GEDmatch centi Morgan https://www.sciencenews.org/article/golden-state-killer-suspect-dna-genetics-genealogy DNA Doe project https://dnadoeproject.org/ GEDmatch http://smithplanet.com/stuff/gedmatch.htm centi Morgan https://isogg.org/wiki/CentiMorgan Shared segment of chromosome by relatives https://thegeneticgenealogist.com/2017/08/26/august-2017-update-to-the-shared-cm-project/ Autosomal DNA match thresholds https://isogg.org/wiki/Autosomal_DNA_match_thresholds 23andMe等が採用している、セグメント検出の定義など