ゲノムワイドアソシエーションスタ ディ による 疾患関連遺伝子探索 平成20年9月1日 東京医科大学 東京大学医科学研究所 ヒトゲノム解析センター 山田 亮
GWAS ゲノムワイドアソシエーションス タディ 対象疾患 –NCBI dbGaP 登録疾患リスト t.htmlhttp:// t.html Disease Studies Variables Documents Participants Type of Study – アルツハイマー病、心循環器疾患、高血圧、肥満、ALS、変 性性神経疾患、うっ血性心不全、脳血管障害、気管支喘息、心 肥大、多動症、動脈硬化、躁うつ病、骨粗しょう症、白内障、 2型糖尿病、うつ病、統合失調症、睡眠時無呼吸症候群、乾癬、 脂肪肝、加齢黄斑変性、ホルモン補充療法関連副作用、糖尿病 性神経症、SLE、冠動脈バイパス手術、心弁置換術、関節リ ウマチ・・・・・・・・・・・
疾患の遺伝因子・環境因子 疫学調査は、ひとま ず疫学者に任せてお いて
臨床現場での遺伝性の実感 遺伝子解析の基礎 – 疾患には遺伝性がある – 疾患が血縁関係者に好発する
Commmon diseases とその遺伝性 単一遺伝子病 外傷 感染症 悪性腫瘍 偶然性要因 イメージ アレルギー性疾 患 生活習慣病 リウマチ性疾 患
とある外来にて ○○ 病患者 300人を診療している そのうちの1割、30人の患者の家族歴 が陽性であった さて、この疾患は、「遺伝性」が高いの だろうか?
風邪の家族歴 MI の家族歴 RA の家族歴 奇病の家族歴
遺伝子解析の基礎 – 疾患には遺伝性がある – 疾患が血縁関係者に好発する疾患が血縁関係 者に 好発するとは・・・ – 「普通に」発症している状態より、多く発症 していること
「普通に発症」 有病率と同じ程度に発症 –○○ 病患者 300人を診療している – そのうちの1割、30人の患者の家族歴が陽 性であった – 有病率が1割の疾患だったら、これは「普通 に」発症していて、有病率が5%の疾患だっ たら「普通より好発」している?
家族歴の聴取 「ご家族に ○○ 病の方はいらっしゃいます か?」という質問 – 「家族歴陽性」 「 ○○ 病の診断を受けた家族がいる」 「 ○○ 病の診断を受けた家族が、少なくとも1人い る」 – 「ご家族」の人数は? →N 1-( 発病しない率 ) N =1-(1- 発病率 ) N
1 割の患者で家族歴陽性 有病率
両親 両親 + 同胞両親 + 同胞 + 祖父母 + おじお ば 両親 + 同胞 + 祖父母
比較的高頻度疾患において 「家族歴陽性」は、「普通なこと」で遺 伝性の判断には有用ではない – 「少なくとも1人」だったから 「何人中、何人」という情報なら・・・ – 何人の「家族」を思い浮かべて、「あり」 「なし」の情報を取ったか。 – その「あり・なし」の比率が「普通」か「好 発」か。
家族が 10 人なら有 病率 x10 のところ にピーク
「家族に集積する」環境因子 「遺伝」するのは、遺伝因子だけではな い – 精神科領域疾患の例 養育・教育環境における父母差 など 「家族歴」から感じる遺伝性を、実際の 遺伝性より大きく感じさせる要因
疾患の遺伝因子・環境因子 疫学調査・遺伝学 – 双生児研究・家系研 究
遺伝率 Heritability – 形質のばらつきを、遺伝因子のばらつきと環境因子 のばらつきに分離することで、「遺伝要因の強さ」 を数値化したもの – 基本は育種 種牛の「能力」 – 育種価 breeding value ある個体の個々の遺伝子座においてある形質に働く相加的遺 伝子効果の総和を育種価という。実用的 にはある個体の育種 価はその個体の子どもの平均値の集団平均からの偏差の2倍と しても定義される。相加的遺 伝子効果 – 「ウシのブリーダーはウシを売るのでなく育種価を売るのだ」 という言葉がある。 「家族歴陽性」の判断だけでなく、遺伝 率 ( 学問的な指標 ) をも鈍らせる
家族歴収集の段階で、できるこ と 有病者・非有病者の両方の情報を取る 確実な環境因子を家族員についても聴取する – 喫煙 – 食習慣 – などなど それが面倒くさければ、まったくその情報をと らない代わりに、「バイアスをもたらす環境因 があからさまな疾患の家族歴」からは情報を引 き出さないこととする・・・
特に集積性の高い家系は・・・ 集積度の高い家系と集積度の低い家系 同じ様相を見てもアプローチが異なる – 発ガン家系 → 遺伝因子:発ガン遺伝子 – 肥満家系 → 環境因子:生活習慣 それはなぜ? – あからさまに論じられていないが・・・ 集積が「家族」か 集積が「血縁」か 環境因子は「なだらか」な量的因子・・・ 極端家系がいても、その途中 がいそう 遺伝因子は「遺伝的な近さ」など、「特徴的な」値がある – 一卵性双生児:1 – 親子: 0.5 – 同胞: 0.25 など – 「 MI の配偶者側ヒストリー」
家族歴 血縁家族歴 非血縁家族歴
Commmon diseases とその遺伝性 単一遺伝子病 外傷 感染症 悪性腫瘍 偶然性要因 イメージ アレルギー性疾 患 生活習慣病 リウマチ性疾 患
~遺伝率で遺伝性が判明した後~ いくつのリスク遺伝子があるか それぞれの強さはどのくらいか それらを見つけられるか
スタディ実行!
スタディの結果 「関連遺伝子」の強さ p値 オッズ比・相対危険度 Genotypic attributable risk Genotype-Specific Recurrence Risks
p-value and OR 素のp値 –GWAS で p= ! 素の OR – GWASでOR=2
1マーカーでの関連解 析 形質 ( 疾患 ) マーカー 形質とマーカーとに強い関連があ る
多マーカーでの関連解 析 形質と第 1 マーカーとに強い関連がある マーカー2つ形質 ( 疾患 )
多マーカーでの関連解 析 形質と第 1 マーカーとに強い関連がある? マーカー形質 ( 疾患 )
多マーカーでの関連解 析 形質と第 1 マーカーとに強い関連がある ??????? マルチプルテスティング問題 マーカー形質 ( 疾患 )
p値の補正 マルチプルテスティング補正 – GWASでは「割引き」したp値 –GWAS で p= ! 「論文になった」~ p<0.01 – 「GWASですごいp値」~「GWASのORはす ごい値 – 「p値は補正しないと」~「ORも補正しないと」 – 「かろうじて、有意差が出た」 p= ! ~ p=0.01 「かろうじてのORは1より少しだけ大きい程度」
ORの補正
本当のリスクは?
Korean メタアナリシ ス 発端研究
その他の解釈指標 「本当のリスク」に照らして Genotypic attributable risk – あるリスクアレルがあったときに、そのアレルがな かったら、疾患有病者のどれくらいの割合が今より 減るだろうか、という値。 Genotype-Specific Recurrence Risks – 同胞に発病者がいるとする。罹患同胞も、本人も一 切リスクアレルに関する情報がないとしたときには、 本人 ( 罹患同胞を持つ ) のリスクは によって与えられる。 今、あるリスクローカスについて、本人のジェノタ イプがわかったとすると、そのわかった分だけ、発 病リスクが上がる分がある ( 当該ローカスのリスクア レルを持っていれば ) 。それを Multiplicative model に 照らして数値化したもの。
ポストゲノム時代の疾患遺伝子解 析 ~現状と課題~ 民族差 多型 –SNP と CNP( コピーナンバー多型 ) 遺伝子 – コーディング遺伝子と非コーディング遺伝子 解析規模の拡大 – 統計解析手法
Korean 民族差
Sub-microscopic variants Structural variants Microscopic variants ヒトゲノムサイ ズ 置換型多型 SNP 挿入欠失型 リピート型 向きの多型 ( 逆位 ) 位置の多型 ( 転座 ) CNV ♂♀
Central Dogma & DNA Variations DN A mRNA Peptide Transcription Translation Transcription initiation point Transcription termination point Splicing and mRNA maturation Translation initiation point Codon triplets Translation termination point Variations Post-translational peptide modifications Molecules
Not one way, but Multiple Bifurcations Sequence (qualitative) variations, quantitative variations, Chrono-spatial variations DNA mRNA1 mRNA2 Peptide1 Peptide2 Peptide3 Molecule3 Molecule2Molecule1 Molecule4 Transcript variations Peptide variations Molecular variations
DNA mRNA1 mRNA2 Peptide1 Peptide2 Peptide3 Molecule3 Molecule2Molecule1 Molecule4 Phenotype1 Phenotype2 Phenotype3 Phenotype4
DNA mRNA1 mRNA2 Peptide1 Peptide2 Peptide3 Molecule3 Molecule2 Molecule1 Molecule4 Phenotype1 Phenotype2 Phenotype3 Phenotype4
Susceptible Non-susceptible Association study with DNA-markers DNA-mRNA-Protein relation is not straight, but comparison between DNA variations and phenotype variations bypassing mRNA/proteins simplifies the analysis structure.
Coding-gene World and Variations Coding DNA Coding mRNA Non-coding-gene World and Variations DNA Functional RNA Effects on transcription Effects on translation ?? Effects on phenotypes??
個人のゲノム
Genotyping technologies and further developments 100,000 marker-panel 250,000 marker-panel 500,000 marker-panel …1,000,000 marker-panel … … Whole genome typing of all samples Typing
スタディ規模の大規模化 ランダムサンプル収集が不可能 – 集団構造化 多数のマーカー検定 – マルチプルテスティング
疾患における遺伝因子の位置 ~実用に向けて~ 遺伝子単一では、診断・予測への応用 – その精度と利用法 発病前(予防・発病予測)、発病後(治 療法選択・予後予測)
東京大学医科学研究所 ヒトゲノム解析セン ター 理化学研究所遺伝子多型研究センター 関節リウマチ関連遺伝子研究チーム 京都大学大学院 医学研究科附属ゲノム医学セン ター