対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~

Slides:



Advertisements
Similar presentations
ゲノムワイドアソシエーションスタ ディ による 疾患関連遺伝子探索 平成20年9月1日 東京医科大学 東京大学医科学研究所 ヒトゲノム解析センター 山田 亮.
Advertisements

橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
Statistical Genetics 7 Functionality of SNPs Graduate School of Medicine Kyoto University 2008/09/17-25 IMS-UT Ryo Yamada.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
logistic regression をしたい場合の STATISTICA2000のアプリケーションの使い方について
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
多次元楕円の正球化座標変換を利用した分割表検定のパーミュテーションテスト効率改善について
・力のモーメント ・角運動量 ・力のモーメントと角運動量の関係
RNA i (RNA interference).
特論B 細胞の生物学 第2回 転写 和田 勝 東京医科歯科大学教養部.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
多様性の生物学 第9回 多様性を促す内的要因 和田 勝 東京医科歯科大学教養部.
Geneticsから Epigeneticsへ
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
塩山幾何学を用いた ボロノイ図の解析 立命館高等学校 三村 知洋 宮崎 航輔 村田 航大 塩山幾何学を用いたボロノイ図の解析
analysis of survey data 第3回 香川大学経済学部 堀 啓造
3次元での回転表示について.
復習:雑種第一代(F1) w W Ww Ww Ww Ww すべて『Ww』 優性形質が現れる すべて『ウエット』 遺伝子型 表現型 優性ホモ
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
分割表 Contingency table.
三角形や四角形ではない図形の 角の大きさの和を求めよう。.
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
電磁気学C Electromagnetics C 5/28講義分 電磁波の反射と透過 山田 博仁.
細胞の形と変形のための データ駆動型解析手法
多母集団の同時分析 豊本満喜子 大阪大学人間科学部.
大規模なこと Large scale.
3次元での回転表示について.
M022 ゲノム科学と医療 統計遺伝学分野 2010/11/18,25 山田 亮
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
Central Dogma Epigenetics
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
東日本大震災におけるご遺体身元確認と行方不明家族捜索のためのDNA鑑定
多角形の外角の和 凹型四角形の角 星形五角形の内角の和
母分散の信頼区間 F分布 母分散の比の信頼区間
学 正多角形のどんな性質を使えば,プログラミングで正多角形を描くことができるだろうか。
遺伝を表現するための言葉 Glossary for genetics
遺伝性疾患・先天性疾患  染色体・遺伝子の異常とその分類  遺伝性疾患  先天性疾患.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
尤度の比較と仮説検定とを比較する ~P値のことなど~
母分散の検定 母分散の比の検定 カイ2乗分布の応用
研究科横断型教育プログラム(Bタイプ) 統計遺伝学 全5回
遺伝関係のグラフ Hereditary graphs
親子鑑定に見る尤度比を 角度を変えて眺めてみる
第16章 動的計画法 アルゴリズムイントロダクション.
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
薬理学研究科 のための 遺伝的多様性 11/02/2013 医学研究科 統計遺伝学分野 山田
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
遺伝を表現するための言葉 Glossary for genetics
分割表 Contingency table.
遺伝統計学 集中講義 (6) 終わりに.
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
ベクトル関数の回転(カール、ローティション)
遺伝統計学 Genetic Statistics 2010
Presentation transcript:

対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~ 京都生物統計セミナー(KBS京都) 2009/11/10 京都大学医学・生命科学総合研究棟 京都大学大学院医学研究科附属ゲノム医学センター統計遺伝学分野 山田 亮

遺伝子DNA mRNA タンパク質 分子機能 形質

DNA mRNA1 mRNA2 Peptide1 Peptide2 Peptide3 Molecule3 Molecule2 Molecule1 Molecule4 Phenotype1 Phenotype2 Phenotype3 Phenotype4

Association study with DNA-markers Non-susceptible Susceptible DNA-mRNA-Protein relation is not straight, but comparison between DNA variations and phenotype variations bypassing mRNA/proteins simplifies the analysis structure.

ディプロイド 父由来 母由来 5

優性遺伝・劣性遺伝 父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来

優性遺伝・劣性遺伝 父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来 ヘテロ ホモ1 ホモ2 アレルコピー数 2 0 1 1 2 0 1 1 0 2 形質比 優性遺伝形式 1:0 0:1 劣性遺伝形式 1:0 0:1 7

優性遺伝・劣性遺伝 父由来 母由来 父由来 母由来 父由来 母由来 父由来 母由来 アレルコピー数 2 0 1 1 0 2 形質比 2 0 1 1 0 2 形質比 優性遺伝形式 1:0 0:1 劣性遺伝形式 1:0 0:1 湿性耳垢は優性 が2つか1つで湿性 乾性耳垢は優性 が2つで乾性 8

複合遺伝性疾患と閾値モデル Complex genetic traits and threshold model Heritability = 0.6    Vall=Vg+Ve; Vg=0.6 VlocusX=0.6x0.01 Allele freq of X = 0.4 HWE Phenocopy = 0.2 X non-risk homozygoutes X heterozygoutes Prevalence = 0.01 RR(homo1vs homo2) =1.71 RR(hetero vs homo2) = 1.29 X homozygoutes 9

多型

SNPのケース・コントロール解析 AA Aa aa 和 ケース r1 r2 r3 R コントロール s1 s2 s3 S t1 t2 t3

SNPのケース・コントロール解析 ジェノタイプ(AA Aa aa)の違いはケースになるリスクに影響するか? リスクアレルはあるか? ヘテロだからこそ、という可能性を見るか、ヘテロはホモ1とホモ2の間と見るか ? Risk(AA) >= Risk(Aa) >= Risk(aa) ?

SNPのケース・コントロール解析 2の問いは1の問いでAがリスクをもたらすことを前提としている 2の母数は1に関する対立仮説下でのみ存在する リスクアレルはあるか? A (もしくは a) はケースになるリスクをもたらすか? 遺伝形式は何か? AA Aa は aa に比べてケースになるリスクを増やすがその強弱はどうか? 2の問いは1の問いでAがリスクをもたらすことを前提としている 2の母数は1に関する対立仮説下でのみ存在する

遺伝形式という対立仮説下でのみ存在する(局外)母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~ リスクアレルはある Risk(A)>Risk(a) 局外母数 k には範囲がある Risk(Aa)=k Risk(AA) +(1-k) Risk(aa); 0<=k<=1 k=1 : 優性 k=0 : 劣性 14

道具を導入

2x3分割表の幾何表現

n1+n2+...+nk=N; ni>=0 正(k-1)次元単体 k-1次元空間上のk本の相互に「対等な」ベクトルが cos (-1)(-1/(k-1)) なる角をなして作る

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T R t1 t2 S t3

3カテゴリ(AA,Aa,aa)はそれぞれ2/3pの角で交わる向きに、幅t1,t2,t3を与えている 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T Pop1の正三角形とPop2の正三角形は R,Sに比例した大きさで 独立帰無仮説の点を中心に 点対称で配置され 3カテゴリ(AA,Aa,aa)はそれぞれ2/3pの角で交わる向きに、幅t1,t2,t3を与えている t2 t3 t1

面積を計算して、テーブル数を計算する この正三角形の面積は テーブル数は 1 N-2 N-1 1 2 N-1 N N

周辺度数から、とりうるテーブル数を幾何的に計算 9057 20005 10014 39076 52040 300012 78009 430061 61097 320017 88023 469137 単位正三角形は高さ1 N: テーブル数 A: 多角形の面積 L: 多角形の周長 7億6352万5503

SNPのケース・コントロール解析 2の問いは1の問いでAがリスクをもたらすことを前提としている 2の母数は1に関する対立仮説下でのみ存在する リスクアレルはあるか? A (もしくは a) はケースになるリスクをもたらすか? 遺伝形式は何か? AA Aa は aa に比べてケースになるリスクを増やすがその強弱はどうか? 2の問いは1の問いでAがリスクをもたらすことを前提としている 2の母数は1に関する対立仮説下でのみ存在する

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T 検定手法いくつか 3独立カテゴリについての2群間の独立性検定 優性形式検定 劣性形式検定 Armitage-Cockran トレンド 検定~線形重み付けトレンド検定

自由度2カイ自乗統計量 3独立カテゴリについての2群間の独立性検定 10 20 30

等高線は楕円 をθ回転したもの  θ b a

Aa    <x,y> : 内積 ei : 3方向の単位ベクトル aa AA

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T 検定手法いくつか 3独立カテゴリについての2群間の独立性検定 優性形式検定 劣性形式検定 Armitage-Cockran トレンド 検定~線形重み付けトレンド検定

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T t2 + t3 t1 r1, s1 が等しければ、同じ検定結果 劣性 自由度1

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T 優性 自由度1 r3, s3 が等しければ、同じ検定結果

AA Aa aa 和 Pop1 r1 r2 r3 R Pop2 s1 s2 s3 S t1 t2 t3 T 線形トレンド 自由度1 r2, s2 が等しいライン 2r1+r2, 2s1+s2が等しければ、同じ検定結果 r1-r3, s1-s3が等しければ、同じ検定結果 =

3カテゴリ 自由度2 線形トレンド 自由度1 劣性 自由度1 優性 自由度1

3カテゴリ 自由度2 劣性 自由度1 劣性検定カイ自乗値は、3カテゴリ検定カイ自乗値の「接線」

自由度2の検定値楕円に引いた3接線は、3つの異なる自由度1の検定統計量に対応していた。 接線は楕円の全周に引ける。 3本の接線は、ホモとヘテロのリスク比に対応づけられる。 接線は自由度2検定で帰無仮説が成立しないときにのみ値を持つ母数である。 「興味ある」接線はどれか?

複合遺伝性疾患と閾値モデル Complex genetic traits and threshold model Heritability = 0.6    Vall=Vg+Ve; Vg=0.6 VlocusX=0.6x0.01 Allele freq of X = 0.4 HWE Phenocopy = 0.2 X non-risk homozygoutes X heterozygoutes Prevalence = 0.01 RR(homo1vs homo2) =1.71 RR(hetero vs homo2) = 1.29 X homozygoutes 35

「興味ある」接線はどれか? ヘテロはホモ1とホモ2の間 ? Risk(AA) >= Risk(Aa) >= Risk(aa) ? “MAX” from Dominant to Recessive OMTT (Optimal Mode Trend Test)

Chi-square for Trend AA Aa aa marginal pop1 d11 d12 d13 R pop2 d21 d22 weight w1 w2 w3 dij = obsij –expij wi : トレンドの重み {w1,w2,w3}={1,r,0}; -∞<=r<=∞ r=1 : 優性モデル r=0.5 : 線形トレンド r=0 : 劣性 -∞<=r<=∞ : 自由度2 0<=r<= : OMTT

自由度2 自由度1 P値は OMTT 自由度・・・ 自由度1 優性 自由度1

おまけ

http://www. genome. med. kyoto-u. ac. jp/wiki_tokyo/index http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/公開アプリケーション