Download presentation
Presentation is loading. Please wait.
1
多次元楕円の正球化座標変換を利用した分割表検定のパーミュテーションテスト効率改善について
統計関連学会連合大会2010年度 2010/09/06 山田 亮・川口喬久 京都大学大学院医学研究科附属ゲノム医学センター 統計遺伝学分野・疾患ゲノム疫学分野
2
動機 遺伝子マッピング 分割表検定 小さめのP値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト
小さめのP値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか 幾何を使ってみる
3
2x3表検定 1つの表で複数の検定 ケース・コントロール(2表現型) 3ジェノタイプ 遺伝形式 WW、Wm、mm 優性形式 劣性形式
2x3表検定 1つの表で複数の検定 ケース・コントロール(2表現型) 3ジェノタイプ WW、Wm、mm 遺伝形式 優性形式 リスク(Wm)=リスク(mm) >1←→リスク(WW)=1 劣性形式 リスク(mm)>1←→ リスク(Wm) =リスク(WW)=1 遺伝学的に「ありそうな」遺伝形式 リスク(mm)>= リスク(Wm) >=リスク(WW)=1
4
手順 Nカテゴリの(N-1)次元空間幾何表現 NxM表の(N-1)x(M-1)=自由度-次元の幾何表現 検定統計量の幾何表現
ピアソンの独立性検定統計量:多次元楕円 NxM表における自由度1テスト統計量:超平面 その他の統計量 多次元楕円を多次元球に座標変換(固有値分解) 幾何表現におけるP値とその推定
5
k-1次元にkカテゴリを均等配置 (正単体:正三角形の多次元一般化)
6
3 categories in a triangle
4 categories in a tetrahedron
7
NxM表 (N-1)単体と(M-1)単体とを組み合わせる
8
2x3 表 自由度2、2次元空間 2x3=6セルに6単位ベクトルを対応させる 期待値表を原点に
2x3=6 vectors 2x3=6セルに6単位ベクトルを対応させる 期待値表を原点に 期待値からのずれは2x3=6セルのずれ具合で決まるが、それは自由度2なので、2次元座標で表せる A1 A2 A3 B1 B2 B3
9
NxM 表でも同じ 2x4=8 vectors 2x3=6 vectors
10
ピアソンの独立性検定の カイ自乗値(Psn)
11
自由度1のテストのカイ自乗統計量を共有する表は 直線・超平面をなす Psnとの関係は『接する』こと
12
楕円体は球に座標変換できる それは 固有値分解
Eigenvalue decomposition
13
『接する』関係も座標変換
14
Tangent point to the smaller sphere.
Psnと自由度1の検定の関係 a Test Vector b Tangent point to the smaller sphere. 球化座標では、 接点が原点からの法線ベクトル方向にある 取り扱いが単純になる
15
動機 遺伝子マッピング 分割表検定 P値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか
P値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか 幾何を使ってみる
16
統計量の確率分布が既知とは 統計量の等高線が: 面 低次元楕円体 多次元楕円体
17
統計量の確率分布が未知とは 統計量の等高線が: 「きれいな」図形ではない
18
遺伝子多型2x3表の MAX3検定 3つの遺伝形式(自由度1の検定に対応) 最もフィットした形式の統計量を採用する dom rec add
19
どのモデルに最もフィットするかは 空間における表に位置による
Recessive Additive Dominant Dominant Recessive Additive
20
MAX3検定の等高線は 3組の平行線からなる
21
MAXtest→MAX test 優性と劣性とその間の遺伝形式を網羅
等高線は平行線と弧 MAX MAX3 Arc
22
P value Probability of tables with a statistic value equal to or more than the observed table
23
Pr(θ): The probability further than the contour line in the direction.
All directions are even!
24
2x3 表の場合のP値の推定 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る
平均を取ってよいのは、すべての方向が「平等」だから Genet. Epidemiol. (in press)
25
Generalization to higher dimensions
Spherization
26
NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから
27
NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから
28
NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから
29
NxM 表への一般化 ランダムな方向について、等高線の外側に相当する表の観測確率の平均を取る
平均を取ってよいのは、すべての方向が「平等」だから
30
Random directions are easily sampled in the “spherized” coordinate.
31
Random directions are easily sampled in the “spherized” coordinate.
32
試行回数が少なくても「たくさんの試行」をしたことになる 生起確率が低い表に関しての情報がとれる
黒: パーミュテーション法 赤 : 正球化・ランダム方向法 stats Cumulative prob.
33
正球化の2つのメリット 『接点』が原点から『接線・接面』の法線ベクトル上に乗ること すべての方向が平等になること
34
Comments and questions are welcome → ryamada@genome.med.kyoto-u.ac.jp
R code and web-based calculator of the method for 2x3 table presented are available at; Comments and questions are welcome → Collaborators Graduate school of Medicine, Kyoto University, Kyoto, Japan Katsura Hirosawa Meiko Takahashi Fumihiko Matsuda Lab for Autoimmune Diseases, CGM, RIKEN, Yokohama, Japan Yukinori Okada Yuta Kochi Akari Suzuki Kazuhiko Yamamoto
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.