多次元楕円の正球化座標変換を利用した分割表検定のパーミュテーションテスト効率改善について

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
地理情報システム論 第11回 GIS による処理技法 アドレスマッチングの利用 空間的分布の特徴の把握.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
一般化線形モデル(GLM) generalized linear Models
第3回  CVにおけるエピポーラ幾何
・力のモーメント ・角運動量 ・力のモーメントと角運動量の関係
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
第6回 分散分析(第7章) Analysis of Variance
統計解析 第8回 第7章 2項分布.
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
「Self-Organizing Map 自己組織化マップ」 を説明するスライド
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
確率・統計Ⅱ 第7回.
統計解析 第8回 第7章 2項分布.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
分割表 Contingency table.
Computer Graphics 第3回 座標変換 芝浦工業大学情報工学科 青木 義満
対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~
量的表現 Quantitation.
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
細胞の形と変形のための データ駆動型解析手法
黒体輻射 1. 黒体輻射 2. StefanのT4法則、 Wienの変位測 3. Rayleigh-Jeansの式
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
可視面・不可視面の判定方法と隠れ面(不可視面)の消去法について述べる.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
様々な情報源(4章).
1.母平均の検定:小標本場合 2.母集団平均の差の検定
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
尤度の比較と仮説検定とを比較する ~P値のことなど~
第4章 統計的検定 (その2) 統計学 2006年度.
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
x2+y2+z2+u2=1 上の初等幾何 -直投影&スライスして見る-
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
地理情報システム論(総)/ 国民経済計算論(商)
地理情報システム論 第4回 コンピュータシステムおける データ表現(2)
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
遺伝を表現するための言葉 Glossary for genetics
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
分割表 Contingency table.
重力波解析ライブラリKagaliのためのAntenna pattern functionの作成
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
ベクトル関数の回転(カール、ローティション)
~国際比較にみる達成目標と評価のガイドライン~
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
ランダムプロジェクションを用いた音響モデルの線形変換
空間図形の取り扱いについて.
Presentation transcript:

多次元楕円の正球化座標変換を利用した分割表検定のパーミュテーションテスト効率改善について 統計関連学会連合大会2010年度 2010/09/06 山田 亮・川口喬久 京都大学大学院医学研究科附属ゲノム医学センター 統計遺伝学分野・疾患ゲノム疫学分野

動機 遺伝子マッピング 分割表検定 小さめのP値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 小さめのP値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか 幾何を使ってみる

2x3表検定 1つの表で複数の検定 ケース・コントロール(2表現型) 3ジェノタイプ 遺伝形式 WW、Wm、mm 優性形式 劣性形式 2x3表検定 1つの表で複数の検定 ケース・コントロール(2表現型) 3ジェノタイプ WW、Wm、mm 遺伝形式 優性形式 リスク(Wm)=リスク(mm) >1←→リスク(WW)=1 劣性形式 リスク(mm)>1←→ リスク(Wm) =リスク(WW)=1 遺伝学的に「ありそうな」遺伝形式 リスク(mm)>= リスク(Wm) >=リスク(WW)=1

手順 Nカテゴリの(N-1)次元空間幾何表現 NxM表の(N-1)x(M-1)=自由度-次元の幾何表現 検定統計量の幾何表現 ピアソンの独立性検定統計量:多次元楕円 NxM表における自由度1テスト統計量:超平面 その他の統計量 多次元楕円を多次元球に座標変換(固有値分解) 幾何表現におけるP値とその推定

k-1次元にkカテゴリを均等配置 (正単体:正三角形の多次元一般化)

3 categories in a triangle 4 categories in a tetrahedron

NxM表 (N-1)単体と(M-1)単体とを組み合わせる

2x3 表 自由度2、2次元空間 2x3=6セルに6単位ベクトルを対応させる 期待値表を原点に 2x3=6 vectors 2x3=6セルに6単位ベクトルを対応させる 期待値表を原点に 期待値からのずれは2x3=6セルのずれ具合で決まるが、それは自由度2なので、2次元座標で表せる A1 A2 A3 B1 B2 B3

NxM 表でも同じ 2x4=8 vectors 2x3=6 vectors

ピアソンの独立性検定の カイ自乗値(Psn)

自由度1のテストのカイ自乗統計量を共有する表は 直線・超平面をなす Psnとの関係は『接する』こと

楕円体は球に座標変換できる それは 固有値分解 Eigenvalue decomposition

『接する』関係も座標変換

Tangent point to the smaller sphere. Psnと自由度1の検定の関係 a Test Vector b Tangent point to the smaller sphere. 球化座標では、 接点が原点からの法線ベクトル方向にある 取り扱いが単純になる

動機 遺伝子マッピング 分割表検定 P値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか P値閾値 10^(-8) 統計量の確率分布が未知 パーミュテーションテスト 何か他にやり方はないか 幾何を使ってみる

統計量の確率分布が既知とは 統計量の等高線が: 面 低次元楕円体 多次元楕円体

統計量の確率分布が未知とは 統計量の等高線が: 「きれいな」図形ではない

遺伝子多型2x3表の MAX3検定 3つの遺伝形式(自由度1の検定に対応) 最もフィットした形式の統計量を採用する dom rec add

どのモデルに最もフィットするかは 空間における表に位置による Recessive Additive Dominant Dominant Recessive Additive

MAX3検定の等高線は 3組の平行線からなる

MAXtest→MAX test 優性と劣性とその間の遺伝形式を網羅 等高線は平行線と弧 MAX MAX3 Arc

P value Probability of tables with a statistic value equal to or more than the observed table

Pr(θ): The probability further than the contour line in the direction. All directions are even!

2x3 表の場合のP値の推定 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから Genet. Epidemiol. (in press)

Generalization to higher dimensions Spherization

NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから

NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから

NxM 表への一般化 2πの方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから

NxM 表への一般化 ランダムな方向について、等高線の外側に相当する表の観測確率の平均を取る 平均を取ってよいのは、すべての方向が「平等」だから

Random directions are easily sampled in the “spherized” coordinate.

Random directions are easily sampled in the “spherized” coordinate.

試行回数が少なくても「たくさんの試行」をしたことになる 生起確率が低い表に関しての情報がとれる 黒: パーミュテーション法 赤 : 正球化・ランダム方向法 stats Cumulative prob.

正球化の2つのメリット 『接点』が原点から『接線・接面』の法線ベクトル上に乗ること すべての方向が平等になること

Comments and questions are welcome → ryamada@genome.med.kyoto-u.ac.jp R code and web-based calculator of the method for 2x3 table presented are available at; http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/Estimate_of_P-value_of_MAX_for_2x3_tables Comments and questions are welcome → ryamada@genome.med.kyoto-u.ac.jp Collaborators Graduate school of Medicine, Kyoto University, Kyoto, Japan Katsura Hirosawa Meiko Takahashi Fumihiko Matsuda Lab for Autoimmune Diseases, CGM, RIKEN, Yokohama, Japan Yukinori Okada Yuta Kochi Akari Suzuki Kazuhiko Yamamoto