分割表 Contingency table.

Slides:



Advertisements
Similar presentations
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
Advertisements

統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
VE 01 え form What is え form? え? You can do that many things with え form?
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
多次元楕円の正球化座標変換を利用した分割表検定のパーミュテーションテスト効率改善について
第6回 分散分析(第7章) Analysis of Variance
How to Measure Genetic Heterogeneity
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
Chapter 11 Queues 行列.
Bellwork: English meaning? 1)はじめまして 2)どうぞ 3)すみません 4)おはようございます 5)しゅくだい
相関係数 植物生態学研究室木村 一也.
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
構造的表現 Structure and Space
なぜ 今の どうする どうやって なにを どのように だれが だれと (変える) どこで だれの 考え方9W4H(Ver.0) いつ から
Chris Burgess (1号館1308研究室、内線164)
What did you do, mate? Plain-Past
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
Let’s discuss in English! What are your opinions? Let’s discuss it!
V 03 I do NOT eat sushi. I do NOT do sumo.
A 02 I like sushi! I like origami!
Licensing information
Provisioning on Multiple Network(NIC) env
定期考査2 英語.
“You Should Go To Kyoto”
VTA 02 What do you do on a weekend? しゅうまつ、何をしますか。
What is the English Lounge?
ストップウォッチの カード ストップウォッチの カード
カタカナ  4 When you want to own a car in the big cities in Japan, you need to prove you have a place to park your car. Unless you have a parking space on.
生命情報科学人材養成コンソーシアム バイオインフォマティクス実習コース 遺伝医学
P4-21 ネットワーク上の経路に対する 回帰問題について
Session 8: How can you present your research?
分割表 Contingency table.
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
Photometric properties of Lyα emitters at z = 4
対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
量的表現 Quantitation.
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
大規模なこと Large scale.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
Question Words….
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
2019年4月8日星期一 I. EPL 84, (2008) 2019年4月8日星期一.
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
遺伝統計学 集中講義 (4) SNPによる領域の評価
日本語 JPN102 February. 1, 2010 (Monday).
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
遺伝を表現するための言葉 Glossary for genetics
Genetic Statistics Lectures (4) Evaluation of a region with SNPs
Genetic Statistics Lectures (2) Linkage disequilibrium(LD) LD mapping
尤度の比較と仮説検定とを比較する ~P値のことなど~
構造的表現 Structure and Space
ー生命倫理の授業を通して生徒の意識に何が生じたかー
The difference between adjectives and adverbs
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
Created by L. Whittingham
東北大 情報科学 田中和之,吉池紀子 山口大 工 庄野逸 理化学研究所 岡田真人
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
遺伝統計学 集中講義 (2) 連鎖不平衡・連鎖不平衡マッピング
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
遺伝を表現するための言葉 Glossary for genetics
Cluster EG Face To Face meeting
Grammar Point 2: Describing the locations of objects
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
ガウシアングラフィカルモデルにおける一般化された確率伝搬法
Presentation transcript:

分割表 Contingency table

R sources “Rx-y.R”s are packed in the zip file HERE. http://www.genome.med.kyoto-u.ac.jp/wiki_tokyo/index.php/StatGenetOhm

いくつの数値で表を説明するか?How many values do you need to describe this table?

2x2 table

分割表を読む Read tables 自由度 Degree of freedom 自由な変数 Free parameter

2x3 table

有意性を判断する Judgment of significance 説明をするのに、変数を増やすか増やさないか、それが問題 Do you use additional parameter to describe the table “APPROPRIATELY”?

判断基準をプロットして考える Use plot to decide when you add the parameter 次元が自由度の空間にプロットする Plot in df-dimensional space

順序をつける Order tables

珍しさの計算 Calculation of rarity 確率 Probability

正確確率検定とピアソンのカイ自乗検定 Exact probability test and chi-square test of Pearson R13-2.R

確率と尤度 Probability and likelihood 仮説を固定、観察を動かす Hypothesis is fixed, observations vary 確率:G1,G2に差がないときにn11=x (x=0,1,2,…)という観察をする確率 尤度:G1ではAの割合がp1でG2ではAの割合がp2であるという仮定のもとでn11=n11という観察をする確率(p1=0~1,p2=0~1) Probability:When no diff. between G1 and G2, how often n11=x (x=0,1,2,…) ? Likelihood:A’s fraction of G1 and G2 are p1 and p2, how likely do we observe n11=n11. p1 and p2 ranges from 0 to 1. 仮説を動かす、観察を固定 Hypothesis vary, observations is fixed

observation hypothesis

検定3種 Three types of tests 正確確率検定 Exact tests パーミュテーションテスト Permutation-based テーブルの正確生起確率による Exact Probability based on table ピアソンの独立性検定 Pearson's independence test 尤度比検定 Likelihood ratio test

だいたい同じ 少し違う Similar each other but a bit different

尺度 Index HWD index f LD index D’, r^2

HWE MM Mm mm Mとmが独立なら MM: p(M)^2, Mm:2p(M)p(m), mm:p(m)^2 独立でないなら、ずれる When M and m are independent, MM: p(M)^2, Mm:2p(M)p(m), mm:p(m)^2 Hardy-Weinberg equilibrium(HWE) 独立でないなら、ずれる When M and m are not independent, MM/Mm/mm dist. Deviates from the HWE.

MM : p(M)^2 +f p(M)p(m) Mm : 2p(M)p(m) – fp(M)p(m) mm : p(m)^2 +f p(M)p(m) f represents deviation from HWE f can be calculated from observed MM/Mm/mm What is true value of f ?? Most likely value of f is what?

パラメタの値の推定 Estimation of value of parameters 推定値 Estimate 点推定 Point estimate 区間推定 Interval estimate

区間推定 Interval estimate #R12-1.R set.seed(.Random.seed[1]) # 疑似乱数を揃えるため N <- 20;k <- 6 # 観測情報 p <- seq(from = 0, to = 1, by = 0.01) # 数値を計算するpのリスト v <- dbeta(p, k + 1, N - k + 1) # β関数の確率密度 plot(p, v, type = "l") abline(v = k/N) # 最尤推定値 cirange <- 0.95 # 信頼区間を与え上下 0.025の範囲を指定します # β関数のクォンタイル ci <- qbeta(c((1 - cirange)/2, 1 - (1 - cirange)/2), k + 1, N - k + 1) abline(v = ci) # 95%信頼区間 Likelihood Parameter

信頼区間もいろいろな決め方 Multiple methods for confidence interval

アレル関連 連鎖不平衡 連鎖平衡 Allelic associaion, Linkage disequilibrium/equilibrium (LD LE) Alleles on two or more loci are independent(LE) ---------------------dependent (Allelic association ~LD)

Deviation from LE 2SNP haplotype H1 = pA pB +d H2 = pA pb -d d=r sqrt(pA pa pB pb) r^2 : LD index

Similarity between HWD and LD MM : p(M)^2 +f p(M)p(m) Mm : 2p(M)p(m) – fp(M)p(m) mm : p(m)^2 +f p(M)p(m) H1 = pA pB +d H2 = pA pb -d H3 = pa pB –d H4 = pa pb + d d=r sqrt(pA pa pB pb) r^2 : LD index MM : p(M)p(M) +d Mm : p(M)p(m) – d mM : p(m)p(M) – d mm : p(m)p(m) + d d= f sqrt(p(M)p(m)p(M)p(m))

Index -> Stat. value H1 = pA pB +d H2 = pA pb -d MM : p(M)p(M) +d d=r sqrt(pA pa pB pb) r^2 : LD index MM : p(M)p(M) +d Mm : p(M)p(m) – d mM : p(m)p(M) – d mm : p(m)p(m) + d d= f sqrt(p(M)p(m)p(M)p(m)) N : No. samples Chi^2 = N r^2 Chi^2 = N f^2

HWE LE

ハプロタイプ頻度を推定する Inference of haplotype freq. EMアルゴリズム EM algorithm 最大の尤度にどうやって到達する? How to reach the MAXIMUM likelihood ? BB Bb bb AA AB / AB AB / Ab Ab / Ab Aa AB / aB (AB/ab) vs. (Ab/aB) Ab / ab aa aB / aB aB / ab ab /ab

遺伝モードを検定する Tests of genetic modes 遺伝モデル Genetic modes 優性・劣性 Dominant Recessive 相加・相乗 Additive Multiplicative