法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
2006 年度 統計学講義内容 担当者 河田正樹
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
『基礎理論』 (C)Copyright, Toshiomi KOBAYASHI,
第4章補足 分散分析法入門 統計学 2010年度.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
社会調査とは何か(3) 調査対象者の選定方法
統計学 12/3(月).
経済統計 第三回 5/1 Business Statistics
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
統計学 11/30(木).
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田
テキストマイニング, データマイニングと 社会活動のトレース
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
ベイズ的ロジスティックモデル に関する研究
統計学 12/13(木).
3章 Analysing averages and frequencies (前半 p )
社会福祉調査論 第9講 母集団の推計 12月14日.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
復習:雑種第一代(F1) w W Ww Ww Ww Ww すべて『Ww』 優性形質が現れる すべて『ウエット』 遺伝子型 表現型 優性ホモ
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
法数学勉強会 2011/11/26 京都大学大学院医学研究科 統計遺伝学分野 山田 亮
大規模データによる未知語処理を統合した頑健な統計的仮名漢字変換
疫学概論 適中度と尤度比 Lesson 19. 評価の指標 §C. 適中度と尤度比 S.Harano, MD,PhD,MPH.
疫学概論 適中度と尤度比 Lesson 19. 評価の指標 §C. 適中度と尤度比 S.Harano, MD,PhD,MPH.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
日本人類遺伝学会 2014/11/20 京都大学 医学研究科 統計遺伝学分野 山田 亮
法数学勉強会 2018/07/21 京大(医) 統計遺伝学分野 山田亮
第3章 統計的推定 (その1) 統計学 2006年度.
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
法数学勉強会 2016年4月会 京都大学(医)統計遺伝学分野 山田 亮
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
分子生物情報学(2) 配列のマルチプルアライメント法
数理統計学 西 山.
法数学勉強会 2016/06/15 京都大学(医)統計遺伝学分野 山田 亮
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
東日本大震災におけるご遺体身元確認と行方不明家族捜索のためのDNA鑑定
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
テキストマイニング, データマイニングと 社会活動のトレース
2011/05/28 京都大学大学院 附属ゲノム医学センター統計遺伝学分野 山田 亮
決定木-II 学習目標 1.○与えられた事例集合から,指定された属性選択基準に基づいて決定木を生成 できる 利得 利得比
疫学概論 情報の要約 Lesson 3. 情報の要約 (率、比、割合) S.Harano,MD,PhD,MPH.
第24回日本法科学技術学会 2018/11/08 京都大学 医学研究科 統計遺伝学分野 山田 亮
尤度の比較と仮説検定とを比較する ~P値のことなど~
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
経営学研究科 M1年 学籍番号 speedster
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
法医学会 2013年6月26日 京都大学(医)統計遺伝学 山田 亮
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重み付き投票ゲームにおける 投票力指数の計算の高速化
親子鑑定に見る尤度比を 角度を変えて眺めてみる
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
法数学勉強会 2015/09/26 京都大学統計遺伝学分野 山田 亮
DNA鑑定を理解するために必要な数学の学び方
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
サンプリングと確率理論.
法数学における ベイジアンネットワーク(2) ~成書で学ぶ~
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
混合試料の構成人数 Nuisance パラメタ
Presentation transcript:

法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田 尤度・尤度比・事前確率 法数学勉強会(京大法医学講座) 2012/02/18 京都大学 統計遺伝学 山田

島の子ザル 絶海の孤島 ボス(雄)ザルが倒れ序列が崩壊 N頭の雄ザル 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か! 1頭だけ、『血統書付き』 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か!

島の子ザル 雄ザルのDNA 『血統書付き』の雄ザルのDNAはある それ以外はマーカーの『頻度』だけ 事前確率 すべての雄ザルが 1/N

島の子ザル 雄ザル S1,S2,...,SN S 1:血統書付き 尤度比 子ザルのジェノタイプの子が産まれる確率 p(1) : (N-1)p(2) 雄ザル 子ザルのジェノタイプの子が産まれる確率 S1 p(1) S2 p(2) S3 P(3) = P(2) ... SN P(N) = P(2)

島の子ザル 雄ザル 個体別の尤度比 個体別の尤度比として、どれくらいの大きさで納得するか 「取り違え事件」の1/N ? p(1) : p(2) 個体別の尤度比として、どれくらいの大きさで納得するか 「取り違え事件」の1/N ? 雄ザル 子ザルのジェノタイプの子が産まれる確率 S1 p(1) S2 p(2) S3 P(3) = P(2) ... SN P(N) = P(2)

島の子ザル 実は すべての雄ザルと雌ザルには「GPS」がつけられていて、「近くに居た時間」が計測されていた! 近くに居た時間に比例して『事前確率』を変更しよう! GPS搭載のウミガメ

父親鑑定

島の子ザル 絶海の孤島 ボス(雄)ザルが倒れ序列が崩壊 N頭の雄ザル 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か! 1頭だけ、『血統書付き』 1頭の雌ザルから1頭の子ザルが生まれた 父ザルは『血統書付き』か否か!

日本列島の子 絶海の孤島 N人の候補者 1人だけ、『お墨(戸籍)付き』 父親は『お墨付き』か否か!

日本列島の子 候補者のDNA 事前確率 『お墨付き』候補者のDNAはある それ以外はマーカーの『頻度』だけ すべての候補者が 1/N ??? ~5000万(半数) ? ~4000万(成人男性) ?

日本列島の子 実は 近くに居た時間に比例して『事前確率』を変更しよう! すべての候補者と母親には「GPS」がつけられていて、「近くに居た時間」が計測されていた!!! 近くに居た時間に比例して『事前確率』を変更しよう!

日本列島の子 候補者個体別の尤度比は計算できる さすがに、GPS記録はないけれども・・・ それに準じて、事前確率の重みはつけられるか・・・ p(1) : p(2) さすがに、GPS記録はないけれども・・・ それに準じて、事前確率の重みはつけられるか・・・

GPS記録はないけれども・・・ 事前確率 事前確率「込み」での尤度比が L なら信用するのなら、 妊娠時期の見積もりずれが30-60日??として N~30-60?? (単位は『日』) N~30-60 x 24 (単位は『時間』) N~30-60 x 24 x 60 (単位は『分』) 『近くに居た時間』という重みづけは、もう少し、考えられそう 事前確率「込み」での尤度比が L なら信用するのなら、 Lは2体取り違えと大差ない・・・?

GPS記録はないけれども・・・ N~30-60?? 事前確率「込み」での尤度比が L なら信用するのなら、 要求される候補者個体別の尤度比 p(1) / p(2) は p(1) / (p(2)xN) = L p(1) / p(2) = NxL

今日はここまで

次回? マルチプルテスティング問題 ペテン師団が 手を変え品を変えて、100人を候補者として順繰りに送り込んできて、100人目で「当たった」とする

次回? マルチプルテスティング問題 カタログと照合するときのこと そのときの尤度・尤度比の評価 それらしいカタログ、それらしくないカタログ 事前確率の高いカタログ、そうでもないカタログ そのときの尤度・尤度比の評価 カタログの大きさ(母集団に占めるカタログ上サンプルの比率)の影響・・・

肉親を求めて 記憶喪失で発見された。天涯孤独? いとこはいそうだ

肉親を求めて 事前確率は 1/N : Nは人口? 可能性のあるジェノタイプは K 種類、それぞれの確率はpi, i=1,2,...,K 世界でそれぞれのジェノタイプの頻度はqi 尤度が pi の人が Nxqi 人

肉親を求めて ペテン師が登場 ペテン師のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 その100人のジェノタイプが、一般集団に占める割合を ti, i=1,2,...,100 ペテン師のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える?

肉親を求めて H1 ペテン師のリストに本当のいとこが含まれている H2 ペテン師のリストに本当のいとこが含まれていない

肉親を求めて H1 H2 ペテン師のリストに本当のいとこが含まれている 100人のうち1人が「本物」で、残りの99人を「偽物」とした上で、すべての場合について、生起確率を計算して合算する L1 = Σi ri Πj != i tj H2 ペテン師のリストに本当のいとこが含まれていない 100人のうち全員の100人を「偽物」とし、N-100人の中の1人がいとこである、生起確率を計算して合算する L2 = Πj tj L1/L2 = Σi ri / ti

肉親を求めて 『親切な人』が登場 『親切な人』のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 「私の持つ100人のリストの中に探しているいとこが含まれている、と自信があります!」 その100人のジェノタイプが、いとこのジェノタイプである確率が ri, i=1,2,...,100 『親切な人』のリストに本当のいとこが含まれているか、いないか、という尤度比はどう考える? 『ペテン師』と『親切な人』の差は リストに含まれている、と信じる「事前確率」が異なること ペテン師の場合、100/N 親切な人の場合、 >100/N 『親切』な程度の『根拠』に応じて事前確率を上げる

熟考すべきは 事前確率か