ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)

Slides:



Advertisements
Similar presentations
1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
第 2 章 : DNA 研究法 2.2DNA クローニング クローニングベクター 大腸菌以外のベクター ゲノム分子生物学 年 5 月 7 日 担当 : 中東.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
配偶者選択による グッピー (Poecilia reticulata) の カラーパターンの進化 :野外集団を用いた研究 生物多様性進化分野 A1BM3035 吉田 卓司.
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
検定 P.137.
RNA i (RNA interference).
分布の非正規性を利用した行動遺伝モデル開発
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
確率・統計Ⅱ 第7回.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
マイクロシミュレーションにおける 可変属性セル問題と解法
京都大学 化学研究所 バイオインフォマティクスセンター
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
生物科学科(高分子機能学) 生体高分子解析学講座(第3) スタッフ 教授 新田勝利 助教授 出村誠 助手 相沢智康
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
疫学概論 横断研究 Lesson 11. 記述疫学 §A. 横断研究 S.Harano,MD,PhD,MPH.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
4章までのまとめ ー 計量経済学 ー.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
統計学 西 山.
統計遺伝学 講義 Sep 26 (Mon, 13:00-15:00) Overview of this lecture series in Japanese with basics on population genetics. (a) What does statistical genetics handle.
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
Anja von Heydebreck et al. 発表:上嶋裕樹
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
イントロ DNA配列 意味. イントロ DNA配列 意味 3 DNA配列は化学的配列空間 を占める 4.
遺伝統計学の骨組み Skeleton of Genetic Statistics
分子生物情報学(2) 配列のマルチプルアライメント法
遺伝統計学 集中講義 (4) SNPによる領域の評価
卒業研究進捗報告 2009年  月   日 研究題目: 学生番号:         氏名:          
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
尤度の比較と仮説検定とを比較する ~P値のことなど~
第3章 線形回帰モデル 修士1年 山田 孝太郎.
研究科横断型教育プログラム(Bタイプ) 統計遺伝学 全5回
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
クロス表とχ2検定.
親子鑑定に見る尤度比を 角度を変えて眺めてみる
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
配偶者選択による グッピー(Poecilia reticulata)の カラーパターンの進化 :野外集団を用いた研究
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
遺伝統計学 集中講義 (6) 終わりに.
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
感受性遺伝子解析の データ処理 平成18年11月29日 山田.
疫学概論 横断研究 Lesson 11. 記述疫学 §A. 横断研究 S.Harano,MD,PhD,MPH.
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学) 平成18年5月8日(月) 第5限 ゲノム情報疫学講座 山田

本日の構成 統計学とは、統計学的考え方とは どうして「遺伝統計学」なのか 遺伝統計学の対象

統計学とは たくさんのデータを集約して指標にする 一部のサンプルについて調べて、全体についての情報を得る 推定する 検定する

統計学とは たくさんのデータを集約する 特徴を抽出するさまざまな指標

統計学とは 一部のサンプルを調べて全体について考える 推定と推定値 全部調べるのと一部調べるのは何が違うか 虚実の判断をする

統計学 指標 推定と検定 各種指標を学ぶこと、指標から全体を思い描くことができるようになること すべてを観測することはありえないということを知ること

ケース・コントロールスタディ ケース 因子あり 40% 因子なし 60% コントロール 因子あり 10% 因子なし 90%

たくさん調べてみる

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それが白いボールだと、小学1年生の女の子が教えてくれました。2個のうち黒いボールは、0個、1個、2個のどれだと「賭け」ますか?

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それが白いボールだと、小学1年生の女の子が教えてくれました。2個のうち黒いボールは、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けて白ボールが出たとのことです。さて、どうしますか?

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それが白いボールだと、小学1年生の女の子が教えてくれました。2個のうち黒いボールは、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けて白ボールが出たとのことです。さて、どうしますか? 〇〇〇● となりました。さて、どうします?

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それが白いボールだと、小学1年生の女の子が教えてくれました。2個のうち黒いボールは、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けて白ボールが出たとのことです。さて、どうしますか? 〇〇〇● となりました。さて、どうします? 〇〇〇●〇〇〇〇〇〇〇 となりました。さて、どうします?

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で2個あり、黒・白のうちわけは不明です。黒いボールが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それが白いボールだと、小学1年生の女の子が教えてくれました。2個のうち黒いボールは、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けて白ボールが出たとのことです。さて、どうしますか? 〇〇〇● となりました。さて、どうします? 〇〇〇●〇〇〇〇〇〇〇 となりました。さて、どうします? 〇〇〇●〇●〇〇●〇〇 だったら、どうでしょうか?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けてサチノカ〇が出たとのことでした。さて、どうしますか?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けてサチノカ〇が出たとのことでした。さて、どうしますか? 〇〇〇● となりました。さて、どうします?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けてサチノカ〇が出たとのことでした。さて、どうしますか? 〇〇〇● となりました。さて、どうします? 〇〇〇●〇〇〇〇〇〇〇 となりました。さて、どうします?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けてサチノカ〇が出たとのことでした。さて、どうしますか? 〇〇〇● となりました。さて、どうします? 〇〇〇●〇〇〇〇〇〇〇 となりました。さて、どうします? 〇〇〇●〇●〇〇●〇〇 だったら、どうでしょうか?

確率的な考え方 トチオトメ● サチノカ〇 今、2種類のイチゴが入った袋がありました。イチゴは全部で2個あり、トチオトメ●とサチノカ〇です。トチオトメとサチノカのうちわけは不明です。トチオトメが入っている個数を予想してください。 まず、予想してみてください。 袋から1個を取り出したら、それがサチノカ〇だったとのことでした。2個のうちトチオトメ●は、0個、1個、2個のどれだと「賭け」ますか? 袋から1個出しては戻して、を繰り返したところ、〇〇〇 と3回続けてサチノカ〇が出たとのことでした。さて、どうしますか? 〇〇〇● となりました。さて、どうします? 〇〇〇●〇〇〇〇〇〇〇 となりました。さて、どうします? 〇〇〇●〇●〇〇●〇〇 だったら、どうでしょうか? トチオトメとサチノカのどちらを取り出したのかを教えてくれる人が、栃木県のイチゴ栽培農家の方だったら、何かかわるでしょうか?

確率的な考え方 今、黒と白のボールが入った袋がありました。ボールは全部で1000個あり、黒・白のうちわけは不明です。黒いボールと白いボールが500個ずつ入っているか、数に違いがあるかを知りたいとしたら、どうしますか? 全部数える どちらかが501個になるまで数える 一部を抜き取って数える ・・・不確かなことしか言えない ・・・不確かなりに、信じられればそれでよい 不確かなりに信じるための条件は何? 全部で1,000,000個だったら・・・

ベイズの定理 ○○だったら、××でしょう

『遺伝』統計学とは

家系・血縁関係での 確率的な考え方 O B AB O B AB A なにかがおかしい なにかがおかしい、けど、それは状況によりけり

生物学研究における遺伝学の特徴 と 確率論

遺伝学研究とは 「形質」と「遺伝子」との関係の解析 大きく2方向のアプローチ 分子の解析→その遺伝子の解析 関連遺伝子の解析→その分子の解析 Position of today’s talk and genetic approach in the context of today’s symposium 1

分子から遺伝子へ 分子生物学 その遺伝学的検証 分子機能の解析 介入実験的検証 非介入的遺伝解析 遺伝子改変マウス Position of today’s talk and genetic approach in the context of today’s symposium 3

介入実験 遺伝子要因を実験者がコントロールしてその結果との因果関係を究明する 非介入的遺伝子解析 ヒトでは不可能(・・・だと思います) ヒト以外では可能、ただし、要因の数は限定的 非介入的遺伝子解析 遺伝的な違いを起こす『実験』はすでに終わっている ヒトでの『実験』がなされている 多数の遺伝子の組み合わせで『実験』されている Genetic study概論 2タイプ

遺伝子から分子へ 遺伝する形質とそれをもたらす遺伝子の同定 その分子の機能解析 Position of today’s talk and genetic approach in the context of today’s symposium 3

統計遺伝学的の守備範囲に共通すること 統計的有意差 確率的な考え方 仮説とモデルとその「ありやすさ」と適合度 なぜ、遺伝学が、統計の祖なのか ベイズ(事前確率と事後確率) 尤度 仮説とモデルとその「ありやすさ」と適合度 帰無仮説 その他のモデルとモデルで表現した仮説 なぜ、遺伝学が、統計の祖なのか 不確実なこと、確率的に起きる現象を対象にしたから 「遺伝する」ということが「〇だったら、×、×だったら△」、というように、ベイズ的な発想が当てはまる現象だったから

統計遺伝学とバイオインフォマティクス 統計遺伝学 バイオインフォマティクス(計算機科学・情報利用) ベイズ メンデル フィッシャー フォン ノイマン チューリング

統計遺伝学 その取り扱い対象 配列・構造・発現関係 進化遺伝学 繁殖 集団遺伝学 遺伝疫学・・・疾患関連遺伝子の探索を含む

統計遺伝学 その取り扱い対象 配列・構造・発現関係 遺伝地図の作成 配列比較 遺伝子構造予測 比較ゲノム学 体系的発現解析データの解釈 タンパク質進化の確率モデル

統計遺伝学 その取り扱い対象 地図の作成 組換え基準の地図 塩基配列塩基番号 マーカーをそれぞれの地図上に配置 形態学上の地図 染色バンド 組換え基準の地図 遺伝地図 Radiation Hybrid Map DNA分子構造上の地図 物理マップ 塩基配列塩基番号 マーカーをそれぞれの地図上に配置 マイクロサテライト SNP

統計遺伝学 その取り扱い対象 配列比較 配列的分子とその情報 配列検索 分子配列ホモロジー 核酸 タンパク質 Blastその他 Expect = 4e -180 配列一致度の確率表現 配列比較 配列的分子とその情報 核酸 タンパク質 配列検索 Blastその他 分子配列ホモロジー

統計遺伝学 その取り扱い対象 遺伝子構造予測 エクソン エクソン-イントロン境界 調節配列 それぞれの配列の特徴を抽出し、その特徴にマッチする構造を検出     ・・・このプロセスで確率的手法を使用

統計遺伝学 その取り扱い対象 タンパク質進化の確率モデル 1次元構造(ペプチド鎖)比較によるホモロジー アミノ酸同士の化学的近似度の評価と組み込み 2次元構造比較によるホモロジー ホモロジーの数値化    ・・・機能上距離の推定

PADI酵素アミノ酸配列の配列比較と系統樹(ヒト・ラット・マウス)

統計遺伝学 その取り扱い対象 体系的発現解析データの解釈 データクオリティ評価・データ補正 有意差検定・マルチプルテスティング補正 パターン抽出・クラスタリング x 2 x 1/2

統計遺伝学 その取り扱い対象 進化 歴史の解析 進化に関する研究はすべて推定

統計遺伝学 その取り扱い対象 進化遺伝学 形態進化学 分子進化学 ゲノム進化学 系統樹学 尤度 距離の解釈

統計遺伝学 その取り扱い対象 比較ゲノム学 遺伝的距離の決定 距離の図示 系統樹描図アルゴリズム 距離行列を樹に変換する方法の1つNJ法 距離行列を扱う点でクラスター解析と同様

統計遺伝学 その取り扱い対象 繁殖 遺伝学の実学的側面 「進化学」における「過去推定」の反対で「実験科学」である 条件設定とそれに従った介入実験、その結果の観察が可能 動植物・微生物 交配 形質と形質関連遺伝子の探索

遺伝統計学 その取り扱い対象 繁殖における統計遺伝学の役割 推定するのは何か 交配という介入は既知 推定されるべき「未知」は 組換え現象 遺伝子組み換え技術の成立前は、組換え現象は介入不能だった

統計遺伝学 その取り扱い対象 集団遺伝学 個から集団へ 個の研究 配列・発現の比較・解析では、個々の確定している配列・遺伝子産物とその差異を対象とした 進化学では、「種」を取り扱った。「種」は、集団から構成されるが、その集団は、「種」の名の下に、均一な存在である 繁殖学では、個体のかけあわせにより、個体間の差異を対象とするが、個々の個体は、確定した存在であった 均一・確定した存在の解釈にも確率・推定が必要である

統計遺伝学 その取り扱い対象 個から集団へ 多様・不均一な対象の解釈には、さらに確率・推定を必要とする 集団の研究 集団の構成要素が多様であるとき、その集団について研究するときには、集団の特性を確率的に捉えることとなる 種としてのヒトの集団を対象とするとき、集団内の多様性を解析する 多様集団の内部構造 多様集団の空間分布 多様集団の歴史的背景 多様集団の疫学 多様・不均一な対象の解釈には、さらに確率・推定を必要とする

統計遺伝学 その取り扱い対象 集団遺伝学 数学モデル CoalescenceとRecombination 連鎖不平衡 集団比較遺伝学 ヒトの遺伝的歴史 Structure by J.Pritchard

統計遺伝学 その取り扱い対象 遺伝疫学 疾患遺伝子解析と遺伝疫学 個体を対象とした疾患遺伝子解析と集団を対象とした疾患遺伝子解析 家系サンプリング 集団を対象 集団サンプリング 個体・集団のリスク評価 個人に「なにか」が起こる確率の推定 集団に「なにか」が起こる確率の推定 「確率」を決める因子の探索 遺伝因子 環境因子 浸透率 解析手法 連鎖解析 ノン-パラメトリック連鎖解析 関連解析 TDT これらを遂行するためのツール群にも確率的手法を用いる 薬理遺伝学

統計遺伝学的なアプローチ 統計的有意差 確率的な考え方 仮説とモデルとその「ありやすさ」と適合度 方法 ベイズ(事前確率と事後確率) 尤度 帰無仮説 その他のモデルとモデルで表現した仮説 方法 シミュレーション (Monte-Carlo Method) 最尤法 隠れマルコフモデル マルコフ連鎖モンテカルロ(MCMC)法 Metropolis-Hastings アルゴリズム Gibbs Sampler