生  物  数  学 斉木 里恵.

Slides:



Advertisements
Similar presentations
Mathematica による固有値計算の高速化 Eigenvalue calculation speed by Mathematica 情報工学部 06A2055 平塚翔太.
Advertisements

HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
1 線形代数学. 2 履修にあたって 電子情報システム学科 必修 2005 年度1セメスタ開講 担当 草苅良至 (電子情報システム学科) 教官室: G I 511 内線: 2095 質問等は上記のいずれかに行なうこと。 注意計算用のノートを準備すること。
池内研究室 Computer Vision Laboratory 東京大学 The University of Tokyo 偏光レイトレーシング 宮崎大輔 2004 年 6 月 22 日(火) CVL セミナー.
0章 数学基礎.
奈良女子大集中講義 バイオインフォマティクス (3) 配列アラインメント
日本バイオインフォマティクス学会 バイオインフォマティクス カリキュラム中間報告
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
2009/12/4 グラフ (2) 第10講: 平成21年12月4日 (金) 4限 E252教室 コンピュータアルゴリズム.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
2点A(2,4)、B(-3,1)の距離を求めてみよう。
群論とルービックキューブ 白柳研究室  水野貴裕.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
奈良女子大集中講義 バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
動的ハフマン符号化の例 入力:ABCDEからなる文字列 出力:動的に作ったハフマン木.
線形代数学 4.行列式 吉村 裕一.
データ構造と アルゴリズム 知能情報学部 新田直也.
Probabilistic Method 6-3,4
      線形写像  線形写像 U,V:R上のベクトル空間 T:UからVへの写像 (1)T(u+v)=T(u)+T(v)  (u,v∈U),
京都大学 化学研究所 バイオインフォマティクスセンター
主成分分析と因子分析 による競馬の勝因の研究
電気回路学Ⅱ エネルギーインテリジェンスコース 5セメ 山田 博仁.
10. 積分 積分・・確率モデルと動学モデルで使われる この章は計算方法の紹介 積分の定義から
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Ⅰ 孤立イオンの磁気的性質 1.電子の磁気モーメント 2.イオン(原子)の磁気モーメント 反磁性磁化率、Hund結合、スピン・軌道相互作用
コンパイラ(9) 情報工学科5年 担当 河田 進.
情報生命科学特別講義III (7)進化系統樹推定
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
7章後半 M1 鈴木洋介.
Lorenz modelにおける 挙動とそのカオス性
ガウス過程による回帰 Gaussian Process Regression GPR
数学 ---> 抽象化、一般化 より複雑な関係ー>解析学 一次関数 y=ax+b より多くの要素ー>線形代数 x y f(x) y1 x1
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
決定木とランダムフォレスト 和田 俊和.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
分布定数回路(伝送線路)とは 電圧(電界)、電流(磁界)は回路内の位置に依存 立体回路 TE, TM波
第9章 混合モデルとEM 修士2年 北川直樹.
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
独立成分分析 (ICA:Independent Component Analysis )
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
Introduction to Soft Computing (第11回目)
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
主成分分析 Principal Component Analysis PCA
烏骨鶏のミトコンドリア 全長塩基配列について
分子生物情報学(2) 配列のマルチプルアライメント法
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
モデル化とシミュレーション.
2つのサイコロを同時に投げる.
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
様々な情報源(4章).
進化ゲームと微分方程式 第15章 n種の群集の安定性
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
計算の理論 I -プッシュダウンオートマトン-
人工知能特論II 第8回 二宮 崇.
MD計算による血小板細胞膜蛋白とリガンド結合の立体構造および結合の力学特性の解明(loss of function 型変異体に関して)
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
行列 一次変換,とくに直交変換.
実験計画法 Design of Experiments (DoE)
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
割り当て問題(assignment problem)
多様性の生物学 第11回 多様性の整理 和田 勝 東京医科歯科大学教養部.
北大MMCセミナー 第17回 Date:2013年12月16日(月) 16:30~18:00 ※通常とは曜日が異なります
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

生  物  数  学 斉木 里恵

生物数学について・・・ これから話す内容の中では、分子生物学の中で、DNAやタンパク質などを扱いやすくするために数学的に表す。 生物学を学ぶ人にとっては新しい考え方や発見ができる。 数学を学ぶ人にとっては数学が実際にどのように活用されているかを知ることができる。

大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成

例えば・・・ S1:ATTGCGTATGCC S2:AATGCCTAAGCC S3:AATGCCTAAGGC ↓

進化系統樹 <大原則>Bifurcating(分岐する)        1つの内点に3つのedgeが集結する。        (根には2つのedgeが集結する。)

位相的に同じ

U P G M A FitchMargoliashアルゴリズム 近 隣 結 合 法 3つの進化系統樹作成法 U P G M A FitchMargoliashアルゴリズム 近 隣 結 合 法

UPGMA ※分子時計を仮定する。 ①一番近い2つのtaxaを結合。 ②その2つのtaxaを1つとみなして、また一番近いtaxaを結合。 ③これを繰り返す。 S1 S2 S3 S4 4 2 6

3点の公式 3点A,B,Cについて、それぞれの2点間の距離がわかっているとき、 x=(dAB+dAC-dBC)/2  3点A,B,Cについて、それぞれの2点間の距離がわかっているとき、  x=(dAB+dAC-dBC)/2  y=(dAB+dBC-dAC)/2  z=(dAC+dBC-dAB)/2  が成り立つ。

FMアルゴリズム ※分子時計を仮定せず、よりデータに近い系統樹を作成。 ①1番近い2つのtaxaとそれ以外のすべてのtaxaについて3点の公式を使う。 S1 S2 S3 S4 6 3 7 8

S1-3 S2 S4 13/2 15/2 7 ②さっきの2つのtaxaを  1つのグループにし、もう1度表を作り直す。そのあとはまた①の手順を繰り返す。

完成

近隣結合法 UPGMAやFMアルゴリズムでは距離が1番近いtaxaを選んでいた。 ↓ 左図の場合S1とS2を結合させてしまう。  UPGMAやFMアルゴリズムでは距離が1番近いtaxaを選んでいた。 ↓  左図の場合S1とS2を結合させてしまう。  neighborsを結合させるような方法が必要。

neighborsなら・・・ d(S1,S2)+d(Si,Sj)<d(S1,Si)+d(S2,Sj) ↓ (N-3)d(S1,S2)+∑j=3,j≠id(Si,Sj) <(N-3)d(S1,Si)+∑j=3,j≠id(S2,Sj) (N-2)d(S1,S2)+Rⅰ<(N-2)d(S1,Si)+R2

(N-2)d(S1,S2)+Rⅰ<(N-2)d(S1,Si)+R2 ↓ (N-2)d(S1,S2)-R1-R2 <(N-2)d(S1,Si)-R1-Rⅰ M(S1,S2)<M(S1,Si) つまり、 SnとSmがneighborsなら、全てのk≠mに対して、 M(Sn,Sm)<M(Sn,Sk) が成り立つ。

近隣結合法の手順 ①N個のtaxaに対し、Mの値の表を作る。Mの値が最も小さくなるSi、Sjを選ぶ。 ②Si、Sj以外のtaxaを1つのグループGとする。3点の公式を使ってd(Si,V)、d(Sj,V)を求める。 ③Sk∈Gに対して3点の公式を使ってd(Sk,V)をそれぞれ求める。  それを新しい距離データの表とする。 ④これらの操作をtaxaが3つになるまで繰り返す。3つになったら3点の公式を使って終わり。

大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成

塩基置換の行列モデル 初期の塩基配分・・・P0=(PA,PG,PC,PT) 条件付確率・・・・・・・Pi|j=P(S1=i|S0=j) 遷移行列       PA|APA|GPA|CPA|T    M=PG|APG|GPG|CPG|T       PC|APC|GPC|CPC|T       PT|APT|GPT|CPT|T 1単位時間後の塩基配分    MP0=P1

マルコフモデル マルコフ行列とは、成分が全て0以上で、列の和が1の行列。 ※成分が正のマルコフ行列はいつも狭義最大固有値λ=1を持つ。  マルコフ行列とは、成分が全て0以上で、列の和が1の行列。 ※成分が正のマルコフ行列はいつも狭義最大固有値λ=1を持つ。 ※λ=1に対応する固有ベクトルはただ1つ存在する。 ∵フロベニウスの定理。

Jukes-Cantorモデル 全ての塩基置換が同じ確率で起こる。 P0=(1/4,1/4,1/4,1/4) その変異率をαとすると、       1-α α/3 α/3 α/3     M=α/3 1-α α/3 α/3       α/3 α/3 1-α α/3       α/3 α/3 α/3 1-α

木村2,3パラメータモデル 木村2パラメータモデル * β γ γ M=β * γ γ γ γ * β γ γ β * *=1-β-γ       * β γ γ     M=β * γ γ       γ γ * β        γ γ β *   *=1-β-γ 木村3パラメータモデル       * β γ δ     M=β * δ γ       γ δ * β        δ γ β *   *=1-β-γ-δ

Jukes-Cantor距離 d=t×α =(経過時間)×(変異率) =(経過時間)×(siteごとの塩基置換の数)  =(経過時間)×(変異率)  =(経過時間)×(siteごとの塩基置換の数)  =(経過時間内でのsiteごとの塩基置換の数) dは経過時間に比例する。dを進化の距離ととらえる。

いろいろな距離公式 Jukes-Cantor距離 dJC(S0,S1)= -3/4ln(1-4p/3) 木村2パラメータ距離 dK2(S0,S1)=-1/2ln(1-2p1-p2) -1/4ln(1-2p2) 木村3パラメータ距離 dK3(S0,S1)=-1/4(ln(1-2β-2γ) +ln(1-2β-2δ)+ln(1-2γ-2δ)) Log-det距離 dLD(S0,S1)=-1/4(ln(det(F))-1/2ln(g0g1))

大まかな流れ DNAのアラインメント(整列) ↓ DNA間の距離の推定 進化系統樹の作成