タンパク質の進化 タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか? 今のタンパク質を調べることでわからないだろうか?

Slides:



Advertisements
Similar presentations
組合せ最適化輪講 2.3 連結性 川原 純. 2.3 連結性 内容 – グラフ上の節点をすべてたどるアルゴリズム 計算機上でのグラフの表現 – 強連結成分を求めるアルゴリズム トポロジカル順序を求める方法も – k- 連結、 k- 辺連結について – 2- 連結グラフの耳分解について.
Advertisements

第 14 章 競争を生き抜く 生物多様性の創造における進化と絶 滅 ガラパゴス諸島の異なる島々から得られたフィ ンチ.ダーウィンによるオリジナルの挿絵.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
2009/12/4 グラフ (2) 第10講: 平成21年12月4日 (金) 4限 E252教室 コンピュータアルゴリズム.
ラベル付き区間グラフを列挙するBDDとその応用
Gene Constellator SystemTM
タンパク質相互作用ネットワークの スケールフリーモデル
遺伝的アルゴリズム  新川 大貴.
細胞性粘菌は遺伝子機能解析リソースの 優れもの!
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
数理科学コース・ 倉田 和浩 2007/11/3 大学祭オープンラボ
伝播速度限定モデル Scale Free Network 上 の情報拡散 日本大学文理学部 情報システム解析学科 谷聖一研究室 古池 琢也
生物統計学・第3回 全体を眺める(2) 主成分分析
An Algorithm for Enumerating Maximal Matchings of a Graph
Reed-Solomon 符号と擬似ランダム性
10.Private Strategies in Games with Imperfect Public Monitoring
PSOLA法を用いた極低ビットレート音声符号化に関する検討
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
Probabilistic Method 6-3,4
統計解析 第10回 12章 標本抽出、13章 標本分布.
第11講: 平成18年12月 8日 (金) 4限 E352教室 グラフ (1).
線形計画法 スケールフリーネットワーク 須藤 孝秀.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
計算量理論輪講 岩間研究室 照山順一.
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
電気・通信・電子・情報工学実験D 確率的情報処理の基礎 第3部講義(2007年6月19日,6月26日)
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
生命情報学入門 配列のつなぎ合わせと再編成
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
第19回 HiHA Seminar Hiroshima Research Center for Healthy Aging (HiHA)
ランダムグラフ エルデシュとレーニイによって研究された.→ER-model p:辺連結確率 N:ノード総数 分布:
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
意外と身近なゲーム理論 へなちょこ研究室 p.
25. Randomized Algorithms
b f c a d e g h a b c d e f g 図1 図2 2012年度 有限幾何学 期末試験
生命科学基礎C 第1回 ホルモンと受容体 和田 勝 東京医科歯科大学教養部.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
生命情報学特論 (8)複雑ネットワークと制御理論
進化ゲームと微分方程式 第15章 n種の群集の安定性
ex-8. 平均と標準偏差 (Excel 実習シリーズ)
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生命情報解析 第3回 シグナル配列の統計解析(2)
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
5.3, 5.4 D2 岡本 和也.
構造的類似性を持つ半構造化文書における頻度分析
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
2009/11/27 グラフ (1) 第9講: 平成21年11月27日 (金) 4限 E252教室 コンピュータアルゴリズム.
九大数理談話会 複雑ネットワークと制御理論
ex-8. 平均と標準偏差 (Excel を演習で学ぶシリーズ)
ヒープソート.
Jan 2015 Speaker: Kazuhiro Inaba
生命情報学 (8) 生物情報ネットワークの構造解析
Speaker: Kazuhiro Inaba Paper Introduction from WSDM 2015
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
各種荷重を受ける 中空押出形成材の構造最適化
北大MMCセミナー 第100回 附属社会創造数学センター主催 Date: 2019年7月11日(木) 16:30~18:00
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

タンパク質の進化 タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか? 今のタンパク質を調べることでわからないだろうか?

タンパク質ドメインネットワーク 頂点 (vi): タンパク質 Pi ( vi と vj の間に辺がある)  =( Pi と Pj が共通のドメインを持つ) タンパク質 P2 タンパク質 P1 D1 D1 D2 D2 タンパク質 P3

生物データ 頂点の次数 k 頂点に接続している辺の数 k=3 k=1 生物種 ドメイン数 タンパク質数 ヒト 3936 11387 マウス 3545 8166 k=3 Uniprot, InterPro データベースより k=1 生物種 ドメイン数 タンパク質数 ヒト 3936 11387 マウス 3545 8166 ショウジョウバエ 1571 2087 酵母菌 2412 4980 大腸菌 2162 3335 シロイヌナズナ 1467 2925

次数 k の分布 2種類のべき乗則が観測された。

さまざまな次数分布 ポアソン分布 (ランダムグラフ) べき乗則分布 (スケールフリーグラフ) P (k) log P (k) k ポアソン分布  (ランダムグラフ) べき乗則分布 (スケールフリーグラフ) P (k) log P (k) k log(k)

バラバシ・アルバートモデル べき乗則分布を示すグラフを生成する。 成長 優先的選択 少数の頂点から始める。 m本の辺を持つ新しい頂点を一つづつ加える。 優先的選択 新しい辺は以下の確率で頂点iと接続する。 次数の大きい頂点ほど選ばれ易い。

タンパク質進化の1ドメインモデル 始め: 生命のスープ 突然変異: (1-a) の確率で1つのドメインを持つタンパク質が1つだけできる。 タンパク質は存在しない。 突然変異: (1-a) の確率で1つのドメインを持つタンパク質が1つだけできる。 複製: a の確率で今あるタンパク質が1つだけ複製される。 1回のイベントで必ず1つだけタンパク質が増える。 P1 D1 Pi Pi Pj Dm Dm Dm

1ドメインモデルの負のべき乗則 n(i) : i 番目のドメインの数 i 番目のドメインが増える確率 n の分布 次数 k (= n-1) の分布

1ドメインモデルの正のべき乗則 完全グラフが生成される。 同じドメインを持つ n 個のタンパク質の次数 k は n-1 なので、常に f(k) ≥ k+1 十分大きな k については f (k) = k+1 ≈ k D1 D2 D1 D1 D2 D2 D1

1ドメインモデルの数値実験結果 2種類のべき乗則が観測された。

モデルの拡張 始めは何もタンパク質はない。 突然変異: (1-a-b) の確率 複製: a の確率 P1 P2 P3 D1 D3 D1 D4 D4 D2 D2

拡張モデルの数値実験結果 ヒトの場合との比較 ヒト 数値実験結果

正のべき乗則に従うタンパク質の 特徴 多くの変異体が存在する。 膜貫通受容体 免疫グロブリン 外部の様々なシグナルを受け取るために様々なタンパク質変異体が存在。 免疫グロブリン 様々なウィルスなどを認識するために様々な変異体が存在。