タンパク質の進化 タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか? 今のタンパク質を調べることでわからないだろうか?
タンパク質ドメインネットワーク 頂点 (vi): タンパク質 Pi ( vi と vj の間に辺がある) =( Pi と Pj が共通のドメインを持つ) タンパク質 P2 タンパク質 P1 D1 D1 D2 D2 タンパク質 P3
生物データ 頂点の次数 k 頂点に接続している辺の数 k=3 k=1 生物種 ドメイン数 タンパク質数 ヒト 3936 11387 マウス 3545 8166 k=3 Uniprot, InterPro データベースより k=1 生物種 ドメイン数 タンパク質数 ヒト 3936 11387 マウス 3545 8166 ショウジョウバエ 1571 2087 酵母菌 2412 4980 大腸菌 2162 3335 シロイヌナズナ 1467 2925
次数 k の分布 2種類のべき乗則が観測された。
さまざまな次数分布 ポアソン分布 (ランダムグラフ) べき乗則分布 (スケールフリーグラフ) P (k) log P (k) k ポアソン分布 (ランダムグラフ) べき乗則分布 (スケールフリーグラフ) P (k) log P (k) k log(k)
バラバシ・アルバートモデル べき乗則分布を示すグラフを生成する。 成長 優先的選択 少数の頂点から始める。 m本の辺を持つ新しい頂点を一つづつ加える。 優先的選択 新しい辺は以下の確率で頂点iと接続する。 次数の大きい頂点ほど選ばれ易い。
タンパク質進化の1ドメインモデル 始め: 生命のスープ 突然変異: (1-a) の確率で1つのドメインを持つタンパク質が1つだけできる。 タンパク質は存在しない。 突然変異: (1-a) の確率で1つのドメインを持つタンパク質が1つだけできる。 複製: a の確率で今あるタンパク質が1つだけ複製される。 1回のイベントで必ず1つだけタンパク質が増える。 P1 D1 Pi Pi Pj Dm Dm Dm
1ドメインモデルの負のべき乗則 n(i) : i 番目のドメインの数 i 番目のドメインが増える確率 n の分布 次数 k (= n-1) の分布
1ドメインモデルの正のべき乗則 完全グラフが生成される。 同じドメインを持つ n 個のタンパク質の次数 k は n-1 なので、常に f(k) ≥ k+1 十分大きな k については f (k) = k+1 ≈ k D1 D2 D1 D1 D2 D2 D1
1ドメインモデルの数値実験結果 2種類のべき乗則が観測された。
モデルの拡張 始めは何もタンパク質はない。 突然変異: (1-a-b) の確率 複製: a の確率 P1 P2 P3 D1 D3 D1 D4 D4 D2 D2
拡張モデルの数値実験結果 ヒトの場合との比較 ヒト 数値実験結果
正のべき乗則に従うタンパク質の 特徴 多くの変異体が存在する。 膜貫通受容体 免疫グロブリン 外部の様々なシグナルを受け取るために様々なタンパク質変異体が存在。 免疫グロブリン 様々なウィルスなどを認識するために様々な変異体が存在。