集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター.

Slides:



Advertisements
Similar presentations
組合せ最適化輪講 2.3 連結性 川原 純. 2.3 連結性 内容 – グラフ上の節点をすべてたどるアルゴリズム 計算機上でのグラフの表現 – 強連結成分を求めるアルゴリズム トポロジカル順序を求める方法も – k- 連結、 k- 辺連結について – 2- 連結グラフの耳分解について.
Advertisements

Voronoi Game on Graph and its Complexity 寺本 幸生 上原 隆平 (JAIST)
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
情報生命科学特別講義III (1) 文字列マッチング
2009/12/4 グラフ (2) 第10講: 平成21年12月4日 (金) 4限 E252教室 コンピュータアルゴリズム.
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
ラベル付き区間グラフを列挙するBDDとその応用
タンパク質相互作用ネットワークの スケールフリーモデル
情報生命科学特別講義III (8)木構造の比較: 順序木
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
伝播速度限定モデル Scale Free Network 上 の情報拡散 日本大学文理学部 情報システム解析学科 谷聖一研究室 古池 琢也
Scale Free Network 上における 伝播速度限定モデルの情報拡散シミュレーション
An Algorithm for Enumerating Maximal Matchings of a Graph
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(3) + 数理談話会 木構造および画像データの文法圧縮
C11: 大量データ処理のための領域効率の良いアルゴリズム
宇野 毅明 国立情報学研究所 2002年3月 東北大大学院 情報科学研究科ワークショップ
京都大学 化学研究所 バイオインフォマティクスセンター
データ構造とアルゴリズム 第6回の2 木 ~ データ構造(3)~.
第11講: 平成18年12月 8日 (金) 4限 E352教室 グラフ (1).
線形計画法 スケールフリーネットワーク 須藤 孝秀.
京都大学 化学研究所 バイオインフォマティクスセンター
分子生物情報学(7) 遺伝子発現データの情報解析法 スケールフリーネットワーク
奈良女子大集中講義 バイオインフォマティクス (10) スケールフリーネットワーク
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
電気・通信・電子・情報工学実験D 確率的情報処理の基礎 第3部講義(2007年6月19日,6月26日)
集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム(4) ブーリアンネットワーク
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
九州大学大学院 情報学専攻特別講義 (9) ブーリアンネットワークの 解析と制御
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
グラフアルゴリズムの可視化 数理科学コース 福永研究室 高橋 優子 2018/12/29.
第9章 混合モデルとEM 修士2年 北川直樹.
7.4 Two General Settings D3 杉原堅也.
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
WWW上の効率的な ハブ探索法の提案と実装
ランダムグラフ エルデシュとレーニイによって研究された.→ER-model p:辺連結確率 N:ノード総数 分布:
Introduction to Soft Computing (第11回目)
タンパク質の進化 タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか? 今のタンパク質を調べることでわからないだろうか?
25. Randomized Algorithms
九州大学大学院 情報学専攻特別講義 (3) 配列解析
生  物  数  学 斉木 里恵.
分子生物情報学(2) 配列のマルチプルアライメント法
情報生命科学特別講義III (13) 固定パラメータアルゴリズムと 部分k木
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
生命情報学特論 (8)複雑ネットワークと制御理論
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
統計解析 第1回 条件付き独立性と確率的グラフィカルモデル 本講義の全体像
九州大学大学院 情報学専攻特別講義 (6) 固定パラメータアルゴリズムと 部分k木
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
京都大学 化学研究所 バイオインフォマティクスセンター
九州大学大学院 情報学専攻特別講義 (8) ニューラルネットワークの 離散モデル
ポッツスピン型隠れ変数による画像領域分割
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
九大数理談話会 複雑ネットワークと制御理論
情報生命科学特別講義III (14) グラフの比較と列挙
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
生物情報ソフトウェア特論 (4)配列解析II
生命情報学 (8) 生物情報ネットワークの構造解析
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
Speaker: Kazuhiro Inaba Paper Introduction from WSDM 2015
情報生命科学特別講義III (3)たたみ込みとハッシュに 基づくマッチング
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
分子生物情報学(0) バイオインフォマティクス
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

集中講義(九州大学数理学研究院) バイオ構造データに対する数理モデルと アルゴリズム( 1 ) スケールフリーネットワーク 阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター

講義内容 バイオインフォマティクス概観 スケールフリーネットワーク タンパク質進化の数理モデル 木構造および画像データに対する文法圧縮 ブーリアンネットワーク  定常状態検出アルゴリズム  ブーリアンネットワークの制御 木の編集距離

スケールフリーネット ワーク

グラフ  情報科学や離散数学における基礎概 念  グラフは頂点集合と辺集合から構成 される 頂点 ⇔ 物 (例:化合物) 辺 ⇔ 2個の物の間の関係 (例:化学 反応)  無向グラフ:辺に方向無し  有向グラフ:辺に方向有り ネットワーク  グラフの辺などに意味や量などのつ いたもの  本講義ではグラフとネットワークを 区別しない グラフとネット ワーク

グラフと生物情報ネットワー ク 代謝ネットワーク (KEGG) グラ フ ・ 点と線で構造を表す

代謝ネットワーク  頂点 ⇔ 化合物、 辺 ⇔ 代謝反応 タンパク質相互作用ネットワーク  頂点 ⇔ タンパク質、 辺 ⇔ 相互作用 遺伝子ネットワーク  頂点 ⇔ 遺伝子、 辺 ⇔ 遺伝子間制御関係 WWW  頂点 ⇔ WEB ページ、辺 ⇔ リンク 共著関係  頂点 ⇔ 研究者、 辺 ⇔ 共著論文の有無 グラフと実際のネットワークの対 応

スモールワールド: 頂点間の距離 頂点間のパス  二つの頂点をつなぐ辺の列 パスの長さ  パス中の辺の個数 頂点間の距離  距離が最短のパスの長さ A と E の間のパスの例 パス 1: (A,G), (G,B), (B,F),(F,E) ⇒長さ =4 パス 2: (A,G), (G,F), (F,E) ⇒長さ =3 パス 3: (A,B), (B,E) ⇒長さ =2 A と E の距離=2 (A と I の距離 =3 、 C と H の距離 =3)

スモールワールド: クラスター係 数 クラスター係数  m i :頂点 i に隣接する頂点 間の辺の個数  k i :頂点 i の次数 頂点のまわりのモ ジュール性の指標  C i ≒ 1 <-> クリーク に近い  m i の最大値は i Ci = 1 i Ci = 0

スモールワールド 任意の2頂点間の距離(最 短経路)の平均値が小さく ( O(log n) 以下)、かつ、ク ラスター係数の平均値が大 きいグラフ 多くの現実のネットワーク はスモールワールドとなる WWW の直径(各サイト間 のリンク数の平均値)は? ⇒約19クリック (Albert al., Nature, 1999) 直径≦3

頂点の次数 その頂点につな がっている辺の個 数 P(k) 次数分布 次数 k の頂点の頻 度 スケールフリー ネットワーク P(k) がべき乗則に 従う スケールフリーネットワーク (1)

スケールフリーネットワーク (2) 次数 頂点数 ∝ ( 次数 ) -3

スケールフリーネットワーク (3) 次数 k の頂点の個数が k -γ に比例(べき乗則)  ランダムな場合 ( ポアソン分布 : e -λ λ k /k!) と大差 Barabasi らが 1999 年頃に発見。以降、数多く の研究 特徴: 有力な頂点(ハブ)に多くの頂点が連 結 実際のネットワークにおける k –γ  タンパク質相互作用: γ ≒ 2.2  代謝ネットワーク: γ ≒ 2.24 (生物種により異なる)  映画俳優の共演関係: γ ≒ 2.3  WWW : γ ≒ 2.1  送電網: γ ≒ 4

ポアソン分布とべき乗分布 P (k)P (k) klog(k) log P (k) ポアソン分布 (ランダムグラフ) べき乗分布 (スケールフリーグラ フ)

タンパク質ネットワークの解 析 タンパク質相互作用のネットワークもべき乗 則に従う(酵母の場合)  頂点:タンパク質  辺:相互作用の有無 次数5以下の頂点(全体の 93% )  21%程度が必須(生存に必要) 次数16以上の頂点(全体の 0.7 %)  62 %程度が必須  次数の高い頂点はハブと呼ばれ、重要な役割を果 たすものが多い

スケールフリーネットワーク構成法:優先的選択 法 優先的選択法 ( 優先的選択型成長モデル ) [Barabasi & Albert 1999]  別名: Rich-get-richer モデル 構成法 (ほぼ、 k -3 のべき乗則従うネットワークを生成)  m 0 個の頂点から成るグラフを構成する  以下のステップを必要なだけ繰り返す 現在のグラフに新たな頂点 v を追加する v から既存の頂点に、 deg(v i )/(Σ j deg(v j )) に従う確率で、ランダムに 辺を張る(全部で m 本の辺を張る) 参考:ランダムグラフの構成法  N 個の頂点を配置  以下の操作を辺の個数が指定の数になるまで繰り返す 任意の2頂点をランダムに選んでは辺を追加 (もしくは、一様な確率 p で任意の 2 頂点間に辺を引く)

ランダムネットワーク vs. スケールフリーネット ワーク 2/6 3/10 2/10 4/14 2/14 4/14 ランダムネットワーク スケールフリーネットワーク

優先的選択法の平均場近似による解析 k i (t): (時刻 t i )に追加された頂点 i の時刻 t における次数 時刻 t までに追加された辺の個数≒ mt 時刻 t において頂点 i の次数が増加する確率は この微分方程式を条件 k i (t i )=m のもとで解くと 時刻 t n にネットワークが完成したとすると、 次数 k の頂点の生成時刻は、 k i (t n )=k を解いて、 ここで、 k が1だけ増えると、 t i がどれくらい減るかは、 上の式を k で微分することにより、 よって、時刻が 2t n m 2 k -3 だけ異なると k が1変わる よって、次数 k の頂点は 2t n m 2 k -3 のオーダーの個数存在

階層型スケールフリーネットワーク 優先的選択法によるスケールフリーネットワ ーク  クラスター係数の平均値( )が小さい( ) 実際の代謝ネットワーク  クラスター係数の平均値が大きい  階層的な構造をしていると考えられる ⇒ クラスター係数が大きな階層的スケールフ リーネットワークの構成法

階層型ネットワークの構成法 再帰的、かつ、決定的(乱数を使わず)に構成 フラクタル的 L 角形を使うと クラスター係数 は定数オーダー [Ravasz et al, Nature, 2002]

階層型ネットワークの解析

L+M モデル Barabasi のモデルの拡張 2より大きな任意の値にいくらでも近い γ を持つネ ットワークを構成可能 ( Barabasi モデルでは γ<2.58 ) ( L =2) (M=2)

L+M モデルの解析

Barabasi らの階層モデルの解釈 Barabasi らの階層スケールフリーモデル ⇒ L+M モデルにおける M =1 の場合に相 当 L =3, M =1

まとめ グラフとネットワーク  頂点と辺 スモールワールド  2頂点間の平均距離が短いグラフ スケールフリーネットワーク  次数分布がべき乗則に従うネットワーク スケールフリーネットワークの構成法  優先的選択型成長モデル  階層型モデル  L+M モデル