生命情報学特論（８）複雑ネットワークと制御理論

Slides:

Advertisements

Similar presentations

HBSP モデル上での行列積を求めるアルゴリム情報論理工学吉岡健太.

Advertisements

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（ 1 ）スケールフリーネットワーク阿久津達也京都大学化学研究所バイオインフォマティクスセンター.

区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム

ラベル付き区間グラフを列挙するBDDとその応用

タンパク質相互作用ネットワークのスケールフリーモデル

情報生命科学特別講義III （8）木構造の比較：順序木

　　　　有限幾何学　　　　　　第8回.

スケールフリーネットワークにおける経路制御のためのフラッディング手法の提案と評価

Extremal Combinatorics 14.1 ~ 14.2

　　　　有限幾何学　　　　　　　第5回.

分子生物情報学動的計画法に基づく配列比較法 (ペアワイズアライメント法)

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（３）＋数理談話会木構造および画像データの文法圧縮

Reed-Solomon 符号と擬似ランダム性

京都大学化学研究所バイオインフォマティクスセンター

(ラプラス変換の復習) 教科書には相当する章はない

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（５）木構造データ間の編集距離

5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)

分子生物情報学(7) 遺伝子発現データの情報解析法スケールフリーネットワーク

奈良女子大集中講義バイオインフォマティクス (10) スケールフリーネットワーク

情報生命科学特別講義III （11） RNA二次構造予測

k 個のミスマッチを許した点集合マッチング・アルゴリズム

集中講義（九州大学数理学研究院）バイオ構造データに対する数理モデルとアルゴリズム（４）ブーリアンネットワーク

シャノンのスイッチングゲームにおけるペアリング戦略について

3. 可制御性・可観測性.

第25章単一始点最短路 3節 Bellman-Fordのアルゴリズム

九州大学大学院情報学専攻特別講義（９）ブーリアンネットワークの解析と制御

ネットワーク上での社会的効用と個人的効用の対立問題に対するアルゴリズム的研究

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

WWW上の効率的なハブ探索法の提案と実装

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

ランダムグラフエルデシュとレーニイによって研究された．→ER-model p:辺連結確率 N:ノード総数分布：

タンパク質の進化タンパク質は進化の過程でどのようにドメインを獲得してきたのだろうか？今のタンパク質を調べることでわからないだろうか？

25. Randomized Algorithms

九州大学大学院情報学専攻特別講義（３）配列解析

計算量理論輪講　chap5-3 M1　高井唯史.

分子生物情報学(2) 配列のマルチプルアライメント法

情報生命科学特別講義III （13）固定パラメータアルゴリズムと部分k木

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

First Course in Combinatorial Optimization

九州大学大学院情報学専攻特別講義（６）固定パラメータアルゴリズムと部分k木

2016年度有限幾何学中間試験問1　次のグラフを描け．（描けない場合は理由を述べよ）　各20点

ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部佐々木稔

生物情報ソフトウェア特論（２）たたみ込みとハッシュに基づくマッチング

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

　　　　有限幾何学　　　　　　　第5回.

5.3, 5.4 D2　岡本　和也.

京都大学化学研究所バイオインフォマティクスセンター

Max Cut and the Smallest Eigenvalue 論文紹介

核融合炉における多変数制御、分布制御に向けた制御器設計

九州大学大学院情報学専攻特別講義（８）ニューラルネットワークの離散モデル

2009/11/27 グラフ (1) 第9講: 平成21年11月27日 (金) 4限 E252教室コンピュータアルゴリズム.

統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- ２００３年８月１４日前半

九大数理談話会複雑ネットワークと制御理論

情報生命科学特別講義III （14）グラフの比較と列挙

2017年度有限幾何学期末試験注意：ループと多重辺がないグラフのみを扱う．問1 次の定理と，その証明の概略を読み，各問に答えよ．

生命情報学特論（６）固定パラメータアルゴリズムと部分k木

Chapter5 Systems of Distinct Representatives

Jan 2015 Speaker: Kazuhiro Inaba

生物情報ソフトウェア特論（4）配列解析II

生命情報学（８）生物情報ネットワークの構造解析

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

Speaker: Kazuhiro Inaba Paper Introduction from WSDM 2015

情報生命科学特別講義III （３）たたみ込みとハッシュに基づくマッチング

生物情報ソフトウェア特論（１０）固定パラメータアルゴリズムと部分k木

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観

分子生物情報学(0) バイオインフォマティクス

グラフの帯域幅連続多重彩色を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室西川和秀.

Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神諭

Presentation transcript:

生命情報学特論（８）複雑ネットワークと制御理論生命情報学特論（８）複雑ネットワークと制御理論阿久津　達也京都大学　化学研究所バイオインフォマティクスセンター

内容スケールフリーネットワークスケールフリーネットワークの構造的可制御性最小支配集合（MDS) MDSサイズの理論解析計算機シミュレーションによる解析データベース解析生物情報ネットワーク解析への応用 MDSの拡張結論

スケールフリーネットワーク

スケールフリーネットワーク（１）頂点の次数 P(k) スケールフリーネットワーク P(k) がべき乗則に従うスケールフリーネットワーク　（１）頂点の次数その頂点につながっている辺の個数 P(k) 次数分布次数 k の頂点の頻度スケールフリーネットワーク P(k) がべき乗則に従う

代謝マップ, グラフ, 次数 A B C D F G H I J E 次数次数分布: P(k) 次数1の頂点： J 次数3の頂点： E, I, A 次数分布: P(k) P(1)=0.1, P(2)=0.6, P(3)=0.3, P(4)=P(5)=P(6)=…=0

スケールフリーネットワーク（２）頂点数頂点数 ∝ (次数)-3 次数

スケールフリーネットワークの構造的可制御性 [Liu, Slotine, Barabasi: Nature, 2011]

線形システムの可制御性（１）入力: 出力: 線形システム: 初期状態: x0 目標状態: xF 線形システムの可制御性　（１）入力: 線形システム: 初期状態: x0 目標状態: xF 出力: 有限時間で、システムの状態を x0 から xF へ導く制御 u(t) (tの関数) x(t): N-dim. real vector (internal nodes) u(t): M-dim. real vector (control nodes) A: N×N real matrix B: N×M real matrx

線形システムの可制御性　（２）定理. システムが可制御 iff N×NM 行列 C=(B,AB,A2B,…,AN-1B) のランクがN (i.e., rank(C)=N). ほとんど係数について rank(C)=4 ⇒ 構造的可制御性

構造的可制御性定理. [Liu et al. 2011] GB(VL,VR;EB) : G(V,E) から以下により構成した二部グラフ M* を GB の最大マッチングのサイズ（辺数）とする時。システムを構造的可制御とするために必要な制御頂点（driver nodes）の最小数は max {N-M*,1} driver nodes

スケールフリーネットワークの構造的可制御性構造的可制御のための driver nodes 数 [Liu et al. 2011] ランダムなネットワークスケールフリーネットワーク ⇒ γ<2 の場合、多くの driver nodes が必要 n: ネットワークの頂点数

最小支配集合（MDS）

最小支配集合（１） VD が無向グラフ G(V,E) の支配集合（dominating set） ⇔ (∀v∈V)（v ∈VD∨(∃u∈VD)({u,v}∈E)) 最小支配集合（MDS: minimum dominating set）: 要素数最小の支配集合

最小支配集合（２） NP困難であるが、線形計画法＋分枝限定法に基づく実用的ソフトが存在人工ネットワークの設計・制御への既存応用 mobile ad-hoc networks (MANET) transportation routing computer communication networks

MDSと可制御性の関係定理. [Nacher & Akutsu, 2012] ネットワークの各辺は両方向性であり、MDSの各頂点はすべての接続辺を個別に制御可能であると仮定。すると、MDSを driver nodes として選択すれば、システムは構造的可制御。

MDSサイズの理論解析

解析結果（近似的な解析） γ>2 上限: trivially O(n) 下限: O(n) (to be shown) γ<2 解析結果　（近似的な解析） γ>2 上限: trivially O(n) 下限: O(n) (to be shown) γ<2 上限: O(n1-(2-γ)(γ-1)) 下限: ?

γ>2 の時の下限（１）次数分布がαk-γに従うとして、以下のようにαを決定 γ>2 の時の下限（１）次数分布がαk-γに従うとして、以下のようにαを決定 C(S) をS と V-S の間の辺の集合とすると、 |S|+|C(S)|<n であれば、 S は支配集合でない S として次数 K 以上の頂点をすべて選ぶと

γ>2 の時の下限（２） |S|<n/2 を仮定できるので、よって、 |S| の下限は以下のように見積もれる γ>2 の時の下限（２） |S|<n/2　を仮定できるので、よって、 |S| の下限は以下のように見積もれるこれは γ についての増加関数になっている

γ<2 の場合の上限の解析 (1) 次数 K=nβ 以上の頂点集合を DS とするその頂点数NDS は、一方、辺の総数 EG は、 γ<2 の場合の上限の解析 (1) 次数 K=nβ 以上の頂点集合を DS　とするその頂点数NDS は、一方、辺の総数 EG は、 EDS (=DSに接続する辺の個数) は、よって、任意に選んだ辺が DS に接続しない確率は、

γ<2 の場合の上限の解析 (2) DSに接続しない辺があると、その頂点がDSにカバーされない可能性　⇒ DSにカバーされない頂点数の期待値 (NG-DS) は次式以下 NG-DS と NDS をバランスさせるとより、β=2-γ を得るよって、MDS の上限はこの式は 1<γ<2　において o(n) さらに、γ=1.5 の時、最小オーダー (O(n0.75))となる This analysis is a corrected version of one in our paper appeared in New Journal of Physics.

γ<2の時の説明次数 nβ 以上の頂点数そこから出る辺でカバーされない頂点数以下を満たす β を選ぶ MDSのサイズ ≥nβ

生物情報ネットワーク解析への応用

MDS の生体ネットワーク解析への応用実際の生物の制御は困難でも、MDS は重要性の高いタンパク質や遺伝子の検出には有効タンパク質相互作用ネットワーク解析への応用 [Milenkovic et al. PLoS One, 2011] (before our work) [Wuchty, PNAS, 2014] [Khuri & Wuchty, BMC Bioinformatics, 2015] [Wang et al., BIBM 2014] 代謝ネットワーク解析への応用 [Asgari et al., PLoS ONE, 2013]

タンパク質相互作用ネットワーク解析への応用 MDSは重要なタンパクの検出に有効　 [Wuchty, PNAS 2014] 必須遺伝子、がん関連遺伝子、ウィルスの標的遺伝子などにおいて、MDS 中のタンパク質の比率が高い. These proteins are highly involved in regulatory functions, showing high enrichment in transcription factors and protein kinases, and participate in regulatory links, phosphorylation events, and genetic interactions. [Wuchty, PNAS 2014]

MDSの拡張

二部グラフ構造を持つネットワークの制御多くのネットワークは二部グラフ構造を持つ薬剤・標的、研究者・共著論文、遺伝子・疾患ネットワークなど左側頂点のみが制御頂点となる MDSは常にLiuらの手法以下の頂点数を与える [Nacher & Akutsu: Sci. Rep. 2013]

必須・冗長頂点の計算 Jiaらにより提案された必須および冗長頂点 [Jia et al.: Nat. Comm. 2013] の概念をMDSに適用（⇐MDSは一意とは限らない）必須頂点: すべてのMDSにおいて出現冗長頂点: どのMDSにも出現しない必須頂点は単なるMDS頂点より重要性が高いと考えられる [Nacher & Akutsu: J. Comp. Net. 2015]

ロバストMDS ロバストMDS (RMDS): 各頂点がC個以上の頂点によりカバーされる (C=1 ⇒ MDS) RMDSサイズは最小次数が D-C+1のMDSサイズとオーダーが一致 [Nacher & Akutsu: PRE, 2015]

Molnarらによる研究次数カットとMDSサイズの関連性 [Sci. Rep. 2013]

結論

既存結果と矛盾しない理由 Liu et al. 提案手法（MDS法） Driver node の値のみが制御可能と仮定 ⇒ 次数 k の頂点は、k 個の driver nodes に相当

結論 γ<2 であれば、MDSのサイズは小さい(o(n)) ⇒ 非一様性の高いネットワーク（heterogeneous network）は制御が比較的容易その傾向をシミュレーション解析およびデータベース解析により検証人工ネットワーク(e.g., mobile networks and computer networks) では接続辺の個別な制御が可能であると思われるので、この結果が有効である可能性しかし、生体内ネットワークではその仮定が成立しない今後の課題生体内ネットワークの制御を容易とする理論的枠組みの構築 MDSサイズのより精緻な解析