グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定

Slides:

Advertisements

Similar presentations

HBSP モデル上での行列積を求めるアルゴリム情報論理工学吉岡健太.

Advertisements

多目的ＧＡに対するパレート最適個体の分布制御九州大学大学院工学府知能機械システム専攻徳井宏司.

三木光範（同志社大学工学部）廣安知之（同志社大学工学部）花田良子（同志社大学工学部学部生）水田伯典（同志社大学大学院）ジョブショップスケジューリング問題への分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.

世帯マイクロデータの適合度評価における重みの決定手法

OWL-Sを用いたWebアプリケーションの検査と生成

遺伝的アルゴリズムにおけるランドスケープによる問題のクラス分類

リフレッシュ型分散遺伝的アルゴリズムの組み合わせ最適化問題への適用

区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム

グローバルコンピューティング環境における遺伝的アルゴリズムの検討

Webプロキシサーバにおける動的資源管理方式の提案と実装

最新ファイルの提供を保証する代理FTPサーバの開発

クラウドにおけるネストした仮想化を用いた安全な帯域外リモート管理

ラベル付き区間グラフを列挙するBDDとその応用

遺伝的アルゴリズム　新川　大貴.

全体ミーティング (4/25) 村田雅之.

対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発

遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms

ＰＣクラスタにおける２個体分散遺伝的アルゴリズムの高速化

谷村勇輔（同志社大学大学院）廣安知之（同志社大学）三木光範（同志社大学）青井桂子（同志社大学大学院）

DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価

遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~

P,Q比が変更可能なScaLAPACKのコスト見積もり関数の開発

分散遺伝的アルゴリズムによる各種クラスタのベンチマーク

マイクロシミュレーションにおける可変属性セル問題と解法

情報工学科 05A2301 樽美澄香（Tarumi Sumika)

ネットワーク性能に合わせた分散遺伝的アルゴリズムにおける最適な移住についての検討

同期的にアドバイスを活性化できる分散動的アスペクト指向システム

ノードの情報を動的に反映したオーバレイネットワークの構築

ノードの情報を動的に反映したオーバレイネットワークの構築

グリッド環境に適したJava用階層型実行環境Jojoの設計と実装

ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装

MPIによる行列積計算情報論理工学研究室渡邉伊織情報論理工学研究室渡邉伊織です。

大阪大学大学院情報科学研究科博士前期課程２年宮原研究室土居聡

P2P方式によるオンラインゲームの研究、開発

MPIを用いた並列処理～GAによるTSPの解法～

高速剰余算アルゴリズムとそのハードウェア実装についての研究

蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価

オーバレイ構築ツールキットOverlay Weaver

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

Jh NAHI 横田　理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景　H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法

アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化

遺伝的アルゴリズムを用いた構造物の最適形状探索のプログラムの作成

通信機構合わせた最適化をおこなう並列化ンパイラ

進化的計算手法の並列計算機への実装三木光範

グリッド環境に適した並列組み合わせ最適化システムjPoPにおける分枝限定法の実装

Grid環境に適した並列組み合わせ最適化システムの提案

遺伝的交叉を用いた並列シミュレーテッドアニーリング同志社大学工学部／大学院廣安知之，三木光範，○小掠真貴

未使用メモリに着目した複数ホストにまたがる仮想マシンの高速化

片方向通信路を含むネットワークアーキテクチャに於ける動的な仮想リンク制御機構の設計と実装

Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

同志社大学工学研究科知的システムデザイン研究室修士２年中尾昌広

VMが利用可能なCPU数の変化に対応した並列アプリケーション実行の最適化

Virtualizing a Multiprocessor Machine on a Network of Computers

Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化

Data Clustering: A Review

福岡工業大学情報工学部情報工学科種田研究室于聡

秘匿リストマッチングプロトコルとその応用

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~

ISO23950による分散検索の課題とその解決案に関する検討

遺伝的アルゴリズム (GA) を活用したスペクトルの波長選択および時系列データにおけるプロセス変数かつその時間遅れ (ダイナミクス) の選択明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

クローン検出ツールを用いたソフトウェアシステムの類似度調査

卒業研究 JCSPを用いたプログラム開発　池部理奈.

表紙分散遺伝的アルゴリズムのための新しい交叉法.

理工学部情報学科情報論理工学研究室延山周平

ユビキタスコンピューティングのためのハンドオーバー機能付きRMIの実装

情報工学科 05A2301 樽美澄香（Tarumi Sumika)

MPIを用いた並列処理計算情報論理工学研究室金久英之

MPIを用いた並列処理情報論理工学研究室 06‐1‐037‐0246　杉所　拓也.

Presentation transcript:

グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定 Hokke 2003/3/12 グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定中田秀基1,2 、中島直敏3、小野功3、松岡聡2,4 関口智嗣1、小野典彦3、楯真一5 1:産業技術総合研究所 2:東京工業大学 3:徳島大学 4:国立情報学研究所 5:生物分子工学研究所

JavaによるGA支援環境ｊPoP-GAを開発中 Hokke 2003/3/12 背景遺伝的アルゴリズムはグリッドアプリケーションとして有望並列度が高く粒度調整が容易実アプリケーションに応用範囲が広いグリッド上の実装言語としてJavaは有望バイトコードによるポータビリティマルチスレッドによるレイテンシの隠蔽セキュリティ機構によるコードシッピング JavaによるGA支援環境ｊPoP-GAを開発中並列化手法の指針を欠く

本研究の目的遺伝的アルゴリズムの並列実装の指針を得る GAをいくつかの方法で並列実装核磁気共鳴分光法によるたんぱく質構造決定問題に適用 Hokke 2003/3/12 本研究の目的遺伝的アルゴリズムの並列実装の指針を得る GAをいくつかの方法で並列実装実装にはグリッド向け通信ライブラリJojoを使用核磁気共鳴分光法によるたんぱく質構造決定問題に適用並列手法をWAN環境で評価

発表の概要遺伝的アルゴリズムとMGG MGGの並列化手法核磁気分光法によるたんぱく質構造決定 Jojoの概要評価と議論 Hokke 2003/3/12 発表の概要遺伝的アルゴリズムとMGG MGGの並列化手法核磁気分光法によるたんぱく質構造決定 Jojoの概要評価と議論結論と今後の課題

遺伝的アルゴリズムの概要生物の進化機構を模した最適化アルゴリズム解候補集合を世代交代させることで漸近的に近似解に到達 Hokke 2003/3/12 遺伝的アルゴリズムの概要生物の進化機構を模した最適化アルゴリズム解候補集合を世代交代させることで漸近的に近似解に到達探索の効率は、個体へのコーディング、交叉・突然変異の設計、世代交代手法（複製選択と生存選択）に依存複製選択交叉突然変異生存選択

MGG(Minimal Generation Gap) Hokke 2003/3/12 MGG(Minimal Generation Gap) 世代交代手法の一つ探索序盤における初期収束を回避探索後半における進化的停滞を抑制 1世代交代で入れ替わる個体数は最大2個多様性を維持しやすい一組の両親に対して交叉を多数回行うローカルに強力な探索を行うことに相当生成された子個体群から最良2個体をプールに戻す

MGGの動作 2.親個体を交叉、突然変異させてｎ組の子を生成 1.親個体を選択 3. 子個体を評価４.親個体と子の評価値を Hokke 2003/3/12 MGGの動作 2.親個体を交叉、突然変異させてｎ組の子を生成 1.親個体を選択４.親個体と子の評価値を用いて次世代に残す個体を選択して個体群に戻す 3. 子個体を評価個体群

MGGの並列化計算量の多い過程は生存選択のための評価マスタ・ワーカで実装手法のバリエーション評価部のみの並列化でも効率化が期待できる Hokke 2003/3/12 MGGの並列化計算量の多い過程は生存選択のための評価評価部のみの並列化でも効率化が期待できるマスタ・ワーカで実装手法のバリエーション世代内並列と世代間並列ワーカへ何を渡すか評価のみモデル：評価対象個体交差評価モデル：親個体ワーカで一度に処理する個体数

Hokke 2003/3/12 世代内並列世代の評価を並列に行う 2.親個体からｎ組の子を生成 1.親個体を選択 1 1 1 1 1 1 1 1 3. 子個体を評価 2 2 2 2 2 2 2 2 ４. 次世代に残す個体を選択個体群 3 3 3 3 3 3 3 3

世代間並列ある世代の評価を行っている間に次の世代の親個体を選択し、評価を開始親個体の選択の幅が狭くなる 1 1 1 1 1 1 1 1 Hokke 2003/3/12 世代間並列ある世代の評価を行っている間に次の世代の親個体を選択し、評価を開始親個体の選択の幅が狭くなる GAの効率への影響を検討する必要がある 2.親個体からｎ組の子を生成 1.親個体を選択 1 1 1 1 1 3. 子個体を評価 1 1 1 2 2 2 2 2 2 2 ４. 次世代に残す個体を選択個体群 2 3 3 3 3 3 3 3 3

評価のみモデル Worker Master Worker 交叉はマスター側で一括して実行評価部を各ワーカで行う実装が容易通信量は多い Hokke 2003/3/12 評価のみモデル交叉はマスター側で一括して実行評価部を各ワーカで行う実装が容易通信量は多い Crossover, mutation Evaluate Pool Worker Selection Evaluate Master Worker

交叉評価モデル Worker Master Worker 親個体をワーカに送りつけ、ワーカ側で交叉と評価、選択 Hokke 2003/3/12 交叉評価モデル親個体をワーカに送りつけ、ワーカ側で交叉と評価、選択マスタはワーカから回収した個体に対してさらに選択を行い、プールにもどす実装が複雑通信量は少ない Crossover, mutation Pool Evaluate Selection Worker Crossover, mutation Selection Evaluate Master Selection Worker

核磁気共鳴分光法によるたんぱく質構造決定 Hokke 2003/3/12 核磁気共鳴分光法によるたんぱく質構造決定結晶化できないたんぱく質にも適用可能 X線結晶解析には結晶化が必要人手では専門家でも数ヶ月を要する自動化の研究はあるが実用化されていない最も人月を要するNOE帰属決定部をGAで行う個体は二面角で表現

グリッド向け実行環境Jojo オブジェクトパッシングライブラリグリッド環境での実行を考慮受信は登録したハンドラで実行 Hokke 2003/3/12 グリッド向け実行環境Jojo オブジェクトパッシングライブラリ受信は登録したハンドラで実行送信と受信をペアにしたRPC呼び出しを用意さまざまなAPIで柔軟な通信を実現グリッド環境での実行を考慮 Globus、SSHによる起動時の認証、通信の秘匿化

Jojoの特徴(1) ツリー状の通信を行うので、プライベートアドレスでも問題なく使用が可能再帰的な起動 Hokke 2003/3/12 Jojoの特徴(1) ツリー状の通信を行うので、プライベートアドレスでも問題なく使用が可能再帰的な起動起動プロトコル:Globus GRAM、ssh、rsh 混在可能クライアント GRAM ssh ルータノードルータノード rsh GRAM サイトB サイトA

Jojoの特徴(2) 階層構造を持つノードのそれぞれで実行されるプログラムを記述 Hokke 2003/3/12 Jojoの特徴(2) 階層構造を持つノードのそれぞれで実行されるプログラムを記述階層構造を意識したプログラミングが可能各ノード上のプログラムは自分の近傍ノード(親、子、兄弟)と通信 Jojoのシステムプログラムやユーザのプログラムを動的にダウンロードシステムのバージョン違いなどのトラブルを未然に防ぐクラスタの各ノードにはJava VMが実行できる環境だけがあればよいのでインストールの必要がない

評価評価項目測定項目評価のみモデルと交叉評価モデルの比較世代間並列実行の効果対象たんぱく質サイズの効果 10世代の計算にかかる時間 Hokke 2003/3/12 評価評価項目評価のみモデルと交叉評価モデルの比較世代間並列実行の効果対象たんぱく質サイズの効果測定項目 10世代の計算にかかる時間スタートアップの影響を避けるために20世代まで実行して4世代目の実行終了時刻から14世代目の実行終了時刻までを測定

評価セットアップ MGGの設定評価対象たんぱく質個体プールには100個体各世代では100組の子個体を生成小：13残基大：27残基 Hokke 2003/3/12 評価セットアップ MGGの設定個体プールには100個体各世代では100組の子個体を生成各世代で200個の個体を評価評価対象たんぱく質小：13残基エンコードサイズ 2.8Kbyte、評価にかかる時間 55ms 大：27残基エンコードサイズ 5.9Kbyte、評価にかかる時間 358ms

評価環境広域環境 Client CableTVのネットワークで接続された自宅PCから接続クライアントはVMWare上のLinux Hokke 2003/3/12 評価環境 Client Linux in VMWare Pentium 4 1.8GHz 広域環境 CableTVのネットワークで接続された自宅PCから接続クライアントはVMWare上のLinux 接続にはSSHを使用 Throughput: to Cluster: 0.07 Mbyte/s from Cluster:0.17 Mbyte/s Latency: 150ms Cluster Node Cluster Node Cluster Node Linux PC Pentium III 1.4GHz Dual x (32 + 1)

Hokke 2003/3/12 評価のみモデルの結果残基数13 世代間並列ありワーカ数2以上では顕著な高速化は見られない

交叉評価モデルでの結果残基数13 世代間並列あり評価のみモデルよりも高速同時評価個体数は大きいほうが効率がよい Hokke 2003/3/12 交叉評価モデルでの結果残基数13 世代間並列あり評価のみモデルよりも高速同時評価個体数は大きいほうが効率がよい

世代間並列の効果世代間並列を行ったほうが高速同時評価個体数が大きい場合にとくに顕著残基数13 同時評価個体数4、50 Hokke 2003/3/12 世代間並列の効果残基数13 同時評価個体数4、50 世代間並列を行ったほうが高速同時評価個体数が大きい場合にとくに顕著

たんぱく質サイズの影響（1）評価のみモデル Hokke 2003/3/12 たんぱく質サイズの影響（1）評価のみモデル世代間並列あり同時評価個体数50 大きいほうがよりスケールする大きい場合でも4ワーカ程度で飽和

たんぱく質サイズの影響（2）交叉評価モデル Hokke 2003/3/12 たんぱく質サイズの影響（2）交叉評価モデル対象たんぱく質サイズが大きいほうがよりスケールする世代間並列あり同時評価個体数50

評価のまとめ交叉評価モデルが有効同時評価個体数は多いほうが効率的同時評価個体数を増やすためには世代間並列実装が不可欠 Hokke 2003/3/12 評価のまとめ交叉評価モデルが有効転送データ量が同時評価個体数にかかわらず一定同時評価個体数は多いほうが効率的交差評価モデルでは転送データ量と計算量の比率が変わる同時評価個体数を増やすためには世代間並列実装が不可欠世代間並列を行わないと並列度が不足対象たんぱく質サイズは大きいほうがスケールするいずれのモデルの場合も転送データ量と計算量の比率が変わる

まとめ遺伝的アルゴリズムの並列化手法を提案 Java用グリッド実行環境Jojoを用いて実装広域環境で評価 Hokke 2003/3/12 まとめ遺伝的アルゴリズムの並列化手法を提案 Java用グリッド実行環境Jojoを用いて実装広域環境で評価交叉評価モデルと世代間並列が効果的

今後の課題より大規模な環境、問題で評価他の並列化GA手法（島モデルなど）との比較検討ｊPoP-GAへ本稿の手法を実装 Hokke 2003/3/12 今後の課題より大規模な環境、問題で評価他の並列化GA手法（島モデルなど）との比較検討ｊPoP-GAへ本稿の手法を実装世代間並列実行のGA効率への影響の確認