グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
OWL-Sを用いたWebアプリケーションの検査と生成
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
Webプロキシサーバにおける 動的資源管理方式の提案と実装
最新ファイルの提供を保証する代理FTPサーバの開発
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
ラベル付き区間グラフを列挙するBDDとその応用
遺伝的アルゴリズム  新川 大貴.
全体ミーティング (4/25) 村田雅之.
対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
マイクロシミュレーションにおける 可変属性セル問題と解法
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
同期的にアドバイスを活性化できる分散動的アスペクト指向システム
ノードの情報を動的に反映したオーバレイネットワークの構築
ノードの情報を動的に反映したオーバレイネットワークの構築
グリッド環境に適したJava用階層型実行環境Jojoの設計と実装
ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
大阪大学 大学院情報科学研究科 博士前期課程2年 宮原研究室 土居 聡
P2P方式によるオンラインゲームの研究、開発
MPIを用いた並列処理 ~GAによるTSPの解法~
高速剰余算アルゴリズムとそのハードウェア実装についての研究
蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価
オーバレイ構築ツールキットOverlay Weaver
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
グリッド環境に適した並列組み合わせ最適化システムjPoPにおける分枝限定法の実装
Grid環境に適した並列組み合わせ最適化システムの提案
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
片方向通信路を含む ネットワークアーキテクチャに於ける 動的な仮想リンク制御機構の設計と実装
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
同志社大学工学研究科 知的システムデザイン研究室 修士2年 中尾昌広
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
Virtualizing a Multiprocessor Machine on a Network of Computers
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
Data Clustering: A Review
福岡工業大学 情報工学部 情報工学科 種田研究室 于 聡
秘匿リストマッチングプロトコルとその応用
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
ISO23950による分散検索の課題と その解決案に関する検討
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
卒業研究 JCSPを用いたプログラム開発  池部理奈.
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
理工学部情報学科 情報論理工学研究室 延山 周平
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
Presentation transcript:

グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定 Hokke 2003/3/12 グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定 中田 秀基1,2 、中島 直敏3、小野 功3、松岡 聡2,4 関口 智嗣1、小野 典彦3、楯 真一5 1:産業技術総合研究所 2:東京工業大学 3:徳島大学 4:国立情報学研究所 5:生物分子工学研究所

JavaによるGA支援環境jPoP-GAを開発中 Hokke 2003/3/12 背景 遺伝的アルゴリズムはグリッドアプリケーションとして有望 並列度が高く粒度調整が容易 実アプリケーションに応用範囲が広い グリッド上の実装言語としてJavaは有望 バイトコードによるポータビリティ マルチスレッドによるレイテンシの隠蔽 セキュリティ機構によるコードシッピング JavaによるGA支援環境jPoP-GAを開発中 並列化手法の指針を欠く

本研究の目的 遺伝的アルゴリズムの並列実装の指針を得る GAをいくつかの方法で並列実装 核磁気共鳴分光法によるたんぱく質構造決定問題に適用 Hokke 2003/3/12 本研究の目的 遺伝的アルゴリズムの並列実装の指針を得る GAをいくつかの方法で並列実装 実装にはグリッド向け通信ライブラリJojoを使用 核磁気共鳴分光法によるたんぱく質構造決定問題に適用 並列手法をWAN環境で評価

発表の概要 遺伝的アルゴリズムとMGG MGGの並列化手法 核磁気分光法によるたんぱく質構造決定 Jojoの概要 評価と議論 Hokke 2003/3/12 発表の概要 遺伝的アルゴリズムとMGG MGGの並列化手法 核磁気分光法によるたんぱく質構造決定 Jojoの概要 評価と議論 結論と今後の課題

遺伝的アルゴリズムの概要 生物の進化機構を模した最適化アルゴリズム 解候補集合を世代交代させることで漸近的に近似解に到達 Hokke 2003/3/12 遺伝的アルゴリズムの概要 生物の進化機構を模した最適化アルゴリズム 解候補集合を世代交代させることで漸近的に近似解に到達 探索の効率は、個体へのコーディング、交叉・突然変異の設計、世代交代手法(複製選択と生存選択)に依存 複製選択 交叉 突然変異 生存選択

MGG(Minimal Generation Gap) Hokke 2003/3/12 MGG(Minimal Generation Gap) 世代交代手法の一つ 探索序盤における初期収束を回避 探索後半における進化的停滞を抑制 1世代交代で入れ替わる個体数は最大2個 多様性を維持しやすい 一組の両親に対して交叉を多数回行う ローカルに強力な探索を行うことに相当 生成された子個体群から最良2個体をプールに戻す

MGGの動作 2.親個体を交叉、突然変異 させてn組の子を生成 1.親個体を選択 3. 子個体を評価 4.親個体と子の評価値を Hokke 2003/3/12 MGGの動作 2.親個体を交叉、突然変異 させてn組の子を生成 1.親個体を選択 4.親個体と子の評価値を 用いて次世代に残す個体 を選択して個体群に戻す 3. 子個体を評価 個体群

MGGの並列化 計算量の多い過程は生存選択のための評価 マスタ・ワーカで実装 手法のバリエーション 評価部のみの並列化でも効率化が期待できる Hokke 2003/3/12 MGGの並列化 計算量の多い過程は生存選択のための評価 評価部のみの並列化でも効率化が期待できる マスタ・ワーカで実装 手法のバリエーション 世代内並列と世代間並列 ワーカへ何を渡すか 評価のみモデル:評価対象個体 交差評価モデル:親個体 ワーカで一度に処理する個体数

Hokke 2003/3/12 世代内並列 世代の評価を並列に行う 2.親個体から n組の子を生成 1.親個体を選択 1 1 1 1 1 1 1 1 3. 子個体を 評価 2 2 2 2 2 2 2 2 4. 次世代に残 す個体を選択 個体群 3 3 3 3 3 3 3 3

世代間並列 ある世代の評価を行っている間に次の世代の親個体を選択し、評価を開始 親個体の選択の幅が狭くなる 1 1 1 1 1 1 1 1 Hokke 2003/3/12 世代間並列 ある世代の評価を行っている間に次の世代の親個体を選択し、評価を開始 親個体の選択の幅が狭くなる GAの効率への影響を検討する必要がある 2.親個体から n組の子を生成 1.親個体を選択 1 1 1 1 1 3. 子個体を 評価 1 1 1 2 2 2 2 2 2 2 4. 次世代に残 す個体を選択 個体群 2 3 3 3 3 3 3 3 3

評価のみモデル Worker Master Worker 交叉はマスター側で一括して実行 評価部を各ワーカで行う 実装が容易 通信量は多い Hokke 2003/3/12 評価のみモデル 交叉はマスター側で一括して実行 評価部を各ワーカで行う 実装が容易 通信量は多い Crossover, mutation Evaluate Pool Worker Selection Evaluate Master Worker

交叉評価モデル Worker Master Worker 親個体をワーカに送りつけ、ワーカ側で交叉と評価、選択 Hokke 2003/3/12 交叉評価モデル 親個体をワーカに送りつけ、ワーカ側で交叉と評価、選択 マスタはワーカから回収した個体に対してさらに選択を行い、プールにもどす 実装が複雑 通信量は少ない Crossover, mutation Pool Evaluate Selection Worker Crossover, mutation Selection Evaluate Master Selection Worker

核磁気共鳴分光法による たんぱく質構造決定 Hokke 2003/3/12 核磁気共鳴分光法による たんぱく質構造決定 結晶化できないたんぱく質にも適用可能 X線結晶解析には結晶化が必要 人手では専門家でも数ヶ月を要する 自動化の研究はあるが実用化されていない 最も人月を要するNOE帰属決定部をGAで行う 個体は二面角で表現

グリッド向け実行環境Jojo オブジェクトパッシングライブラリ グリッド環境での実行を考慮 受信は登録したハンドラで実行 Hokke 2003/3/12 グリッド向け実行環境Jojo オブジェクトパッシングライブラリ 受信は登録したハンドラで実行 送信と受信をペアにしたRPC呼び出しを用意 さまざまなAPIで柔軟な通信を実現 グリッド環境での実行を考慮 Globus、SSHによる起動時の認証、通信の秘匿化

Jojoの特徴(1) ツリー状の通信を行うので、プライベートアドレスでも問題なく使用が可能 再帰的な起動 Hokke 2003/3/12 Jojoの特徴(1) ツリー状の通信を行うので、プライベートアドレスでも問題なく使用が可能 再帰的な起動 起動プロトコル:Globus GRAM、ssh、rsh 混在可能 クライアント GRAM ssh ルータノード ルータノード rsh GRAM サイトB サイトA

Jojoの特徴(2) 階層構造を持つノードのそれぞれで実行されるプログラムを記述 Hokke 2003/3/12 Jojoの特徴(2) 階層構造を持つノードのそれぞれで実行されるプログラムを記述 階層構造を意識したプログラミングが可能 各ノード上のプログラムは自分の近傍ノード(親、子、兄弟)と通信 Jojoのシステムプログラムやユーザのプログラムを動的にダウンロード システムのバージョン違いなどのトラブルを未然に防ぐ クラスタの各ノードにはJava VMが実行できる環境だけがあればよいのでインストールの必要がない

評価 評価項目 測定項目 評価のみモデルと交叉評価モデルの比較 世代間並列実行の効果 対象たんぱく質サイズの効果 10世代の計算にかかる時間 Hokke 2003/3/12 評価 評価項目 評価のみモデルと交叉評価モデルの比較 世代間並列実行の効果 対象たんぱく質サイズの効果 測定項目 10世代の計算にかかる時間 スタートアップの影響を避けるために20世代まで実行して4世代目の実行終了時刻から14世代目の実行終了時刻までを測定

評価セットアップ MGGの設定 評価対象たんぱく質 個体プールには100個体 各世代では100組の子個体を生成 小:13残基 大:27残基 Hokke 2003/3/12 評価セットアップ MGGの設定 個体プールには100個体 各世代では100組の子個体を生成 各世代で200個の個体を評価 評価対象たんぱく質 小:13残基 エンコードサイズ 2.8Kbyte、評価にかかる時間 55ms 大:27残基 エンコードサイズ 5.9Kbyte、評価にかかる時間 358ms

評価環境 広域環境 Client CableTVのネットワークで接続された自宅PCから接続 クライアントはVMWare上のLinux Hokke 2003/3/12 評価環境 Client Linux in VMWare Pentium 4 1.8GHz 広域環境 CableTVのネットワークで接続された自宅PCから接続 クライアントはVMWare上のLinux 接続にはSSHを使用 Throughput: to Cluster: 0.07 Mbyte/s from Cluster:0.17 Mbyte/s Latency: 150ms Cluster Node Cluster Node Cluster Node Linux PC Pentium III 1.4GHz Dual x (32 + 1)

Hokke 2003/3/12 評価のみモデルの結果 残基数13 世代間並列あり ワーカ数2以上では顕著な高速化は見られない

交叉評価モデルでの結果 残基数13 世代間並列あり 評価のみモデルよりも高速 同時評価個体数は大きいほうが効率がよい Hokke 2003/3/12 交叉評価モデルでの結果 残基数13 世代間並列あり 評価のみモデルよりも高速 同時評価個体数は大きいほうが効率がよい

世代間並列の効果 世代間並列を行った ほうが高速 同時評価個体数が 大きい場合にとくに 顕著 残基数13 同時評価個体数4、50 Hokke 2003/3/12 世代間並列の効果 残基数13 同時評価個体数4、50 世代間並列を行った ほうが高速 同時評価個体数が 大きい場合にとくに 顕著

たんぱく質サイズの影響(1) 評価のみモデル Hokke 2003/3/12 たんぱく質サイズの影響(1) 評価のみモデル 世代間並列あり 同時評価個体数50 大きいほうがよりスケールする 大きい場合でも4ワーカ程度で飽和

たんぱく質サイズの影響(2) 交叉評価モデル Hokke 2003/3/12 たんぱく質サイズの影響(2) 交叉評価モデル 対象たんぱく質サイズ が大きいほうが よりスケールする 世代間並列あり 同時評価個体数50

評価のまとめ 交叉評価モデルが有効 同時評価個体数は多いほうが効率的 同時評価個体数を増やすためには世代間並列実装が不可欠 Hokke 2003/3/12 評価のまとめ 交叉評価モデルが有効 転送データ量が同時評価個体数にかかわらず一定 同時評価個体数は多いほうが効率的 交差評価モデルでは転送データ量と計算量の比率が変わる 同時評価個体数を増やすためには世代間並列実装が不可欠 世代間並列を行わないと並列度が不足 対象たんぱく質サイズは大きいほうがスケールする いずれのモデルの場合も転送データ量と計算量の比率が変わる

まとめ 遺伝的アルゴリズムの並列化手法を提案 Java用グリッド実行環境Jojoを用いて実装 広域環境で評価 Hokke 2003/3/12 まとめ 遺伝的アルゴリズムの並列化手法を提案 Java用グリッド実行環境Jojoを用いて実装 広域環境で評価 交叉評価モデルと世代間並列が効果的

今後の課題 より大規模な環境、問題で評価 他の並列化GA手法(島モデルなど)との比較検討 jPoP-GAへ本稿の手法を実装 Hokke 2003/3/12 今後の課題 より大規模な環境、問題で評価 他の並列化GA手法(島モデルなど)との比較検討 jPoP-GAへ本稿の手法を実装 世代間並列実行のGA効率への影響の確認