並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究同志社大学大学院小掠真貴同志社大学工学部廣安知之

Slides:

Advertisements

Similar presentations

HBSP モデル上での行列積を求めるアルゴリム情報論理工学吉岡健太.

Advertisements

多目的ＧＡに対するパレート最適個体の分布制御九州大学大学院工学府知能機械システム専攻徳井宏司.

三木光範（同志社大学工学部）廣安知之（同志社大学工学部）花田良子（同志社大学工学部学部生）水田伯典（同志社大学大学院）ジョブショップスケジューリング問題への分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.

世帯マイクロデータの適合度評価における重みの決定手法

日本バイオインフォマティクス学会バイオインフォマティクスカリキュラム中間報告

遺伝的アルゴリズムにおけるランドスケープによる問題のクラス分類

リフレッシュ型分散遺伝的アルゴリズムの組み合わせ最適化問題への適用

MPIを用いたグラフの並列計算情報論理工学研究室藤本　涼一.

到着時刻と燃料消費量を同時に最適化する船速・航路計画

グローバルコンピューティング環境における遺伝的アルゴリズムの検討

キャッシュ付ＰＲＡＭ上の並列クィックソートと並列マージソート

超並列計算研究会 PCクラスタにおけるベンチマークと並列ツールの紹介廣安知之三木光範大向一輝吉田純一.

遺伝的アルゴリズム　新川　大貴.

対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発

研究集会「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日完全パイプライン化シフト QR 法による実対称三重対角行列の固有値並列計算宮田考史　　山本有作　　張紹良　名古屋大学　大学院工学研究科　計算理工学専攻.

遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms

ＰＣクラスタにおける２個体分散遺伝的アルゴリズムの高速化

谷村勇輔（同志社大学大学院）廣安知之（同志社大学）三木光範（同志社大学）青井桂子（同志社大学大学院）

遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~

P,Q比が変更可能なScaLAPACKのコスト見積もり関数の開発

分散遺伝的アルゴリズムによる各種クラスタのベンチマーク

各種PC クラスタの性能評価同志社大学　工学部廣安　知之三木　光範谷村　勇輔.

情報工学科 05A2301 樽美澄香（Tarumi Sumika)

リンクパワーオフによる光ネットワークの省電力化

マイクロシミュレーションにおける可変属性セル問題と解法

制約条件の確率的選択に基づく資源追加削減法の改良三木光範（同志社大工）廣安知之（同志社大工） ○小林繁（同志社大院）

ネットワーク性能に合わせた分散遺伝的アルゴリズムにおける最適な移住についての検討

MPIによる行列積計算情報論理工学研究室渡邉伊織情報論理工学研究室渡邉伊織です。

京都大学大学院医学研究科画像応用治療学・放射線腫瘍学石原佳知

MPIを用いた並列処理～GAによるTSPの解法～

MPIを用いた最適な分散処理情報論理工学研究室角仁志

蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価

5 テスト技術 5.1 テストとは LISのテスト故障診断 fault diagnosis 故障解析 fault analysis

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

Jh NAHI 横田　理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景　H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法

知的システムデザイン研究室学籍番号：笠井誠之

アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化

遺伝的アルゴリズムを用いた構造物の最適形状探索のプログラムの作成

通信機構合わせた最適化をおこなう並列化ンパイラ

進化的計算手法の並列計算機への実装三木光範

遺伝的交叉を用いた並列シミュレーテッドアニーリング同志社大学工学部／大学院廣安知之，三木光範，○小掠真貴

階層的境界ボリュームを用いた陰関数曲面の高速なレイトレーシング法

サポートベクターマシンを用いたタンパク質スレッディングのためのスコア関数の学習情報科学科4年 81025G 蓬来祐一郎.

Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

適応的近傍を持つシミュレーテッドアニーリングの性能

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

Data Clustering: A Review

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~

遺伝的アルゴリズム (GA) を活用したスペクトルの波長選択および時系列データにおけるプロセス変数かつその時間遅れ (ダイナミクス) の選択明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

ビット空間におけるＧＡの解探索モニタリングシステム

卒業研究 JCSPを用いたプログラム開発　池部理奈.

MD計算による血小板細胞膜蛋白とリガンド結合の立体構造および結合の力学特性の解明(loss of function 型変異体に関して)

表紙分散遺伝的アルゴリズムのための新しい交叉法.

BSPモデルを用いた並列計算の有用性の検証

理工学部情報学科情報論理工学研究室延山周平

半正定値計画問題（SDP)の工学的応用について

シミュレーテッドアニーリングにおける重要温度領域に関する考察

情報工学科 05A2301 樽美澄香（Tarumi Sumika)

MPIを用いた並列処理計算情報論理工学研究室金久英之

分散遺伝的アルゴリズムにおけるパラメータの検討

情報論理工学研究室第1回：並列とは.

BSPモデルを用いた最小スパニング木情報論理工学研究室０２－１－４７－１３４小林洋亮.

MPIを用いた並列処理情報論理工学研究室 06‐1‐037‐0246　杉所　拓也.

分散メモリ型並列計算機上での行列演算の並列化

集中講義（東京大学）「化学システム工学特論第３」バイオインフォマティクス的手法による化合物の性質予測（１）バイオインフォマティクス概観

分子生物情報学(0) バイオインフォマティクス

各種荷重を受ける中空押出形成材の構造最適化

遺伝的交叉を用いた並列シミュレーテッドアニーリングの検討小掠真貴廣安知之三木光範角美智子岡本祐幸同志社大学大学院

Presentation transcript:

並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究同志社大学大学院小掠真貴同志社大学工学部廣安知之同志社大学大学院　小掠真貴同志社大学工学部　廣安知之三木光範同志社大学（学）　角美智子昨年度，私達の研究グループでは，けいはんな通信放送機構（ＴＡＯ）において，ＩＢＭマシンＲＳ／６０００ＳＰを使用し並列計算に関する研究を行いました．本日はその研究成果報告を行います．

研究背景大規模な科学技術計算タンパク質立体構造解析地球外知的生命体探査地球シミュレータ画像処理気象解析流体解析近年，さまざまな科学技術計算が必要とされていますが，それらのほとんどが大規模な計算です．たとえば，地球外生命体探査（The Search for Extraterrestrial Intelligence:SETI[カリフォルニア大バークレー校]）では，宇宙からくる電波を解析し，そこに地球外生命体からの信号がないかどうかを探すというものです．宇宙からくるすべての電波を解析しなければならないため，莫大な計算量が必要となります．また，地球シミュレータ[海洋科学技術センター]とは，地球変動（地震，温暖化現象）を予測するための仮想地球（計算機システム）であり，同様に多くの計算量を必要とします．タンパク質の立体構造解析も計算量が膨大になる科学技術計算のひとつです．気象解析流体解析

研究背景タンパク質遺伝子解析からタンパク質の立体構造解析へ生物の生命活動に必要生物学的機能と密接な関係アルツハイマー病，糖尿病遺伝子を設計図として作られるヒトゲノム研究により遺伝子情報が次第に明らかになるタンパク質は，人間をはじめとする生物の生命活動に欠かせないものです．タンパク質の持つ機能は，生物学的な機能と密接な関係にあるため，その機能の解析は重要となります．たとえば，アルツハイマー病は，タンパク質が正常な形で存在しない場合に起こることや，糖尿病はインスリンというタンパク質ホルモンの分泌が少ないときに起こる病気だということが知られています．タンパク質は遺伝子を設計図として作られますが，ヒトゲノム研究によりヒトの遺伝子情報が次第に明らかになってきた今日では，その遺伝子情報を元にしたタンパク質の立体構造解析へと注目が集まっています．遺伝子解析からタンパク質の立体構造解析へ

タンパク質の立体構造解析タンパク質の構造タンパク質立体構造解析の必要性新薬の開発病理の発現機構の解明アミノ酸配列（一次構造）

タンパク質の立体構造解析数値計算によるタンパク質の立体構造解析エネルギーが最も低くなる状態を求める最適化手法による計算が必要となる最適化問題としての立体構造解析

最適化問題ある条件のもとで，目的とするものを最小化（最大化）するような変数を決定する問題最も安く行きたい最も早く行きたい A A B 40min \120 20min \120 40min \120 20min \120 35min \220 35min \220 30min 30min \100 \100 A A B B 50min 50min 30min \150 30min \150 \60 45min \160 \60 45min \160 42min \90 42min \90 115min \380 95min \540

最適化手法最適化手法の分類数理的手法最急降下法，ニュートン法など現実問題を解くことは困難発見的手法（ヒューリスティック法）物理現象のアナロジー数理的手法には最急降下法やニュートン法などが挙げられるが，モデル化や計算量から，現実問題を数理的手法で解くことができる場合は少ない．そこで近年，物理現象や生物進化をコンピュータで模擬し，経験的に最適解を得ようとする手法として，発見的手法（ヒューリスティック法）が受け入れられている．ヒューリスティック手法も膨大な計算量を必要とするが，現実問題を解くことができる有効な手法のひとつであると考えられる．生物進化のアナロジー膨大な計算量

シミュレーテッドアニーリング (SA) 金属の焼きなまし（アニーリング）という物理現象をコンピュータでシミュレートする方法ゆっくり冷やす高温状態低温状態エネルギーが大きく不安定エネルギーが小さく安定ヒューリスティック法のひとつとしてここでは２つの手法を紹介する．まず一つ目としてシミュレーテッドアニーリング（以下ＳＡ）は，・・・

シミュレーテッドアニーリング (SA) f (x1, x2) 初期化生成評価温度受理判定クーリング終了くり返し high temperature 初期化 low temperature local minimum 生成評価受理判定クーリング global minimum 温度くり返し Metropolis基準　 P = －(Enext－Ecurrent) T exp 終了

遺伝的アルゴリズム (GA) 生物の進化の過程を模倣した最適化手法もう一つのヒューリスティック法として，遺伝的アルゴリズム（ＧＡ）が挙げられる．染色体やＤＮＡの概念を利用．

遺伝的アルゴリズム (GA) f (x1, x2) 初期化評価選択交叉突然変異 (3, 5 ) 1 1 1 x1 x2 終了 Candidate solution 評価選択交叉突然変異 encode decode (3, 5 ) くり返し (Genetic Operator) 遺伝的操作 Individual : 1 1 1 x1 x2 終了 chromosome

並列処理プロセッサを複数個用いて，複数の処理を同時並行的に行うこと並列処理の必要性計算の高速化計算機システムの信頼性，分散性などの向上しかし，ヒューリスティック法では計算量が多く必要となるため，並列処理が欠かせない．並列処理とは，プロセッサを複数個用いた・・・並列処理によって，計算の高速化や計算機システムの・・・を図ることができる．

並列処理計算時間の短縮 task1 task2 task3 task1 task2 task3 逐次処理並列処理 Time 計算の高速化とは，計算時間を短縮すること，つまり処理速度を向上することである．たとえば，この図のように３つのタスクがあるとする．もし１つのプロセッサで逐次処理を行うと，３つ分の時間がかかることになる．しかし，３つのプロセッサを用いると，各プロセッサはタスクを１つずつ処理すればよく，かかる時間が三分の一となる．

並列処理プロセッサ間通信 task1 task2 task3 task4 task5 task6 task3 task2 task1 逐次処理並列処理 task1 task2 task3 task4 task5 task6 task3 task2 task1 Time communication しかし実際には，プロセッサ数に比例して処理速度が向上するとは限らない．並列処理を行うことによって，本来の逐次処理では必要としなかった本来の目的と異なるところで余分な時間がかかることがあるからである．その一つに，プロセッサ間通信がある．処理を複数のプロセッサに分けることによって，本来一ヶ所にあるべきデータを分割する必要が生じる．そのデータの受け渡しにかかる時間が通信時間である．通信時間がかかりすぎると，並列処理によって得られる速度向上の意味がなくなってしまうので，通信時間は計算時間全体と比較して，小さいものでなければならない．そのため，並列処理を行うときに使用する手法はその点を考慮して作成するべきである． task6 task5 task4

IBM RS/6000SP 分散メモリ型超並列プロセッサ 13ノードで構成 Node4~13 : Type1 本実験では，並列処理用のマシンである，ＩＢＭのＲＳ／６０００ＳＰという分散メモリ型超並列プロセッサを用いた．分散メモリ型並列プロセッサでは，先程述べた通信を必要とする．本マシンは３つの異なるタイプからなる１３ノードの並列計算機である． Node4~13 : Type1 Node2, 3 : Type2 Node1 : Type3

IBM RS/6000SP Type1 10ノードによる並列処理ノード間通信通信媒体 : SPスイッチ (150MByte/Sec) 今回は，科学技術計算に適したＴｙｐｅ１の１０ノードを用いて実験を行った．１ノードに１プロセッサであるため，複数のノードを用いて計算を行うためにはプロセッサ間通信（ノード間通信）が必要となる．通信のための媒体は，ＳＰスイッチである．

遺伝的交叉を用いた並列シミュレーテッドアニーリング SAとGAのハイブリッドアルゴリズムタンパク質の立体構造解析において，従来のSAよりも性能が高いことが明らかとなっている分散メモリ型並列計算機に実装するためには新たなモデルが必要 RS/6000SPに実装するための遺伝的交叉を用いた並列シミュレーテッドアニーリングの並列モデルを開発

遺伝的交叉を用いた並列SAによるタンパク質の立体構造解析 5つのアミノ酸からなるタンパク質Met-enkephalin 最小エネルギー構造 E < -11 kcal/mol Met-enkephalin 設計変数　19個の二面角 1つの設計変数ごとにアニーリングの処理を行う 19回のアニーリングの処理を1MCsweepという

遺伝的交叉を用いた並列SAによるタンパク質の立体構造解析構造解析のモデル化とアルゴリズムの適用 1MCsweepあたり 19回のアニーリング

実験結果：解探索能力 0.93 0.90 0.90

実験結果：計算時間 810.53 544.31 409.78

遺伝的交叉を用いた並列SAの実装モデルは結論遺伝的交叉を用いた並列SAの並列実装モデルを開発し，タンパク質立体構造解析をRS/6000SP によって行った 90%以上の解探索能力 1.98倍の速度向上　（プロセッサ数2倍）遺伝的交叉を用いた並列SAの実装モデルは分散メモリ型並列計算機を用いてのタンパク質立体構造解析に有効である

fin 本研究の実施にあたり，岡崎国立共同研究機構の岡本祐幸先生に多大なご指導をいただいたことに深く感謝申し上げます． IBM RS/6000SPの利用にあたり，ご指導くださいましたけいはんな通信放送機構(TAO)やIBMの皆様に心より感謝申し上げます．