サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

©2008 Ikuo Tahara探索 状態空間と探索木 基本的な探索アルゴリズム 横形探索と縦形探索 評価関数を利用した探索アルゴリズム 分岐限定法 山登り法 最良優先探索 A ( A* )アルゴリズム.
動的計画法を用いたアラインメント  小菅孝史.
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
到着時刻と燃料消費量を同時に最適化する船速・航路計画
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
ラベル付き区間グラフを列挙するBDDとその応用
ニューラルネットのモデル選択 村田研究室 4年  1G06Q117-5 園田 翔.
遺伝的アルゴリズム  新川 大貴.
奈良女子大集中講義 バイオインフォマティクス (8) タンパク質立体構造予測
全体ミーティング (4/25) 村田雅之.
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
分子生物情報学 動的計画法に基づく配列比較法 (ペアワイズアライメント法)
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
整数計画法を用いた ペグソリティアの解法 ver. 2.1
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
京都大学 化学研究所 バイオインフォマティクスセンター
Cubic Residue and Cubic Root Modulo p
まずはじめに、二次元電気泳動によって得られたタンパク質に酵素処理を行い、ペプチドを解離する。
情報工学総合演習 D-I 近似アルゴリズム 埼玉大学 理工学研究科 山田 敏規、 橋口 博樹、 堀山 貴史
サポートベクターマシン によるパターン認識
阿久津 達也 京都大学 化学研究所 バイオインフォマティクスセンター
Fuzzy c-Means法による クラスター分析に関する研究
生命情報学基礎論 (5) タンパク質立体構造予測
ニューラルネットは、いつ、なぜ、どのようにして役立つか?
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Deep Learningを用いたタンパク質のコンタクト残基予測
膜タンパク質の 立体構造予測.
奈良女子大集中講義 バイオインフォマティクス (9) 相互作用推定
SVMを用いた生体分子への 金属結合部位予測手法の提案
神奈川科学技術アカデミー バイオインフォマティクスコース 蛋白質立体構造予測 I,II,演習
第14章 モデルの結合 修士2年 山川佳洋.
顧客維持に関するモデル.
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
分子動力学計算によりプリオンタンパク(野生型・変異型)が
明治大学大学院理工学研究科 総合講義C バイオインフォマティクスにおける 数理的手法
分子生物情報学(2) 配列のマルチプルアライメント法
膜タンパク質のインフォマテイクス 必要とされている課題.
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
分子生物情報学(3) 確率モデル(隠れマルコフモデル)に 基づく配列解析
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
適応的近傍を持つ シミュレーテッドアニーリングの性能
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
需要点,供給点,辺容量を持つ木の分割アルゴリズム
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
タンパク質.
Data Clustering: A Review
タンパク質-リガンド複合体への共溶媒効果の系統的解析
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
サポートベクターマシン Support Vector Machine SVM
Data Clustering: A Review
秘匿リストマッチングプロトコルとその応用
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
全原子の位置 r(t) を求める(各原子がいつ,どこにあるか)
人工知能特論II 第8回 二宮 崇.
ベイズ音声合成における 事前分布とモデル構造の話者間共有
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
ICML読む会資料 (鹿島担当) 教師ナシ の 構造→構造 マッピング 読んだ論文: Discriminative Unsupervised Learning of Structured Predictors Linli Xu (U. Waterloo) , … , Dale Schuurmans.
生物情報ソフトウェア特論 (10)固定パラメータアルゴリズムと 部分k木
集中講義(東京大学)「化学システム工学特論第3」 バイオインフォマティクス的手法による化合物の性質予測(1) バイオインフォマティクス概観
分子生物情報学(0) バイオインフォマティクス
Presentation transcript:

サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎

研究対象 経験的なタンパク質の構造予測方法である タンパク質スレッディング 特定のスコア関数で最適スレッディングを求めるBranch-and-boundアルゴリズムの実装と改良 SVMによるスコア関数の学習

研究の動機 タンパク質の構造決定はアミノ酸配列の決定より困難 遺伝子の機能の予測 抗生物質など薬剤の設計への期待

研究の背景 タンパク質の構造には1000種類程度の 多様性しかないという予測[Chothia92] タンパク質の構造データの蓄積(PDB)[Bernstein76] タンパク質スレッディングのモデル 最適スレッディングを求める効率的なBranch-and-bound Algorithm[Lathrop96,99] 統計的スコア関数[Miyazawa85]

タンパク質スレッディング ×1 ×3 ×2 コア1 ? T A 相互作用 コア2 S D M ? K E T A A A K F E R Q H M D S S T S A A

スコア関数 パラメータの種類 パラメータの数 αヘリックス 20 βシート 相互作用 ×1 ×3 ×2 20×(20+1)/2=210 T A S D M パラメータの種類 パラメータの数 αヘリックス 20 βシート 相互作用 20×(20+1)/2=210

学習データ アミノ酸配列 ARSTNTFNYATYHTLDEIYDFMDLLVAQHPELVSKLQIGRSY LDEIYDFMDLLVAQ コア部分の 実際の アミノ酸配列

サポートベクターマシン 超平面 サポートベクター 最大マージン

スコア関数の評価 アミノ酸配列をそれ自身の構造に割り当て最適スレッディングと実際のスレッディングを比較 Branch-and-bound Algorithm ギャップを許したタンパク質スレッディングで最適のアラインメントを求める問題は、NP困難 探索空間をスコアのlower boundを求めながら分割していき、最適解を探す

スレッディングエラー アミノ酸配列 ARSTNTFNYATYHTLDEIYDFMDLLVAQHPELVSKLQIGRSY コア部分の 実際の アミノ酸配列

スコア関数の精度

特化スコア関数(1) PDBデータ9個 αヘリックス38個 PDBデータ8個 βストランド79個

特化スコア関数(2)

問題点 既存のスコア関数とあまり変わらない 二次計画問題を解くので、あまりデータを多くできない 現在のモデルは単純すぎたかもしれない 学習に使ったタンパク質のデータが少なかった 二次計画問題を解くので、あまりデータを多くできない

今後の課題 よりリアルなスレッディングモデル より多くのタンパク質構造からの学習 より高速なスレッダー