BioRuby プロジェクト In-house R&D 環境のためのオープンソースプラットフォーム

Slides:



Advertisements
Similar presentations
マイクロソフトがホスティングする拡張性に優れたサービス ベース アプリケーション プラットフォーム.
Advertisements

だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
この部分こそが必 要とされている ! Runtime 自身と Expression が カバーする!
VE 01 え form What is え form? え? You can do that many things with え form?
Windows Azure ハンズオン トレーニング Windows Azure Web サイト入門.
KNOB CD-bootable Linux で開くバイオインフォマティクスの世界
2005/3/3 国立遺伝学研究所共同研究会「生物情報資源の相互運用性」 スクリプト言語による ウェブサービスの利用
Webサービスに関する基本用語 Masatoshi Ohishi / NAOJ & Sokendai
第十七か ぐちとうわさ話.
英語勉強会.
STEP 2 ノート・テイキングのサンプル.
Recognise, ask about and talk about purpose
と.
BioRuby プロジェクト In-house R&D 環境のためのオープンソースプラットフォーム
データベース工学 データベースとは データモデル 関係データベースとSQL 物理データベース編成とインデクス
続 Entity Framework 入門 SQLWorld #8 サヴロウ.
Ruby Extended Library Howto
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
吉田和弘 株式会社ミッタシステム Rubyのすすめ 吉田和弘 株式会社ミッタシステム
Location nouns.
じょし Particles.
Ruby Extended Library Howto
What did you do, mate? Plain-Past
Tcl/Tk 西中 芳幸.
Object Group ANalizer Graduate School of Information Science and Technology, Osaka University OGAN visualizes representative interactions between a pair.
Japanese verbs informal forms
Delphi Day ~Delphi 概要、および新バージョンのご紹介~
Silverlight とは.
形容詞(2) けいようし.
IDENTIFYING and using RESOURCES
Windows Summit /8/2017 © 2010 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be.
V 03 I do NOT eat sushi. I do NOT do sumo.
十年生の 日本語 Year 10 Writing Portfolio
The future tense Takuya Mochizuki.
Licensing information
定期考査2 英語.
On / in / at Honoka Tanno.
BioRubyにおける高速なBLAST結果処理機能の実装
VTA 02 What do you do on a weekend? しゅうまつ、何をしますか。
第1回オープンバイオ研究会 w/ SIG-BMK.
Topics on Japan これらは、過去のインターンが作成したパワポの写真です。毎回、同じような題材が多いため、皆さんの出身地等、ここにない題材も取り上げるようにしてください。
New accessory hardware Global Platform Division
BioRubyの開発と 遺伝子情報解析への応用 大阪大学遺伝情報実験センター ゲノム情報解析分野 後藤 直久 2005年1月21日.
Session 8: How can you present your research?
Important Information
Windows Azure 通知ハブ.
Bellwork: 1)宿題がたくさんあるのに、ゲームをしました。 2)大好きなのに、結婚ができません。
ゲノムネットの利用法に関する講習会 北陸先端科学技術大学院大学 知識科学研究科 佐藤賢二.
Microsoft Visual Studio 2005 Tools for
サイエンス・テクノロジー・システムズ株式会社 癸生川絵里
データベース工学 生研 戦略情報融合研究センタ 喜連川 優.
Present Status of Metbroker
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
第24回応用言語学講座公開連続講演会 後援:国際言語文化研究科教育研究プロジェクト経費
日本語113 5月29日(木) 〜でしょう てんきよほう.
第13回 2007年7月20日 応用Java (Java/XML).
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
日本語タイトル(point 28) 第4回DSANJ Bio Conference’19 Open
The difference between adjectives and adverbs
Db2 Warehouse on Cloud Db2 on Cloud フルマネージドサービス提案時の注意点
Cluster EG Face To Face meeting
日本語タイトル(point 28) 第4回DSANJ Bio Conference’19 Open
Grammar Point 2: Describing the locations of objects
もっていきます・もってきます.
PHP と SQL (MySQL) の連携 日本語のデータを扱う
Microsoft Office Project Server 2007
BW: 英語で書いて下さい 1)小さくする 2)うるさく話す 3)大きく書く 4)上手になる (なる=become)
Cluster EG Face To Face meeting 3rd
Presentation transcript:

BioRuby プロジェクト In-house R&D 環境のためのオープンソースプラットフォーム 片山俊明@京大化研 http:// bioruby.org/ 2002/1/12 特定領域研究C「ゲノム情報科学」班会議 パネルディスカッション「ゲノムサイエンスにおけるXML等の標準化の現状と未来」 @ 東京国際交流館プラザ平成

Ruby は まつもとゆきひろさんが作ったスクリプト言語 とにかく全てがオブジェクト きれいな言語仕様 インタプリタ Perl Python コンパイル C Java オブジェクト指向度

なぜ BioRuby (yet another BioPerl?) コードの再利用 データベースや BLAST/FASTA 出力のパースなど 簡単キレイ Perl は「my $muda = $na->オマジナイ」が多すぎた 日本語でディスカッション、日本のリソースにも ゲノムネットや KEGG もサクサク使いたい スタンスの違い ハイエンドなシーケンスセンター vs 個人のニーズ

BioRuby にできること 配列(翻訳、スプライシング、ウィンドウサーチ etc.) 相同性解析 データ取得 各種データベースパーザ Bio::Sequence::NA, AA, Bio::Location 相同性解析 Bio::Blast, Bio::Fasta データ取得 Bio::FlatFile, DBGET, PubMed, BRDB 各種データベースパーザ Bio::GenBank, Bio::KEGG::GENES etc. (今は20種くらい) グラフ、2項関係、文献データなど Bio::Pathway, Relation, Reference, MEDLINE →クラス図へ

BioRuby クラス図

GenBank エントリ

GenBank オブジェクト #!/usr/bin/env ruby require 'bio' entry = ARGF.read # entry = Bio::DBGET.bget("gb:AF139016") gb = Bio::GenBank.new(entry)

On-demand パーシング 1. 軽く分割 ↓method 2. 切り刻む キャッシュする

GenBank のパース gb = Bio::GenBank.new(entry) gb.entry_id → "AF139016"

GenBank のパース gb. date gb. nalen gb. division gb. natype

GenBank のパース gb. definition gb. taxonomy gb. common_name gb. basecount

GenBank のパース refs = gb. references → リファレンスオブジェクトのリスト refs.each do |r| puts r.bibitem end

GenBank のパース f = gb. features # →フィーチャーオブジェクトのリストに変更する予定 gb.each_cds do |cds| puts cds['product'] puts cds['translation'] # → Bio::Sequence::AA オブジェクト end GenBank のパース

GenBank のパース seq = gb. naseq →配列オブジェクト seq.splicing(pos) →スプライスされた配列 loc = Bio::Locations(pos) → ロケーションオブジェクト ポジションの例: join((8298.8300)..10206,1..855) complement((1700.1708)..(1715.1721)) 8050..one-of(10731,10758,10905,11242) join(complement(1..61),complement(AP000007.1:252907..253505)) GenBank のパース seq = gb. naseq  →配列オブジェクト seq.splicing(pos) →スプライスされた配列

BRDB エントリをパースして MySQL に入れておく 現在 GenBank/RefSeq で試験中 I/O の高速化、正規化 現在 GenBank/RefSeq で試験中 GenBank/RefSeq/DDBJ, EMBL/TrEMBL/Swiss-Prot, PROSITE, MEDLINE, TRANSFAC, LITDB, AAindex ... KEGG/GENES, GENOME, BRITE, COMPOUND, ENZYME, CELL, Microarray ... dRuby, XML, SOAP, Corba などの API も検討

BioRuby Genome Browser BRDB からデータ取得 GenBank/RefSeq の全エントリに対応 SVG による出力 BioRuby を使った sample application

Open Source Biome (Bio*) BioPerl bioperl.org BioPython biopython.org BioJava biojava.org BioLisp biolisp.org BioCorba biocorba.org BioXML bioxml.org The Open BIoinformatics Foundation BioSQL BioDAS Ensembl GO EMBOSS MOBY etc...

標準化への動き Bio Hackathon /etc/bioinformatics/sequence 2002/01/25 - 01/28 @ Tuscon, AZ 2002/02/24 - 03/01 @ Cape Town, S. Africa /etc/bioinformatics/sequence <seq-db-name> <meta-type> <base/update> <location-as-string> XML / DAS / SOAP / SQL / Corba ... DAS (distributed annotation system) : XML over http SOAP (simple object access protocol) is a lightweight protocol for exchange of information in a decentralized, distributed environment. It is an XML based protocol that consists of three parts: an envelope that defines a framework for describing what is in a message and how to process it, a set of encoding rules for expressing instances of application-defined datatypes, and a convention for representing remote procedure calls and responses. SOAP can potentially be used in combination with a variety of other protocols; however, the only bindings defined in this document describe how to use SOAP in combination with HTTP and HTTP Extension Framework. XEMBL (BSML : LabBook XML format, AGAVE : DoubleTwist XML format), NCBI-XML (ASN.1), DDBJ-XML XML schema, XQuery ... MOBY-DIC: Model Organism Bring Your-own Database Interface Conference BOSC 2002 (ISMB 2002)

今後のロードマップ 2002/01 2002/02 配列、データベース以外の拡張予定: 安定バージョン BioRuby 0.4 リリース BioRuby DB のインプリ SOAP / XML 2002/02 Bio Hackathon をふまえた対応 配列、データベース以外の拡張予定: Pathway (グラフ) クラスの応用 PDB (構造系) GUI (ファクトリー)

スタッフ staff@bioruby.org 片山俊明 - k (プロジェクトリーダー) 奥地秀則 - o 中尾光輝 - n 川島秀一 - s Happy Hacking!