KNOB CD-bootable Linux で開くバイオインフォマティクスの世界 Itoshi NIKAIDO 二階堂愛 <itoshi@sourceforge.jp> KNOB Project
Bioinformaticsの学習を阻むもの 環境を用意するのが大変 Cygwin ? Linux ? UNIX? make ? tar.gz ? ナニソレ Perl ? Ruby ? なにげにBioPerlのインストールは難しい。 そんな貴方に、Mac OS X ! でも、会社が、学校が、嫁さんが、旦那が、息子が、娘が許してくれない 実は、解析環境を整えるにはそれなりの努力がいる? いままでの Windows の資産は! GIW2004 Open-bio BoF 2004/12/13
モティベーション Grasp the KNOB ! Windows環境を壊すことなく、GNU/Linux でバイオインフォマティクスの勉強がしたい。 Cygwinのような擬似的なUNIX環境ではなく、本物のGNU/Linux環境を使いたい。 はじめから一通りのツールは入っていてほしい。 データベースのミラーは大変だ Grasp the KNOB ! GIW2004 Open-bio BoF 2004/12/13
KNOB (ノブ) = KNOppix for Bio Bioinformatics の世界へ誘うドアのノブ WindowsマシンにCD入れたらLinuxが起動 Knoppix JPを利用 Windowsマシンのハードディスクはいぢらない バイオインフォマティクスのツールが一通りインストールされている。 Publicなデータベースをネットワーク経由で利用できる。 KNOB1.2からはNTFSに保存されたファイルにアクセス可能 GIW2004 Open-bio BoF 2004/12/13
KNOPPIX (クノーピクス) とは Klaus Knopper 氏が開発しているCD bootable Linux Debian GNU/Linux をベースとしたフリーソフトウェア 産総研の須崎有康氏が日本語化 GIW2004 Open-bio BoF 2004/12/13
Knoppix for Bio の仕組み NTFS Database BioRuby/BioPerl/BioJava, EMBOSS /home Kernel Boot Loader Mini Root Internet Bio databases cloop file GenomeNet KEGG NCBI GenBank EMBL cloop = 圧縮ループバックデバイス 700MB = 2GB相当のディスク GIW2004 Open-bio BoF 2004/12/13
収録されているバイオインフォマティクスのツールとプログラミング言語 EMBOSS/EMBOSS:GUI BioPerl BioRuby BioJava BioDAS BLAST FASTA HMMER ClustalW Bioconductor, SMA PyMol Etc… Perl Ruby Python C C++ Fortran R GIW2004 Open-bio BoF 2004/12/13
利用できるデータベース BioRuby/BioPerl/BioJava EMBOSS BioFetch (BioRuby) Protein SpTrEMBL PIR RefSeq Protein SWISSPROT SWALL Nucleotide DDBJNEW DDBJRELEASE EMBL Refseq GenBank BioRuby/BioPerl/BioJava BioFetch (BioRuby) KEGG SWISSPROT EMBL GenBank RefSeq Etc… GIW2004 Open-bio BoF 2004/12/13
EMBOSSを使ってみよう JAMBO (JApan eMBOss Users Group)が翻訳中のEMBOSSチュートリアル5章より ネットワーク上のタンパク質配列から ops2_ ではじまるIDを持つタンパク質配列を得る。 clustalW で 多重アラインメントをする アラインメントを図示する GIW2004 Open-bio BoF 2004/12/13
$ seqret SWISSPROT:ops2_* $ emma ops2.fasta $ prettyplot ops2.aln コマンドライン編 $ seqret SWISSPROT:ops2_* $ emma ops2.fasta $ prettyplot ops2.aln EMBOSS::GUI編 http://localhost/EMBOSS/ にアクセス GIW2004 Open-bio BoF 2004/12/13
Perl + BLAST + SOAP あるDNA配列をInternet 上のタンパク質配列データベース(SWISSPROT)に対して、配列類似性検索(BLASTX)を行う。 GIW2004 Open-bio BoF 2004/12/13
$ jed soapblast.pl #!/usr/bin/perl -w use strict; use SOAP::Lite; my $seq; $seq .= $_ while <>; my $serv_ge = SOAP::Lite->service('http://xml.nig.ac.jp/wsdl/GetEntry.wsdl'); my $serv_bl = SOAP::Lite->service('http://xml.nig.ac.jp/wsdl/Blast.wsdl'); $serv_bl->proxy('http://localhost/', timeout => 60*60*6); print $serv_bl->searchSimple("blastx", "SWISS", $seq); $ perl soapblast.pl hoge.fasta > hoge.blx $ less hoge.blx BLASTX 2.2.6 [Apr-09-2003] Reference: Altschul, Stephen F., Thomas L. Madden, Alejandro A. Schaffer, Jinghui Zhang, Zheng Zhang, Webb Miller, and David J. Lipman (1997), "Gapped BLAST and PSI-BLAST: a new generation of protein database search programs", Nucleic Acids Res. 25:3389-3402. Query= (660 letters) Database: swiss_all.seq 138,949 sequences; 51,136,567 total letters Searching..................................................done Score E Sequences producing significant alignments: (bits) Value sp|P07327|ADHA_HUMAN Alcohol dehydrogenase alpha chain (EC 1.1.1... 446 e-125 sp|P28469|ADH_MACMU Alcohol dehydrogenase alpha chain (EC 1.1.1.... 423 e-114 GIW2004 Open-bio BoF 2004/12/13
WindowsからRealVNCを使って操作 VMware/Virtual PC/coLinuxから起動 ネットワークから起動 SFS Server SFS client SFS Knoppix SFS deamon Kernel Boot Loader Internet/LAN SFS Client Mini Root KNOB cloop file GIW2004 Open-bio BoF 2004/12/13 http://staff.aist.go.jp/k.suzaki/knoppix/sfs/sfs_file
Project KNOB http://knob.sourceforge.jp/ Download http://knob.sourceforge.jp/CD-image/ Mailing List Knob-friends (ユーザ向け) Knob-friends@sourceforge.jp Knob-dev (開発者向け) Knob-dev@sourceforge.jp GIW2004 Open-bio BoF 2004/12/13
今後の予定 最新のKnoppix JPに追いつく パッケージの更新と追加 coLinuxが利用可能になる BioPython Staden (http://staden.sourceforge.net/) GIW2004 Open-bio BoF 2004/12/13
プロジェクト参加者募集 ビルダー テスター 大学や企業、研究所などでのバイオインフォマティクス教育で使ってみてほしい。 寄付歓迎 GIW2004 Open-bio BoF 2004/12/13
関連サイト KNOPPIX-JP KNOPPIX本家 http://unit.aist.go.jp/it/knoppix/ KNOPPIX本家 http://www.knopper.net/ ハードディスクへインストールhttp://www.knoppix.net/docs/index.php/HdBasedHowTo GIW2004 Open-bio BoF 2004/12/13
Acknowledgements Knoppix Knoppix JP マホレックス社 GIW2004 Open-bio BoF 2004/12/13
以下、おまけ GIW2004 Open-bio BoF 2004/12/13
ホームディレクトリを保存しておく メニューから継続的なホームディレクトリを設定選択する。 次回起動時は、 boot: knoppix home=scan おすすめは、USBメモリ (/dev/sda1に認識) GIW2004 Open-bio BoF 2004/12/13
EMBOSS +EMBOSS::GUI でみんな幸せ ラボの共有マシンにKNOBを入れて、http://server/EMBOSS/にリモートからアクセスすることで、解析サーバとして使える。 httpd.confを書きかえる必要がある。 GIW2004 Open-bio BoF 2004/12/13
BioRubyを使ってみよう ヒトで酵素番号1.1.1.1が使われている代謝パスウェイを列挙する。 そのパスウェイの画像を取得する。 正確には出力するURLを得る。 1.1.1.1を赤枠にする。 そのパスウェイ上のヒトで報告されている酵素をすべて緑色に塗りつぶす。 GIW2004 Open-bio BoF 2004/12/13
serv = Bio::KEGG::API.new $ jed ecmapper.rb #!/usr/bin/env ruby require 'bio' serv = Bio::KEGG::API.new pathways = serv.mark_all_pathways_by_enzymes('hsa', ['ec:1.1.1.1']) pathways.each do |url| p url end $ ruby ecMapper.rb "http://soap.genome.ad.jp/keggapi/mark_pathway_www?8611+hsa00010.args" "http://soap.genome.ad.jp/keggapi/mark_pathway_www?8611+hsa00350.args" "http://soap.genome.ad.jp/keggapi/mark_pathway_www?8611+hsa00561.args" "http://soap.genome.ad.jp/keggapi/mark_pathway_www?8611+hsa00120.args" “http://soap.genome.ad.jp/keggapi/mark_pathway_www?8611+hsa00071.args” GIW2004 Open-bio BoF 2004/12/13
自己紹介 2000.9 マウスcDNA機能アノテーション会議(FANTOM)へ参加 2002.5 学部 (~1999.3) 東海大学海洋学部 分子系統学(Wet) 博士課程 (~2004.3) 横浜市立大院・総理 理研GSC Microarray Sequence anaysis Statistics Genetics ポスドク (〜現在) 埼玉医大ゲノム医学研究センター 修士課程 (~ 2001.3) 東海大学院・海洋学研究科 EST解析(Dry) GIW2004 Open-bio BoF 2004/12/13