2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報 2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報 2017年5月12日 機能ゲノム科学 尾形 善之
前回(第1回)のフォロー BLAST解析をして、注目遺伝子と相同性のある遺伝子の種の特異性を調べた。 多くの場合は、科で特異的であった。
今日の授業の目的と達成目標 目的 達成目標 公共データバンクに蓄積している遺伝子情報の検索方法について説明する。 注目する遺伝子を公共データバンクで検索する方法について習熟する。
遺伝子情報の予備知識 NCBIの遺伝子情報の書式 GenBank Format File (GBFF) 遺伝子の塩基配列についての情報 GenPept Format File (GPFF) 遺伝子のアミノ酸配列についての情報 どちらも情報の構成はほぼ同じ GPFFに従って説明していきます
GPFFの情報・1 LOCUS DEFINITION ACCESSION 遺伝子座、ACCESSIONと同じ場合が多い アミノ酸残基数、GBFFでは塩基数 DEFINITION 遺伝子名か簡単な説明、大括弧内は種名 ACCESSION データベースで検索するためのID
GPFFの情報・2 VERSION SOURCE, ORGANISM REFERENCE 遺伝子を特定するID 同じ遺伝子座に複数の転写物が存在する SOURCE, ORGANISM 種名、分類(taxonomy) REFERENCE この遺伝子の登録に関わった論文名 PUBMEDの番号をクリックするとジャンプ
GPFFの情報・3 FEATURES Source: 種名、taxonomyへのリンク Protein: タンパク質名、DEFINITIONと同様 Region: ドメイン領域、複数存在する CDD: 保存ドメインデータベースへ Site: ドメイン配列 CDS: コーディング配列 遺伝子名、locus tag、遺伝子の別名 “note”: 遺伝子の機能情報
GPFFの情報・4 FASTA Analyze this sequence GPFF:アミノ酸配列、GBFF:塩基配列 コピーして、BLASTに利用できる Analyze this sequence Run BLAST BLAST解析できる Identify Conserved Domains ドメイン情報のページへ
GPFFの情報・5 Articles about the MYB28 gene Protein clusters PubMedの検索ページへ Protein clusters 類似タンパク質を纏めたページへ Reference sequence information 転写物などのページへ More about the gene 遺伝子のページへ
遺伝子ページの情報・1 Summary Genomic context, Genomic regions Bibliography GBFFと同様 Genomic context, Genomic regions 染色体内の位置を表示 Bibliography 文献 Interactions 他の遺伝子との相互作用
遺伝子ページの情報・2 General gene information Related sequences Homology OrthoDBへ Gene Ontology (GOと略される) 機能情報 Related sequences Protein Accession GenPeptやUniProtKBへ
チェックポイント・I GPFFのページから得られる情報について、簡単に纏めなさい。 遺伝子のページから得られる情報について、簡単に纏めなさい。
Phytozome 植物全般のゲノム情報を提供している 現在はV12 ユーザー登録が必要(無償) NCBIと異なるゲノム情報がある
Gramene 穀物を中心に植物ゲノムを提供している 現在はrelease53 植物の代謝パスウェイ情報も提供している 穀物のGO情報を提供している
TAIR シロイヌナズナの遺伝子情報全般 圧倒的な情報量 V10でひと区切りした。 シロイヌナズナのGO情報を提供している。 最近、一部有償化した。
emSemble ヨーロッパのEBI-EMBLが構築している。 NCBIと同様に、遺伝子情報全般を提供 Ensembl Genome: ゲノム情報 Ensembl: 遺伝子情報 ArrayExpress: 発現情報 UniProt: タンパク質情報
チェックポイント・II NCBI以外で植物のゲノムや遺伝子の情報を提供しているデータベースについて、簡単に纏めなさい。
期末レポートの目的 注目する植物遺伝子を決める。 データベース検索や統計解析を通じて、機能に繋がる特徴を纏める。 生物統計学:シロイヌナズナの遺伝子。 今回:どの植物でもOK。 データベース検索や統計解析を通じて、機能に繋がる特徴を纏める。 生物統計学:発現データの統計解析。 今回:さまざまな手法を駆使する。 Wikipedia
遺伝子の機能に迫る 発現データ 配列データ 文献データ どの条件で働いているかが分かる。 どんな機能を示す配列をしているかが分かる。 組織特異性、ストレス応答性など。 配列データ どんな機能を示す配列をしているかが分かる。 機能ドメイン、その配列を共有する植物など。 文献データ 遺伝子についての全般的な知識が得られる。
遺伝子機能に迫るポイント 注目遺伝子について… どのデータベースに含まれているか? どのくらいの情報が含まれているか? データベースによって、扱っている植物が異なる。 どのくらいの情報が含まれているか? 配列情報:アミノ酸配列まで分かっているか? 発現情報:実験数はどのくらいか? これまで機能はどのくらい分かっているか? 遺伝子名に機能が含まれているか?
期末レポートの作業 配列相同性解析:似ている配列を検索する。 遺伝子発現解析:発現の特異性を調べる。 代謝パスウェイ解析 どの代謝経路で働いているか、調べる。 遺伝子機能解析:機能情報を調べる。 文献検索:さまざまな知見を得る。
期末レポートの提出と書式 提出期限:2017年8月7日(月) 提出先:Shareフォルダ 書式:ワードファイルまたはPDFファイル 提出ファイルのタイムスタンプで判断します 提出先:Shareフォルダ 自分のフォルダ内 書式:ワードファイルまたはPDFファイル 他に参照するファイルがある場合は保存する
今日の実習と課題 注目する遺伝子について、各種の情報を検索して、纏めなさい。 期末レポートに向けて、質問や感想を書いてください。