Presentation is loading. Please wait.

Presentation is loading. Please wait.

2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報

Similar presentations


Presentation on theme: "2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報"— Presentation transcript:

1 2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報 2018年5月11日 機能ゲノム科学  尾形 善之

2 返却するレポートについて レポートの採点(尾形担当回のみ) A+: 5~6? A: 4~5 B: 4 C: 3

3 今日の授業の目的と達成目標 目的 達成目標 公共データバンクに蓄積している遺伝子情報の検索方法について説明する。
注目する遺伝子をBLAST検索して、類似する遺伝子の情報を取得する。

4 遺伝子情報の予備知識 NCBIの遺伝子情報の書式 GenBank Format File (GBFF)
遺伝子の塩基配列についての情報 GenPept Format File (GPFF) 遺伝子のアミノ酸配列についての情報 どちらも情報の構成はほぼ同じ GPFFに従って説明していきます

5 GPFFの情報・1 LOCUS DEFINITION ACCESSION 遺伝子座、ACCESSIONと同じ場合が多い
アミノ酸残基数、GBFFでは塩基数 DEFINITION 遺伝子名か簡単な説明、大括弧内は種名 ACCESSION データベースで検索するためのID

6 GPFFの情報・2 VERSION SOURCE, ORGANISM REFERENCE 遺伝子を特定するID
同じ遺伝子座に複数の転写物が存在する SOURCE, ORGANISM 種名、分類(taxonomy) REFERENCE この遺伝子の登録に関わった論文名 PUBMEDの番号をクリックするとジャンプ

7 GPFFの情報・3 FEATURES Source: 種名、taxonomyへのリンク
Protein: タンパク質名、DEFINITIONと同様 Region: ドメイン領域、複数存在する CDD: 保存ドメインデータベースへ Site: ドメイン配列 CDS: コーディング配列 遺伝子名、locus tag、遺伝子の別名 “note”: 遺伝子の機能情報

8 GPFFの情報・4 FASTA Analyze this sequence GPFF:アミノ酸配列、GBFF:塩基配列
コピーして、BLASTに利用できる Analyze this sequence Run BLAST BLAST解析できる Identify Conserved Domains ドメイン情報のページへ

9 GPFFの情報・5 Articles about the MYB28 gene Protein clusters
PubMedの検索ページへ Protein clusters 類似タンパク質を纏めたページへ Reference sequence information 転写物などのページへ More about the gene 遺伝子のページへ

10 遺伝子ページの情報・1 Summary Genomic context, Genomic regions Bibliography
GBFFと同様 Genomic context, Genomic regions 染色体内の位置を表示 Bibliography 文献 Interactions 他の遺伝子との相互作用

11 遺伝子ページの情報・2 General gene information Related sequences Homology
OrthoDBへ Gene Ontology (GOと略される) 機能情報 Related sequences Protein Accession GenPeptやUniProtKBへ

12 チェックポイント・I GPFFのページから得られる情報について、簡単に纏めなさい。
遺伝子のページから得られる情報について、簡単に纏めなさい。

13 Phytozome 植物全般のゲノム情報を提供している 現在はV12 ユーザー登録が必要(無償) NCBIと異なるゲノム情報がある

14 Gramene 穀物を中心に植物ゲノムを提供している 現在はrelease53 植物の代謝パスウェイ情報も提供している
穀物のGO情報を提供している

15 TAIR シロイヌナズナの遺伝子情報全般 圧倒的な情報量 V10でひと区切りした。 シロイヌナズナのGO情報を提供している。
最近、一部有償化した。

16 emSemble ヨーロッパのEBI-EMBLが構築している。 NCBIと同様に、遺伝子情報全般を提供
Ensembl Genome: ゲノム情報 Ensembl: 遺伝子情報 ArrayExpress: 発現情報 UniProt: タンパク質情報

17 チェックポイント・II NCBI以外で植物のゲノムや遺伝子の情報を提供しているデータベースについて、簡単に纏めなさい。

18 配列相同性解析 配列相同性とは… 配列相同性解析 詳しくは第10回で説明 塩基配列またはアミノ酸配列が似ていること
配列が似ていることを調べる 代表的な解析がBLAST解析 ウェブとスタンドアローンがある 詳しくは第10回で説明

19 ウェブでのBLAST検索 NCBIのウェブサイトで実行 Graphic Summary Descriptions Alignments
横棒グラフ:類似度は赤、紫、緑、青、黒の順 Descriptions 各行がそれぞれ似ている遺伝子、次のスライド Alignments 似ている遺伝子と配列を比較、第10回で説明

20 Descriptions 各項目の説明 Description: 遺伝子名、大括弧内は種名
Max score, Total score: どれだけ似ているか Query cover: マッチさせた配列の割合 E value: マッチさせた配列における期待値 Ident: マッチさせた配列の一致率 Accession: ヒットした配列のID

21 今日の実習と課題 注目する遺伝子に対するBLAST検索をして、似ている遺伝子の植物種の傾向について考察しなさい。
今日の実習についての質問や感想を書いてください。


Download ppt "2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報"

Similar presentations


Ads by Google