2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める 2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める 2017年4月14日 機能ゲノム科学 尾形 善之
授業の目標 植物バイオサイエンス研究領域で必要な情報処理の能力を培う。 要は、バイオサイエンスのビッグデータを使いこなす、ということ。 Wikipedia
1年次 前期 後期 2年次 前期 3年次 前期 応用生命科学類での 情報教育の流れ 情報基礎 統計学基礎I 統計学基礎II 生物統計学 1年次 前期 後期 2年次 前期 3年次 前期 情報基礎 統計学基礎I 統計学基礎II 生物物理化学実験 (生命機能化学課程) 生物統計学 植物バイオサイエンス情報処理演習 (植物バイオサイエンス課程)
授業の概要 教室:ずっとここ 担当教員 来週から3回(第2~4回)は深田先生 他は全部私です 講義(実習):15回 期末レポート
日程 第1回 4月14日 第9回 6月9日 第2回 4月21日 第10回 6月16日 第3回 4月28日 第11回 6月23日 第4回 5月5日 第12回 6月30日 第5回 5月12日 第13回 7月14日 第6回 5月19日 第14回 7月21日 第7回 5月26日 第15回 7月28日 第8回 6月2日 期末レポート 8月7日まで
授業の進め方 講義:30分程度 チェックポイント、自力で書く 実習と課題:60分程度 分からないときは、TAにきく
授業のファイルの置き場所 読み出すファイル 保存するファイル 「Teacher/ogata/植物バイオサイエンス情報処理演習2017/」 「Share/植物バイオサイエンス情報処理演習2017 /」 この中に、自分のフォルダを作る
成績評価 当日レポート、各回5点(5x15=75点) 出席を兼ねます! 期末レポート:25点 最終回に説明します 合計:100 点
期末レポートの目的 注目する植物遺伝子を決める。 データベース検索や統計解析を通じて、機能に繋がる特徴を纏める。 生物統計学:シロイヌナズナの遺伝子。 今回:どの植物でもOK。 データベース検索や統計解析を通じて、機能に繋がる特徴を纏める。 生物統計学:発現データの統計解析。 今回:さまざまな手法を駆使する。 Wikipedia
遺伝子の機能に迫る 発現データ 配列データ 文献データ どの条件で働いているかが分かる。 どんな機能を示す配列をしているかが分かる。 組織特異性、ストレス応答性など。 配列データ どんな機能を示す配列をしているかが分かる。 機能ドメイン、その配列を共有する植物など。 文献データ 遺伝子についての全般的な知識が得られる。
遺伝子機能に迫るポイント 注目遺伝子について… どのデータベースに含まれているか? どのくらいの情報が含まれているか? データベースによって、扱っている植物が異なる。 どのくらいの情報が含まれているか? 配列情報:アミノ酸配列まで分かっているか? 発現情報:実験数はどのくらいか? これまで機能はどのくらい分かっているか? 遺伝子名に機能が含まれているか?
期末レポートの作業 配列相同性解析:似ている配列を検索する。 遺伝子発現解析:発現の特異性を調べる。 代謝パスウェイ解析 どの代謝経路で働いているか、調べる。 遺伝子機能解析:機能情報を調べる。 文献検索:さまざまな知見を得る。
期末レポートの提出と書式 提出期限:2017年8月7日(月) 提出先:Shareフォルダ 書式:ワードファイルまたはPDFファイル 提出ファイルのタイムスタンプで判断します 提出先:Shareフォルダ 自分のフォルダ内 書式:ワードファイルまたはPDFファイル 他に参照するファイルがある場合は保存する
この部屋の使い方 平日の日中は空いています。 授業の邪魔にならなければ自由に使えます。 プリンターは教員の許可が必要です。
まずは自分のフォルダを作りましょう 「Share」→「植物バイオサイエンス情報処理演習2017」フォルダの中に、自分のフォルダを作りましょう 自分の名前(フルネーム) または、学籍番号
それでは今日の講義に入ります 今日は「NCBI」の紹介です バイオサイエンスのビッグデータの本家本元です Wikipedia
遺伝子情報データの蓄積の仕組み 遺伝子研究の学術論文では必ず遺伝子情報を登録する必要がある 研究された遺伝子の数だけ遺伝子情報は溜まる NCBI 公共DNAデータバンク
遺伝子発現解析手法と学術論文数の推移 (Cahvejian et al., Nat Biotechnol, 2008) 遺伝子を扱う学術論文数の推移 遺伝子発現解析手法と学術論文数の推移 (Cahvejian et al., Nat Biotechnol, 2008)
遺伝子を扱う学術論文数の推移
遺伝子を扱う学術論文数の推移
登録された塩基配列データ ヨタ キロヨタ メガヨタ …… ゼタ エクサ ペタ テラ ギガ メガ キロ Sequence Read Archive, NCBI
遺伝子情報はどこに登録される? 公共DNAデータバンク
NCBIとは 米国国立生物工学情報センター 名称はともかく、あらゆる生物の遺伝子に関連する情報を無償で置いています 塩基配列、アミノ酸配列、遺伝子発現、タンパク質構造、文献情報などなど
NCBIの中身 実際にどんな情報があるか見てみましょう 遺伝子の塩基配列(GenBank) タンパク質のアミノ酸配列(RefSeq) 遺伝子の発現(Gene Express Omnibus) 遺伝子実験の生データ(Sequence Read Archive) 文献(PubMed)
チェックポイント・I 遺伝子の論文における手法の推移について、説明しなさい。 NCBIには、どのような情報が登録されているか説明しなさい。 生命情報のデータの容量がますます大きくなったらどうなるか、想像してください。
バイオインフォマティクスとは… 生命情報学 ゲノミクス 遺伝子やタンパク質といった生命がもっている情報を分析することで生命について調べる(Wikipediaより)。 ゲノミクス シーケンサーの開発とゲノム解読の進展により、大規模なゲノム情報をシステムとして扱う分野。 ヒトX染色体の地図 Wikipedia
なぜバイオインフォマティクス? なぜ発達してきたのか? 手法だけなら、情報科学で十分では? 機器の発達により、生命科学で得られる情報が爆発的に増加した。 生命科学者の手に負えなくなった…… 手法だけなら、情報科学で十分では? 生命情報は特殊で複雑…… 遺伝するのは染色体だけだが、それだけで生命現象を解明するのは無理……
今がチャンス!? 次世代シーケンサーの急速な発達!! 読める配列数が急激に増加! ゲノミクスの論文数が増加! DNAだけでなく、RNAの解析にも利用! ついに、府大にも導入!! 皆さんも使えます!
今日の実習と課題 シロイヌナズナの遺伝子の情報を検索します。 今日の実習の感想や疑問点を書いてください。 手順書(「作業手順01_17.docx」)を参照。 今日の実習の感想や疑問点を書いてください。 これからの講義への要望や不安も書いてください。