生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する- 生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する- 2014年9月30日 生命環境科学域 応用生命科学類 尾形 善之
授業の概要 宿題は出しません 当日レポートを出します 期末テストをやります 評価点 次のスライドで詳しく説明します 用紙を渡しておくので、毎週用意してください 期末テストをやります 実習形式のテストを予定しています 評価点 平常点(5x15点)、期末テスト(25点)
当日レポート 毎回の講義の終わりに提出してください 出席を兼ねています 「チェックポイント」と「本日の課題」 チェックポイントを書かないと、遅刻扱いになる場合があります
授業の進め方 前回の復習 チェックポイント(必要に応じて) 今回の講義 チェックポイント(必ず) 今回の実習 本日の課題(必ず)
予習と復習 予習 復習 次回の内容の方法について参考書やインターネットなどで調べておいてください 研究室HPで復習用の材料を提供します URL http://www.plant.osakafu-u.ac.jp/~ogata/2014/seibutsutokei/ 授業のパワポも提供します リンクも貼っておきますので、活用してください 例えば、NCBI
統計解析について学ぶこと 技術について学びます 精神について学びます 目的によって、さまざまな方法があります 「検定」や「多変量解析」など と言っても、根性や気合いの話ではありません 統計解析で「言えること」と「言えないこと」
統計解析の精神 「絶対」とは言えないが「かなり」とは言える 警察の犯人逮捕に喩えると…… 「動かぬ証拠」は見つけられない 「信頼できる状況証拠」を集められる これを「統計的に有意」と言います
「統計解析」とは なるべく「全体」を眺める(統べて計る) 「誰でも納得」させる(客観性) 木を見て森を見ず 「統計的に有意」 全体を眺めてみて何か意味があることが分かる
チェックポイント・I 皆さんの名前のふりがなを書いてください。 皆さんの「確率・統計」体験を説明してください。 皆さんの「統計解析」経験を説明してください。 第4問 1 から9 までの数字が1 つずつ書かれた9 枚の□□□から5 枚の□□□を同時に取り出す。このような□□□の取り出し方はアイウ通りある。 (1) 取り出した5 枚の□□□の中に5 と書かれた□□□がある取り出し方は エオ 通りであり, 5 と書かれた□□□がない取り出し方は カキ 通りである……… 統計学基礎I、II
「生物統計学」とは 「生物学」+「統計学」 「生物情報解析」 「生物データを使って統計解析」…… それだと、実際に習うのは「統計学」 「生物情報」+「統計解析」 「バイオデータサイエンス」に繋がる 「生物情報」を「統計解析」して「生物学的理解」に繋げる 「木」を見て「森」を見てまた「木」を見る
「生物情報」とは 生物から得られる各種情報 今回は「遺伝子情報」を扱います 注目するのは「At1g56650」です たとえば、遺伝情報 遺伝子、交配、進化 今回は「遺伝子情報」を扱います 研究室HPで練習データを提供していきます 注目するのは「At1g56650」です モデル植物シロイヌナズナの遺伝子の名前(遺伝子座)です。
統計解析に入る前に・1 妥当なデータか 元のデータにエラーが含まれている 生データは割と恣意的にいじれてしまう 解析結果は変わる 生データは割と恣意的にいじれてしまう 勝手にデータを省いてはダメ 数値データからはエラーを見つけにくい 統計的にエラー(ノイズ)を省くことはできる でも、もう一度データを見直してください
統計解析に入る前に・2 標準化は可能か 統計解析するためには「標準化」が必要 単位を揃える
統計解析の第一歩・1 全体を眺める 統計指標をつける 代表値(例えば「平均」) 全体をグラフ化する 折れ線グラフ 棒グラフ
統計解析の第一歩・2 みんなを納得させる 検定(テスト)する 実際に飛ばしてみる 「統計的有意」を出す t検定、U検定、ほかいろいろ うまくいかないことも多い
本格的な統計解析 多変量解析 生物現象を解明するためには、多くの種類のデータを集める データ全部を纏めて解析 中には必要のないデータも含まれているかも どのデータに注目していいのか データ全部を纏めて解析 どの方法を使えばいいのか
チェックポイント・II 全体を眺める統計学的手法について説明しなさい みんなを納得させる統計学的手法について説明しなさい。
実習 今日は主に動作確認を中心に進めます 今後利用するソフトウェア エクセル:「データ分析」ツール、ワークシート関数 R:統計解析ソフトウェア Perl:プログラミング言語 BLAST:遺伝子配列解析ソフトウェア
来週までの予習 平均(各種の平均) 分散(ばらつき) グラフ(各種グラフ) ヒストグラム(頻度分布)
本日の課題 今日の授業を振り返って、「生物統計学」についてどういう印象を持ちましたか?