生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-

Slides:



Advertisements
Similar presentations
M2B システム (Moodle/Mahara/BookLooper) の使い方. パスワード:<自分のパスワード> SSO-KID (数字10桁)は学生証の裏に パスワードを忘れた場合は、 から「パスワードを忘れた」を選択.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
情報処理入門A・B 第7回 ワープロソフト入門(2)
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
生物統計学・第3回 全体を眺める(2) 主成分分析
IT入門B2 (木曜日1限) 第一回 講義概要 2004年月9日30日.
コンピュータリテラシ (1) 学習目標(到達目標) ・計算機実習室を正しく利用できる。 ・文書作成ソフトの利用方法を学び、報告作成が
情報数理Ⅱ 平成27年9月30日 森田 彦.
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
湘南工科大学 2013年12月10日 プログラミング基礎1 湘南工科大学情報工学科 准教授 小林 学.
情報工学科 二宮 洋・鈴木 誠 小林 学・高畠俊徳 火曜日 1コマ目
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
地域社会論 第1回その1 授業の概要 10月2日.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
データベース設計 データベース設計 第0回 オリエンテーション 坂口利裕.
第9回:Microsoft Excel (1/2)
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
経営工学基礎演習a PowerPointの利用.
仮説実験授業 板倉聖宣氏が1963年に提唱した授業方法. 教師が質問(こんな実験をしたらどうなるか?) 主題の明確化. ↓
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
第10回:Microsoft Excel (2/2)
情報処理技法(リテラシ)I 第10回:Excel (1/2)
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
湘南工科大学 2013年10月22日 プログラミング基礎1 湘南工科大学情報工学科 准教授 小林 学.
電子計算機工学 Keiichi MIYAJIMA Computer Architecture
講義を行うにあたっての注意 講義は静かに行いたい 出席は取らない(自由に休んでよろしい) 大学と高校の違い 人や先生に聞く・質問すること
情報処理技法(リテラシ)II 第9回:Word (2/2) 産業技術大学院大学 情報アーキテクチャ専攻 助教  柴田 淳司.
植物系統分類学・第14回 分子系統学の基礎と実践
経済情報処理ガイダンス 50分用ガイダンス。時間があれば、後半ログオンして操作させる。 神奈川大学 経済学部.
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
統計学の授業でのセカンド モニタとしてのiPhoneの使用
情報処理基礎A・B 坂口利裕 横浜市立大学・商学部
第10回:Microsoft Excel (2/2)
期末レポートの内容 使うデータ 「biostat18finaldata.txt」 遺伝子発現データ
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
シミュレーション論 Ⅱ 第1回.
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
ガイダンス 電子計算機 電気工学科 山本昌志 1E
応用プロジェクト後半 第5回 (1/5) 担当:奥田・橋本
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
公 開 講 座 9月23日(土) やってみてわかる! 看護の質的研究 共催 高知県立大学 共催 高知県立大学 高知女子大学看護学会 第1回
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/04/13
情報技術演習Ⅰ 人文学研究のための情報技術入門 2015/04/09
情報数理Ⅱ 平成28年9月21日 森田 彦.
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
情報処理技法(リテラシ)II 第1回:オリエンテーション 産業技術大学院大学 情報アーキテクチャ専攻 助教  柴田 淳司 パソコンの基本操作.
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
2018年度 植物バイオサイエンス情報処理演習 第9回 公共データバンクの代謝パスウェイ情報
情報スキル活用 第1週    ガイダンス.
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る- 生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る- 2016年9月27日 生命環境科学域 応用生命科学類 尾形 善之

情報教育の流れ 1年次 前期 後期 2年次 前期 3年次 前期 情報基礎 統計学基礎I 統計学基礎II 生物統計学 生物物理化学実験 1年次 前期 後期 2年次 前期 3年次 前期 情報基礎 統計学基礎I 統計学基礎II 生物物理化学実験 (生命機能化学課程) 生物統計学 植物バイオサイエンス情報処理演習 (植物バイオサイエンス課程)

日程 第1回 9月27日 第9回 11月29日 第2回 10月4日 第10回 12月6日 第3回 10月11日 第11回 12月13日 第4回 10月18日 第12回 12月20日 第5回 10月25日 第13回 1月10日 第6回 11月1日 第14回 1月17日 第7回 11月8日 第15回 1月24日 第8回 11月15日 期末レポート 2月7日まで

授業の概要 宿題は出しません 当日レポートを出します 期末レポートを出します 評価点 ただし、期末レポートを進めていくことを勧めます 次のスライドで詳しく説明します 用紙を渡しておくので、毎週用意してください 期末レポートを出します 厳しめに評価します 評価点 平常点(5x15点)+期末レポート(25点)

当日レポート 毎回の講義の終わりに提出してください 出席を兼ねています 配点は基本的に3~5点です。 「チェックポイント」と「本日の課題」 チェックポイントを書かないと、遅刻扱いになる場合があります

当日レポートの注意事項・1 なるべく学生カードを出席管理システムの機械に通しておいてください。 レポートを後日に提出するときに、出席の証明になります。 やむを得ず欠席・遅刻する場合は、必ず届出をしてください。 電車の遅延:交通機関発行の遅延証明書の裏面に学籍番号と名前を書く。 欠席:欠席届を提出する。後日にレポートの提出も受け付ける。

当日レポートを後日に提出する 原則として、次回の前日の午前中まで受け付けます。 提出先 なるべく当日、提出してください!! 例えば、第1回は9月27日で、第2回は10月4日なので、第1回の当日レポートは、10月3日の午前中まで。 提出先 直接提出する場合:B11棟4階413号室、レポート入れ メールで提出する場合:レポート用紙のワードファイル なるべく当日、提出してください!!

期末レポート 注目した遺伝子について、次世代シーケンサーから得たRNA-Seq解析データを用いて、その機能や特徴について考察する。 詳しくは次回説明します。

授業の進め方 前回の復習 チェックポイント(必要に応じて) 今回の講義 チェックポイント(必ず) 今回の実習 本日の課題(必ず)

実習資料の入手先 「尾形ラボ」で検索 「生物統計学」のページに置いてあります 実習のときに、説明します 「OGATA LAB of New Site 1」 入ったページのアドレスの後ろに、「2016/」を追加 「尾形ラボ|生命環境科学研究科」 「授業」タブをクリック 「生物統計学」のページに置いてあります 実習のときに、説明します

チェックポイント・I 名前のふりがなを書いてください。 「統計解析」経験を説明してください。 「統計学基礎」を受講した人は、印象に残っている内容を書いてください。 それ以外の人は、これまでの統計解析または確率統計に関する体験を書いてください。

「木」を見て「森」を見てまた「木」を見る 「統計解析」とは なるべく「全体」を眺める(統べて計る) 木を見て森を見ず 「誰でも納得」させる(客観性) 「統計的に有意」 「妥当な」結論を導く 「木」を見て「森」を見てまた「木」を見る

「生物情報」を「統計解析」して「生物学的理解」に繋げる 生物統計学での実践的な解釈 「木」を見て「森」を見てまた「木」を見る 「まず木を見る」 注目する要素(遺伝子)を決める 「次に森を見る」 注目要素を含む要素全体を眺める 「また木を見る」 注目要素について妥当な解釈を加える 「生物情報」を「統計解析」して「生物学的理解」に繋げる

「生物情報」とは…… 生物から得られる各種情報 この講義では「遺伝子発現情報」を扱います 私が注目する遺伝子は「At1g56650」です たとえば、遺伝情報(遺伝子、交配、進化) この講義では「遺伝子発現情報」を扱います 私が注目する遺伝子は「At1g56650」です モデル植物であるシロイヌナズナの遺伝子の名前(遺伝子座)です。 次回、皆さんも注目遺伝子を選んでください!

統計解析に入る前に・1 妥当なデータか 元のデータにエラーが含まれている 生データは割と恣意的にいじりやすい 解析結果は変わる 生データは割と恣意的にいじりやすい 勝手にデータを省いてはダメ、もちろん加えてもダメ! 数値データになってしまうと、エラーを見つけにくい 統計的にエラー(ノイズ)を省くことはできる でも、もう一度データを見直してください!

統計解析に入る前に・2 標準化は可能か 統計解析するためには「標準化」が必要 単位を揃える 「センチメートル」と「インチ」…… 「メートル」と「ヤード」……

統計解析の補足・1 全体を眺める 統計指標をつける 全体をグラフ化する 地球温暖化? 代表値(例えば「平均」) 折れ線グラフ 棒グラフ 円グラフ 地球温暖化?

大阪は2度上がったが稚内は1度上昇 → 地球規模では? 統計解析の補足・2 大阪は2度上がったが稚内は1度上昇 → 地球規模では?

統計解析の補足・3 地球全体の気温変化 世界の年平均気温 (気象庁) 南極の気候変動 (Wikipedia)

統計解析の補足・4 みんなを納得させる 検定(テスト)する 「統計的有意」を「逆説的」に出す つまり、「逆の確率がすごく低い」ことを説明する t検定、U検定、ほかいろいろ

統計解析の補足・5 統計解析の結果から何が言えるか? 統計的有意は説明できた だから、「注目要素の生物学的な特徴は……と考えられる」とまで言う

本格的な統計解析の例 多変量解析 さまざまな生物現象を解明するために、多くの種類(実験)のデータを集める データ全部を纏めて解析 どのデータに注目するか データ全部を纏めて解析 どの方法を使えばいいのか

チェックポイント・II 生物統計学の実践的な手順を説明しなさい。 全体を眺める統計学的手法について説明しなさい。 みんなを納得させる統計学的手法について説明しなさい。

本日の実習 今日は主に動作確認を中心に進めます 今後利用していくソフトウェア 手順書に従って作業します エクセル:「データ分析」ツール、ワークシート関数 R:統計解析ソフトウェア

エクセルでの統計解析の参考書 ワークシート関数の使い方 エクセルの統計の初歩 エクセルの操作の初歩 Excel関数辞典(秀和システム)など 例文付きで分かりやすい エクセルの統計の初歩 Excelで学ぶ統計解析入門(オーム社)など あくまで一例です、どの入門書でもいいと思います エクセルの操作の初歩 よくわかるMicrosoft Office Excel 2007(富士通)など バージョンが一緒なら、どれでもいいと思います

でも実際の参考書は…… 多くの場合は、インターネットで調べます!

来週の予定 遺伝子発現データの紹介 さまざまなグラフ グラフ作成のウェブツール 注目遺伝子の決定

本日の課題 今日の授業を振り返って、「生物統計学」についてどういう印象を持ちましたか?