生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-

Slides:



Advertisements
Similar presentations
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
Advertisements

生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
特殊講義(経済理論) B 初級ミクロ経済学 第 1 回 古川徹也 研究室 1号館 714 HP : 2015/09/25 特殊講義(経済理論) B/ 初級ミクロ経 済学 1.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
統計学入門(1) 第 10 回 基本統計量:まとめ. 統計学第 8 回 2 前回の練習問題の解答 (1) から (4) に対応するヒストグラムはそれぞれどれか。
初級ミクロ経済学 第 1 回 (週2回講義,月3,金1) 古川徹也 研究室 1号館 714 HP : 2014/9/22 経済学入門 B/ ミクロ経済学基礎 1.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計解析 第7回 第6章 離散確率分布.
第1回 担当: 西山 統計学.
月曜3限 1132教室 担当者: 河田 正樹 年度 経済データ解析講義内容 月曜3限  1132教室 担当者: 河田 正樹
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
心理学測定法 水曜2限 担当:小平英治.
生物統計学・第3回 全体を眺める(2) 主成分分析
有機化学基礎II 担当:超分子化学講座 伊藤(智)
IT入門B2 (木曜日1限) 第一回 講義概要 2004年月9日30日.
統計学 オリエンテーション   担当: 西山.
情報数理Ⅱ 平成27年9月30日 森田 彦.
母分散が既知あるいは大標本の 平均に関する統計的検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
メディア学部 2011年9月29日(木) 担当教員:亀田弘之
数理統計学 第11回 西 山.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
第9回:Microsoft Excel (1/2)
統計学の基礎と応用 張 南   今日の話:序   論          履修の注意事項.
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
2016年度 植物バイオサイエンス情報処理演習 第13回 情報解析(6) エクセルVBAによる遺伝子機能解析
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
第10回:Microsoft Excel (2/2)
生物統計学・第1回 統計解析を始める前に -木を見て森を見てまた木を見る-
データからいろんなことを学ぼう! このスライドでは、順に、こんなことを説明します。 「データ」って、どんなもの? 「データ」を集めてみよう
2017年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2018年度 植物バイオサイエンス情報処理演習 第5回 公共データバンクの遺伝子情報
2017年度 植物バイオサイエンス情報処理演習 第1回 情報検索(1) ビッグデータを眺める
植物系統分類学・第15回 比較ゲノミクスの基礎と実践
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
2016年度 植物バイオサイエンス情報処理演習 第6回 情報処理(4) データを加工する・2
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
情報処理技法(リテラシ)II 第9回:Word (2/2) 産業技術大学院大学 情報アーキテクチャ専攻 助教  柴田 淳司.
数理統計学 オリエンテーション   担当: 西山.
植物系統分類学・第14回 分子系統学の基礎と実践
2018年度 植物バイオサイエンス情報処理演習 第12回 情報解析(2) 配列相同性解析・DNA
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
確率と統計2009 第12日目(A).
情報処理基礎A・B 坂口利裕 横浜市立大学・商学部
第10回:Microsoft Excel (2/2)
1.因子分析とは 2.因子分析を行う前に確認すべきこと 3.因子分析の手順 4.因子分析後の分析 5.参考文献 6.課題11
2017年度 植物バイオサイエンス情報処理演習 第11回 系統樹
岡村耕二 情報ネットワーク 岡村耕二 情報ネットワーク.
2018年度 植物バイオサイエンス情報処理演習 第13回 メタゲノミクス
統計学  第9回 西 山.
メディア学部 2010年9月30日(木) 担当教員:亀田弘之
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
情報技術演習Ⅰ 人文学研究のための情報技術入門 2017/04/13
情報数理Ⅱ 平成28年9月21日 森田 彦.
平成23年12月22日(木) No.9 東京工科大学 担当:亀田弘之
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
2018年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
2019年度 植物バイオサイエンス情報処理演習 第1回 ビッグデータを眺める
Presentation transcript:

生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する- 生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する- 2014年9月30日 生命環境科学域 応用生命科学類 尾形 善之

授業の概要 宿題は出しません 当日レポートを出します 期末テストをやります 評価点 次のスライドで詳しく説明します 用紙を渡しておくので、毎週用意してください 期末テストをやります 実習形式のテストを予定しています 評価点 平常点(5x15点)、期末テスト(25点)

当日レポート 毎回の講義の終わりに提出してください 出席を兼ねています 「チェックポイント」と「本日の課題」 チェックポイントを書かないと、遅刻扱いになる場合があります

授業の進め方 前回の復習 チェックポイント(必要に応じて) 今回の講義 チェックポイント(必ず) 今回の実習 本日の課題(必ず)

予習と復習 予習 復習 次回の内容の方法について参考書やインターネットなどで調べておいてください 研究室HPで復習用の材料を提供します URL http://www.plant.osakafu-u.ac.jp/~ogata/2014/seibutsutokei/ 授業のパワポも提供します リンクも貼っておきますので、活用してください 例えば、NCBI

統計解析について学ぶこと 技術について学びます 精神について学びます 目的によって、さまざまな方法があります 「検定」や「多変量解析」など と言っても、根性や気合いの話ではありません 統計解析で「言えること」と「言えないこと」

統計解析の精神 「絶対」とは言えないが「かなり」とは言える 警察の犯人逮捕に喩えると…… 「動かぬ証拠」は見つけられない 「信頼できる状況証拠」を集められる これを「統計的に有意」と言います

「統計解析」とは なるべく「全体」を眺める(統べて計る) 「誰でも納得」させる(客観性) 木を見て森を見ず 「統計的に有意」 全体を眺めてみて何か意味があることが分かる

チェックポイント・I 皆さんの名前のふりがなを書いてください。 皆さんの「確率・統計」体験を説明してください。 皆さんの「統計解析」経験を説明してください。 第4問 1 から9 までの数字が1 つずつ書かれた9 枚の□□□から5 枚の□□□を同時に取り出す。このような□□□の取り出し方はアイウ通りある。 (1) 取り出した5 枚の□□□の中に5 と書かれた□□□がある取り出し方は エオ 通りであり, 5 と書かれた□□□がない取り出し方は カキ 通りである……… 統計学基礎I、II

「生物統計学」とは 「生物学」+「統計学」 「生物情報解析」 「生物データを使って統計解析」…… それだと、実際に習うのは「統計学」 「生物情報」+「統計解析」 「バイオデータサイエンス」に繋がる 「生物情報」を「統計解析」して「生物学的理解」に繋げる 「木」を見て「森」を見てまた「木」を見る

「生物情報」とは 生物から得られる各種情報 今回は「遺伝子情報」を扱います 注目するのは「At1g56650」です たとえば、遺伝情報 遺伝子、交配、進化 今回は「遺伝子情報」を扱います 研究室HPで練習データを提供していきます 注目するのは「At1g56650」です モデル植物シロイヌナズナの遺伝子の名前(遺伝子座)です。

統計解析に入る前に・1 妥当なデータか 元のデータにエラーが含まれている 生データは割と恣意的にいじれてしまう 解析結果は変わる 生データは割と恣意的にいじれてしまう 勝手にデータを省いてはダメ 数値データからはエラーを見つけにくい 統計的にエラー(ノイズ)を省くことはできる でも、もう一度データを見直してください

統計解析に入る前に・2 標準化は可能か 統計解析するためには「標準化」が必要 単位を揃える

統計解析の第一歩・1 全体を眺める 統計指標をつける 代表値(例えば「平均」) 全体をグラフ化する 折れ線グラフ 棒グラフ

統計解析の第一歩・2 みんなを納得させる 検定(テスト)する 実際に飛ばしてみる 「統計的有意」を出す t検定、U検定、ほかいろいろ うまくいかないことも多い

本格的な統計解析 多変量解析 生物現象を解明するためには、多くの種類のデータを集める データ全部を纏めて解析 中には必要のないデータも含まれているかも どのデータに注目していいのか データ全部を纏めて解析 どの方法を使えばいいのか

チェックポイント・II 全体を眺める統計学的手法について説明しなさい みんなを納得させる統計学的手法について説明しなさい。

実習 今日は主に動作確認を中心に進めます 今後利用するソフトウェア エクセル:「データ分析」ツール、ワークシート関数 R:統計解析ソフトウェア Perl:プログラミング言語 BLAST:遺伝子配列解析ソフトウェア

来週までの予習 平均(各種の平均) 分散(ばらつき) グラフ(各種グラフ) ヒストグラム(頻度分布)

本日の課題 今日の授業を振り返って、「生物統計学」についてどういう印象を持ちましたか?