生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.

Slides:



Advertisements
Similar presentations
橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
Advertisements

の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。 (測定回数 n が増せばこの可能性は増 す。) 平均値 偶然誤差によ るばらつき v i は 測定値と平均値の差 で残差、 また、 σ は、標準誤差( Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
生物統計学・第 2 回 全体を眺める(1) 平均と分散、各種グラフ、ヒストグラム 2013 年 10 月 7 日 生命環境科学域 応用生命科学類 植物バイオサイエンス課程 尾形 善之.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
生物統計学・第 15 回 エラーを調べる -第一種の過誤、第二種の過誤、外れ値 - 2016 年 1 月 26 日 生命環境科学域 応用生命科学類 尾形 善之.
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
生物統計学・第 14 回 Perl を使いこなす インストール、プログラミング 2014 年 1 月 20 日 生命環境科学域 応用生命科学 類 尾形 善之.
統計学入門(1) 第 10 回 基本統計量:まとめ. 統計学第 8 回 2 前回の練習問題の解答 (1) から (4) に対応するヒストグラムはそれぞれどれか。
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
数理統計学  第9回 西山.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
統計学  第7回 西 山.
第1回 担当: 西山 統計学.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
生物統計学・第3回 全体を眺める(2) 主成分分析
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
データ解析基礎 4. 正規分布と相関係数 keyword 正規分布(教科書:31ページ~38ページ) 正規分布の性質 偏差値
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
3章 Analysing averages and frequencies (前半 p )
主成分分析                     結城  隆   .
生物統計学・第1回 統計解析を始める前に -妥当なデータかどうかを判断する-
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
生物統計学・第2回 注目要素を決める まず木を見る、各種グラフ、ウェブツール
看護研究における 統計の活用法 Part 3 京都府立医科大学 浅野 弘明 2012年11月10日 1.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
相関分析.
統計学 西 山.
中澤 港 統計学第4回 中澤 港
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
統計処理2  t検定・分散分析.
2019年1月22日 生命環境科学域 応用生命科学類 尾形 善之
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
2018年度 植物バイオサイエンス情報処理演習 第12回 次世代シーケンシング・RNA
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
数理統計学  第6回 西山.
プログラミング論 相関
数理統計学  第12回 西 山.
生物統計学・第14回 全体を眺める(6) -相関ネットワーク解析-
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
確率と統計 年1月7日(木) Version 3.
Presentation transcript:

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之

まず最初に円グラフ ……

先週のレポートから ★多かった意見 ♦ 主成分がまだ理解できない ♦ 負荷量がまだ分からない ♦ 得点と負荷量の関係が分からない ♦ 実際の解析例を見たい ♦ クラスター分析の使い分けが難しい ♦ 階層クラスターとヒートマップが見やすい ♦ クラスター分析の見方が分からない

負荷量: 実験条件のための指標 ★各成分 ♦ 絶対値が大きい 実験条件に注目 目盛は目安です ♦ 第 1 主成分 すべての実験条 件が「負」 – 注目遺伝子は 「正」 ○ に対応する実験 群は ? 成熟している組 織

得点: 遺伝子のための指標 ★ランダムとの比較 ♦ データに特徴があるかを確認 ★注目遺伝子 ♦ 主成分ごとに位置を確認 (今回は正) 目盛りはあくま で目安です At1g56650 得点=遺伝子の発現量(平均との差) × 各実験の負荷 量

今日のキーワード:分散 平均 ばらつ き

今日は「ばらつき」の話をし ます ★なぜばらつきを計算しないといけない のか?

ばらつきを計算する理由 ★平均値だけではデータ全体の様子が 分からない ★ばらつきを計算することで、データ が平均値の周りにどのくらいあるか 分かる

標準偏差と標準誤差 ★どちらも「ばらつき」を表す指標で す ★標準偏差 (SD) ♦ ばらつくことを表す ★標準誤差 (SE) ♦ ばらつかないことを表す

ばらつく! 標準偏差 ★右図は左図に比べてばらつきが大きい 比べるのが大 変

ばらつかない! 標準誤差 ★繰り返し実験がどの程度信頼できる か?

標本調査: N - 1 全数調査: N 標本調査: N - 1 全数調査: N 教科書から 標本調査とは … 例えば出口調査 全数調査とは … 例えば選挙結果 標本調査は、ばらつきが大きい

なんで 3 つも指標があるのか ★分散 ♦2 乗和で平均値からのずれを調べる ♦ 平均値との対応がもうひとつ( 2 乗サイズ) ★標準偏差 ♦2 乗和のルートを計算している ♦ 平均と対応できる(同サイズ) ★標準誤差 ♦ 標本数が増えると小さくなる ♦ 信頼が増す(いちおう同サイズ)

実際に計算してみると …… 2 乗サイズ 平均と同じサイ ズ 平均に ま あ 対応するサイ ズ

チェックポイント・ I 1. なぜばらつきを計算するのか? 2. ばらつきを表す 3 つの指標の使い分 け? 3. ばらつきを表す 3 つの指標の計算方 法?

標準偏差を使うとき ★ばらつきを見たいとき ♦ 平均値との対応 ★検定したいとき ♦ 正規分布や t 分布の利用

標準偏差と偏差値

標準偏差と平均値 平均値 標準偏差 2σ 95.4% 5% 危険率 3σ 99.7% 0.5% 危険率

チェックポイント・ II 4. 標準偏差と偏差値の関係? 5. 平均値と標準偏差を組み合わせた 便利な評価方法?

統計解析に入る前に・ 2 ★標準化は可能か ♦ 統計解析するためには「標準化」が必要 ♦ 計算尺 (「風立ちぬ」を見ましたか ? ) ♦ 単位を揃える

標準化 、今日は紹介だけ ★なぜ標準化するのか? ♦ 異なるデータを比較するため 平均値もばらつきも単位も異なることがある ★ふたつの標準化 ♦Z 化 これが最も代表的 ピアソン相関係数に繋がります ♦ 単位ベクトル化 特殊だが便利、実は皆さん知っているはず …… コサイン相関係数に繋がります

Z 化 、今日は簡単に

単位ベクトル化 、今日は簡単に

標準化と主成分分析 ★標準化をすることで、主成分分析に 変化が起こる! ♦ 良い変化になるか、よくない変化になるか ♦ 次回、説明します

チェックポイント・ III 6. ふたつの代表的な標準化とは? 7. 代表的な標準化の計算方法は?

今日の自習のポイント

次回までの予習 ★次回は「 t 検定、 U 検定」です ♦ 教科書 検定、 t 検定、帰無仮説 ウィルコクスンの順位和検定 マン・ホイットニーの検定 正規性、正規性の検定、正規確率紙 ♦ インターネット U 検定 「 t 検定」の名前の由来を調べてみてください

本日の課題 ★ある遺伝子の発現データに関して 1. 左右に対称な分布(パラメトリッ ク)の時の標準化について、「平 均」と「標準偏差」を用いて答えな さい。 2. データの標準化についての印象や疑 問点を書いてください。