系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう.

Slides:



Advertisements
Similar presentations
分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
Advertisements

授業展開#12 コンピュータの扱いにくい問 題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣 を比較するためには、標準的なコン ピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモ デルとして、チューリングマシンを考え、
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
シミュレーション論Ⅰ 第 7 回 待ち行列のシミュレーション(2). 第 6 回のレポート(解答例) 乱数表より乱数を記入し、到着間隔・サービス時間にした がってグラフを作成する 例) 最大待ち人数:2人 最大待ち時間:5分 平均待ち時間:3分.
初年次セミナー 第13回 2次元グラフィックス(1).
数理統計学  第9回 西山.
初年次セミナー 第8回 データの入力.
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
プログラミング入門 電卓番外編 ~エクセルで関数表示~.
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか
分散分析マスターへの道.
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
ファーストイヤー・セミナーⅡ 第8回 データの入力.
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:1要因被験者内デザイン 寺尾 敦 青山学院大学社会情報学部
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
疫学概論 無作為化比較対照試験 Lesson 14. 無作為化臨床試験 §A. 無作為化比較対照試験 S.Harano,MD,PhD,MPH.
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
母分散が既知あるいは大標本の 平均に関する統計的検定
第6章 2重ループ&配列 2重ループと配列をやります.
シミュレーション物理7 乱数.
システム開発実験No.7        解 説       “論理式の簡略化方法”.
1時限で理解する 統計の基礎 応用情報処理II 2015/12/4 講師:新居雅行.
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
対応のあるデータの時のt検定 重さの測定値(g) 例:
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
社会統計学Ic・統計科学I 第六回 ~仮説検証~
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
第4日目第1時限の学習目標 3つ以上の平均値の差の検定(分散分析)の概要を知る。 (1)分散分析の例を知る。
Android端末によるロボット制御とその評価
システム工学実験 品質管理 第1週目 システム工学実験
Rコマンダーで2元配置ANOVA 「理学療法」Vol28(8)のデータ
寺尾 敦 青山学院大学社会情報学部 エクセルでの正規分布の グラフの描き方 寺尾 敦 青山学院大学社会情報学部
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
アルゴリズムとプログラミング (Algorithms and Programming)
席替えシュミレーション.
統計処理2  t検定・分散分析.
生物統計学・第3回 全体を眺める(2) クラスタリング、ヒートマップ
確率と統計2009 第12日目(A).
第12回授業(12/18)の目標 ANOVA検定の実習 WEB を用いたANOVA検定と、授業で行った検定結果の正誤の確認方法(宿題)
コンピュータにログイン 第1章 コンピュータにログイン 啓林館 情報A最新版 (p.6-13)
コンパイラ 2011年10月20日
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
ベイズ最適化 Bayesian Optimization BO
シミュレーション論Ⅰ 第7回 シミュレーションの構築と実施.
データ構造とアルゴリズム (第5回) 静岡大学工学部 安藤和敏
数理統計学 西 山.
本時のねらい 「合同な三角形の作図を通して三角形の合同条件を導き、それを理解する。」
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
実習 実験の目的 現行と目標値の具体的数値を記す。 数値がわからなければ設定する。.
要因Aの差,要因Bの差を見たい 2つの要因なので二元配置分散分析の適用 要因B 水準A 水準B 水準C 要因A 水準a
2つの変量間の関係を知る 1.水稲の収量に関連のある生育指標を知りたい 2.トマトの糖度は施肥量によってどのように変化するかを知りたい
Presentation transcript:

系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう. 前回の授業でも学んだように右図のような測定結果が得られた場合,大きな系統誤差を含むBとDの場合は,系統誤差のために測定回数を増やしても真の値には近づきません.統計解析では系統誤差を実験の処理による効果と見分けることができませんから,系統誤差に対して,適切に対処しないと実験結果を正しく解釈できません. そこで,フィッシャーの三原則のうち,無作為化と局所管理によってこのような系統誤差に対して適切に対応する必要があります.

りんごで実験をする りんごの違い(重さ,大きさ,果皮の色,熟度など)を無作為化によって偶然誤差に転化する 無作為化とはランダムに実験の処理を割り付けることです.一見,簡単そうに思える無作為化です.けれども,実はそんなに簡単なことではありません. 例えばりんご15個を3つにわけて,3段階の温度処理(20℃,25℃,30℃)×5反復の実験をして,温度がエチレン発生量に及ぼす影響を調べる実験を計画するとしましょう. りんごによって,重さ,大きさ,果皮の色,熟度などいろいろな要因が異なっています.それらはエチレン発生量を変化させる要因になるかもしれませんから,エチレン発生量の系統誤差の原因となります.しかし,重さ,大きさを完全に揃えたりんごを準備することは不可能ですから,重さ,大きさが少しは異なるりんごを15個集めて実験するしかありません.この場合,重さや大きさのちがいによる系統誤差は無作為化によって,偶然誤差に転化しないと,統計解析できません. りんごの違い(重さ,大きさ,果皮の色,熟度など)を無作為化によって偶然誤差に転化する

ランダムにりんごをわりつける 20℃ 20℃ 25℃ 30℃ 25℃ 30℃ 20℃ 30℃ 20℃ 30℃ 20℃ 25℃ 25℃ 30℃ ではりんごを適当にとって,3つの温度処理に分ければよいと思うかもしれません.しかし,人間の無意識の好みによって,先に大きいりんごを,あるいは赤いりんごを,あるいは軽いりんごを取る人がいるかもしれません.適当に取れば無作為化するとは限らないのです.自分自身も知らない癖が系統誤差の結果になる可能性は決して否定できないのです.したがって,乱数表を使う,エクセルの乱数関数(=randbetweenあるいは=rand)を使うなどの方法でりんごを無作為化しなければなりません. 25℃ 25℃ 30℃ 25℃ 乱数表などでランダムに処理をわりつける

=randbetweenによる無作為化 3は6回目なので無視して飛ばす あとは2しかないからこれで終わり =randbetween関数は=randbetween(a,b)とすると整数a以上整数b以下の数値をaからbのどの整数も同じ確率でランダムに出力する関数です.=randbetween(1,6)はさいころということになります. 20℃区を1,25℃区を2,30℃区を3と決めましょう.そうすれば=randbetween(1,3)とすると1,2,3の3つの数字のどれかをランダムに出力します.りんごをそうして各処理に割り付けることが,画面のようにできます.なお先にどれかの処理に5つの処理が当たれば,それ以降はいっぱいになった数字は無視して飛ばしてやればよいのです. 画面ではりんごの13回目で3が6回目なので,これは無視します.さらにりんご15回目で1も6回目ですが,あとは2しかいらないので,終わりです.あるいはりんご12で実は1と3は5回目がでたので,ここで終わりにして,のこり3つは全部2をわりあててよいのです.3つ続くからランダムじゃないということではありません. これ以外の方法に=rand関数,=rank関数,=mod関数を組み合わせる方法もあります.この方法だと飛ばす必要はなくなります.エクセルファイルに例があるので,興味がある人は見てください.   あとは2しかないからこれで終わり

ガラス室にポットを置く 次にポット実験でA,B,C3つのイネの品種をポットに移植し,ガラス温室内で実験することを考えてみましょう. この場合,ポットによって,大きさ,土の養分なども微妙に異なります.しかもポットを置く場所によって,ガラス室内における日当たり,風,温度のむら,ばらつきも系統誤差の原因となります.したがって,どのポットに植えるかをランダムに決めなければいけません. ポットの違い(重さ,土など)だけでなく,ガラス室の場所による違い(日当たり,風,温度のむら)なども系統誤差の原因となる

ガラス室に規則的にポットを置くと A B C A B C A B C A B C A B C しかし,調査が面倒だからと画面のように品種を整然と並べる研究者はけっこういます.しかし,このような並べ方をすると系統誤差を無作為化できません.ガラス室の場所による違い(日当たり,風,温度のむら)などが系統誤差を引き起こすからです. このようなむらを減らす方法として,定期的にポットをローテーションして移動する方法もあります.しかし,まずは無作為化が基本です.無作為化した上でポットを規則的にローテーション移動する(一種の局所管理)とさらに系統誤差は小さくなります. ガラス室の場所による違い(日当たり,風,温度のむら)などが系統誤差を引き起こす

ガラス室にポットを置く それでは予習問題をやってみましょう. ではポットに3つの品種,A,B,Cをランダムに割り振ってみましょう. 予習は「生物統計学第10回宿題と第11回のための予習2013 」の提出用タブ欄問4に入力して提出してください. ポットの違い(重さ,土など)だけでなく,ガラス室の場所による違い(日当たり,風,温度のむら)なども系統誤差の原因となる

完全無作為化法 豚番号 1 2 3 4 5 6 7 8 9 10 11 12 乱数 5 3 1 12 7 2 9 8 4 6 11 10 処理 B A C 12頭の子豚(体重順に1~12番)に3種類(A,B,C)の餌を与える処理について,フィッシャーの三原則を適用してみましょう.完全無作為化法では12頭にランダムにA,B,Cを割り当てます.先ほどのりんごやポットと同じように乱数を使って,例えば画面の表のようになったとしましょう. このような完全無作為法で得られたデータは一元配置の分散分析で処理間に差があるのかを検定できます.完全無作為化法による二元配置ももちろん可能です).さきほどりんごやガラス室のポットに処理を配置した方法も完全無作為化法によるものです. フィッシャーの3原則のうち,反復と無作為化を満たす実験計画

乱塊法 ブロック 1 2 3 4 豚番号 5 6 7 8 9 10 11 12 乱数 3 2 1 処理 C B A 系統誤差の原因をブロック間の差として除去するのが乱塊法である しかし,事前に子豚の体重がわかっており,さらに餌の効果は体重によって異なることもわかっているなら,体重の近いものを1つにまとめて,そのブロック内でA,B,Cを1つずつ割り当てた方が精度が向上します.すなわち体重順にブロック1(1~3),ブロック2(4~6),ブロック3(7~9),ブロック4(10~12)とし,各ブロック内ではランダムにA,B,Cを割り当てます. このように局所管理された(ここでは体重をなるべく同じになるように局所管理した)ブロックを作り,ブロック因子以外の系統誤差を偶然誤差に転化するためにブロック内では無作為に配置する方法を乱塊法といいます. フィッシャーの3原則をすべて満たすもっとも基本的な実験計画

完全無作為化法から乱塊法の例 品種A~Eの水稲品種試験,3反復 E A B D B E C D E C D C B A A それではいくつかの例で完全無作為化法による実験配置を乱塊法による実験配置にした例をみていきましょう. 水田に品種A~Eの5品種を比較する試験を3反復でおこなうとしましょう.3反復×5品種なので,15の試験区を準備し, そこに無作為に(ランダムに)品種を配置します.例えば画面のように品種を配置することになったとしましょう. D C B A A

乱塊法の例(水田試験) ブロック1~3,品種A~Eの水稲品種試験 1 B C D A E 地力の高低 ブロック 2 D E B A C 3 しかし,水田の地力の高低が画面右の矢印のようになっていることがわかっていて,それが水稲収量に影響することがわかっていたら,力の高い上をブロック1,低い下をブロック3,真ん中をブロック2として,それぞれのブロックに品種A~Eを1回ずつ割り当てることによって精度を向上させることができます.こうすると画面のように実験を配置することができます. 3 A E C D B 位置の違い(空間的差異)がブロックになる場合

ガラス室にポットを置く ブロック1 ブロック2 ブロック3 ブロック4 ブロック5 北 南 それでは予習問題をやってみましょう. 先ほどのポット実験でA,B,C3つのイネの品種をポットに移植し,ガラス温室内で実験することを考えてみよう.ガラス室は南北に長く,ポットを置くと,南北で生育にむらがあることがわかっているとしたら,南北にブロック化したら,系統誤差をブロック間差として消去できるようになる. それでは予習問題として,ポットに3つの品種,A,B,Cを乱塊法に基づいて割り振ってみよう. 予習は「生物統計学第10回宿題と第11回のための予習2013 」の提出用タブ欄問5に入力して提出してください. 北 南

乱塊法の分散分析 水稲5品種の収量(kg/10a)を比較する実験を行った 4ブロックある乱塊法で実験を配置した 乱塊法での分散分析は二元配置と同じように行えます.二元配置の因子の一つがブロック因子である(残りひとつは制御因子)と考えればよいのです.ただし,ブロック因子は制御因子や標示因子と交互作用があってはいけません.もしそのような因子をブロック因子としてしまったなら,その因子は標示因子あるいは層別因子として実験をやり直すべきでしょう. さて,画面のようなデータ,5品種の水稲の収量実験(kg/10a)について,乱塊法での分散分析を行ってみましょう. 水稲5品種の収量(kg/10a)を比較する実験を行った 4ブロックある乱塊法で実験を配置した

一元配置の分散分析では もし乱塊法を採用しないで,単に一元配置の分散分析を行うと画面のような分散分析表となり,p値は0.080となって処理の効果が5%の有意水準では認められませんでした.

乱塊法の分散分析 列(品種)のp値は0.029 品種によって収量は変わる しかし,乱塊法であるので,繰り返しのない二元配置の分散分析をすれば画面の表のような結果となります.分散分析の結果から,処理間に5%の有意水準で有意差が認められました.さらにブロック間にも5%の有意水準で有意差がありましたので,ブロックにすることで実験の系統誤差をブロック間の差として,誤差から除去でき,実験精度が向上したことがわかります.