フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか

Slides:



Advertisements
Similar presentations
計測工学 - 測定の誤差と精度 2- 計測工学 2009 年 4 月 28 日 Ⅱ限目. 授業内容 2.1 数値計算における誤差 2.2 計算過程での誤差 2.3 測定の精度.
Advertisements

分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。 (測定回数 n が増せばこの可能性は増 す。) 平均値 偶然誤差によ るばらつき v i は 測定値と平均値の差 で残差、 また、 σ は、標準誤差( Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学  第9回 西山.
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
第4章補足 分散分析法入門 統計学 2010年度.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第1部 一元配置分散分析: 1つの条件による母平均の違いの検定 第2部: 2つの条件の組み合わせによる二元配置分散分析
分散分析マスターへの道.
推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
重回帰分析入門 経済データ解析 2009年度.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第5回(5/10) 授業の学習目標 1.1.5節 検定の前提とその適否について考えよう(テキスト輪読 p.10から p.11)
重回帰分析入門 経済データ解析 2011年度.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
本時の目標 標本調査の意味を知り、全数調査と標本調査の違いを理解する。
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
疫学(Epidemiology) 第4回 標本抽出法 誤差やバイアスの制御 中澤 港(内線1453)
確率・統計Ⅱ 第7回.
記 憶 管 理(2) オペレーティングシステム 第10回.
第4回講義(4/26)の学習目標 1.1.3節 2種類の過誤等の理解を深めよう 1.1.4節 効果量とは 1.1.5節 検定の前提とその適否
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
系統誤差への適切な対処 プリント「生物統計学_第11回実験計画法2013年」P5以降を予習しながら空所を埋めていきましょう.
因果関係3原則 2009年月曜日・3時限 社会理論と調査法.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
対応のあるデータの時のt検定 重さの測定値(g) 例:
週のスケジュールについて (1部、月の活動)
第3章 補足:パラメータが極小値に収束する例
寺尾 敦 青山学院大学社会情報学部 社会統計 第9回:実験計画法 寺尾 敦 青山学院大学社会情報学部
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
生物統計学・第2回 全体を眺める(1) 各種グラフ、ヒストグラム、分布
4章までのまとめ ー 計量経済学 ー.
システム工学実験 品質管理 第1週目 システム工学実験
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
第11回授業(12/11)の学習目標 第8章 分散分析 (ANOVA) の学習 分散分析の例からその目的を理解する 分散分析の各種のデザイン
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
再討論 狩野裕 (大阪大学人間科学部).
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
実習 実験の目的 現行と目標値の具体的数値を記す。 数値がわからなければ設定する。.
サンプリングと確率理論.
重回帰分析入門 (第5章補足) 統計学 2007年度.
統計現象 高嶋 隆一 6/26/2019.
Presentation transcript:

フィッシャーの三原則 実験につきまとう誤差をいかにして制御するか プリント「生物統計学_第10回分散分析その3 交互作用の解析・フィッシャーの三原則2013年」P9以降を予習しながら空所を埋めていきましょう. 実験にともなう「誤差」を評価し,かつ実験の精度を上げるために,分散分析の開発者でもあるR.A.フィッシャーは次の三原則を満足するように実験を計画しなければならないと提案しました.① 反復,② 無作為化,③ 局所管理の3つの原則です. 画面の図のように,反復によって,誤差の推定と誤差の減少ができます.無作為化によって誤差の推定ができます.局所管理によって誤差の減少ができます.誤差の推定は統計的推定や検定では必須の条件です.誤差の減少は統計的推定や検定の精度を高めます.したがって,反復と無作為化は実験には必須であり,局所管理も精度の向上のためには行うことが望ましいということになります. 実験につきまとう誤差をいかにして制御するか

1.反復 誤差の大きさを見積もる 誤差を小さくする 誤差を評価するためには1回だけの実験では不可能です.2回以上の実験をしなければ誤差の評価はできません.さらに反復の回数を増やせば,誤差をより正確に評価できるだけでなく,誤差自体を小さくすることができます.反復数が増えると,標本数が増えるから,標準誤差が小さくなるからです.

反復の数はいくらぐらい? 反復は誤差の自由度が6~20くらいが適当とされる エクセルの分散分析表では,グループ内誤差,誤差,あるいは繰り返し誤差とあるところの自由度のことである しかし,反復数を多くすればするほどよいとは限りません.同じ条件で繰り返した実験でないと反復ではありませんから,多数の実験を同じ条件ですることは困難になります.工業製品では同じ条件で多数の製品を作ることもできるかもしれませんが,農業では同じ条件をそろえること自体がなかなか難しくなります.したがって,現実的には反復数には限度があります.どのぐらいの反復数がよいかは,必要とする実験の精度によって決まるから一概にはいえません.一般には誤差の自由度は6~20が適当とされます.(誤差の自由度とは分散分析における誤差の自由度のことです).

反復とは? 1 2 3 4 5 同じポットの5株は反復か? 1 2 3 4 5 ポットを変えれば反復なのか? 1  2  3  4  5 同じポットの5株は反復か? 1 2 3 4 5 反復とは実験を繰り返すことなので,実験を繰り返したとは認められないものは反復とはいえません.例えば,同じポットに植わっている5つの植物を5反復とするのは間違いです.反復は実験を繰り返すことによって得られますから,反復1の実験と反復2の実験とは独立しているはずであり,同じポットに植わっている植物はそれぞれに影響し合うから反復とはみなせません.同じポットでは植物は複数あるけれども,それが植わっている土壌は1つしかありません(土壌分析データは反復がない).でもポットを変えれば反復なのかというとそれはそうとは限りません.そもそも近づけすぎたポットではお互いに影響して,反復とはいいがたくなります.判断が分かれるのは同じ1室の人工気象室に5つのポットを入れた場合,これを反復と見なすかです.アメリカでは同じ1室の人工気象室にポットを複数入れても反復とは見なさないのがふつうです.ヨーロッパはそこまで厳しくない傾向にあり,日本はもっと甘いです. ポットを変えれば反復なのか?

2.無作為化 系統誤差を偶然誤差に転化する 実験をランダムに割り当てることによって,系統誤差はランダムに各処理に割り当てられることになり,偶然誤差に転化できる 真の値はわからないから,系統誤差はそのままでは評価できない.系統誤差は偏りのある誤差だから,効果と区別できないからである(交絡するという) 実験の場は,系統誤差が影響を及ぼさないように全体をできるだけ均一にしなければなりません.しかし,現実には必ずしもそれが可能とは限りません.例えば,圃場実験では圃場のすべてにおいて地力,温度,水などを全く均等にするというわけにはいきません.このような偏りや癖を持って現れる誤差を系統誤差を完全に除去することは不可能で.さらにすべての系統誤差の原因を把握することも不可能です.つまりいくら注意深い実験をしても,未知の系統誤差が潜んでいる可能性を排除することはできません. 実験配置を無作為に行うことによって,このような系統誤差を偶然誤差に転化させることを無作為化といいます.無作為化するには,さいころ,乱数サイ,乱数表,パソコンの乱数関数などが使えます.どんな実験でも無作為化は基本です. フィッシャーの三原則のうち,反復と無作為化を行ったものを完全無作為化法とよぶ(次回,学習する). 系統誤差のうち,どこに原因があるかをわかっているものは次の局所管理で除去するのが望ましい

無作為化の例 月曜日 火曜日 石臼挽きのそば 水曜日 木曜日 そうでないそば 金曜日 土曜日 日曜日 そば屋の例で無作為化を考えてみましょう.曜日によって,客数が違うことを知らないとしても,処理を無作為に(ランダムに)割り当てることによって,曜日による影響を偶然誤差(つまりさいころのせい)にすることができます.こういうとなんかごまかしのように感じるかもしれません.しかし,このようなくじびきあるいはさいころによって,曜日を割り当てる回数を増やしていけば,石臼挽きのそばもそうでないそばもそのうち均等に曜日が当たるようになるはずです.無作為化とはこのようにして,曜日の影響を少なくしてやる方法です. 無作為化は,系統誤差の原因がわかっていない場合でも有効ですし,もしわかっていても対処しようがない,対処しにくい系統誤差の場合でも有効です.実験ではすべての系統誤差を把握できませんので,無作為化は必ず行わなければなりません.

3.局所管理  実験の場全体を均一にはできなくても,その一部を均一にすることは可能である.反復数を増やして誤差を減らそうとすると,反復を増やした結果,実験全体を均一にできないためにかえって誤差が増える可能性がある.この場合,反復数を増やすときに各反復をその中の均一にした部分(かたまり,ブロック)に当てることで,系統誤差を除去することができる 実験の場全体を均一にはできなくても,その一部を均一にすることは可能です.反復数を増やして誤差を減らそうとすると,反復を増やした結果,実験全体を均一にできないためにかえって誤差が増える可能性があります.この場合,反復数を増やすときに各反復をその中の均一にした部分(かたまり,ブロック)に当てることで,系統誤差を除去することができます. 無作為化は実験の場にある系統誤差を偶然誤差にすることによって,測定の精度を高める方法ですが,局所管理はさらにそれより強力であり,実験の場にある系統誤差をブロックの差にすることによって,処理間差から消去することによって,測定の精度を高める方法です.

局所管理の例 月曜日 火曜日 石臼挽きのそば 水曜日 木曜日 そうでないそば 金曜日 土曜日 日曜日 そば屋の例で局所管理を考えてみましょう.土曜日,日曜日の週末と月曜日から金曜日までの平日の2つは客数が違うということがわかっているならば,それを利用して,系統誤差を除去することができます. つまり土曜日と日曜日を1つのブロックにして,その中に石臼挽きのそばとそうでないそばを1つずつ割り当て,平日を1つのブロックにして,その中に石臼挽きのそばとそうでないそばを1つずつ割り当てます.こうすることで曜日による系統誤差を小さくすることができます.なおブロック内では無作為に割り当てます.土曜日と日曜日で少しは差があるかもしれませんから,それを無作為化によって偶然誤差に転化するのです. フィッシャーの三原則に基づく実験計画については次回の授業で詳しく扱います.