推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした.

Slides:



Advertisements
Similar presentations
計測工学 - 測定の誤差と精度 2- 計測工学 2009 年 4 月 28 日 Ⅱ限目. 授業内容 2.1 数値計算における誤差 2.2 計算過程での誤差 2.3 測定の精度.
Advertisements

分散分析と誤差の制御 実験結果からできるだけ多くの情報を取り出すために 分散分析を利用する 主効果の大きさ 交互作用の大きさ 誤差の大きさ 採用した因子の効果の有無 の検定には,誤差の大きさ と比較するので誤差を小さ くできれば分散分析での検 出力が高まる どのようにしたら誤差を小さくできるか?
母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
数理統計学 西 山. 前回のポイント<ルート N の法則> 1. データ(サンプル)の合計値 正規分布をあてはめる ルート N をかけて標準偏差を求める 2. データ(サンプル)の平均値 正規分布を当てはめる 定理8がポイント ルート N で割って標準偏差を求める.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
の範囲に、 “ 真の値 ” が入っている可能性が約 60% 以上ある事を意味する。 (測定回数 n が増せばこの可能性は増 す。) 平均値 偶然誤差によ るばらつき v i は 測定値と平均値の差 で残差、 また、 σ は、標準誤差( Standard Error, SE ) もしくは、平均値の標準偏差、平均値の平均二乗.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
生物統計学・第 4 回 比べる準備をする 平均、分散、標準偏差、標準誤差、標準 化 2015 年 10 月 20 日 生命環境科学域 応用生命科学類 尾形 善之.
ヒストグラム5品種 松江城 出雲大社 石見銀山 三瓶山 アクアス しかしグラフで比較するのはめんどうなところがある 端的に1つの数字(代表値)で品種の特徴を表したい.
統計学 西山. 標本分布と推定 標準誤差 【例題】 ○○ 率の推 定 ある人気ドラマをみたかどうかを、 100 人のサンプルに対して質問したところ、 40 人の人が「みた」と答えた。社会全体 では、何%程度の人がこのドラマを見た だろうか。 信頼係数は95%で答えてください。
数理統計学 西 山. 前回の問題 ある高校の 1 年生からランダムに 5 名を選 んで 50 メートル走の記録をとると、 、 、 、 、 だった。学年全体の平均を推定しなさい. 信頼係数は90%とする。 当分、 は元の分散と一致 していると仮定する.
数理統計学 西 山. 推定には手順がある 信頼係数を決める 標準誤差を求める ← 定理8 標準値の何倍の誤差を考慮するか  95 %信頼区間なら、概ね ±2 以内  68 %信頼区間なら、標準誤差以 内 教科書: 151 ~ 156 ペー ジ.
統計学 西山. 平均と分散の標本分布 指定した値は μ = 170 、 σ 2 = 10 2 、データ数は 5 個で反復 不偏性 母分散に対して バイアスを含む 正規分布カイ二乗分布.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
MS-EXCEL、 OpenCalcを 用いた表計算
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
みかけの相関関係 1:時系列 2つの変数に本来関係がないのに,データだけから相関係数を計算すると相関係数がかなり大きくなることがある.
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
統計学  第7回 西 山.
第1回 担当: 西山 統計学.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計的推定と検定 推定: 統計的に標本の統計量から母集団の母数(母平均・母標準偏差など)を推測することを統計的推定という 検定:
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
統計的仮説検定 治験データから判断する際の過誤 検定結果 真実 仮説Hoを採用 仮説Hoを棄却 第一種の過誤(α) (アワテモノの誤り)
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
流れ(3時間分) 1 ちらばりは必要か? 2 分散・標準偏差の意味 3 計算演習(例題と問題) 4 実験1(きれいな山型の性質を知ろう)
繰り返しのない二元配置の分散分析 データの値は,それぞれ偶然誤差による変動と処理の効果による変動とが重なってできている.
統計的推論 正規分布,二項分布などを仮定 検定 統計から行う推論には統計的( )と統計的( )がある 推定
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
カイ二乗検定の応用 カイ二乗検定はメンデル遺伝の分離比や計数(比率)データの標本(群)の差の検定にも利用できる 自由度
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学 第3回 10/11 担当:鈴木智也.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
二項分布 大きさ の標本で,事象Eの起こる確率を とするとき, そのうち 個にEが起こる確率 は二項分布に従う 例
対応のあるデータの時のt検定 重さの測定値(g) 例:
数理統計学 第11回 西 山.
データのバラツキの測度 レンジと四分位偏差 分散と標準偏差 変動係数.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
繰り返しのない二元配置の例 ヤギに与えると成長がよくなる4種類の薬(A~D,対照区)とふだんの餌の組み合わせ
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
代表値とは 散布度とは 分布のパラメータ 母集団とサンプル
第3章 統計的推定 (その1) 統計学 2006年度.
統計学 西 山.
中澤 港 統計学第4回 中澤 港
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
数理統計学 西 山.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
統計学  第9回 西 山.
数理統計学 西 山.
推定と予測の違い 池の魚の体重の母平均を知りたい→推定 池の魚を無作為に10匹抽出して調査 次に釣り上げる魚の体重を知りたい→予測
多重検定(多重比較) ハムスターの成長をよくする餌(ひまわり,大豆,人工餌)のうち,どれが効果があるかあるいはないかを比較したい.したがって,ひまわり,大豆,人工餌の3つを比較することになる プリント「生物統計学_第8回分散分析その1 一元配置2013年」P10以降を予習しながら空所を埋めていきましょう.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

推定の精度 例: 宍道湖に生育するある魚が今回の大水害でどのような影響を 受けたかを明らかにするために,魚を捕獲して調査しようとした. 湖の魚を一部,標本として捕獲 さて何匹捕獲したら精度が保証できるのか? ここでは統計を使って統計的推定をするときに精度を示す指標の1つである標準誤差について学びます.標準誤差は実験データの表示にはよく使われる指標です.例として,宍道湖に生育するある魚が今回の大水害でどのような影響を受けたかを明らかにするために,魚を捕獲して調査しようとしたというケースを考えてみましょう.調査するには湖から魚を無作為に捕獲して調査することになります.さて何匹捕獲したら精度が保証できでしょうか?

どちらが正確な標本調査か? S県は宍道湖に生息するある魚の平均体重を調査することを3つの会社に依頼した A社は3匹で B社は20匹で C社は100匹で 平均体重を推定しようとした 平均をいちばん精度よく推定する会社はどれでしょうか? S県は宍道湖に生息するある魚の平均体重を調査することを3つの会社に依頼しました. A社は3匹で,B社は20匹で,C社は100匹で湖の魚の平均体重を推定しようとしました 平均をいちばん精度よく推定する会社はどれでしょうか?これはいちばん多くの魚を調べたC社です. さて,数が少ないからA社の調査はだめだとS県の担当者がいうと,しかし,A社は抗議した.精度が低いという証拠があるのか!!! 逆ギレといわれそうですが,証拠を出せというので,担当者が100匹をC社は調べたというと,A社は湖の魚は百万匹いるだろう.1万匹以上調べれば,全体の1%調べるからそこそこの精度があるかもしれない. しかし,1万匹に比べれば3匹も100匹も数百万匹いる母集団に比べれば,ほとんど調べてないに等しい.どこに違いがあるのか?というのです.A社の精度はだからC社とほとんど同じだと主張します. 実際は標本と母集団の比率は標本の精度にはほとんど影響せず,標本の大きさ(標本数)が標本の精度をほぼ決定します.しかし,数値で説得しないとA社は納得はしないでしょう?ではこのような標本の精度をどうやって評価するのでしょうか? 数が少ないからA社の調査はだめだとS県の担当者がいうと, しかし,A社は抗議した.精度が低いという証拠があるのか!!! 魚は数百万匹いる, そこから100匹だけとるのと3匹取るのでは精度に差はない

体重のばらつきの大きい池と小さい池 この2つの池からそれぞれ100匹ずつ魚を捕獲して調査した どちらの池の調査の方が平均の精度が高いだろうか? さて,魚の体重のばらつきの大きい池と小さい池,この2つの池からそれぞれ100匹ずつ魚を捕獲して調査したとします.どちらの池の調査の方が平均の精度が高いでしょうか?これは下の方の池,つまり体重のばらつきの小さい池の方が,同じ100匹を捕獲しても平均値を精度よく推定できるでしょう.ですから,標本の数と母集団の中のばらつきの両方を考慮に入れた指標があればいいのです.

標本から母集団の平均を推定する場合 標本から母集団の平均を推定する場合, ① 標本の数を多くするほど, 母集団の平均を推定する精度は ① 標本の数を多くするほど,  母集団の平均を推定する精度は   ( 高くなる ・ 変わらない ・ 低くなる) ② 標本の数が同じであれば,母集団の分散が大きいほど, まとめますと,標本から母集団の平均を推定する場合, ① 標本の数を多くするほど,母集団の平均を推定する精度は ( 高くなる ・ 変わらない ・ 低くなる) どれが正しいでしょうか?標本が増えるほど,精度は高くなります. ② 標本の数が同じであれば,母集団の分散が大きいほど,母集団の平均を推定する精度は( 高くなる ・ 変わらない ・ 低くなる)どれが正しいでしょうか? 母集団の分散が大きい,すなわち母集団の要素のばらつきが大きいほど精度は低くなります. では推定精度を定量的に評価できないのでしょうか?標本数と母集団の分散(あるいは標準偏差)の2つを使って,定量的に平均を推定する精度を表す式があります. では推定精度を定量的に評価できないのか?

標準誤差 標準誤差は標本平均 が母集団の平均を推定するときに,どのくらい確実であるかの目安を与える 標本数 ,標準偏差 のとき,標準誤差 は 標準誤差は標本平均  が母集団の平均を推定するときに,どのくらい確実であるかの目安を与える 標本数  ,標準偏差    のとき,標準誤差    は 例: ある鳥について,100個の卵の重さを測ったところ, 平均25.3g,標準偏差3.0gであった. それが標準誤差というものです.標準誤差は標本平均エックスバー(Xの上に線を引いたもの,xの平均を意味する) が母集団の平均を推定するときに,どのくらい確実であるかの目安を与えます. 標準誤差は次のように定義されます.標本数n,標準偏差SDのとき,標準誤差SEはSE=SD÷√nです. 例で考えてみましょう.ある鳥について,100個の卵の重さを測ったところ,平均25.3g,標準偏差3.0gでした. 標準誤差SE=SD÷√n=3.0÷√100=0.3gとなります. このように標準誤差は標本数nと母集団のばらつきである標準偏差SDから計算されるので,この2つを反映した精度を表す指標です. 式の標本数nに注目するとわかるように,サンプルの数が多くなると標準誤差が小さくなることから,標本数を増やすと精度が高まり,しかも√nなので標本を2から3つと1つ増やすとかなり標準誤差が小さくなるのに,10から11個に標本を増やしてもあまり標準誤差が増えないことがわかります.実験では標本を4つか5つしか用意しないことが多いですが,その理由は標本をそれ以上増やしても精度を向上するメリットが小さくなるからです. 標準誤差は

標準誤差 例:ある鳥の卵10個の重さを量ったところ,15.4, 15.8, 15.9, 16.1, 16.2, 16.4, 16.6, 16.8, 16.9, 17.5gであった.平均は16.4g,標準偏差は0.6g,標準誤差は0.2gである.  16.4±0.2(mean±SE)と論文などでは表記される(SEはstandard error:標準誤差) もう一つの例です.例:ある鳥の卵10個の重さを量ったところ,15.4, 15.8, 15.9, 16.1, 16.2, 16.4, 16.6, 16.8, 16.9, 17.5gでした.平均は16.4g,標準偏差は0.6g,標準誤差は0.2gです. 16.4±0.2(mean±SE,平均±標準誤差)と論文などでは表記されます(SEはstandard error:標準誤差のことです)

標本の数を多くすると標準誤差が小さくなる 標準偏差 標準偏差 標準偏差 標準誤差 標本数5 標本数25 標本数50 標準誤差は標本の平均から母集団の平均(母平均)を推定するときにどの程度の誤差があるかを示す指標です.この図のように標本が5つだけしかないと,そこから推定した母平均はときには大きな誤差を含んでいると考えられます.しかし,標本を50個に増やせば,そこから推定した母平均の誤差はほとんどないと考えられます.すなわち少ない標本から得た標本平均は母集団平均を推定するには誤差が大きくなります(左図).しかし標本数を増やせば精度が高まります(右図).このように,標本から母平均を推定する誤差を定量的に示すものが標準誤差です.平均を計算したときはかならず標準誤差を計算すべきです.標準誤差が小さければ,標本平均の信頼が増すといえます. 標準偏差 標準誤差が小さくなる 標本平均の信頼が増す 標本平均の標準偏差

エクセルによる標準誤差の計算 の計算はエクセルでは それではエクセルで標準誤差を計算します.基本的にはエクセルの関数を組み合わせて計算するのがよいでしょう. 標準誤差を直接計算する関数はエクセルにはありませんので,定義から関数式を作ります. 標準偏差は=STDEV,平方根は=SQRTを使います.すると画面のような関数を使って,標準誤差の式を組むことができます. の計算はエクセルでは

標準誤差の計算:例 ある鳥の卵10個の重さを量ったところ,以下の通りだった 標準誤差はいくらか? 例でとり上げた問題を計算してみましょう.エクセルの数式を組み合わせて,一度に計算してもよいですが,打ち間違えなどがあるので,最初のうちは一つ一つ計算するとよいでしょう.標準誤差を計算する上で必要なデータは,標準偏差,サンプル数です.サンプル数は=countという関数で,( )の範囲内のデータの数を数えてくれます.このような関数を組み合わせると標準誤差を計算できます.データ数が決まっていたら,count関数を使わないで,その標本数をそのまま使う方が簡単でしょう. 16.4±0.2g (平均±標準誤差SE)と慣用的に表記される

分析ツール・基本統計量 標準誤差をエクセルで計算するには標準偏差,サンプル数をそれぞれ関数から計算する方法を説明しましたが,分析ツールにある基本統計量から計算する方法もあります.このように基本統計量を計算すると上から2つめに標準誤差を計算してくれます.上から5番目の標準偏差と混同しないようにしましょう.

代入したら標準誤差を計算するシート さらに100個以内のデータであれば計算するシートを「生物統計学_授業用データ集2013」のエクセルファイルの第2回基本統計量タブのところに作ってあります.データを測定値の下に入力すると自動的に平均,分散,標準偏差,メジアン,レンジ,変動係数,標準誤差を計算してくれます.関数がすぐに理解できないときはこの式をみて練習してもよいでしょう.

練習:標準誤差の計算 練習①: 宍道湖で50匹のコイの標本を得た. 平均体重 3.5kg,標準偏差 1.2kgであった. この標本の標準誤差を求めよ. 練習②: 宍道湖で10匹のコイの標本を得た. それぞれの体重は 1.3, 1.8, 2.3, 2.9, 3.5, 3.6, 3.8, 4.0, 4.3, 5.1kgであった. この標本の標準誤差を求めよ. それでは画面の2つの問題について標準誤差を計算してみましょう.3つの方法を全部やってみて,一致するかを確認して,その答えを「生物統計学第3回宿題と第4回のための予習2013」に入力して,moodleに提出してください(問2(予習)タブに問題があります).