放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
cm, cGy (単位の例) cm 2, cGy 2 cm, cGy
平均と分散の練習問題 5 本の人参があり、その長さが 6, 7, 8, 9, 10 cm であったとする。 人参の長さの平均はいくらか? –8 cm 人参の長さの分散はいくらか? –2 人参の長さの標準偏差はいくらか? –1.41 cm
合計の誤差と平均の誤差の直感的な説明 100 cpm を 1 分間測定 100±10 –N=100 x 1 min =100, σ=100 1/2 = cpm を 1 分測定、 4 回繰り返し 400±20 –N=100 cpm x 1 min x 4 =400, –σ=400 1/2 = 20 – この ”20” は 10 x 4 1/2 でも計算ができる。 上記を 4 で除して 1 分当たりに戻す 100±5 – この ”5” は、 10/4 1/2 でも計算できる。
合計の誤差と平均の誤差の練習問 題 5 本の人参があり、その長さが 6, 7, 8, 9, 10 cm であったとする。 人参の長さの合計はいくらか? –40 cm 人参の長さの合計の標準偏差はいくらか ? –3.16 cm 人参の長さの平均はいくらか? –8 cm 人参の長さの平均の標準偏差 はいくらか? –0.63 cm
1.2 合計 (y) の誤差 ここで、偏微分の式を書く都合上、 y の分散 s y 2 を Δy 2 と書いた。 y の標準偏差 s y は y の分散 s y 2 の平方根である。 y の分散は、 x i の偏差 Δx i を用いて次式で計算される。(誤差の伝搬)
1.3 x i の平均 x av の誤差 x av の分散は、 x i の偏差 Δx i を用いて次式で計算される。(誤差の伝搬) ここで、偏微分の式を書く都合上、 x av の分散 s xav 2 を Δx av 2 と書 いた。 x av の標準偏差 s xav は x av の分散 s xav 2 の平方根である。
中心極限定理 分布がどのようなものであっても、平均 μ 、 分散 σ 2 をもつ母集団からとられた大きさ n の標本の平均値x av の分布は、 n が大きく なるとき正規分布 N(μ 、 σ 2 /n) に近づく。 宮川公男、「基本統計学」 モンテカルロ法の数学的裏付 け
図 3 x の標準偏差 図 4 合計 y の誤差 sy
本当かな? →s 2 を数値計算
分散 s 2 の数値計算 Excel の RAND() 関数: (0,1) の乱数を発生 –10 個の乱数の平均と分散 s 2 を計算。 –100 組を計算し、 s 2 の平均を調べる。 – 乱数の数 n=9 ~ n=1 に変えて繰り返す。
s 2 のエクセルでの計算結果 確かに、 n に依存して s 2 が変化した!
平均の期待値 μ(=0.5) との差の 2 乗和の平均 エクセルでの数値計算 –10 個の乱数の分散 2 を計算。 –100 組を計算し、 2 の平均を調べる。 –n=9 ~ n=1 に変えて繰り返す。 サンプル数 n に依存しない分散 2 2↓2↓
2 のエクセルでの計算結果 確かに、 2 は n に依存しない。 μ は通常、未知数なので、 2 は分散の計算に使用できない → 困った!
とりあえず、 2 の期待値は? s 2 の期待値は? E(s 2 )=E( 2 ) x (n-1)/n
サンプル数 n に依存しない分散(2) 図 1 分散の値の比較 s 2 の 1/n を 1/(n-1) に変更した次式で、 サンプル数 n に依存しない分散を求 める。 これを、標本分散あるいは分散 の不偏推定値と呼ぶ教科書もあ る。
データ数に依存しない分散の証明 平均の期待値 μ に対する分散の式を変形する 期待値に書き直す。(右辺第 3 項は 0 ) μ に対する分散 x av に対する分散 x av の分散 = +
データ数に依存しない分散 (*) 平均の分散 N±N 1/2 の誤差と等価 (*) 1 章「平均の誤差」のまとめ 分散の定義 * 平均の誤差から導出
t 分布
t 分布の形状 出典 宮川公男, 基本統計学
t 分布の性質
スチューデントの t 分布 オックスフォード大で化学と数学を学び、 1899 年にギネ スビール社のダブリン醸造所に就職。統計学の知識を醸 造と農業(オオムギの改良)の両方に応用しつつ実地の 研究を重ねた。 オックスフォード大化学数学 1899 年ギネ スビールダブリン醸 造農業オオムギ 1906 年から 1907 年にかけて研究し 1908 年に論文を出した が、指導教員はこれを重視せず。この論文は醸造技術者 が関心を寄せる小標本の問題(サンプル数はあまり多く できないがなるべく正確な答を得たい)に応えるものだ った。一方、当時の生物測定学者はそれよりもできるだ け多くの測定を行って正確な答を求めることを重視。 1908 年 ギネスでは企業秘密の問題で社員が論文を出すことを禁 止。ゴセットは Student というペンネームで論文を発表 。もっとも有名な業績はスチューデントの t 分布と呼ばれ る。スチューデントの t 分布 1908 年の「平均値の誤差の確率分布( The probable error of a mean )」 をはじめ、ほとんどの論文がピアソンの 主宰する Biometrika 誌に発表された。 ( 出典: Wikipedia) コーヒーブレイク 1876 年 6 月 13 日生まれ 1937 年 10 月 16 日没
修正 χ 2 分布
χ 2 分布
標本平均 ( 値 ) の標準誤差 ( 省略 ) 標準偏差 誤差 不確かさ 「標本平均の標準誤差」の表記の省略の組み合わせ表 ・初等統計学:平均の標準誤差 ・放射線計測の理論と演習:平均値の標準 誤差 ・放射線計測ハンドブック:記述なし ・放射線計測(プライス):記述なし ・総務省統計局 HP :標本誤差 ・ Wikipedia : 標準誤差 ・カレイダグラフ:標準誤差 付録 B.1 「平均値の誤差」の表記について
「平均値の誤差」と同じ意味でありそうな言語の検索結果
2章 2 項分布、ポアソン分布、ガウス 分布 分布の概要 合計、平均、分散 相互の関連
実験による 2 項分布の生成 2つの状態を同じ確率で生じる物を 10 個用意せよ。 – 例えば、一円硬貨を 10 枚用意し、その片方の面に、マーク ( 例えば除去可能なシール ) をつけよ。 このうちの何枚かを取り出して並べ、マーク付きの 面が上向きである場合 p を数える。(下向きを q と書 く ) –1 枚の場合は、 p が 1 の場合と 0 の場合がある。 –2 枚の場合は、 pp, pq, qp, qq の 4 通りがあり、 p が 2,1,0 であ る組み合わせが、それぞれ 1,2,1 である。 –3 枚の場合は、 ppp, ppq, pqp, pqq, qpp, qpq, qqp, qqq の 8 通 りがあり、 p が 3,2,1,0 である組み合わせが、それぞれ 1,3,3,1 である。 – これを 8 枚まで、できれば 10 枚まで調べよ。
実験による 2 項分布の生成 (2) 複数枚のサンプルを机の上に 10 回投げて、マ ーク付きの面がでる枚数を調べる。 –1 枚の場合から始めて、 10 枚まで調べよ。 – 前のページで調べた並べた場合の分布と比較を行 え。 並べる方法は総当たりで確率を求めている。 投げる方法はサンプリングを行っている。 並べる方法で現れるどの組み合わせも、等し い確率でサンプリングで現れるはずであるの で、両者は統計変動の範囲内で一致するはず である。
p=0.5, n=1 から 10 として (17) 式の f(x) を求め、実験的に作成した 2 項分布の分布と比較せよ。
X の分散 V(x)
図 8 2 項分布とポアソン分布の比較 2 項分布で当たり率を下げていくと ポアソン分布に漸近する。
図 9 2 項分布とポアソン分布のガウス分布による近似
最小 2 乗法の概念: d 1 2 +d 2 2 +d 3 2 の最小値を求める。 ( 図 10) 第3章 最小二乗法
付録
修正 χ 2 分布と χ 2 分布の形状 出典 宮川公男, 基本統計学
F 分布の形状 出典 宮川公男, 基本統計学