第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。 検定と推定は、1つの関係式の見方の違いで あることを学ぶ。
第1章の WEB 宿題(5月1日分)実行上の注 意点 各自の学籍フォルダの下に作成した data フォルダの 下に、 TeraPad で 5/1 (金)の授業中に使った10個 のデータは、 basic_stat.txt なるファイル名で保存。 各自が作成した sasprog フォルダの下に、千野の HP から basic_stat.sas なる SAS プログラムを保存し、 filename 文の basic_stat.txt へのパスの一部を修正保 存する。ただし、この時は、プログラム名はもとの ままとする。 出力結果は、各自が作成した sasout フォルダの下に basic_stat.lst なるファイル名で保存。
第1章の WEB 宿題(4月24日分)実行上の 注意点 各自の data フォルダの下に既に作成したデータファ イル basic_stat.txt をコピーし、名前を basic_stat0.txt と変更したうえで、改めて TeraPad で開き、データの一部を削除・追加することにより 4/24 (金)の授業中に使った10個に変えて上書き 保存する。 各自が sasprog フォルダの下に既に作成した SAS プ ログラム basic_stat.sas をコピーし、名前を basic_stat0.sas と変更したうえで、 filename 文の basic_stat.txt へのパスの一部を修正し上書き保存す る。 basic_stat0.sas の出力結果は、各自が作成した sasout フォルダの下に basic_stat0.lst なるファイル 名で保存。
母平均の区間推定とは? (1) 標本 (sample) と母集団 (population) の違いを基 礎実験の1つであるミラーリエル錯視で考えて みよう。 例えば、30度30 mm 条件での20名の被験者 の錯視量データを X 1, X 2, …,X 20 と書けば、この データセットは、当該錯視条件における標本で ある。 この標本の特徴を記述するには、第1章で学ん だ平均、標準偏差などを計算すればよい。
母平均の区間推定とは? (2) 基礎実験では、これらの値を計算し、それらの値 をグラフにプロットし、錯視量に対して斜線分の 長さがどう影響するかを考察した(次のスライ ド)。 しかし、そこでの考察はあくまでも手にした20 個のデータ、すなわち標本についての情報のみか ら、データの特徴を記述したにすぎない。 このような特定の標本での数値の特徴ではなくて、 例えば、30度30mm条件で一般的に錯視量は どれぐらいかを推定できないだろうか。
基礎実験での考察課題の例 認知・行動領域のミラーリエル錯視実験 (1)斜線の長さ( 15mm, 30mm, 45mm )を変えた条件 下での錯視量を測定し、各条件の錯視量の平均値と SD を 計算し、「矢羽根の長さが錯視にどのような影響を及ぼ すか」を考察した。 斜線の長さ 15mm30mm45mm
母平均の区間推定とは? (3) 特定の標本での数値の特徴ではなくて、例えば、 30度30mm条件で一般的に錯視量はどれぐら いかという場合、我々は標本とそれが得られたも との数値の集まりを区別していることになる。 標本を抽出したもとの数値の集まりのことを、統 計学では母集団と呼ぶ(テキスト p.9 本文2行 目) 。 通常、母集団の数値の数は無限であると考えるこ とが多い。そのような母集団は、無限母集団 ( infinite population) と呼ばれる(テキスト p.9 本文4行目)。 このことを図式化すると、つぎのスライドのよう になる。
統計的推定・検定の基本的な考え方- 1 母集団と標本の関係 我々が手にするデー タ は、大きな数値の集ま り から抽出された標本で あ り、特定のもの。 一方、大きな数値の 集 まりから成る集団は、 母 集団と呼ばれる。検定 の 文脈では、通常、無限 母 集団が仮定される。 母集団 無作為抽出 標本
統計的推定・検定の基本的な考え方- 2 母集団の数値について の特徴を調べるには、 数値の分布(母集団分 布)を考える必要があ る。 そうなると、母集団分 布の平均(母平均)や 標準偏差(母標準偏 差)を考える必要があ る。 手にした標本から母集 団の特性を推定したり 判断したりすることを、 推定・検定と呼ぶ。 母集団 推定・検定 標本
統計的推定・検定の基本的な考え方- 3 母集団の数値について の特徴を調べるには、 数値の分布(母集団分 布)を考える必要があ る。 そうなると、母集団分 布の平均(母平均)や 標準偏差(母標準偏 差)を考える必要があ る。 手にした標本から母集 団の特性を推定したり 判断したりすることを、 推定・検定と呼ぶ。 母集団分布(理論分布) 標本の分布(度数分布) μ σ 母標準偏差 母平均 標本平均 標本標準偏差 sxsx
第3章での母平均の区間推定の考え方 ここでは、例えば10個 の標本からそれが抽出さ れたもとの集団、すなわ ち母集団の平均(母平 均)がどのぐらいになる かを推定する問題を扱う。 より具体的には、例えば 10個の標本の平均値等 から、それが得られた母 集団の平均値がある値か らある値(区間)に入る 可能性(確率)が例えば 95%である、と推論 (区間推定)する。 母集団 推定・検定 標本
母平均の推定のための2つの方法 N 個の標本 x1, x2, …,xN から、それが抽出され た母平均の区間推定する方法には、2つの方法 がある。 1つは、母集団分布は未知、母分散(母標準偏 差)は既知、標本数が大の場合である(テキス ト、 pp.9-12 )。 他方は、母集団分布が正規分布で、母分散(母 標準偏差)は未知の場合である(テキスト、 pp )。 正規分布とは、つぎのスライドにあるような対 称で釣鐘型の分布であり、統計学ではこの仮定 がこれまでは、よく用いられてきた。 この授業では、後者の場合の検定を学ぶ。
平均 μ 、分散 σ 2 の正規分布の特徴 μ,μ,μ-σ,μ-σ, μ+ σ,μ+ σ, μ +2 σ μ-2σ,μ-2σ, 34.13% 13.59% 2.15% 約7 0% 約 95%
信頼区間導出の概要(参考) -1 テキスト p.13 の (3.18) 式は、後者の場合の母平 均の区間推定の公式である。これは、どのよう にして導かれるのであろうか? その答えは、テキスト p.12 の最後から p.13 の最 初の式にある:
信頼区間導出の概要-1 この式の右辺の平均値は、平均 μ 0 の正規分布す る母集団からの N 個の標本から計算する。 この同じ平均を持つ母集団から、これとは異な る N 人の人の当該現象についてのデータを収集 すれば、少し異なる平均が得られよう。 この新たなデータの t 値を計算すると、以前と異 なる値となるだろう。つまり、 t の値は、 N 個の 標本を変えると、いろいろな値を取り得る、と 言える。
信頼区間導出の概要-2 つまり、 t は、同一母集団からの無作為サンプル であっても、標本を変えると異なる値になる。 ただし、標本を収集する前には、 t の値は決まら ない。 言い換えると、 t は標本を収集する前の段階では、 高々、それが如何なる値を取る可能性(確率) がどれ程あるか、と言えるに過ぎない。
信頼区間導出の概要-3(参 考) 実際、標本が得られた母集団の母分散が未知の 場合、平均 μ 0 なる正規分布からの N 個の標本を 用いて上記の t なる量を計算すると、 すなわち、 t は自由度 ν=N-1 の t- 分布に従う ことが証明できる。ここで、 t- 分布とは?
信頼区間導出の概要-4 (参 考) t 分布とは、テキスト p.13 の上方の (3.17) 式で表される分布で、 f(t) は任意 の t が特定の値を取る確率を表す:
自由度 v = N-1 の t- 分布の分布とは? -正規分布に近い y 軸対称な分布 t N-1 ( α/2) - t N-1 ( α/2) t t- 分布 確率 斜線部 1- α