確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
第1章 統計学の準備 ー 計量経済学 ー.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第2章 単純回帰分析 ー 計量経済学 ー.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
確率・統計Ⅱ 第7回.
回帰分析.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
第5章 回帰分析入門 統計学 2006年度.
統計解析 第10回 12章 標本抽出、13章 標本分布.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
経営学研究科 M1年 学籍番号 speedster
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤

6-5 適合度と独立性の検定 ・期待度数 母集団が互いに排反なn個のクラスA1,A2,・・・,Anに分けられており、ある固体が各クラスに属する確率がp1,p2,・・・,pnであることが分かっている(p1+p2+・・・+pn=1)。 この母集団から大きさNの標本を抜き出したとき、各クラスに属する個体の数は、 p1・N,p2・N,・・・pn・Nと期待される。これを期待度数という。 ・観測度数 抽出した標本で、実際に各クラスに入っている個体の数をx1,x2,・・・xnとすると、 x1+x2+・・・+xn=Nとなる。 この観測した個体の数を観測度数という。 この2つを比較しようというのが適合度の検定である。

6-5 適合度と独立性の検定 例 メンデルの法則で、草花の遺伝的形質が3:2:2:1の割合で生じることが理論的に分かっているとする。その草花を実際に240本観察した結果、遺伝的形質の割合が 87:66:55:32であったとする。 この場合のクラスはA1~A4の4つ存在し、それぞれの確率はp1=3/8,p2=p3=1/4, P4=1/8であることが分かる。 期待度数はp1・N=3/8・240=90のように求まる。 表に期待度数と観測度数をまとめると以下のようになる。 クラス A1 A2 A3 A4 期待度数 90 60 60 30 観測度数 87 66 55 32

6-5 適合度と独立性の検定 ・多項分布の極限 クラス分けされた母集団は、多項分布に従っており、無作為抽出したN個の標本の観測度数  ~  の確率分布は、 (6.10) で与えられる。 ここで多項分布のNが大きいときの近似分布を考える。 上式に の変換を施し、4-3節と同じような計算を行うと、      のとき、       の従う 分布         は、 となる。 自由度n-1の  分布に従う

6-5 適合度と独立性の検定 以上のことから      のとき、多項分布で (6.11) をつくるとXは自由度n-1の  分布に従う、という命題が成り立つ。 観測度数をもとにした帰無仮説の検定 適合度の   検定 例 メンデルの法則で求めた期待度と観測度を用いて、帰無仮説を立て、危険度5%で適合度の   検定を行うと、 クラス数は4つであるから、Xは4‐1=3の  分布に従う。 教科書の最後に付随している附表3から自由度3、危険度5%のときの棄却域を求めると、 X>7.81である。 X=1.25 は採択域であるので観察例はメンデルの法則にあっていないとは いえない。

6-5 適合度と独立性の検定 ・分割表 母集団が2つの性質A,Bに互いに排反なm個のクラスA1,A2,・・・Amと互いに排反なn個のクラスB1,B2,・・・Bnに分けられているとき、この母集団からN個の標本を抽出して、クラス「AiかつBj」に属する個体の観測度数がxij(i=1,2,・・・,m;  j=1,2,・・・,n)であるとする。これを表にすると以下のようになる。 性質 B1 B2 ・・・ Bn 計 A1 x11 x21 ・・・ x1n a1 A2 x21 x22 ・・・ x2n a2 ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ Am xm1 xm2 ・・・ xmn am 計 b1 b2 ・・・ bn N 上のような表を分割表とよび、分割表を用いて2つの性質A,Bが独立であるかどうかを 検定することを独立性の検定という。

6-5 適合度と独立性の検定 ・独立性とχ 分布 母集団から無作為抽出した1つの個体が、        に属する確率         に属する確率        が分かっているとすると、AとBが独立なときには、 その個体が  かつ  に属する確率は   となる。よってN個の標本を抽出したとき、 期待度数は    である。このとき、観測度数  の総数はmn個なので、例の命題を 使うと、 (6.12) は、mn-1のχ 分布に従うことになる。 実際問題、期待度数が分からない場合が殆どであるため、独立性の検定を行うためには このままではマズイ。修正が必要。

6-5 適合度と独立性の検定 次のように修正する。 前の分割表のB1の列を見ると、和はb1で、AiかつB1に属する確率はb1/Nと仮定できる。 ここでこの列だけに着目して、Nの代わりにb1、xiの代わりにxi1、piの代わりにai/Nをとる と、 これがm-1のχ2分布に従うと考えられ、さらに同様にj列について、上式を適応させると これまたm-1のχ2分布に従うと考えられる。 X=X1+X2+・・・+Xnとして、なおかつb1+b2+・・・+bn=Nの拘束条件より、Xは自由度が (m-1)×(n-1)のχ2分布に従う。結局以下の命題が成り立つ。 (6.13)

6-6 最小2乗法と相関係数の推定・検定 ・散布図やらなんやら 重さ x バネ長 y 100 20.4 回帰直線 120 22.6 130 23.4 150 25.6 160 26.9 180 28.7 相関図または散布図 相関を取ったりするのに使える

・ 6-6 最小2乗法と相関係数の推定・検定 ・最小2乗法 回帰直線からの誤差 (6.15) この式を線形回帰モデルという。 6-6 最小2乗法と相関係数の推定・検定 ・最小2乗法 ・ 回帰直線からの誤差  (6.15) この式を線形回帰モデルという。 グラフ上の全ての点における線形回帰モデルの和≒0 全体の誤差の指標にはならない 誤差の指標として、線形回帰モデルの2乗の和をとり、その値が最小となるような回帰直線の未知係数a,bを求める。これを最小2乗法という!! (6.16) (6.17)

6-6 最小2乗法と相関係数の推定・検定 Qが最小になるようなa,bを求めるには、 (6.18) (6.19) の極値問題を考えればよい。 (6.17)式より、 となる。

6-6 最小2乗法と相関係数の推定・検定

6-6 最小2乗法と相関係数の推定・検定 ここまでの5式を回帰係数の定義という。この定義を用いると、   ,   は次のようになる。 となり、この2つが誤差の2乗和を最小にするa,bの値であり、標準回帰係数という。

6-6 最小2乗法と相関係数の推定・検定 また、標準相関係数を と定義すると、 以上のような標本平均、標本分散、標本相関係数を用いると、回帰直線は、 (6.34) と書ける。

6-6 最小2乗法と相関係数の推定・検定 ・誤差の分散 は誤差の分散に相当する。 上式を(6.27)、(6.23)、(6.25)、(6.26)を用いて変形させ、(6.30)を代入し、さらに(6.30)を 使うと、 と変形でき、標本相関係数Cxyが0に近いほどバラつきが大きく、 ±1に近づくほど直線に近づくことが分かる

6-6 最小2乗法と相関係数の推定・検定 ・相関係数の意味 相関係数は-1から+1の尺度 負の相関がある 正の相関がある 曲線的なものとの相関は取れない!

6-6 最小2乗法と相関係数の推定・検定 ・「相関なし」の検定 直線の当てはめを行った2つの変化量x,yについての標本が、2次元正規分布に従っている母集団から抽出したものと考えてよい場合、標本からつくった標本相関係数をもとにして、母集団の母相関係数についての推定、検定をすることができる。 (4.33)式のρxyを母相関係数と考える。相関係数ρxy=0のときには、X、Yはそれぞれ独立に1次元正規分布に従う(p-91、例1参照)ので、次の命題が成り立つ。 ρxy=0の2次元正規分布に従う母集団から大きさnの標本(x1,y1),(x2,y2),・・・ (xn,yn)を無作為抽出したとき、標本相関係数Cxyは、確率密度が の分布に従い、 のTは、自由度n-2のt分布に従う。

6-6 最小2乗法と相関係数の推定・検定 ρxy≠0の2次元正規分布に従う母集団から大きさnの標本(x1,y1),(x2,y2),・・・ (xn,yn)を無作為抽出したとき、標本相関係数Cxyを と変換したとき、nが大きければ、Zは に近似的に従う。その結果、 としたとき、 はN(0,1)に従う。 これらの命題を用いることで、標本相関係数Cxyに基づいて母相関係数ρxyの推定、検定を行うことができる。

疑問、苦情などがありましたらこちらまで・・・ http://www.google.co.jp/