正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
第6回授業( 5/15) の目標 先回の第1章の WEB 宿題実行上の注意。 第3章の区間推定の基本的考え方を学ぶ(こ の途中までで、終了)。 第3章の母平均の区間推定に必要な数表の見 方を知る(岩原テキスト、 p.434, t- 分布表)。 テキスト p.13 の信頼区間はどのようにして得 られる?-信頼区間導出の概要について学ぶ。
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
Q 1. ある工場で直径1インチの軸棒を標準偏差 0.03 の 管理水準で製造している。 ある日の製造品の中から 10 本の標本をとって直径を測定 したところ、平均値が インチであった。品質管理上、 軸棒の直径が短すぎるだろうか、それとも、異常なしと判断 して、製造を続けてもよいであろうか。
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
      仮説と検定.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
確率・統計Ⅱ 第7回.
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
統計学 12/13(木).
母分散が既知あるいは大標本の 平均に関する統計的検定
統計学  西 山.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
対応のあるデータの時のt検定 重さの測定値(g) 例:
クロス集計とχ2検定 P.144.
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
データの分類 P.128 診断や治療を,長年の経験則に頼らず, 科学的根拠に裏付けされた事実に基づいて判断する。
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
リサーチカンファ 29 Aug, 2017.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 西 山.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
Presentation transcript:

正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定 地理生態学研究室 3年 宮内 麻衣 2010.3.8

正規性の検定の意義 ・パラメトリック検定 (対象がある特定の分布に従う時) ・ノンパラメトリック検定   ・パラメトリック検定   (対象がある特定の分布に従う時)    ・ノンパラメトリック検定   (対象が特定の分布に従わない時、サンプル数が極端に少ない    時)     のどちらを行うか決める上で重要!

正規性の検定のいろいろ ①χ2分布を用いる適合度検定 ②コルモゴロフ‐スミノルフ検定 ③リリフォース 検定 (②の改良版) ③リリフォース 検定 (②の改良版) ④シャピロ‐ウィルク のW 検定 (標本数が少ない場合) ⑤肉眼的判断(ヒストグラム・箱ひげ図) 各々検出力が異なる

χ2分布を用いる適合度の検定     ・名義尺度の場合に使用できる。 名義尺度      血液型の場合には,A 型:1、B 型: 2、AB 型: 3、O 型:4のように 数値に対応させる場合。   これらの数値は血液型を 区別するために使われているだけであ る。 例≪サイコロを 56 回振って目の出方を調べたところ,表 のようになった。このサイコ ロは正しいサイコロといえるだろうか≫

1. 前提 帰無仮説 H0:「「サイコロの目の出方の確率は各々  である」  対立仮説 H1:「「サイコロの目の出方の確率は各々  でない」 2. 56個のケースが,6個のカテゴリーに分類されている。 3. Oi 第 i カテゴリーの観察値 O1 = 10,O2 = 12,... ,O6 = 8 4. Ei  第 i カテゴリーの期待値 正しいサイコロならば,どの目の出る確率も等しく 1/6 であるはずである したがって,各目の出る期待値は,E1 = E2 = ... = E6 =56×(1/6) = 9.333 である。

5. 以下の式で検定統計量を計算する。 χ20 = [ (10-56/6)2+(12-56/6)2+ ... + (8-56/6)2 ] / (56/6) = 5.5 6.有意確率を 求める 自由度 5 の χ2分布において, P = 0.3579459>0.05 7. 帰無仮説を採択する。   すなわち,「サイコロの目の出方の確率は各々  である」                       一様分布に従う

1標本コルモゴロフ-スミルノフ検定 ■順序尺度 ・順序尺度以上の場合に用いる。  ■順序尺度   治療効果の判定において,悪化を -1,不変を 0,改善を 1,著効 を 2 のように数値に対応させる場合。  ■順序尺度以上   間隔尺度(数値の差のみに意味がある場合)   比例尺度(数値の比にも意味がある場合)   を含む

確率変数(Xとする)と、一般に標準正規分布では   と表される。 確率変数1.65以上が95%の場合は、  と表される。 「標準正規分布」の「累積分布関数」と呼ばれている。 正規分布でないときも、 と表せる。これを一般にF(x)と表す。    コルモゴロフ=スミノルフ検定はこのF(x)をサンプルから定めて行う検定。

1標本コルモゴロフ-スミルノフ検定 Ⅹ≦1.65が確率0.95=「n個のサンプル値の中で0.95n個が1.65以下」 つまり、F(x)に従うサンプルに対しては であるはずで、逆に両辺が大きくくい違えば、               帰無仮説H0:母集団分布はF(x) は棄却される。

1標本コルモゴロフ-スミルノフ検定 そこで、サンプルx1,x2, …,xnでx以下の累積度数の率 を「経験累積分布関数」と呼ぶ。 これをxごとにF(x)との差で対照し 最も大きいずれ つまり を統計量として判断する。 Dを最大偏差統計量という。

例えば・・・ F(x):標準正規分布の累積分布関数 Fn(x):経験累積分布関数 2 個のサイコロを1000 回振って毎回の出た目の和を記録するという実験を行った結 果を,表 に示す。 F(x):標準正規分布の累積分布関数  Fn(x):経験累積分布関数

例≪血糖値データの正規分布チェック≫ 36人の男性被験者に対する空腹時血糖値が、平均80標準偏差6の正規分布(80,36) に従っているか? 75,92,80,80,84,72,84,77,81,77,75,81,80,92,72,77,78,76 77,86,77,92,80,78,68,78,92,68,80,81,87,76,80,87,77,86 小さい方から並べて順序統計量に直し、順序統計量の値ごとに計算する。 差の最大をDとすると、D=0.1547である。 F(x):標準正規分布の累積分布関数  Fn(x):経験累積分布関数 観察度数 相対度数 累積度数 F(x) Fn(x) 68 2 0.0228 0.0556 0.0328 72 4 0.0918 0.1111 0.0193 ….. …. 87 32 0.879 0.8889 0.0099 92 36 0.9772 1.0000

n≧35(n<40とする数表もある)のケースDの境界値表 n=36のケースでは、α=0. 05に対して棄却値は1. 36/ =0 n≧35(n<40とする数表もある)のケースDの境界値表 n=36のケースでは、α=0.05に対して棄却値は1.36/ =0.23であり、 D=0.1547<0.23 この血糖値データが正規分布N(80,62)からのサンプルであるとの仮説は棄てられない。 正規分布に従うと言える

参考文献 松原望著(2007) 『入門 統計解析 医学・自然科学編』 東京図書 356pp. 「おしゃべりな部屋」 (群馬大学 青木繁伸) 「おしゃべりな部屋」  (群馬大学 青木繁伸)    http://aoki2.si.gunma-u.ac.jp/