数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回.

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

母平均の区間推定 ケース2 ・・・ 母分散 σ 2 が未知 の場合 母集団(平均 μ 、分散 σ 2) からの N 個の無作為標本から平均値 が得られてい る 標本平均は平均 μ 、分散 σ 2 /Nの正規分布に近似的に従 う 信頼水準1- α で区間推定 95 %信頼水準 α= % 信頼水準.
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
統計解析第 11 回 第 15 章 有意性検定. 今日学ぶこと 仮説の設定 – 帰無仮説、対立仮説 検定 – 棄却域、有意水準 – 片側検定、両側検定 過誤 – 第 1 種の過誤、第 2 種の過誤、検出力.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
数理統計学第1回 1 数理統計学 ( 第一回) 確率変数とは? 浜田知久馬. 数理統計学第1回 2 世の中は不確定なことが多い 決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき,確率変数によって,物事 を確率的に記述できると便利なことが多 い.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
統計学第10回 多群の差を調べる~ 一元配置分散分析と多重比較 中澤 港
      仮説と検定.
数理統計学(第四回) 分散の性質と重要な法則
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
データ分析入門(11) 第11章 平均値の差の検定 廣野元久.
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
ホーエル『初等統計学』 第8章1節~3節 仮説の検定(1)
第7回 独立多群の差の検定 問題例1 出産までの週数によって新生児を3群に分け、新生児期黄疸の
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
数理統計学(第八回) 統計的仮説検定とは?
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
多重比較 東邦大学 地理生態学研究室              柊 雅実.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
タレントの魅力測定とその分析.
確率・統計Ⅱ 第7回.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
統計学 12/13(木).
ホーエル『初等統計学』 第8章4節~6節 仮説の検定(2)
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
第8回 関連多群の差の検定 問題例1 健常人3名につき、血中物質Xの濃度を季節ごとの調べた。 個体 春 夏 秋 冬 a
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
Excelによる実験計画法演習 小木哲朗.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
中澤 港 統計学第4回 中澤 港
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
1.母平均の検定:小標本場合 2.母集団平均の差の検定
母分散の検定 母分散の比の検定 カイ2乗分布の応用
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
統計的検定   1.検定の考え方 2.母集団平均の検定.
母分散の検定 母分散の比の検定 カイ2乗分布の応用
第4章 統計的検定 (その2) 統計学 2006年度.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
数理統計学 西 山.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第3章 統計的推定 (その2) 統計学 2006年度 <修正・補足版>.
Presentation transcript:

数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回

パラとノンパラ パラメトリック 特定の分布(狭義には正規分布)を仮定した方法 e.g. t検定 ノンパラメトリック   分布はパラメータ(例,μ,σ2)によって定まる. e.g. t検定 ノンパラメトリック 特定の分布を仮定しない方法 (狭義にはデータの順位情報のみを用いる方法) e.g. ウイルコクソン検定 数理統計学第10回

パラとノンパラの仮定 パラ ノンパラ 赤:帰無仮説 緑:対立仮説 数理統計学第10回

パラとノンパラ パラ ノンパラ 位置の指標 平均 メディアン バラツキの指標 SD 4分位偏差 パラ ノンパラ 位置の指標 平均 メディアン バラツキの指標 SD 4分位偏差 1標本検定 t検定(unpaired) ウイルコクソン   符号検定 2標本検定(対応) t検定(paired) ウイルコクソン 2標本検定 t検定(unpaired) ウイルコクソン   サベージ,FW等 数理統計学第10回

パラとノンパラ パラ ノンパラ 多群比較 1-way ANOVA KW 多群比較(paired) 乱塊法 Friedman パラ ノンパラ 多群比較 1-way ANOVA KW 多群比較(paired) 乱塊法 Friedman 相関係数 Pearson Spearman Kendall 用量相関 回帰分析 Jonckheere 多重比較 Dunnett Steel Tukey Steel-dwass Willimas Shirley-Willimas 数理統計学第10回

パラとノンパラ パラ ノンパラ 分布形の仮定 正規分布 必要なし 等分散性 仮定 仮定 第1種の過誤 ≒α 常に<α 正規分布のとき ◎ ○ パラ ノンパラ 分布形の仮定 正規分布 必要なし 等分散性 仮定 仮定 第1種の過誤 ≒α 常に<α 正規分布のとき ◎ ○ 外れ値が存在 × ○ 変数変換 変 不変 N<6 △ × 料理に例えると 懐石 電子レンジ 数理統計学第10回

ノンパラ検定の仮説 X1, X2, ・・・, XN ~分布関数Fを持つ Y1, Y2, ・・・, YN ~分布関数Gを持つ 帰無仮説H0:F=G 対立仮説H1:F≠G(両側検定) 対立仮説H1:F<G(上側検定) 対立仮説H1:F>G(下側検定) 数理統計学第10回

ビタミンEに細胞増殖効果はあるのか? 浜君と石君で実験 4枚を通常栄養 4枚をビタミンE処理(PM11:00) 数理統計学第10回

翌朝(AM7:30) 実験は成功したが,石君は来なかった. 121 118 110 95 90 34 22 12 数理統計学第10回

(PM:2:00)浜君は考えてみた. ビタミンE処理群はどれか? 121 118 110 95 90 34 22 12 数理統計学第10回

8枚から4枚を選ぶ組み合わせの数は? 8C4=(8×7×6×5)/(4×3×2×1)=70通り ビタミンE群 4枚の細胞数の和 ビタミンE群 4枚の細胞数の和 121 118 110 95 444 121 118 110 90 439 121 118 110 34 383 121 118 110 22 371 121 118 110 12 361 121 118 95 90 424 : 数理統計学第10回

図1 並べ替え分布の幹葉表示と箱ひげ図 ビタミンEに増殖効果がなければ全てのパターンは等しい確率で生じるはず. Stem Leaf # Boxplot 44 4 1 | 42 49 2 | 40 36 2 | 38 3 1 | 36 01381 5 | 34 001356812567 12 +-----+ 32 58903578 8 | | 30 7578 4 *--+--* 28 4575 4 | | 26 12245792347 11 | | 24 12567014679 11 +-----+ 22 149 3 | 20 9 1 | 18 69 2 | 16 38 2 | 14 8 1 | ----+----+----+----+ Multiply Stem.Leaf by 10**+1 数理統計学第10回

(PM:4:55)石君到着 合計細胞数=439 121 118 110 95 90 34 22 12 数理統計学第10回

図1 並べ替え分布の幹葉表示と箱ひげ図 和が439以上になるのは2通り:確率2/70 Stem Leaf # Boxplot 44 4 1 | 42 49 2 | 40 36 2 | 38 3 1 | 36 01381 5 | 34 001356812567 12 +-----+ 32 58903578 8 | | 30 7578 4 *--+--* 28 4575 4 | | 26 12245792347 11 | | 24 12567014679 11 +-----+ 22 149 3 | 20 9 1 | 18 69 2 | 16 38 2 | 14 8 1 | ----+----+----+----+ Multiply Stem.Leaf by 10**+1 数理統計学第10回

並べ替え検定の手順 1.検定統計量を選択する. e.g. 片方の群の和、順位和、平均値の差 2.得られたデータで検定統計量を計算する. 3.permutationによって検定統計量の分布を調べる. 4.得られたデータ以上に極端な場合の頻度を数え上げる(2/70). 数理統計学第10回

並べ替え検定 permutation test ノンパラメトリック検定:αエラーの制御 複雑な仮定を必要としない. 拡張が容易 統計量の選択によっては、漸近的には最強力な検定と同程度の検出力を有する. 計算に時間がかかる→ハードウエアの進歩 ネットワークアルゴリズム 正確な検定、randomization検定 数理統計学第10回

正確な検定と並べ替え検定 exact test and permutation test (distribution free) permutation test(検定の構成原理) (randomization test) permutation testはノンパラメトリック検定 ノンパラメトリック検定≠permutation test 数理統計学第10回

可能な組み合わせの数 (2N!)/(N!N!) N パターン数 N パターン数 1 2 10 184756 1 2 10 184756 2 6 20 137846528820 3 20 30 1.1826458×1017 4 70 40 1.0750721×1023 5 252 50 1.0089134×1029 6 924 100 9.0548515×1058 7 3432 8 12870 9 48620 数理統計学第10回

並べ替え検定が必要な場合 多 パターン数 少 よい 理論分布による近似 悪い 1)サンプルサイズが小さい場合 2)スパースなデータ 多 パターン数 少 よい 理論分布による近似 悪い 1)サンプルサイズが小さい場合 2)スパースなデータ 3)外れ値を含んでいる場合 4)結果が微妙な場合 数理統計学第10回

並べ替え検定のプログラム data ve; do group=0 to 1; do i=1 to 4; input y @@;output;end;end; cards; 95 34 22 12 121 118 110 90 ; proc freq data=ve;tables y*group/all;exact pcorr; output out=result pcorr; 数理統計学第10回

並べ替え検定の結果 H0: 相関 = 0 に対する検定 帰無仮説が正しいもとでの漸近標準誤差 0.2040 Z 4.0040 ・FREQプロシジャの出力 H0: 相関 = 0 に対する検定 帰無仮説が正しいもとでの漸近標準誤差 0.2040 Z 4.0040 片側 Pr > Z <.0001 両側 Pr > |Z| <.0001 正確検定 片側 Pr >= r 0.0286 両側 Pr >= |r| 0.0571 ・PRINTプロシジャの出力 OBS PL_PCORR PR_PCORR P2_PCORR XPL_PCOR XPR_PCOR XP2_PCOR 1 .   .000031141 .000062281 .   0.028571 0.057143 数理統計学第10回

並べ替え分布 Stem Leaf # Boxplot 44 4 1 | 42 49 2 | 40 36 2 | 38 3 1 | 44 4 1 | 42 49 2 | 40 36 2 | 38 3 1 | 36 01381 5 | 34 001356812567 12 +-----+ 32 58903578 8 | | 30 7578 4 *--+--* 28 4575 4 | | 26 12245792347 11 | | 24 12567014679 11 +-----+ 22 149 3 | 20 9 1 | 18 69 2 | 16 38 2 | 14 8 1 | ----+----+----+----+ Multiply Stem.Leaf by 10**+1 数理統計学第10回

有限母集団からの非復元抽出 大きさNの有限母集団:a1,a2,・・・,aN 大きさnの標本を非復元抽出:X1,X2,・・・,Xn 組合せの数:NCn= Pr(X=ai1,ai2,・・・, ain)=1/NCn 注意 Xiの周辺分布はX1の周辺分布, (Xi , Xj)の同時分布は(X1 , X2)の同時分布に等しい.(順番は分布に影響しない) 赤玉と青玉の例を思い出そう. 数理統計学第10回

非復元抽出 同時にn個取出す 2 a8 2 a7 2 a2 2 a9 2 a1 2 a4 2 a3 2 a5 2 a6 数理統計学第10回

平均と分散 ・母集団の期待値(母平均)と分散(母分散) ・標本平均X・の期待値と分散         :有限修正項 数理統計学第10回

標本平均と分散 X1,X2,・・・,Xnは独立でないため 数理統計学第10回

標本平均と分散 数理統計学第10回

標本平均と分散 数理統計学第10回

標本平均と分散 数理統計学第10回

N=5の場合 (a1a2) (a1a3) (a1a4) (a1a5) (a2a3) 数理統計学第10回

X1がaiのときはX2はaiを取り得ないので負の相関が生じる. 標本平均と分散 X1がaiのときはX2はaiを取り得ないので負の相関が生じる. 数理統計学第10回

標本平均と分散 数理統計学第10回

超幾何分布の分散 袋の中にN個の玉があって,そのうち 比率p1で赤球,比率1-p1で青玉が入っている. n個を非復元抽出したときの赤の個数の分散は? 復元抽出のときの分散: σ2=np1(1-p1) 非復元抽出のときの分散: 復元抽出:二項分布 超幾何分布:非復元抽出 数理統計学第10回

確認実験 袋の中にNN個の玉があって,そのうち 比率0.5(p)で赤球が入っている.10(N)個非復元抽出したときの赤球の個数の分布(Y)は? NN=10,20,・・・,100 それぞれ1万回のシミュレーションを行う. 復元抽出(二項分布の場合) E[Y]=Np=5,V[Y]=Np(1-p)=1.582 数理統計学第10回

SASプログラム data data; p=0.5;n=10; do nn=10 to 100 by 10; do i=1 to 10000; r=nn*p; y=rand('hypergeometric',nn,r,n); output; end;end; proc means maxdec=2;var y;class nn; run; 数理統計学第10回

シミュレーションの結果 nn N 平均値 標準偏差 最小値 最大値   オブザーべション nn N 平均値 標準偏差 最小値 最大値 -------------------------------------------------- 10 10000 5.00 0.00 5.00 5.00 20 10000 4.99 1.15 1.00 9.00 30 10000 5.00 1.31 0.00 10.00 40 10000 5.00 1.39 0.00 10.00 50 10000 5.01 1.44 0.00 10.00 60 10000 5.00 1.44 0.00 10.00 70 10000  4.99 1.47 0.00 10.00 80 10000 4.98 1.50 0.00 10.00   90 10000 5.01 1.50 0.00 10.00 100 10000 5.00 1.50 0.00 10.00 --------------------------------------------------- 数理統計学第10回

演習 標本平均X・の期待値と分散を計算せよ また復元抽出の場合と結果を比較せよ 非復元抽出 同時に2個取出す 2 3 2 5 2 1 2 X2 2 4 2 X1 2 数理統計学第10回