Presentation is loading. Please wait.

Presentation is loading. Please wait.

初心者による初心者のための「量的データの二変量解析」

Similar presentations


Presentation on theme: "初心者による初心者のための「量的データの二変量解析」"— Presentation transcript:

1 初心者による初心者のための「量的データの二変量解析」
2011/11/05 第3回 心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会 初心者による初心者のための「量的データの二変量解析」 土屋政雄 2014/03/22: 29枚目の引用間違いを修正

2 本日の内容 2変量解析とは(連続量) 効果量 論文での示し方 Rでやってみる 必要性 種類と算出方法 区間推定 相互変換
※一部に初心者編を 逸脱する表現が含まれてしまったため,該当 スライドには以下の星マークをつけました

3 2変量解析(連続量) 交絡要因を調整した多変量解析(重回帰,共分散分析など)と比べて,独立変数,従属変数が共に1つずつの解析
t検定 ピアソンの積率相関係数 1要因分散分析 単変量解析と表記する者もいるが,これは誤解されやすいのでやめた方がよい

4 t検定 独立な2群の平均値差の検定 # t検定関数のヘルプ確認。exampleより help(t.test) # データの図示
plot(extra ~ group, data = sleep) # groupによるextraのt検定 t.test(extra ~ group, data = sleep)  実際は,groupを因子型にしたり,変数のまま扱うようにするにはattachをするといったような細々した作業がある

5 ピアソンの積率相関 # 相関係数(検定付)のヘルプ確認。exampleより help(cor.test) # データ設定
x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1) y <- c( 2.6, 3.1, 2.5, 5.0, 3.6, 4.0, 5.2, 2.8, 3.8) # ピアソンの積率相関 cor.test(x,y) 

6 1要因分散分析 # インターネットにつながっている状態で読みこみ
hs1 <-read.table(" header=T, sep=",") attach(hs1) # 回帰のlm関数で計算して,anova関数で結果を出力 anova(lm(write~factor(prog))) R Class Notes Analyzing Data (UCLA Statistical Computing)

7 帰無仮説有意性検定:NHST (null hypothesis significance testing)
Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Hypothesis tests. It is hard to imagine a situation in which a dichotomous accept-reject decision is better than reporting an actual p value or, better still, a confidence interval. Always provide some effect size estimate when reporting a p value(p599) ※かつて,アメリカ心理学会(APA)の委員会で,APA Journalにおいて帰無仮説検定を禁止すべきかどうかの議論があったが,上記Wilkinsonの推奨に落ち着いた (Thompson, 2007)

8 具体例で確かめてみよう 15 25 9 1.52 >.05 0.56 20 30 2.15 <.05 N mean SD t p
SFトリビアの知識テスト得点 N mean SD t p Cohen's d 研究1 Jedi-wannabes 15 25 9 1.52 >.05 0.56 Trekkies 20 研究2 30 2.15 <.05 この下に数字があります この下に数字があります Jedi-wannabes= Star Wars fans Trekkies = Star Trek fans Ellis, (2010) p33

9 相関係数とp値( Nakagawa & Cuthill , 2007 )
効果の不確実性 効果の方向 効果の強さ Nakagawa & Cuthill , (2007)のFig2参照。相関係数のp値とn数別の点推定値及び区間推定値のフォレストプロット p-p-! p-p-!

10 なぜ効果量が必要か Effect sizes
Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Effect sizes Always present effect sizes for primary outcomes. If the units of measurement are meaningful on a practical level (e.g. number of cigarettes smoked per day), then we usually prefer an unstandardized measure (regression coefficient or mean difference ) to a standardized measure (r or d) (p599) この論文を引用している文献をWeb of Knowledgeで逆引きしてみたが2011/11/03時点で被引用数: 827 APA出版マニュアル第5版

11 なぜ効果量が必要か Journal of Consulting and Clinical Psychology
Instructions to Authors Authors should report means and standard deviations for all continuous study variables and the effect sizes for the primary study findings. (If effect sizes are not available for a particular test, authors should convey this in their cover letter at the time of submission.) JCCP also requires authors to report confidence intervals for any effect sizes involving principal outcomes (see Fidler et al., 2005, JCCP pp. 136–143 and Odgaard & Fowler, 2010, JCCP pp.287–297).

12 メタ分析的思考 ( Nakagawa & Cuthill , 2007 )
メタ分析はGene Glass (1976) の紹介以来,社会科学,医学において文献レビューについての本質的かつ確立したツールとなった 効果量に基づいて研究を統合し,そのばらつきを推定するためNHSTの限界にしばられない NHSTよる結論の間違いを覆してきた 近年,メタ分析の有益性は"メタ分析的"思考と呼ばれている(Cumming & Finch, 2001; Thompson, 2002b)

13 メタ分析的思考( Nakagawa & Cuthill , 2007 )
効果量による先行研究の結果の正確な理解は本質的である (信頼区間が伴った)効果量の報告が習慣になり,メタ分析への組み入れが容易になる 先行研究の効果量と新たな研究の効果量を比較することで新たな結果の解釈がなされる 研究者は彼らの1片の研究を,研究世界のより大きな絵図に対する中程度の貢献物としてみる

14 効果量(連続量) 標準化効果量(standardized effect size)
d-family (群間の違い) Cohen' s d Hedges' g Glass' ⊿ r-family (関連) ピアソンの積率相関係数 非標準化効果量(unstandardized effect size ) 平均値差 非標準化回帰係数 ※このように,色んな種類があるので,時々effect sizeとしか書いてない論文もみられるが,何の効果量なのか明示しないとだめ。

15 効果量の公式(d family) 言葉で(Coe, 2002) 記号で(Ellis, 2010: p10,26,27) 介入群の 平均値
統制群の 平均値 標準偏差 言葉で(Coe, 2002) 記号で(Ellis, 2010: p10,26,27) Cohen (1962)がこの指標を開発した時,母集団標準偏差の計算については明確にしていなかったが,現在では3つの解が出ている(Ellis, 2010:p10) あとはRやcalculatorに おまかせ!

16 効果量の公式(d family) プールされた標準偏差(Ellis, 2010: p26,27) Cohen (1988:67)
Hedges (1981:110) ※Nakagawa & Cuthill (2007) Table1 によると,SD*pooledによる効果量は,文献中ではd, Cohen's dと呼ばれることも多いらしい。詳しくはKline, 2004, p.102を見よと書いてある。

17 効果量の公式(d family) バイアスの修正(Ellis, 2010: p27)
dの計算上起こる小さな正のバイアスを取り除くことでgを計算(Hedges,1981) この式も,分母の部分でバリエーションがいろいろある。4(n+n-2)-1,とかdf使ってたりとか Hedges & Olkin (1985:81) ただし,ここでのgはHedges and Olkinでdと呼ばれていて,混乱が見られる(Ellis, 2010:p27) ※Nakagawa & Cuthill(2007)はこれ(g)を dunbiased, =Hedges' d と呼んでる。したがってdはdbiased (つまりCohen's d又はHedges' g)と表記している)。常にdunbiased を報告することを推奨している

18 記号の混乱(McGrath & Meyer, 2006)

19 検定と効果量の関係 検定統計量=効果の大きさ×標本の大きさ n1=n2の場合 n1n2/n1+n2=n/2 n=1の場合,1/2=0.5;
S*は「群内の標準偏差の推定量」 南風原(2002),p163; Rosnow(2003)

20 効果量の95%信頼区間 Interval estimates.
Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Cumming & Finch (2001)の解説論文 (a)解釈しやすい (b)有意性検定とつながりがある (c)メタ分析的思考を促進する (d)正確性についての情報を提供する Interval estimates. Interval estimates should be given for any effect sizes involving principal outcomes. (p599)

21 効果量の95%信頼区間 95%CI = ES -1.96se to ES +1.96se
「母集団から無限に無作為抽出を繰り返したら,得られた95%信頼区間の内,95%の区間推定値が母数を包含する」という意味(Thompson, 2007:p247) よくある誤解は,「特定の信頼区間が母数をとらえる確からしさ(100%)」 近似95%信頼区間の計算方法(Nakagawa & Cuthill, 2007, p599) 95%CI = ES -1.96se to ES +1.96se

22 効果量の95%信頼区間 Cohen's d (実際はHedges' g)の漸近標準誤差
Nakagawa & Cuthill(2007),Table 3 Cohen's d (実際はHedges' g)の漸近標準誤差 Hedges'd (unbiased d) の漸近標準誤差

23 正確な95%信頼区間 Odgaard & Fowler(2010), JCCP Recommendations (p293)
First, we recommend that authors use exact rather than approximate CIs for ESs whenever possible. ・・・ Second, we recommend that authors and editors add to standard practice the reporting of the specific techniques used to compute CIs for ESs. standard practice :普通の習慣,標準的技法 ※付録に計算法やSAS,SPSS,特別なソフトの紹介あり

24 効果量に関する補足事項 ESというと何かとCohen's dが出てくるが,公式的にはHedges'g (Nakagawa & Cuthill., 2007: p596, Table1) dよりrを推奨する統計家もいる(Field, ) 標準化効果量は,非標準化効果量に比べて優先されるわけではない。非標準化の方がよい時も多い(Nakagawa & Cuthill, 2007: p595; Coe, 2002:conclusionより; ) 公式は間違ってるんじゃないかっていうのが結構あるので,出典をきちんと把握しておく 基本的に効果量は相互変換可能 解釈は,Cohenの基準を盲信せず,文脈的に。過去の研究と比較

25 Package "rpsychi" ind.t.test (y~x, data=dat)
連続量yについて,カテゴリ変数xでt検定。効果量と95%信頼区間を算出 (Hedges' g) ind.t.test.second(m=c(13,11),sd=c(2.739, 2.236),n=c(5,5)) それぞれの平均値,標準偏差,nから効果量と95%信頼区間を算出 zero.r.test(y~x, data=dat) :相関 ind.oneway(formula = y~x, data=dat)  :1要因ANOVA

26 Package "compute.es" mes(m.1, m.2, sd.1, sd.2, n.1, n.2)
平均値,標準偏差,人数をそれぞれ直で入れてCohen'd(※SDpooledの式はHedges'gだった), Hedges'g(unbiasedの 修正式かけたやつ)やその分散,その他の効果量を計算 tes (t-value, n1, n2) 平均とSDのかわりにt値を使用 ※95%信頼区間を算出するためには,出てきたvarの値の平方根を計算する,すなわちES±1.96*sqrt(var) を計算

27 Package "MBESS" smd(Mean.1=13, Mean.2=11, s.1=2.739, s.2=2.236, n.1=5, n.2=5) 標準化平均値差の値のみを算出,=の後に値を記入 smd(Mean.1=13, Mean.2=11, s.1=2.739, s.2=2.236, n.1=5, n.2=5, Unbiased=T) バイアスを調整した標準化平均値差の値のみを 算出 ・the difference between the two means, divided by the pooled estimate  of standard deviation ・corrected using a factor provided by Hedges and Olkin (1985) ・95%信頼区間はci.smdを使って算出

28 補足 Effect size計算用Rスクリプト(Nakagawa) 効果量の計算,報告,解釈ガイドライン (Durlak, 2009)
Exact CIの計算 効果量の計算,報告,解釈ガイドライン (Durlak, 2009)

29 論文での示し方例(介入研究) Adamsen et al., (2009) BMJ
Method: Effect size was calculated by the mean difference divided by the pooled standard deviation, the root mean square error estimated from the general linear model. Results: The fatigue score was reduced in the intervention group by an estimated mean difference of −6.6 points (95% CI −12.3 to −0.9) compared with the control group (P=0.02, effect size=0.33, 95% CI 0.04 to 0.61) (table 3).

30 論文での示し方例(介入研究) Cooper et al., (2010) Child Adolesc Psychiatry Ment Health. Method: Effect sizes and 95% confidence intervals were calculated using the Effect Size Calculator from the Centre for Evaluation and Monitoring, Durham University Effect sizes are given as Hedges' g throughout the paper. Like Cohen's d, Hedges' g is calculated by dividing the difference between experimental and control group means at endpoint by the pooled standard deviation; however, it uses a slightly different formula to calculate the latter [see [34]], correcting for biases that can occur in smaller sample sizes. Results: Participants who attended counselling did not improve significantly more on the primary outcome measure, the SDQ-ES, than those on the waiting list (g = 0.03). ・・・(略)・・・ Analysis of data from the subgroup of clients who met the MDE cutpoint only (n = 10) found a trend towards significantly greater efficacy for counselling over waiting list (p = .087), with an effect size (g) for treatment against control of 1.13 (95% CI = ) on the SDQ-ES. main sub group

31 主要引用文献 ※Ellis PD. The Essential Guide to Effect Sizes: Statistical Power, Meta-Analysis, and the Interpretation of Research Results Cambridge University Press. New York ※Nakagawa S, Cuthill IC. Effect size, confidence interval and statistical significance: a practical guide for biologists. Biol Rev Camb Philos Soc. 2007;82(4): Coe R. It's the Effect Size, Stupid: What effect size is and why it is important Paper presented at the Annual Conference of the British Educational Research Association, University of Exeter, England, 12-4 September Available at: (accessed 2/3/11). 又は (Excelのcalculator付) 南風原朝和. 心理統計学の基礎-統合的理解のために.2002有斐閣 Rosnow RL. Effect sizes for experimenting psychologists. Can J Exp Psychol. 2003;57(3): Thompson, B., Effect sizes, confidence intervals, and confidence intervals for effect sizes. Psychology in the Schools, 2007, 44: 423–432. Fidler F, Cumming G, Thomason N, Pannuzzo D, Smith J, Fyffe P, Edmonds H, Harrington C, Schmitt R. Toward improved statistical reporting in the journal of consulting and clinical psychology. J Consult Clin Psychol ;73:

32 Odgaard EC, Fowler RL. Confidence intervals for effect sizes: compliance and clinical significance in the Journal of Consulting and clinical Psychology. J Consult Clin Psychol ;78: McGrath RE, Meyer GJ. When effect sizes disagree: the case of r and d. Psychol Methods ;11: Durlak JA. How to select, calculate, and interpret effect sizes. J Pediatr Psychol. 2009;34: ※Wilkinson L, Task Force Stat I.. Statistical methods in psychology journals - Guidelines and explanations. American Psychologist (8): Cumming G, Finch S.. A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions. Educational and Psychological Measurement (4):532. Adamsen L, Quist M, Andersen C, Moller T, Herrstedt J, Kronborg D, Baadsgaard MT, Vistisen K, Midtgaard J, Christiansen B, Stage M, Kronborg MT, Rorth M. Effect of a multimodal high intensity exercise intervention in cancer patients undergoing chemotherapy: randomised controlled trial. BMJ Oct 13;339:b3410 Cooper M, Rowland N, McArthur K, Pattison S, Cromarty K, Richards K. Randomised controlled trial of school-based humanistic counselling for emotional distress in young people: feasibility study and preliminary indications of efficacy. Child Adolesc Psychiatry Ment Health Apr 22;4:12.


Download ppt "初心者による初心者のための「量的データの二変量解析」"

Similar presentations


Ads by Google