初心者による初心者のための「量的データの二変量解析」

Slides:



Advertisements
Similar presentations
英語ゼミ 6/15( 水 ) 金 正福. Part2 Unit8 ~査読者とのやりと り~ 科学技術英語 ロボット工学.
Advertisements

生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 - 後期 第 1 回 - 1 統計学入門2 講義内容の紹介 推測統計とは. 統計学入門2 - 後期 第 1 回 - 2 教科書 & 参考書 教科書 特に使用しない 参考書 「統計解析の基本と仕組み」 ( 秀和システム ) 「データ分析のための統計入門」(共立出版)
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
第 5 章 2 次元モデル Chapter 5 2-dimensional model. Contents 1.2 次元モデル 2-dimensional model 2. 弱形式 Weak form 3.FEM 近似 FEM approximation 4. まとめ Summary.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
VE 01 え form What is え form? え? You can do that many things with え form?
SS2-15:A Study on Image Recognition and Understanding
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
第6回 分散分析(第7章) Analysis of Variance
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
The authors have no actual or potential declaration to make.
第1回レポートの課題 6月15日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
Chapter 11 Queues 行列.
保健統計演習 橋本.
相関係数 植物生態学研究室木村 一也.
ABC社マジック・クアドラントでリーダーの位置づけ
2010年7月9日 統計数理研究所 オープンハウス 確率モデル推定パラメータ値を用いた市場木材価格の期間構造変化の探求 Searching for Structural Change in Market-Based Log Price with Regard to the Estimated Parameters.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
What did you do, mate? Plain-Past
心理統計学 II 第7回 (11/13) 授業の学習目標 相関係数のまとめと具体的な計算例の復習 相関係数の実習.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
日本人の英語文章の中で「ENJOY」はどういうふうに使われているのか
Noun の 間(に) + Adjective Verb てform + いる間(に) during/while.
Targeted Temperature Management at 33℃ versus 36℃ after Cardiac Arrest
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
Licensing information
Chapter 4 Quiz #2 Verbs Particles を、に、で
CRLA Project Assisting the Project of
“You Should Go To Kyoto”
ストップウォッチの カード ストップウォッチの カード
P4-21 ネットワーク上の経路に対する 回帰問題について
ISO 9001:2015 The process approach
4章までのまとめ ー 計量経済学 ー.
Session 8: How can you present your research?
2012/09/21 日本行動療法学会 第38回大会 WS12 「明日から使える 臨床的有意性の指標:行動療法研究に求められる統計学」
分割表 Contingency table.
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
Rコマンダーで2元配置ANOVA 「理学療法」Vol28(8)のデータ
Term paper, Report (1st, first)
My Dance Circle December 13, 2018  表紙 my dance circle.
いくらですか?.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
Term paper, report (2nd, final)
第1回レポートの課題 6月24日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
Genetic Statistics Lectures (4) Evaluation of a region with SNPs
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
北大MMCセミナー 第62回 附属社会創造数学センター主催 Date: 2016年11月4日(金) 16:30~18:00
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
The difference between adjectives and adverbs
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
Cluster EG Face To Face meeting
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
分割表 Contingency table.
~国際比較にみる達成目標と評価のガイドライン~
医学英語 III 6/11.
Improving Strategic Play in Shogi by Using Move Sequence Trees
ABC社[マーケット・セグメント名を入力]のハイプ・サイクルで「関連プレーヤー」に選定
Presentation transcript:

初心者による初心者のための「量的データの二変量解析」 2011/11/05 第3回 心理・医学系研究者のためのデータ解析環境Rによる統計学の研究会 初心者による初心者のための「量的データの二変量解析」 土屋政雄 2014/03/22: 29枚目の引用間違いを修正

本日の内容 2変量解析とは(連続量) 効果量 論文での示し方 Rでやってみる 必要性 種類と算出方法 区間推定 相互変換 ※一部に初心者編を 逸脱する表現が含まれてしまったため,該当 スライドには以下の星マークをつけました

2変量解析(連続量) 交絡要因を調整した多変量解析(重回帰,共分散分析など)と比べて,独立変数,従属変数が共に1つずつの解析 t検定 ピアソンの積率相関係数 1要因分散分析 単変量解析と表記する者もいるが,これは誤解されやすいのでやめた方がよい

t検定 独立な2群の平均値差の検定 # t検定関数のヘルプ確認。exampleより help(t.test) # データの図示 plot(extra ~ group, data = sleep) # groupによるextraのt検定 t.test(extra ~ group, data = sleep)  実際は,groupを因子型にしたり,変数のまま扱うようにするにはattachをするといったような細々した作業がある

ピアソンの積率相関 # 相関係数(検定付)のヘルプ確認。exampleより help(cor.test) # データ設定 x <- c(44.4, 45.9, 41.9, 53.3, 44.7, 44.1, 50.7, 45.2, 60.1) y <- c( 2.6, 3.1, 2.5, 5.0, 3.6, 4.0, 5.2, 2.8, 3.8) # ピアソンの積率相関 cor.test(x,y) 

1要因分散分析 # インターネットにつながっている状態で読みこみ hs1 <-read.table("http://www.ats.ucla.edu/stat/R/notes/hs1.csv", header=T, sep=",") attach(hs1) # 回帰のlm関数で計算して,anova関数で結果を出力 anova(lm(write~factor(prog))) R Class Notes Analyzing Data (UCLA Statistical Computing) http://www.ats.ucla.edu/stat/r/notes/analyze.htm

帰無仮説有意性検定:NHST (null hypothesis significance testing) Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Hypothesis tests. It is hard to imagine a situation in which a dichotomous accept-reject decision is better than reporting an actual p value or, better still, a confidence interval. Always provide some effect size estimate when reporting a p value(p599) ※かつて,アメリカ心理学会(APA)の委員会で,APA Journalにおいて帰無仮説検定を禁止すべきかどうかの議論があったが,上記Wilkinsonの推奨に落ち着いた (Thompson, 2007)

具体例で確かめてみよう 15 25 9 1.52 >.05 0.56 20 30 2.15 <.05 N mean SD t p SFトリビアの知識テスト得点 N mean SD t p Cohen's d 研究1 Jedi-wannabes 15 25 9 1.52 >.05 0.56 Trekkies 20 研究2 30 2.15 <.05 この下に数字があります この下に数字があります Jedi-wannabes= Star Wars fans Trekkies = Star Trek fans Ellis, (2010) p33

相関係数とp値( Nakagawa & Cuthill , 2007 ) 効果の不確実性 効果の方向 効果の強さ Nakagawa & Cuthill , (2007)のFig2参照。相関係数のp値とn数別の点推定値及び区間推定値のフォレストプロット p-p-! p-p-!

なぜ効果量が必要か Effect sizes Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Effect sizes Always present effect sizes for primary outcomes. If the units of measurement are meaningful on a practical level (e.g. number of cigarettes smoked per day), then we usually prefer an unstandardized measure (regression coefficient or mean difference ) to a standardized measure (r or d) (p599) この論文を引用している文献をWeb of Knowledgeで逆引きしてみたが2011/11/03時点で被引用数: 827 APA出版マニュアル第5版

なぜ効果量が必要か Journal of Consulting and Clinical Psychology Instructions to Authors http://www.apa.org/pubs/journals/ccp/index.aspx Authors should report means and standard deviations for all continuous study variables and the effect sizes for the primary study findings. (If effect sizes are not available for a particular test, authors should convey this in their cover letter at the time of submission.) JCCP also requires authors to report confidence intervals for any effect sizes involving principal outcomes (see Fidler et al., 2005, JCCP pp. 136–143 and Odgaard & Fowler, 2010, JCCP pp.287–297).

メタ分析的思考 ( Nakagawa & Cuthill , 2007 ) メタ分析はGene Glass (1976) の紹介以来,社会科学,医学において文献レビューについての本質的かつ確立したツールとなった 効果量に基づいて研究を統合し,そのばらつきを推定するためNHSTの限界にしばられない NHSTよる結論の間違いを覆してきた 近年,メタ分析の有益性は"メタ分析的"思考と呼ばれている(Cumming & Finch, 2001; Thompson, 2002b)

メタ分析的思考( Nakagawa & Cuthill , 2007 ) 効果量による先行研究の結果の正確な理解は本質的である (信頼区間が伴った)効果量の報告が習慣になり,メタ分析への組み入れが容易になる 先行研究の効果量と新たな研究の効果量を比較することで新たな結果の解釈がなされる 研究者は彼らの1片の研究を,研究世界のより大きな絵図に対する中程度の貢献物としてみる

効果量(連続量) 標準化効果量(standardized effect size) d-family (群間の違い) Cohen' s d Hedges' g Glass' ⊿ r-family (関連) ピアソンの積率相関係数 非標準化効果量(unstandardized effect size ) 平均値差 非標準化回帰係数 ※このように,色んな種類があるので,時々effect sizeとしか書いてない論文もみられるが,何の効果量なのか明示しないとだめ。

効果量の公式(d family) 言葉で(Coe, 2002) 記号で(Ellis, 2010: p10,26,27) 介入群の 平均値 統制群の 平均値 ー 標準偏差 言葉で(Coe, 2002) 記号で(Ellis, 2010: p10,26,27) Cohen (1962)がこの指標を開発した時,母集団標準偏差の計算については明確にしていなかったが,現在では3つの解が出ている(Ellis, 2010:p10) あとはRやcalculatorに おまかせ!

効果量の公式(d family) プールされた標準偏差(Ellis, 2010: p26,27) Cohen (1988:67) Hedges (1981:110) ※Nakagawa & Cuthill (2007) Table1 によると,SD*pooledによる効果量は,文献中ではd, Cohen's dと呼ばれることも多いらしい。詳しくはKline, 2004, p.102を見よと書いてある。

効果量の公式(d family) バイアスの修正(Ellis, 2010: p27) dの計算上起こる小さな正のバイアスを取り除くことでgを計算(Hedges,1981) この式も,分母の部分でバリエーションがいろいろある。4(n+n-2)-1,とかdf使ってたりとか Hedges & Olkin (1985:81) ただし,ここでのgはHedges and Olkinでdと呼ばれていて,混乱が見られる(Ellis, 2010:p27) ※Nakagawa & Cuthill(2007)はこれ(g)を dunbiased, =Hedges' d と呼んでる。したがってdはdbiased (つまりCohen's d又はHedges' g)と表記している)。常にdunbiased を報告することを推奨している

記号の混乱(McGrath & Meyer, 2006)

検定と効果量の関係 検定統計量=効果の大きさ×標本の大きさ n1=n2の場合 n1n2/n1+n2=n/2 n=1の場合,1/2=0.5; S*は「群内の標準偏差の推定量」 南風原(2002),p163; Rosnow(2003)

効果量の95%信頼区間 Interval estimates. Statistical Methods in Psychology Journals (Wilkinson & the Task Force on Statistical Inference APA Board of Scientific Affairs, 1999) Cumming & Finch (2001)の解説論文 (a)解釈しやすい (b)有意性検定とつながりがある (c)メタ分析的思考を促進する (d)正確性についての情報を提供する Interval estimates. Interval estimates should be given for any effect sizes involving principal outcomes. (p599)

効果量の95%信頼区間 95%CI = ES -1.96se to ES +1.96se 「母集団から無限に無作為抽出を繰り返したら,得られた95%信頼区間の内,95%の区間推定値が母数を包含する」という意味(Thompson, 2007:p247) よくある誤解は,「特定の信頼区間が母数をとらえる確からしさ(100%)」 近似95%信頼区間の計算方法(Nakagawa & Cuthill, 2007, p599) 95%CI = ES -1.96se to ES +1.96se

効果量の95%信頼区間 Cohen's d (実際はHedges' g)の漸近標準誤差 Nakagawa & Cuthill(2007),Table 3 Cohen's d (実際はHedges' g)の漸近標準誤差 Hedges'd (unbiased d) の漸近標準誤差

正確な95%信頼区間 Odgaard & Fowler(2010), JCCP Recommendations (p293) First, we recommend that authors use exact rather than approximate CIs for ESs whenever possible. ・・・ Second, we recommend that authors and editors add to standard practice the reporting of the specific techniques used to compute CIs for ESs. standard practice :普通の習慣,標準的技法 ※付録に計算法やSAS,SPSS,特別なソフトの紹介あり

効果量に関する補足事項 ESというと何かとCohen's dが出てくるが,公式的にはHedges'g (Nakagawa & Cuthill., 2007: p596, Table1) dよりrを推奨する統計家もいる(Field, ) 標準化効果量は,非標準化効果量に比べて優先されるわけではない。非標準化の方がよい時も多い(Nakagawa & Cuthill, 2007: p595; Coe, 2002:conclusionより; ) 公式は間違ってるんじゃないかっていうのが結構あるので,出典をきちんと把握しておく 基本的に効果量は相互変換可能 解釈は,Cohenの基準を盲信せず,文脈的に。過去の研究と比較

Package "rpsychi" ind.t.test (y~x, data=dat) 連続量yについて,カテゴリ変数xでt検定。効果量と95%信頼区間を算出 (Hedges' g) ind.t.test.second(m=c(13,11),sd=c(2.739, 2.236),n=c(5,5)) それぞれの平均値,標準偏差,nから効果量と95%信頼区間を算出 zero.r.test(y~x, data=dat) :相関 ind.oneway(formula = y~x, data=dat)  :1要因ANOVA

Package "compute.es" mes(m.1, m.2, sd.1, sd.2, n.1, n.2) 平均値,標準偏差,人数をそれぞれ直で入れてCohen'd(※SDpooledの式はHedges'gだった), Hedges'g(unbiasedの 修正式かけたやつ)やその分散,その他の効果量を計算 tes (t-value, n1, n2) 平均とSDのかわりにt値を使用 ※95%信頼区間を算出するためには,出てきたvarの値の平方根を計算する,すなわちES±1.96*sqrt(var) を計算

Package "MBESS" smd(Mean.1=13, Mean.2=11, s.1=2.739, s.2=2.236, n.1=5, n.2=5) 標準化平均値差の値のみを算出,=の後に値を記入 smd(Mean.1=13, Mean.2=11, s.1=2.739, s.2=2.236, n.1=5, n.2=5, Unbiased=T) バイアスを調整した標準化平均値差の値のみを 算出 ・the difference between the two means, divided by the pooled estimate  of standard deviation ・corrected using a factor provided by Hedges and Olkin (1985) ・95%信頼区間はci.smdを使って算出

補足 Effect size計算用Rスクリプト(Nakagawa) 効果量の計算,報告,解釈ガイドライン (Durlak, 2009) http://www.bristol.ac.uk/biology/research/staff/cuthill.i/ Exact CIの計算 効果量の計算,報告,解釈ガイドライン (Durlak, 2009)

論文での示し方例(介入研究) Adamsen et al., (2009) BMJ Method: Effect size was calculated by the mean difference divided by the pooled standard deviation, the root mean square error estimated from the general linear model. Results: The fatigue score was reduced in the intervention group by an estimated mean difference of −6.6 points (95% CI −12.3 to −0.9) compared with the control group (P=0.02, effect size=0.33, 95% CI 0.04 to 0.61) (table 3).

論文での示し方例(介入研究) Cooper et al., (2010) Child Adolesc Psychiatry Ment Health. Method: Effect sizes and 95% confidence intervals were calculated using the Effect Size Calculator from the Centre for Evaluation and Monitoring, Durham University http://www.cemcentre.org/. Effect sizes are given as Hedges' g throughout the paper. Like Cohen's d, Hedges' g is calculated by dividing the difference between experimental and control group means at endpoint by the pooled standard deviation; however, it uses a slightly different formula to calculate the latter [see [34]], correcting for biases that can occur in smaller sample sizes. Results: Participants who attended counselling did not improve significantly more on the primary outcome measure, the SDQ-ES, than those on the waiting list (g = 0.03). ・・・(略)・・・ Analysis of data from the subgroup of clients who met the MDE cutpoint only (n = 10) found a trend towards significantly greater efficacy for counselling over waiting list (p = .087), with an effect size (g) for treatment against control of 1.13 (95% CI = -0.21 - 2.46) on the SDQ-ES. main sub group

主要引用文献 ※Ellis PD. The Essential Guide to Effect Sizes: Statistical Power, Meta-Analysis, and the Interpretation of Research Results. 2010 Cambridge University Press. New York ※Nakagawa S, Cuthill IC. Effect size, confidence interval and statistical significance: a practical guide for biologists. Biol Rev Camb Philos Soc. 2007;82(4):591-605. Coe R. It's the Effect Size, Stupid: What effect size is and why it is important Paper presented at the Annual Conference of the British Educational Research Association, University of Exeter, England, 12-4 September 2002. Available at: http://www.leeds.ac.uk/educol/documents/00002182.htm (accessed 2/3/11). 又は http://www.cemcentre.org/evidence-based-education/effect-size-calculator (Excelのcalculator付) 南風原朝和. 心理統計学の基礎-統合的理解のために.2002有斐閣 Rosnow RL. Effect sizes for experimenting psychologists. Can J Exp Psychol. 2003;57(3):221-37. Thompson, B., Effect sizes, confidence intervals, and confidence intervals for effect sizes. Psychology in the Schools, 2007, 44: 423–432. Fidler F, Cumming G, Thomason N, Pannuzzo D, Smith J, Fyffe P, Edmonds H, Harrington C, Schmitt R. Toward improved statistical reporting in the journal of consulting and clinical psychology. J Consult Clin Psychol. 2005 ;73:136-43.

Odgaard EC, Fowler RL. Confidence intervals for effect sizes: compliance and clinical significance in the Journal of Consulting and clinical Psychology. J Consult Clin Psychol. 2010 ;78:287-97. McGrath RE, Meyer GJ. When effect sizes disagree: the case of r and d. Psychol Methods. 2006 ;11:386-401. Durlak JA. How to select, calculate, and interpret effect sizes. J Pediatr Psychol. 2009;34:917-28. ※Wilkinson L, Task Force Stat I.. Statistical methods in psychology journals - Guidelines and explanations. American Psychologist 1999 54(8):594-604. Cumming G, Finch S.. A primer on the understanding, use, and calculation of confidence intervals that are based on central and noncentral distributions. Educational and Psychological Measurement 2001 61(4):532. Adamsen L, Quist M, Andersen C, Moller T, Herrstedt J, Kronborg D, Baadsgaard MT, Vistisen K, Midtgaard J, Christiansen B, Stage M, Kronborg MT, Rorth M. Effect of a multimodal high intensity exercise intervention in cancer patients undergoing chemotherapy: randomised controlled trial. BMJ. 2009 Oct 13;339:b3410 Cooper M, Rowland N, McArthur K, Pattison S, Cromarty K, Richards K. Randomised controlled trial of school-based humanistic counselling for emotional distress in young people: feasibility study and preliminary indications of efficacy. Child Adolesc Psychiatry Ment Health. 2010 Apr 22;4:12.