Download presentation
Presentation is loading. Please wait.
1
スケジュール予定など 9:30-10:20頃 看護研究・データ分析再考 10:30-12:00頃 データ入力段階の留意 昼 食
9:30-10:20頃 看護研究・データ分析再考 データ分析の意味や意義をわかる 10:30-12:00頃 データ入力段階の留意 仮説からデータ準備の思わぬ盲点 昼 食 13:00-14:20頃 個人データ分析に挑戦 データ分析はエクセル~Webで慣れる 14:30-16:00 統計サイトでノンパラ検定を 統計的検定法をサイトで習得
2
About 研修講師 田中 潔(たなかきよし) 略歴: 岡山大、九州大修了後岡山商大へ勤務。教授 岡山県を中心に看護研修を25年以上
田中 潔(たなかきよし) 略歴: 岡山大、九州大修了後岡山商大へ勤務。教授 岡山県を中心に看護研修を25年以上 主な科目:ネットワークシステム演習、社会調査実践他など 連絡先 岡山商科大学 〒 (専用番号で届く) (Web) 検索エンジン 「岡山商大 田中」で検索 大学電話 大学FAX 2 2
3
After 研修後 アポイントメント 相談の「三種の神器」: 看護研究計画書、使用アンケート用紙、データ入力エクセルファイル(すでにあれば) 遠方の場合メールだけで指導する場合もある(PC用メールがあるとファイルのやり取りが便利。連絡なら携帯メールでも可能) 3 3
4
After インターネット上での情報源 検索エンジン「岡山商大 田中」
5
看護研究やデータ分析を考える
6
データ分析の背景 看護研究はこのあたりか 国勢調査や行政調査 マーケティング(市場調査)・世論調査 実験や臨床研究、業務改善
国・県などの公的調査 国勢調査は統計法に基づく(2010年は調査年) 政府統計ポータルサイト(政府統計の窓口) マーケティング(市場調査)・世論調査 ある目的のため市場を調査する アンケート調査 実験や臨床研究、業務改善 比較的小規模、実験データ 看護研究はこのあたりか
7
看護研究に問われる量か質か 量的研究(学部卒レベル) 質的研究(院レベル)
通常のアンケート調査、多くの場合対象者全員からの回答は無理→標本調査 量的研究の主目的は、市場の現況を把握すること 質的研究(院レベル) インタビュー調査、症例研究、観察など 未知なる問題の場合、仮説を発見するために比較的小規模にて行う
8
そもそも医療分野で 統計的分析が好まれるわけ
統計分析の考え方: 「目標達成のために満足のできるものであれば良しとする接近法」(ネイマン・ピアソン流) 医療で解決すべき課題(目標仮説) (ここに看護的意味づけが必要) データで証明する(実現仮説または達成仮説) つまり、調査や実験の成否判定 (有意になれば良いのではありません。 有意にならないことが大事なときもあります) 仮説設計、データ収集、集計、統計分析の各作業
9
「統計」のことば始め 「高き屋にのぼりて見れば煙けぶり立つ民のかまどはにぎはひにけり 」(新古今和歌集、仁徳天皇) 帝王の学問
「高き屋にのぼりて見れば煙けぶり立つ民のかまどはにぎはひにけり 」(新古今和歌集、仁徳天皇) 帝王の学問 最も古いのはBC3800年代バビロン王朝で行われ、約BC3000年エジプトや中国などで見られる 。 大化の改新(645年)によって班田収授の法 。 1920(大正9)年10月1日を 期して、第1回「国勢調査」 。
10
統計=stat(istics) 近代統計学の父ケトレー(コペルニクスに影響) 英語で統計または統計学= statistics。
近代統計学の父ケトレー(コペルニクスに影響) 英語で統計または統計学= statistics。 語源はラテン語で「状態」を意味するstatisticum 。 イタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢データを比較検討する学問。 さらに費用対効果から、必要最低限度の数を調査して、その場合の精度が、「目標達成のために満足のできるものであれば良しとする接近法」が考案される。⇒現代の「統計学」の基本原理 推測統計学(stochastics)。
11
データ分析の流れ データの正しい収集法(集める) データの集計方法(サンプル・標本集団の分析) データの分析方法(背景の母集団を意識)
計画的な抽出や正しい質問の作り方 データの集計方法(サンプル・標本集団の分析) 基礎統計量とクロス表、グラフ化 データの分析方法(背景の母集団を意識) 検定、回帰・相関、因子分析など多変量解析法 統計分析、データ分析、データ科学、 データマイニングなど呼び方はさまざま
12
母集団と標本 母集団:未知、 標本:既知 仮説の下で考える理想的な集団。標本はこの母集団から無作為に取り出された部分集団 無作為抽出
母集団:未知、 標本:既知 仮説の下で考える理想的な集団。標本はこの母集団から無作為に取り出された部分集団 無作為抽出 母集団:未知 標本・サンプル 既知:データ分析の対象 標本は分析できる 未知または既知
13
大まかな統計分析の流れ 4段階 母集団(未知であり不可視) 標本(可視) 集計 推定・検定 データの収集 データ集計 統計解析
大まかな統計分析の流れ 4段階 母集団(未知であり不可視) 標本(可視) 集計 推定・検定 データの収集 データ集計 統計解析 アンケート調査 無作為抽出 平均値やクロス表 基礎統計量や集計表 t検定やカイ2乗検定結果(有意かどうか) 神の領域 人間界 第一段階 第二段階 第三段階 第四段階
14
データ分析の道のり 母集団を想定する(想像する)、仮説を決める 標本集団を収集する(実験や調査) 分析に合うよう素データの加工や集計
見えないけれど、どんな現象集団 標本集団を収集する(実験や調査) 精密でなく正確な回答か?答えやすい用紙?、回収率 分析に合うよう素データの加工や集計 度数表、基礎等計量、グラフ、クロス表など 仮説をうらづけるグラフ? 統計手法で分析する 種々の統計解析法、仮説を説明できた?
15
情報処理と看護研究のハザマ 看護研究 エビデンス 心がけなければならない先人のコトワザ 情報面 GIGO(ぎーご)
看護の中で、課題を立証し客観的結論を得る エビデンス 明白なこと、証拠や根拠 心がけなければならない先人のコトワザ 情報面 GIGO(ぎーご) Garbege In Garbege Out ゴミからはゴミしか生まれない 統計学 群盲評象(ぐんもうひょうぞう) 尻尾を握って象がわかったつもりになっていませんか?
16
ステップ1 研究や分析のための データ準備 留意点
17
個人データ分析の道具 マイクロソフトOfficeはあるか?
マイクロソフト社の代表ソフト群 ワード、エクセル、パワーポイント、アクセス PCを買うとWordとExcelはついているのが普通...でも本当は Word 文書や資料作成(看護研究計画書類) Excel データ分析・グラフ(データの視覚化・プレゼン) パワーポイント 必要に応じて購入するソフト(別売1~2万円) 施設PCには装備なしのこともあり プレゼン準備にハタと困る場合あり 17
18
自PCでソフト確認 PC購入時には「スタート」、「すべてのプログラム」を開いてMSOfficeの確認をする
19
WordやExcelからパワーポイント 精密な文書作成にはやはりWord 精密なデータ処理にはExcelを
機械可読式データ(マシン・リーダブル・データ) 人に見せる時,これらをパワーポイントで要約して表示する 19
20
平均が意味ある場合、ない場合 データの「測定尺度」
比率や間隔尺度 身長160,170,180 平均は170cm ◎ 順序尺度 1.嫌い 2.まあまあ 3.好き どれか1つ選ぶ 回答 2,1,1,3,3,3,2 合計15 平均2.1 △ 名義尺度 1.品数 2.一ヶ所で買える 3.駐車場 4.その他 この場合平均は求められません→集計へ ×
21
エクセル使いなら必需品A1 行側(ギョウソク)と列側(レツソク)
→列側(項目、変数、変量) 行側↓ (ケース)
22
入力したデータ
23
データ収集の時、気づかうこと 有効数字について
計算結果を小数点何桁まで取るべきか? 答え 測定値で影響されます。 身長160cmは「センチ単位」で測定されました。 160.1かも160.4かも知れません。 有効数字 小数点以下0桁 でした。 そこで平均値など計算結果の表示は、ひと桁多くし小数点以下1桁(2桁目を四捨五入して)で表示しましょう 教訓 計算結果の有効数字は測定値よりも1桁多く
24
収集データの欠席扱いとは 欠測値について 計測されなかった、計測できなかった値・回答 表ソフトで欠測値には0ゼロを入力しない
欠測値という 表ソフトで欠測値には0ゼロを入力しない エクセルの場合何も入力しない セル値の削除はdeleteキーで 0は計測値として計算してしまいます 99や0など特定値を入れることは 一部の統計ソフトでは除外可能だが、エクセルとの互換性を考えると入力しない方が無難でしょう
25
いくつのサンプルが要りますか? 理論的には概ね10サンプルでも可能 現実的目標は、「1グループ20以上ずつ」
でも、本当は多ければ多いほどが良い 現実的目標は、「1グループ20以上ずつ」 全部で20あればではない× グループ数は原則2、3が適当 細かなグループ分けはデータ分析を複雑にする 男女別ならば男20、女20=40が望ましい 3世代なら若い20+中年20+老年20=60 グループごと数は違っていても結構 1グループ20に欠けていても結構
26
データ分析をタイプ別に データを揃え、入力する 道具はエクセル、知識は測定尺度 時にankstat(エクセルシート)を使うと便利
1つの項目ごとデータ分析(単変数分析) グラフで「見える化」、資料作り エクセルの関数機能を活用 指導者に「○○を計算しておいて」向き 2項目の関係を分析 散布図から回帰分析、相関など、エクセルで可能 医療では、○×検定や多変量分析の場合もしばしば 統計サイト(インターネット)を使う 高度かつ高価な統計ソフトを考える。例えばSPSS 統計専門家の助言や手助けも有効
27
ステップ2 データが用意できたら、まず 1項目ごとにデータの姿をつかむ 記述統計(基礎統計、度数・クロス集計、グラフ表示)
エクセルで十分可能、個人でも可能
28
基礎統計について (比率や間隔尺度の場合)
基礎、キソと軽んじてはいけません。 この基礎統計からデータの概要を思い浮かべることが、解明の第一歩 基礎統計量算出やグラフ書きは地味ですが、 多くの発表はこれで決まります。 項目ずつ(1変数ごと)の統計分析です
29
最初のデータ分析はデータの形を知る 記述または基礎統計量とは 平均値 標準偏差 最大、最小値 中央値 度数集計表
30
エクセルで基礎統計量を 関数をセルに挿入で求める ○○値を求める関数(名前知らなくても利用できる) 関数名ヘルプをうまく利用する
平均 =AVERAGE(範囲指定) 標準偏差 =STDEV(範囲) 中央値 =MEDIAN(範囲) 最大値 =MAX(範囲) 最小値 =MIN(範囲) 表の度数を求める関数 該当数(通常) =COUNT(範囲)または 条件付該当数 =COUNTIF(範囲、条件) 度数処理にはankstatシートが結構使える
31
名義や順序尺度の場合、基礎統計量はあまり意味を持ちません。 集計しましょう
度数分布表を作りましょう(1つの項目ずつ) これを棒グラフ(ヒストグラム)に描きましょう これである1項目の姿が見えてきます (全ての測定尺度で可能) クロス表(分割表)にまとめましょう(2つの項目ごと) 特に2次元クロス表(分割表)は大事 2つの項目を同時に表にまとめます (特に、順序や名義尺度でも作れます)
32
2つの項目の 基礎集計 投げ1のヒストグラム
33
素データから度数集計してみたら
34
投げ1と投げ2の2群を書き分ける 素データ→度数表→ 2群別のグラフ 投げ2 投げ1
35
投げ1と投げ2を書き分ける 35
36
棒の間隔をコントロール あなたは気をつかっていますか? 36
37
折れ線グラフはプロフィール分析 6つの項目について、それぞれ10点満点で採点する。 1点=できていない 5点=普通 10点=出来ている
1点=できていない 5点=普通 10点=出来ている 患者群、看護群ごとに平均を算出 37
38
グラフは統計分析の設計図 エクセルはグラフ化の良いツール
最初のうちは、グラフ化することがとても大事 図中には、実は分析結果が見えています。 1項目の現象には 棒グラフか折れ線グラフがしばしば。 大切なことは、条件によりグラフを書き分けていますか? 条件とは、女性・男性、学級A、B、C別など
39
ステップ3 (比率尺度の場合) 1つずつ、項目ごとの把握が終ったら エクセルで十分可能、個人でも可能 次は2項目ごとの視覚化と分析
ステップ3 (比率尺度の場合) 1つずつ、項目ごとの把握が終ったら 基礎統計の算出 集計表=度数表やクロス表にまとめる 項目ごとにグラフで表現 エクセルで十分可能、個人でも可能 次は2項目ごとの視覚化と分析 回帰分析で関係をつかむ
40
「散布図」は2項目の関係図 (エクセルで分析可能)
41
散布図→単回帰分析 回帰直線y=x 相関係数r=0.43 投げ1と投げ2の直線関係は弱い(あまりない) 41
42
(単)回帰分析 散布図を描くとX軸とY軸の関係を目視 Y=aX+bという直線関係を考える XとYはデータとして測定される
傾きaとbを決定すれば、XとYの関係が決まる
43
散布図から回帰分析へ 1ケースを点で見る→散布図グラフ化 点を選択→近似直線のあてはめ ①直線の方程式を求めること ②相関係数Rを求める
点の傾向や関係を直線で置き換える 回帰直線 ②相関係数Rを求める 直線の度合い -1(負相関)~0(無相関)~+1(正相関)を知る ③重相関係数R2を求める 直線が示す情報量R2=R×R 例: R=0.7ならR2=0.5 正相関の目安R=0.7ならR2=0.5(50%) つまり相関ありは直線で半分以上の情報を示している
44
データ分析の道具立て 更なる分析にはエクセル以上
記述統計、グラフなどはエクセルで十分 検定、多変量分析となると専用ソフトが望ましい 市販ソフトとしては SPSS 高い、施設向き、論文投稿には望ましい。世界的権威ソフト 新規18万円 ライバル会社にSASがある。安価版としてJUMPも有名 エクセル統計 4万円、エクセルのアドイン、おおむね使えるが細かな使い勝手はあまり良くない フリーソフト(無料) R(アールと発音) 良くできているが上級者でなければ使いにくい!研究者向け
45
なぜ「Office(excel)」を? Windowsマシンが多く導入
Windowsマシンには「Officeファミリ」のうちWordとExcelが大体標準装備 Wordは施設企画書類づくり、発表用配布資料づくりに Excelは素データ入力、グラフ化、基礎統計など個人向け基本データ分析可能 パワーポイントは発表原稿づくりに(別売) Officeファミリーは相互に「コピー&ペースト」で対象物の継承が可能
46
最近ではインターネットのサイトにも 良いものが色々
検索エンジン 群馬 青木 → 「おしゃべりな部屋」 すがやみつる(漫画家)「こんにちは統計学」 Javaはサイトで計算処理を行うための仕組みでありPC購入後各自で導入するもの 施設のPCではセキュリティ保護の観点からJavaを導入していないものもあるので、青木サイトが利用できない場合がある 施設PCで利用できない場合、他の統計パッケージやJava導入した個人PCを利用する 最近ではスマートフォンで利用可能 □ □
47
あなたのPCのJAVA(Oracle社)という仕組みが古いなどの原因で、警告が出たものです。「いいえ」を選んでうまく動作すればいいですね。
48
ネット覗き体験その1 「群馬 青木」サイトの先頭ページ
ネット覗き体験その1 「群馬 青木」サイトの先頭ページ
49
覗き体験2 すがやみつる「こんにちは統計学」
覗き体験2 すがやみつる「こんにちは統計学」
50
覗き体験その3 検索「ankstat」 統計シートankstat(アンクスタット)
田中研究室提供のエクセル(バージョンは問わず)専用のシート 主に基礎集計やクロス集計を行う。統計解析はほぼ実施しない 検索エンジンで「ankstat」 。最新は5.9版 最大500ケース×200項目を集計する
51
アンクスタットankstatや研修資料は 「岡山商大 田中」サイトからも探せる
アンクスタットankstatや研修資料は 「岡山商大 田中」サイトからも探せる
52
さらに進むと…
53
シートankstatの入力シート
54
項目ごとの基礎統計量や度数表(%表示も可能)を算出
シートに素データを入力して、 下のタブを選ぶと 項目ごとの基礎統計量や度数表(%表示も可能)を算出
55
では統計サイトを実際に試してみましょう
56
看護に代表的な検定を分析体験 t検定(比率尺度で使用) カイ2乗検定(名義・順序尺度で使用) クロス表に傾向や関連性があるか
ある測定データの平均値がある値かどうか 仮説: 測定データの平均値=46.7 2群の平均は等しいとみなせるか 仮説: 群1の平均=群2の平均 カイ2乗検定(名義・順序尺度で使用) クロス表に傾向や関連性があるか 仮説: このクロス表の度数は同じか
57
統計的検定はどんなもの ある仮説(○=△)を判定する 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」
例: この実験結果=160.0 例: 群1の平均=群2の平均 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」 (厳密には仮説を認めたくないがやむを得ない) 棄却とは「この仮説を積極的に否定する」
58
検定では「P値」を探せ 検定に見る計算と判定
判定: 出てくる結果の有意確率か有意水準の値により判定 有意水準「P値」>0.05 有意水準5%以上で採択 5%以下ならば棄却(有意、SIG.)←差あり 0.05~0.01 5%有意 * 星1つ 0.01~0.005 1%有意 ** 星2つ 0.005より小 0.5%有意 *** 星3つ P値 有意水準0.05基準⇔今回の有意水準を逆算 つまり、P値が0.05を下回れば「有意」
59
2つの平均値を比べる 2群の平均値差の検定(t検定)
群 平均 SD N A 3.2 3.8 5 B 5.2 8.2 5 等分散性の検定 有意確率2.3%(有意) 2群のばらつきは等しくない 平均値差のt検定 等分散仮定する 6.4% 等分散仮定せず 6.4% いずれも平均値差は有意でない この2群で平均値3.2と5.2は同程度と見るか?否か? 2群のばらつきは 等しくないと判定 ばらつき等しくない仮定の下で、「採択」 2つの平均値が等しいことを否定せず(つまり同程度)
60
二群の平均値差の検定だけでも 入力形式や条件で色々
標準的なサイト 2群の個々の値を入力するタイプ。t検定とノンパラ(マンホットニ)検定が選択できる。マンホイットニ検定とウイルコクソン順位和とは同じもの 2群には対応がない場合 青木おしゃべりな部屋、Java、独立2標本の検定の順に探す
61
PC画面の例
62
応用 平均などで独立2標本検定 http://aoki2.si.gunma-u.ac.jp/JavaScript/t-test.html
応用 平均などで独立2標本検定 素データがなく、平均、標準偏差、ケース数のみがある場合のサイト 対応なしの場合、t検定 おしゃべりな部屋、Javascript、26番2群の平均値差の検定を参照
63
PC画面の例
64
応用 「対応のある」2群の検定 対応のある場合: 1人について前後を測定したなど。薬効や効果があったかはっきり検定する。
応用 「対応のある」2群の検定 対応のある場合: 1人について前後を測定したなど。薬効や効果があったかはっきり検定する。 場所はおしゃべりな部屋、Java,対応のある2標本の検定を探す 伝統的なt検定の他、ウィルコクソン符号付順位和検定、符号検定にも対応する
65
対応のあるデータ、ないデータ 対応ありと考えられる場合 同じ人やグループを追跡して測定 対応ないと考えられる場合
1回 2回 3回・・・ Aさん 1.0 1.5 2.0・・・ Bさん 1.2 1.7 2.2・・・ 対応ないと考えられる場合 毎回グループの構成者を取り替えて測定 岡山 東京 大阪 福岡・・・ 人口 生産額 学生数
66
二群の平均値差の検定 演習問題 以上 65 歳未満の住民検診 に来所した男子 42 名,女子 63 名の血色素量について
二群の平均値差の検定 演習問題 いずれもt検定(対応なし)として平均値差を検定せよ。青木サイトを使用する。 問1 群 平均 SD N 問2 A 3.2 3.8 5 B 5.2 8.2 5 問3 ある地区で行った40 歳 以上 65 歳未満の住民検診 に来所した男子 42 名,女子 63 名の血色素量について の検査成績は,男子では平 均値 15.2 g/dl,不偏分散 1.1,女子では平均値 12.7 g/dl,不偏分散 3.2 であった。 男女の平均値に差はあるか,
67
応用 名義尺度でも使える検定 クロス表の独立性の検定
応用 名義尺度でも使える検定 クロス表の独立性の検定 通称、カイ2乗検定 名義尺度では平均値が意味を持たない そこで表に集計する。 一次元の表こそ度数分布表 2次元以上をクロス集計表 ではこの表での仮説とは 「クロス表のマス目(セル)は同じ割合かどうか」 「クロス表に偏りがあるのかないのか」
68
(2×2)クロス表とはこんなもの 行と列で作表する
上の図では、左上50、右下55この程度の違いで、この表には差があるか、否か(有意性ありかなし?) a、b、c、dに顕著な違いがあるか? 行側:原因→列側:結果 例: 対応なし 投薬有無と結果や運動有無×効果 対応あり 1回目と2回目の状況
69
青木サイトで解く R×Cクロス表のカイ2乗検定
基本は2×2(検討しやすい) 4つのセル値をサイトへ入力 計算結果「P値」で判断する P>0.05 採択 0.01<P<0.05 5%有意他 1%有意 0.5%有意により *、**、***
70
再掲: 判定方法 P値と検定結果 前ページ解答: P値=0.31→採択(差なし) クロス表から有意水準またはP値を算出
判定方法 その1 有意水準の値が 有意水準値=P値が 0.05~0.01 5%有意 * 星1つ 0.01~0.005 1%有意 ** 星2つ 0.005より小 0.5%有意 *** 星3つ
71
クロス表独立性の検定 解答はP値を示す(有意でない=採択)
問10.83、20.76、30.31、40.60 50.01 60.00 採択 採択 採択 採択 ** ***
72
青木サイトを例に、今後使用する場面が出てくる「検定」にまつわる分析方法をご紹介
トピックス 検定手法の進化・深化 かつて皆さんが習ったt検定やカイ2乗検定も、医療界ではさまざまな手法に変わりつつあります。サイトはこの流れに対応しつつあります 青木サイトを例に、今後使用する場面が出てくる「検定」にまつわる分析方法をご紹介
73
主な統計的検定法の体系図
74
代表的なノンパラメトリック検定法 対応のない2標本(群)の代表値差 対応のある2標本(群)の代表値差 マンーホイットニのU検定
2標本コルモゴロフースミロノフ検定 ファンデル・ワーデン検定 中央値検定 対応のある2標本(群)の代表値差 ウイルコクソン符号検定 ウイルコクソン符号付順位和検定
75
早わかり なぜノンパラ検定に? あなたはある日Dr.から「論文のためこのデータをウイルコクソン検定しておいて」と告げられます
早わかり なぜノンパラ検定に? あなたはある日Dr.から「論文のためこのデータをウイルコクソン検定しておいて」と告げられます ウイルコクソン検定が何であるか、どうすれば良いかのため、検索エンジンで「ウイルコクソン検定」とするでしょう すると、分析のためには「青木サイト」に出会うかも知れません
76
今の「流行」検定手法は パラメトリックからノンパラへ
従来のt検定は、 正規分布を仮定するなど制約が多かった でも性能はよろしい(検定力大=シャープな剣) ノンパラ検定群(ウイルコクソンやフリードマン検定など)は、 適用の条件や制約少ない サンプル数も気にしないでも検定力もそこそこある=頑健な=ロバストな検定手法 適応範囲が従来よりかなり広い 次第に愛好者が医療関係者にも増えてきた 市販統計ソフトにも多く採用、使用可能、サイトでも
77
対応のあるデータ、ないデータ 対応ありと考えられる場合 同じ人やグループを追跡して測定 対応ないと考えられる場合
1回 2回 3回・・・ Aさん 1.0 1.5 2.0・・・ Bさん 1.2 1.7 2.2・・・ 対応ないと考えられる場合 毎回グループの構成者を取り替えて測定 岡山 東京 大阪 福岡・・・ 人口 生産額 学生数
78
対応のないk標本(群)の代表値差 クラスカル・ウォリス検定 中央値検定 対応のあるk標本(群)の代表値差 フリードマン検定
79
マンーホイットニのU検定 (Willcoxson順位和検定に同じもの) 2群、対応なし
9個の部品について4個は処置群、残り処置なし群とした。この2つの群の母代表値に差があるかどうか検定しなさい。 処置群の観察値 1.2,1.5,1.8,2.6 処置なし群の観察値 1.3,1.9,2.9,3.1,3.9
80
有意確率=0.142または0.190 有意確率>0.05なので有意差なし・採択 つまり両群に差は認められない
81
ウイルコクソン符号検定 (Wilcoxonの順位和=マンホイットニ検定と区別) 2群、対応あり
10 人の被検者について,五段階評価をした。同じ被検者に対して,1 年後にもう一度評価した。その結果を表 に示す。1 年間で母代表値に差があったかどうか検定しなさい 1 2 3 4 5 6 7 8 9 10 最 初 A A C B D A C B D B 1年後 C A E D B B D A E D
82
Wilcoxson符号検定の結果 正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない
正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない もしも計量値としてWilcoxsonの符号付順位和検定(2群対応なし)を行ったならば、 漸近有意確率=0.114>0.05 採択 やはり 最初と1年後では差はない
83
クラスカルーウォリス検定 3群以上、対応なし
12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえるか SPSS入力 表 1.餌の種類による肝臓の重量 A餌 3.42 3.84 3.96 3.76 B餌 3.17 3.63 3.47 3.44 3.39 C餌 3.64 3.72 3.91
84
H0: 平均1=平均2=平均3 H1: 3群の平均は同じでない 漸近有意水準0.062>0.05 採択 結論: 3群の平均は同じ程度とみなす(帰無できない) ただ、有意水準6.2%と5%に近いことにも留意する 参考
85
フリードマン検定 3群以上、対応あり 表 1 のようなデータがある。4 種の肥料間で収量に差があるか
参考: 行列を入れ替えれば3品種間に差があるかを検定できる 表 1.フリードマン検定が対象とするデータ 肥料 品種 B1 B2 B3 B4 A1 9 17 12 16 A2 1 21 11 A3 7 19 6 9
86
漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると 漸近有意確率0.004<0.005
エクセル版 H0: 4群の平均は等しい H1: 4群の平均は等しくない 漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると H0: 3品種の平均は等しい H1: 等しくない 漸近有意確率0.004<0.005 ***0.5%有意→3品種の平均は異なる 総合的には、肥料、品種いずれも差あり
87
表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。
肥料 品種 B1 B2 B3 B4 A1 9 17 12 16 A2 1 21 11 A3 7 19 6 9 表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。 クロス表では行か列はそれぞれ要因。フリードマンでは行か列は標本(ケース)である。
88
データ分析専門家の活用のために 専門家が知っていること 知らないこと あなたが知らなくても良いこと
データ分析の各段階、楽しさや辛さそして悲しさ 看護研究におけるデータの生かし方 星の数ほどある統計手法であなたの質問に適する手法について 知らないこと あなたの分野の専門的知識 あなたが知らなくても良いこと データ分析の環境整備、ツールそしてコスト
89
あなたが学んだ研修のまとめ □看護研究とデータ分析の関係を理解する □データ分析の前提: 適切な収集が大切 □データ入力での決まりごと
□データ分析の前提: 適切な収集が大切 □データ入力での決まりごと □ 1項目データ分析: 基礎統計量とグラフ □プラットホームはOffice(Excel)、エクセル関数 □ 2項目の関係: 相関、回帰式、散布図 □グループ(群)間比較: 統計的検定 □詳細な分析は統計ソフトやサイト利用可能 おしゃべりな部屋、こんにちは統計学、アンクスタット □検定(統計)手法の変化を知る ノンパラメトリック検定法
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.