スケジュール予定など 9:30-10:20頃 看護研究・データ分析再考 10:30-12:00頃 データ入力段階の留意 昼 食

Slides:



Advertisements
Similar presentations
5 章 標本と統計量の分布 湯浅 直弘. 5-1 母集団と標本 ■ 母集合 今までは確率的なこと これからは,確率や割合がわかっていないとき に, 推定することが目標. 個体:実験や観測を行う 1 つの対象 母集団:個体全部の集合  ・有限な場合:有限母集合 → 1つの箱に入っているねじ.  ・無限な場合:無限母集合.
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
生物統計学・第 5 回 比べる準備をする 標準偏差、標準誤差、標準化 2013 年 11 月 7 日 生命環境科学域 応用生命科学 類 尾形 善之.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 市場調査の手順 1. 問題の設定 2. 調査方法の決定 3. データ収集方法の決定 4. データ収集の実行 5. データ分析と解釈 – データ入力 – データ分析 6. 報告書の作成.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
社会調査データの分析 社会調査・実習. 分析の手順(1) 1 1 入力データの点検 (全部の調査票 に目を通す) 2 2 通し番号の入力。必要ならば回答の コード化。 3 3 入力フォーマットの決定 4 4 データ入力( Excel, エディターなど)
生体情報論演習 - 統計法の実践 第 1 回 京都大学 情報学研究科 杉山麿人.
Wilcoxon の順位和検定 理論生態学研究室 山田 歩. 使用場面 2 標本 離散型分布 連続型分布(母集団が正規分布でない時など 効果的) ただパラメトリックな手法が使える条件がそ ろっている時に、ノンパラメトリックな手法 を用いると検出力(対立仮説が正しいときに 帰無仮説を棄却できる確率)が低下するとい.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
コンピュータプラクティ スⅠ アンケート 水野嘉明 1. 本日の予定 「アンケート」  人間的な要因を評価するための 一手段として、アンケートの方 法について学ぶ  実験では、アンケートの集計を 行う 2.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
岡山商科大学経営学部商学科 教授 田中 潔(教学部長)
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
様々な仮説検定の場面 ① 1標本の検定 ② 2標本の検定 ③ 3標本以上の検定 ④ 2変数間の関連の強さに関する検定
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
検定 P.137.
臨床統計入門(2) 箕面市立病院小児科  山本威久 平成23年10月20日.
スケジュール予定など(再掲) 1日目 午前 10:00-11:00頃 統計学の全体像・歴史 11:00-12:00頃 看護研究の2アプローチ
スケジュール予定など 1日目 午前 10:00-11:00頃 統計学の全体像・歴史 11:00-12:00頃 看護研究の2アプローチ 昼食
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
実証分析の手順 経済データ解析 2011年度.
統計学 第3回 「データの尺度・データの図示」
第1回 担当: 西山 統計学.
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 データ入力 データ分析 報告書の作成.
2008/9/24 岡山県看護協会一般研修 資料 データ分析の基礎知識 統計的検定編 岡山商科大学商学部 商学科長・教授 田中 潔.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
データ分析の基礎知識 午前:総論編+午後:ノンパラ検定編
第3章 二つの変数の記述統計 二つの変数を対象として変数同士の関係を捉える 量的変数どうしの関係 質的変数どうしの関係.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
相関と回帰:相関分析 2つの変量それぞれが正規分布にしたがってばらつく量であるとき,両変数の直線的な関係を相関分析する. 例:兄弟の身長
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
対応のあるデータの時のt検定 重さの測定値(g) 例:
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
スケジュール予定など 2日目 午後 10:00-11:00頃 統計分析ソフトと 青木・すがやのサイト 11:00-12:00頃 統計的検定法
地理情報システム論演習 地理情報システム論演習
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
看護研究における 統計の活用法 Part 1 京都府立医科大学 浅野 弘明 2012年11月10日.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
数量分析 第2回 データ解析技法とソフトウェア
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
講師メモ 田中 潔 岡山商科大学商学部助教授 連絡先(質問や相談ごと) 〒700-8601(商大,専用番号)
analysis of survey data 堀 啓造
母分散の検定 母分散の比の検定 カイ2乗分布の応用
確率と統計2009 第12日目(A).
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
母分散の検定 母分散の比の検定 カイ2乗分布の応用
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
岡山商科大学経営学部商学科 教授 田中 潔(教学部長)
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1変量データの記述 (度数分布表とヒストグラム)
臨床統計入門(1) 箕面市立病院小児科  山本威久 平成23年10月11日.
Presentation transcript:

スケジュール予定など 9:30-10:20頃 看護研究・データ分析再考 10:30-12:00頃 データ入力段階の留意 昼 食 9:30-10:20頃 看護研究・データ分析再考 データ分析の意味や意義をわかる 10:30-12:00頃 データ入力段階の留意 仮説からデータ準備の思わぬ盲点      昼   食 13:00-14:20頃 個人データ分析に挑戦 データ分析はエクセル~Webで慣れる 14:30-16:00  統計サイトでノンパラ検定を 統計的検定法をサイトで習得

About 研修講師 田中 潔(たなかきよし) 略歴: 岡山大、九州大修了後岡山商大へ勤務。教授 岡山県を中心に看護研修を25年以上 田中 潔(たなかきよし) 略歴: 岡山大、九州大修了後岡山商大へ勤務。教授 岡山県を中心に看護研修を25年以上 主な科目:ネットワークシステム演習、社会調査実践他など 連絡先 岡山商科大学 〒700-8601(専用番号で届く) tanaka@po.osu.ac.jp (eメール) http://www.nahaha.org (Web) 検索エンジン 「岡山商大 田中」で検索 大学電話 086-252-0642 大学FAX 086-255-6947 2 2

After 研修後 アポイントメント 質問・相談はeメールtanaka@po.osu.ac.jpが最適。メールなら返事確実。その他電話・FAXは086-284-7726(自宅)でも可能。 相談の「三種の神器」: 看護研究計画書、使用アンケート用紙、データ入力エクセルファイル(すでにあれば) 遠方の場合メールだけで指導する場合もある(PC用メールがあるとファイルのやり取りが便利。連絡なら携帯メールでも可能) 3 3

After インターネット上での情報源 検索エンジン「岡山商大 田中」

看護研究やデータ分析を考える

データ分析の背景 看護研究はこのあたりか 国勢調査や行政調査 マーケティング(市場調査)・世論調査 実験や臨床研究、業務改善 国・県などの公的調査 国勢調査は統計法に基づく(2010年は調査年)http://www.stat.go.jp/index/seido/houbun2n.htm 政府統計ポータルサイト(政府統計の窓口) http://www.e-stat.go.jp/SG1/estat/eStatTopPortal.do マーケティング(市場調査)・世論調査 ある目的のため市場を調査する アンケート調査 実験や臨床研究、業務改善 比較的小規模、実験データ 看護研究はこのあたりか

看護研究に問われる量か質か 量的研究(学部卒レベル) 質的研究(院レベル) 通常のアンケート調査、多くの場合対象者全員からの回答は無理→標本調査 量的研究の主目的は、市場の現況を把握すること 質的研究(院レベル) インタビュー調査、症例研究、観察など 未知なる問題の場合、仮説を発見するために比較的小規模にて行う http://www.geocities.co.jp/Technopolis-Mars/4688/ 南小樽病院 瀬畠さん

そもそも医療分野で 統計的分析が好まれるわけ 統計分析の考え方: 「目標達成のために満足のできるものであれば良しとする接近法」(ネイマン・ピアソン流) 医療で解決すべき課題(目標仮説)        (ここに看護的意味づけが必要) データで証明する(実現仮説または達成仮説) つまり、調査や実験の成否判定        (有意になれば良いのではありません。         有意にならないことが大事なときもあります) 仮説設計、データ収集、集計、統計分析の各作業

「統計」のことば始め 「高き屋にのぼりて見れば煙けぶり立つ民のかまどはにぎはひにけり 」(新古今和歌集、仁徳天皇) 帝王の学問 「高き屋にのぼりて見れば煙けぶり立つ民のかまどはにぎはひにけり 」(新古今和歌集、仁徳天皇) 帝王の学問 最も古いのはBC3800年代バビロン王朝で行われ、約BC3000年エジプトや中国などで見られる 。 大化の改新(645年)によって班田収授の法 。 1920(大正9)年10月1日を 期して、第1回「国勢調査」 。

統計=stat(istics) 近代統計学の父ケトレー(コペルニクスに影響) 英語で統計または統計学= statistics。      近代統計学の父ケトレー(コペルニクスに影響) 英語で統計または統計学= statistics。 語源はラテン語で「状態」を意味するstatisticum 。 イタリア語で「国家」を意味するようになり、国家の人力、財力等といった国勢データを比較検討する学問。 さらに費用対効果から、必要最低限度の数を調査して、その場合の精度が、「目標達成のために満足のできるものであれば良しとする接近法」が考案される。⇒現代の「統計学」の基本原理 推測統計学(stochastics)。

データ分析の流れ データの正しい収集法(集める) データの集計方法(サンプル・標本集団の分析) データの分析方法(背景の母集団を意識) 計画的な抽出や正しい質問の作り方 データの集計方法(サンプル・標本集団の分析) 基礎統計量とクロス表、グラフ化 データの分析方法(背景の母集団を意識) 検定、回帰・相関、因子分析など多変量解析法 統計分析、データ分析、データ科学、 データマイニングなど呼び方はさまざま

母集団と標本 母集団:未知、 標本:既知 仮説の下で考える理想的な集団。標本はこの母集団から無作為に取り出された部分集団 無作為抽出 母集団:未知、 標本:既知 仮説の下で考える理想的な集団。標本はこの母集団から無作為に取り出された部分集団 無作為抽出 母集団:未知 標本・サンプル 既知:データ分析の対象 標本は分析できる 未知または既知

大まかな統計分析の流れ 4段階 母集団(未知であり不可視) 標本(可視) 集計 推定・検定 データの収集 データ集計 統計解析 大まかな統計分析の流れ 4段階 母集団(未知であり不可視)            標本(可視)          集計        推定・検定            データの収集      データ集計         統計解析            アンケート調査       無作為抽出                       平均値やクロス表                       基礎統計量や集計表                           t検定やカイ2乗検定結果(有意かどうか) 神の領域                     人間界 第一段階      第二段階        第三段階          第四段階

データ分析の道のり 母集団を想定する(想像する)、仮説を決める 標本集団を収集する(実験や調査) 分析に合うよう素データの加工や集計 見えないけれど、どんな現象集団 標本集団を収集する(実験や調査) 精密でなく正確な回答か?答えやすい用紙?、回収率 分析に合うよう素データの加工や集計 度数表、基礎等計量、グラフ、クロス表など 仮説をうらづけるグラフ? 統計手法で分析する 種々の統計解析法、仮説を説明できた?

情報処理と看護研究のハザマ 看護研究 エビデンス 心がけなければならない先人のコトワザ 情報面 GIGO(ぎーご) 看護の中で、課題を立証し客観的結論を得る エビデンス 明白なこと、証拠や根拠 心がけなければならない先人のコトワザ 情報面 GIGO(ぎーご) Garbege In Garbege Out ゴミからはゴミしか生まれない 統計学 群盲評象(ぐんもうひょうぞう) 尻尾を握って象がわかったつもりになっていませんか?

ステップ1 研究や分析のための データ準備 留意点

個人データ分析の道具 マイクロソフトOfficeはあるか? マイクロソフト社の代表ソフト群 ワード、エクセル、パワーポイント、アクセス PCを買うとWordとExcelはついているのが普通...でも本当は Word 文書や資料作成(看護研究計画書類) Excel データ分析・グラフ(データの視覚化・プレゼン) パワーポイント 必要に応じて購入するソフト(別売1~2万円) 施設PCには装備なしのこともあり プレゼン準備にハタと困る場合あり 17

自PCでソフト確認 PC購入時には「スタート」、「すべてのプログラム」を開いてMSOfficeの確認をする

WordやExcelからパワーポイント 精密な文書作成にはやはりWord 精密なデータ処理にはExcelを 機械可読式データ(マシン・リーダブル・データ) 人に見せる時,これらをパワーポイントで要約して表示する 19

平均が意味ある場合、ない場合 データの「測定尺度」 比率や間隔尺度 身長160,170,180 平均は170cm ◎ 順序尺度 1.嫌い 2.まあまあ 3.好き どれか1つ選ぶ 回答 2,1,1,3,3,3,2 合計15 平均2.1 △ 名義尺度 1.品数 2.一ヶ所で買える 3.駐車場 4.その他 この場合平均は求められません→集計へ ×

エクセル使いなら必需品A1 行側(ギョウソク)と列側(レツソク)          →列側(項目、変数、変量)   行側↓  (ケース)

入力したデータ

データ収集の時、気づかうこと 有効数字について 計算結果を小数点何桁まで取るべきか? 答え 測定値で影響されます。 身長160cmは「センチ単位」で測定されました。 160.1かも160.4かも知れません。 有効数字 小数点以下0桁 でした。 そこで平均値など計算結果の表示は、ひと桁多くし小数点以下1桁(2桁目を四捨五入して)で表示しましょう 教訓 計算結果の有効数字は測定値よりも1桁多く

収集データの欠席扱いとは 欠測値について 計測されなかった、計測できなかった値・回答 表ソフトで欠測値には0ゼロを入力しない 欠測値という 表ソフトで欠測値には0ゼロを入力しない エクセルの場合何も入力しない セル値の削除はdeleteキーで 0は計測値として計算してしまいます 99や0など特定値を入れることは 一部の統計ソフトでは除外可能だが、エクセルとの互換性を考えると入力しない方が無難でしょう

いくつのサンプルが要りますか? 理論的には概ね10サンプルでも可能 現実的目標は、「1グループ20以上ずつ」 でも、本当は多ければ多いほどが良い 現実的目標は、「1グループ20以上ずつ」 全部で20あればではない× グループ数は原則2、3が適当 細かなグループ分けはデータ分析を複雑にする 男女別ならば男20、女20=40が望ましい 3世代なら若い20+中年20+老年20=60 グループごと数は違っていても結構 1グループ20に欠けていても結構

データ分析をタイプ別に データを揃え、入力する 道具はエクセル、知識は測定尺度 時にankstat(エクセルシート)を使うと便利 1つの項目ごとデータ分析(単変数分析) グラフで「見える化」、資料作り エクセルの関数機能を活用 指導者に「○○を計算しておいて」向き 2項目の関係を分析 散布図から回帰分析、相関など、エクセルで可能 医療では、○×検定や多変量分析の場合もしばしば 統計サイト(インターネット)を使う 高度かつ高価な統計ソフトを考える。例えばSPSS 統計専門家の助言や手助けも有効

ステップ2 データが用意できたら、まず 1項目ごとにデータの姿をつかむ 記述統計(基礎統計、度数・クロス集計、グラフ表示) エクセルで十分可能、個人でも可能

基礎統計について (比率や間隔尺度の場合) 基礎、キソと軽んじてはいけません。 この基礎統計からデータの概要を思い浮かべることが、解明の第一歩 基礎統計量算出やグラフ書きは地味ですが、 多くの発表はこれで決まります。 項目ずつ(1変数ごと)の統計分析です

最初のデータ分析はデータの形を知る 記述または基礎統計量とは 平均値 標準偏差 最大、最小値 中央値 度数集計表

エクセルで基礎統計量を 関数をセルに挿入で求める ○○値を求める関数(名前知らなくても利用できる) 関数名ヘルプをうまく利用する 平均 =AVERAGE(範囲指定) 標準偏差 =STDEV(範囲) 中央値 =MEDIAN(範囲) 最大値 =MAX(範囲) 最小値 =MIN(範囲) 表の度数を求める関数 該当数(通常) =COUNT(範囲)または 条件付該当数  =COUNTIF(範囲、条件) 度数処理にはankstatシートが結構使える

名義や順序尺度の場合、基礎統計量はあまり意味を持ちません。 集計しましょう 度数分布表を作りましょう(1つの項目ずつ) これを棒グラフ(ヒストグラム)に描きましょう これである1項目の姿が見えてきます (全ての測定尺度で可能) クロス表(分割表)にまとめましょう(2つの項目ごと) 特に2次元クロス表(分割表)は大事 2つの項目を同時に表にまとめます (特に、順序や名義尺度でも作れます)

2つの項目の 基礎集計     投げ1のヒストグラム

素データから度数集計してみたら

投げ1と投げ2の2群を書き分ける 素データ→度数表→ 2群別のグラフ 投げ2 投げ1

投げ1と投げ2を書き分ける 35

棒の間隔をコントロール あなたは気をつかっていますか? 36

折れ線グラフはプロフィール分析 6つの項目について、それぞれ10点満点で採点する。 1点=できていない 5点=普通 10点=出来ている 1点=できていない 5点=普通 10点=出来ている 患者群、看護群ごとに平均を算出 37

グラフは統計分析の設計図 エクセルはグラフ化の良いツール 最初のうちは、グラフ化することがとても大事 図中には、実は分析結果が見えています。 1項目の現象には 棒グラフか折れ線グラフがしばしば。 大切なことは、条件によりグラフを書き分けていますか? 条件とは、女性・男性、学級A、B、C別など

ステップ3 (比率尺度の場合) 1つずつ、項目ごとの把握が終ったら エクセルで十分可能、個人でも可能 次は2項目ごとの視覚化と分析 ステップ3 (比率尺度の場合) 1つずつ、項目ごとの把握が終ったら 基礎統計の算出 集計表=度数表やクロス表にまとめる 項目ごとにグラフで表現 エクセルで十分可能、個人でも可能 次は2項目ごとの視覚化と分析 回帰分析で関係をつかむ

「散布図」は2項目の関係図 (エクセルで分析可能)

散布図→単回帰分析 回帰直線y=x 相関係数r=0.43 投げ1と投げ2の直線関係は弱い(あまりない) 41

(単)回帰分析 散布図を描くとX軸とY軸の関係を目視 Y=aX+bという直線関係を考える XとYはデータとして測定される 傾きaとbを決定すれば、XとYの関係が決まる

散布図から回帰分析へ 1ケースを点で見る→散布図グラフ化 点を選択→近似直線のあてはめ ①直線の方程式を求めること ②相関係数Rを求める 点の傾向や関係を直線で置き換える 回帰直線 ②相関係数Rを求める 直線の度合い -1(負相関)~0(無相関)~+1(正相関)を知る ③重相関係数R2を求める 直線が示す情報量R2=R×R 例: R=0.7ならR2=0.5 正相関の目安R=0.7ならR2=0.5(50%) つまり相関ありは直線で半分以上の情報を示している

データ分析の道具立て 更なる分析にはエクセル以上 記述統計、グラフなどはエクセルで十分 検定、多変量分析となると専用ソフトが望ましい 市販ソフトとしては SPSS 高い、施設向き、論文投稿には望ましい。世界的権威ソフト 新規18万円 ライバル会社にSASがある。安価版としてJUMPも有名 エクセル統計 4万円、エクセルのアドイン、おおむね使えるが細かな使い勝手はあまり良くない フリーソフト(無料) R(アールと発音) 良くできているが上級者でなければ使いにくい!研究者向け

なぜ「Office(excel)」を? Windowsマシンが多く導入 Windowsマシンには「Officeファミリ」のうちWordとExcelが大体標準装備 Wordは施設企画書類づくり、発表用配布資料づくりに Excelは素データ入力、グラフ化、基礎統計など個人向け基本データ分析可能 パワーポイントは発表原稿づくりに(別売) Officeファミリーは相互に「コピー&ペースト」で対象物の継承が可能

最近ではインターネットのサイトにも 良いものが色々 検索エンジン 群馬 青木 → 「おしゃべりな部屋」 すがやみつる(漫画家)「こんにちは統計学」 Javaはサイトで計算処理を行うための仕組みでありPC購入後各自で導入するもの 施設のPCではセキュリティ保護の観点からJavaを導入していないものもあるので、青木サイトが利用できない場合がある 施設PCで利用できない場合、他の統計パッケージやJava導入した個人PCを利用する 最近ではスマートフォンで利用可能 □ □

あなたのPCのJAVA(Oracle社)という仕組みが古いなどの原因で、警告が出たものです。「いいえ」を選んでうまく動作すればいいですね。

ネット覗き体験その1 「群馬 青木」サイトの先頭ページ ネット覗き体験その1 「群馬 青木」サイトの先頭ページ

覗き体験2 すがやみつる「こんにちは統計学」 覗き体験2 すがやみつる「こんにちは統計学」

覗き体験その3 検索「ankstat」 統計シートankstat(アンクスタット) 田中研究室提供のエクセル(バージョンは問わず)専用のシート 主に基礎集計やクロス集計を行う。統計解析はほぼ実施しない http://www.osu.ac.jp/~tanaka/ankstat/ 検索エンジンで「ankstat」 。最新は5.9版 最大500ケース×200項目を集計する

アンクスタットankstatや研修資料は 「岡山商大 田中」サイトからも探せる アンクスタットankstatや研修資料は 「岡山商大 田中」サイトからも探せる

さらに進むと…

シートankstatの入力シート

項目ごとの基礎統計量や度数表(%表示も可能)を算出 シートに素データを入力して、 下のタブを選ぶと 項目ごとの基礎統計量や度数表(%表示も可能)を算出

では統計サイトを実際に試してみましょう

看護に代表的な検定を分析体験 t検定(比率尺度で使用) カイ2乗検定(名義・順序尺度で使用) クロス表に傾向や関連性があるか ある測定データの平均値がある値かどうか 仮説: 測定データの平均値=46.7 2群の平均は等しいとみなせるか 仮説: 群1の平均=群2の平均 カイ2乗検定(名義・順序尺度で使用) クロス表に傾向や関連性があるか 仮説: このクロス表の度数は同じか

統計的検定はどんなもの ある仮説(○=△)を判定する 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」 例: この実験結果=160.0 例: 群1の平均=群2の平均 判定結果は採択、または棄却の2分法 採択とは「この仮説を積極的に否定しない」 (厳密には仮説を認めたくないがやむを得ない) 棄却とは「この仮説を積極的に否定する」

検定では「P値」を探せ 検定に見る計算と判定 判定: 出てくる結果の有意確率か有意水準の値により判定 有意水準「P値」>0.05 有意水準5%以上で採択    5%以下ならば棄却(有意、SIG.)←差あり 0.05~0.01  5%有意  * 星1つ 0.01~0.005 1%有意  ** 星2つ 0.005より小 0.5%有意 *** 星3つ P値 有意水準0.05基準⇔今回の有意水準を逆算 つまり、P値が0.05を下回れば「有意」

2つの平均値を比べる 2群の平均値差の検定(t検定) 群 平均 SD N A  3.2 3.8  5 B  5.2 8.2  5 等分散性の検定 有意確率2.3%(有意)  2群のばらつきは等しくない 平均値差のt検定 等分散仮定する 6.4% 等分散仮定せず 6.4% いずれも平均値差は有意でない この2群で平均値3.2と5.2は同程度と見るか?否か? 2群のばらつきは 等しくないと判定 ばらつき等しくない仮定の下で、「採択」 2つの平均値が等しいことを否定せず(つまり同程度)

二群の平均値差の検定だけでも 入力形式や条件で色々 標準的なサイト 2群の個々の値を入力するタイプ。t検定とノンパラ(マンホットニ)検定が選択できる。マンホイットニ検定とウイルコクソン順位和とは同じもの 2群には対応がない場合 http://aoki2.si.gunma-u.ac.jp/Java/TwoSamples/bin/TwoSamples.html 青木おしゃべりな部屋、Java、独立2標本の検定の順に探す

PC画面の例

応用 平均などで独立2標本検定 http://aoki2.si.gunma-u.ac.jp/JavaScript/t-test.html 応用 平均などで独立2標本検定 http://aoki2.si.gunma-u.ac.jp/JavaScript/t-test.html 素データがなく、平均、標準偏差、ケース数のみがある場合のサイト 対応なしの場合、t検定 おしゃべりな部屋、Javascript、26番2群の平均値差の検定を参照

PC画面の例

応用 「対応のある」2群の検定 対応のある場合: 1人について前後を測定したなど。薬効や効果があったかはっきり検定する。 応用 「対応のある」2群の検定 対応のある場合: 1人について前後を測定したなど。薬効や効果があったかはっきり検定する。 http://aoki2.si.gunma-u.ac.jp/Java/RelatedTwoSamples/bin/RelatedTwoSamples.html 場所はおしゃべりな部屋、Java,対応のある2標本の検定を探す 伝統的なt検定の他、ウィルコクソン符号付順位和検定、符号検定にも対応する

対応のあるデータ、ないデータ 対応ありと考えられる場合 同じ人やグループを追跡して測定 対応ないと考えられる場合      1回 2回 3回・・・ Aさん  1.0 1.5 2.0・・・ Bさん  1.2 1.7 2.2・・・ 対応ないと考えられる場合 毎回グループの構成者を取り替えて測定      岡山 東京 大阪 福岡・・・ 人口 生産額 学生数   

二群の平均値差の検定 演習問題 以上 65 歳未満の住民検診 に来所した男子 42 名,女子 63 名の血色素量について 二群の平均値差の検定 演習問題 いずれもt検定(対応なし)として平均値差を検定せよ。青木サイトを使用する。 問1 群 平均 SD  N    問2     A  3.2 3.8  5     B  5.2 8.2  5 問3 ある地区で行った40 歳 以上 65 歳未満の住民検診                                       に来所した男子 42 名,女子 63 名の血色素量について の検査成績は,男子では平 均値 15.2 g/dl,不偏分散 1.1,女子では平均値 12.7 g/dl,不偏分散 3.2 であった。 男女の平均値に差はあるか,

応用 名義尺度でも使える検定 クロス表の独立性の検定 応用 名義尺度でも使える検定 クロス表の独立性の検定 通称、カイ2乗検定 名義尺度では平均値が意味を持たない そこで表に集計する。 一次元の表こそ度数分布表 2次元以上をクロス集計表 ではこの表での仮説とは 「クロス表のマス目(セル)は同じ割合かどうか」 「クロス表に偏りがあるのかないのか」

(2×2)クロス表とはこんなもの 行と列で作表する 上の図では、左上50、右下55この程度の違いで、この表には差があるか、否か(有意性ありかなし?) a、b、c、dに顕著な違いがあるか? 行側:原因→列側:結果 例: 対応なし 投薬有無と結果や運動有無×効果    対応あり 1回目と2回目の状況

青木サイトで解く R×Cクロス表のカイ2乗検定 基本は2×2(検討しやすい) 4つのセル値をサイトへ入力 計算結果「P値」で判断する P>0.05 採択 0.01<P<0.05 5%有意他 1%有意 0.5%有意により *、**、*** http://aoki2.si.gunma-u.ac.jp/JavaScript/FisherExactTest.html

再掲: 判定方法 P値と検定結果 前ページ解答: P値=0.31→採択(差なし) クロス表から有意水準またはP値を算出 判定方法 その1 有意水準の値が 有意水準値=P値が 0.05~0.01  5%有意  * 星1つ 0.01~0.005 1%有意  ** 星2つ 0.005より小 0.5%有意 *** 星3つ

クロス表独立性の検定 解答はP値を示す(有意でない=採択) 問10.83、20.76、30.31、40.60 50.01 60.00  採択   採択  採択  採択  ** ***

青木サイトを例に、今後使用する場面が出てくる「検定」にまつわる分析方法をご紹介 トピックス 検定手法の進化・深化 かつて皆さんが習ったt検定やカイ2乗検定も、医療界ではさまざまな手法に変わりつつあります。サイトはこの流れに対応しつつあります 青木サイトを例に、今後使用する場面が出てくる「検定」にまつわる分析方法をご紹介

主な統計的検定法の体系図

代表的なノンパラメトリック検定法 対応のない2標本(群)の代表値差 対応のある2標本(群)の代表値差 マンーホイットニのU検定 2標本コルモゴロフースミロノフ検定 ファンデル・ワーデン検定 中央値検定 対応のある2標本(群)の代表値差 ウイルコクソン符号検定 ウイルコクソン符号付順位和検定

早わかり なぜノンパラ検定に? あなたはある日Dr.から「論文のためこのデータをウイルコクソン検定しておいて」と告げられます 早わかり なぜノンパラ検定に? あなたはある日Dr.から「論文のためこのデータをウイルコクソン検定しておいて」と告げられます ウイルコクソン検定が何であるか、どうすれば良いかのため、検索エンジンで「ウイルコクソン検定」とするでしょう すると、分析のためには「青木サイト」に出会うかも知れません

今の「流行」検定手法は パラメトリックからノンパラへ 従来のt検定は、 正規分布を仮定するなど制約が多かった でも性能はよろしい(検定力大=シャープな剣) ノンパラ検定群(ウイルコクソンやフリードマン検定など)は、 適用の条件や制約少ない サンプル数も気にしないでも検定力もそこそこある=頑健な=ロバストな検定手法 適応範囲が従来よりかなり広い 次第に愛好者が医療関係者にも増えてきた 市販統計ソフトにも多く採用、使用可能、サイトでも

対応のあるデータ、ないデータ 対応ありと考えられる場合 同じ人やグループを追跡して測定 対応ないと考えられる場合      1回 2回 3回・・・ Aさん  1.0 1.5 2.0・・・ Bさん  1.2 1.7 2.2・・・ 対応ないと考えられる場合 毎回グループの構成者を取り替えて測定      岡山 東京 大阪 福岡・・・ 人口 生産額 学生数   

対応のないk標本(群)の代表値差 クラスカル・ウォリス検定 中央値検定 対応のあるk標本(群)の代表値差 フリードマン検定

マンーホイットニのU検定 (Willcoxson順位和検定に同じもの) 2群、対応なし 9個の部品について4個は処置群、残り処置なし群とした。この2つの群の母代表値に差があるかどうか検定しなさい。 処置群の観察値 1.2,1.5,1.8,2.6 処置なし群の観察値 1.3,1.9,2.9,3.1,3.9

有意確率=0.142または0.190 有意確率>0.05なので有意差なし・採択 つまり両群に差は認められない http://aoki2.si.gunma-u.ac.jp/Java/TwoSamples/bin/TwoSamples.html

ウイルコクソン符号検定 (Wilcoxonの順位和=マンホイットニ検定と区別) 2群、対応あり 10 人の被検者について,五段階評価をした。同じ被検者に対して,1 年後にもう一度評価した。その結果を表 に示す。1 年間で母代表値に差があったかどうか検定しなさい      1 2 3 4 5 6 7 8 9 10 最 初 A A C B D A C B D B 1年後 C A E D B B D A E D

Wilcoxson符号検定の結果 正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない 正確有意確率=0.180>0.05 → 採択 最初と1年後では有意差ない もしも計量値としてWilcoxsonの符号付順位和検定(2群対応なし)を行ったならば、 漸近有意確率=0.114>0.05 採択 やはり 最初と1年後では差はない http://aoki2.si.gunma-u.ac.jp/Java/RelatedTwoSamples/bin/RelatedTwoSamples.html

クラスカルーウォリス検定 3群以上、対応なし 12 匹のラットに 3 種類の餌を与えたときの肝臓の重量は表 1 のようであった。餌の種類により肝臓の重量の平均値に差があるといえるか      SPSS入力 表 1.餌の種類による肝臓の重量 A餌 3.42 3.84 3.96 3.76 B餌 3.17 3.63 3.47 3.44 3.39 C餌 3.64 3.72 3.91

H0: 平均1=平均2=平均3 H1: 3群の平均は同じでない 漸近有意水準0.062>0.05  採択 結論: 3群の平均は同じ程度とみなす(帰無できない) ただ、有意水準6.2%と5%に近いことにも留意する 参考 http://aoki2.si.gunma-u.ac.jp/JavaScript/kw-test.html

フリードマン検定 3群以上、対応あり 表 1 のようなデータがある。4 種の肥料間で収量に差があるか 参考: 行列を入れ替えれば3品種間に差があるかを検定できる 表 1.フリードマン検定が対象とするデータ 肥料  品種   B1   B2   B3   B4  A1 9  17  12  16  A2 1  21  11  A3 7  19  6  9

漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると 漸近有意確率0.004<0.005 エクセル版 http://aoki2.si.gunma-u.ac.jp/lecture/stats-by-excel/vba/html/friedman2.html H0: 4群の平均は等しい H1: 4群の平均は等しくない 漸近有意確率0.001<0.005 *** 0.5%有意 肥料4種の平均は等しくない 行列を入れ替えると H0: 3品種の平均は等しい H1: 等しくない 漸近有意確率0.004<0.005  ***0.5%有意→3品種の平均は異なる 総合的には、肥料、品種いずれも差あり

表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。 肥料  品種   B1   B2   B3   B4  A1 9  17  12  16  A2 1  21  11  A3 7  19  6  9 表の形式は似ていても… 表はクロス表に似ている。しかしクロス表は対応なし、フリードマンは対応ありが大きく異なる。 クロス表では行か列はそれぞれ要因。フリードマンでは行か列は標本(ケース)である。

データ分析専門家の活用のために 専門家が知っていること 知らないこと あなたが知らなくても良いこと データ分析の各段階、楽しさや辛さそして悲しさ 看護研究におけるデータの生かし方 星の数ほどある統計手法であなたの質問に適する手法について 知らないこと あなたの分野の専門的知識 あなたが知らなくても良いこと データ分析の環境整備、ツールそしてコスト

あなたが学んだ研修のまとめ □看護研究とデータ分析の関係を理解する □データ分析の前提: 適切な収集が大切 □データ入力での決まりごと □データ分析の前提: 適切な収集が大切 □データ入力での決まりごと □ 1項目データ分析: 基礎統計量とグラフ □プラットホームはOffice(Excel)、エクセル関数 □ 2項目の関係: 相関、回帰式、散布図 □グループ(群)間比較: 統計的検定 □詳細な分析は統計ソフトやサイト利用可能 おしゃべりな部屋、こんにちは統計学、アンクスタット □検定(統計)手法の変化を知る ノンパラメトリック検定法