看護情報統計学 橋本 永吉 深山
Wordを使う時 新規に文書を作成する 文書の形式を決める 既存の文書を編集する
WORDで文章を書く WORDの起動<-NG
Wordを使う時 新規に文書を作成する 文書の形式を決める 既存の文書を編集する
文書の構成 Context←中身 Document Style←文章の形式 Formatting 以上は別の概念
Officeでは
文書の種類によって 必ずあるべきフィールド 論文:題名,著者 電子メール: あて先,差出人,日付...
フィールドの位置や典型的な印字の形式
題名,著者であるとは コンピュータはどのように知るか?
Wordでは
文書はどうつくっていくか 文書の種類の選択 テンプレート(template)←鋳型
テンプレートの選択って? WORDの中らは新しい文書の作成
9行だけ入れてみよう. 老人看護学報告書 橋本明浩 目次 はじめに 先行研究 本研究の位置づけ 結果と考察 結び 参考文献
題名を選ぶ
マウスを当ててみよう
見出し 目次にいれることが指定できる
ComputerをつかったWord Processing 何がかわるのか? 綺麗な文字? 消しゴム,のり,はさみからの解放 何をしなくてはいけないのか? Computerに文章構造を教える.
ハイライト 構造型の文書の作成方法 文書の印刷方法の指定 題名→章の見出し→節の見出し 本文 最後に文書の整形をする
文書の印刷方法の指定 用紙,用紙向き,余白 ヘッダ 本文印字範囲 フッタ
左 30mm その他は25.4mmが標準 文字の大きさは10.5ポイントまたは10ポイント 1ポイント= 0.3514mm 1インチ= 25.40005 mm ↑これを72ポイント 0.3514でなく0.35277847mmとなるが。。
最後に 文書の形式 文書は骨組みからつくる 個人情報への配慮 環境への配慮
図と表 表1 参考資料 図1 フラダンス
馬鹿の見本 自分で図番号を入れる 自分で表の番号を入れる
A B C
休憩
きょうの目的 正しい看護研究への第一歩 測度
看護研究の方法 何がわかって 何がわからないのか?
症例対照研究では? 鰹だしを飲む・飲まない 健康・健康でない 健康な人 健康でない人 鰹だしを飲む・飲まない 経済的問題 地域性
コホート研究(Cohort Study) 観察 鰹だしをのみはじめた
ランダム化対照試験 Randomized Controlled Trial 鰹だしをのませる 観察 無作為に選ぶ だしを飲ませない 観察
より厳密な実験には 観察者,介入者,解析者←Blind実験 ブラセボ 人間が介入する時間 Placebo→プラシーボ Double Blind Trial 人間が介入する時間
介入実験
検査
[これから勉強すること]大切なこと 2つの過誤 第2種の過誤 (検出力) 第1種の過誤 危険率 (有意水準)
測定の尺度 Measure and Scale
りんご Encode and Decode Encode and Decode Encode Decode 薬品コード631340FA1047 コード表
測定の尺度 諸特性に関する情報を数値に変換する規則のこと 例 男→1 女→2 身長→156.3cm
数値の性質 整数 離散的 実数 連続的 演算が可能!! 順序 1<2 我々は日常生活や研究・開発を問わず、頻繁に数量“を用いる 整数 離散的 実数 連続的 演算が可能!! 順序 1<2 我々は日常生活や研究・開発を問わず、頻繁に数量“を用いる ここでいう数量とは、測定や思考の中で実世界ないしは仮想世界と何らかの繋がりを持つ量
例 変換された数値の世界では計算可能,順序もあるが! 1+2 1<2 1 2 男 女
尺度の分類 比例尺度(物理測定量の多く) 具体的には乗除加減が意味を持つ場合 比例尺度(物理測定量の多く) 具体的には乗除加減が意味を持つ場合 間隔尺度(ある相対的な的な零点からの距離(差)のみに意味がある尺度.) 順序尺度 薬効などで”著効,有効,やや有効,無効,悪効”等の順序関係のある尺度. 名義尺度 職業分類で第1次産業,2次産業,3次産業等の分類. サッカー選手の背番号. 順序もなにも意味がありません.無論サッカー選手の背番号を平均して,計算しても意味もありません. 量的尺度
順序尺度での注意 すべてに順序がなくてはいけない. (全順序) もしも 薬効などで”著効,有効,やや有効,無効,悪効”等の順序関係に“不明”が加われば... 推移律が成立しないといけない X<Y Y<Z → X<Z (推移律) ジャンケンは駄目です. イシ>チョキ チョキ>パー
よくある2重の間違い アンケート調査 27人 平均値1.88 大変満足した5 2人 やや満足した4 3人 ふつう 3 8人 アンケート調査 27人 大変満足した5 2人 やや満足した4 3人 ふつう 3 8人 あまり不満 2 1人 不満 1 3人 わからない 0 10人 平均値1.88 ←“わからない”を除けば平均は3
ではもう1つの間違いは?
尺度とその分類のまとめ 数字(データ) 1,12,34,.... 尺度: 観測した結果と数値を対応させる基準 比例尺度(物理測定量の多く) 間隔尺度(ある相対的な的な零点からの距離(差)のみに意味がある尺度.) 順序尺度 薬効などで”著効,有効,やや有効,無効,悪効”等の順序関係のある尺度. すべての尺度に順序関係が与えられることが条件です.この例にもしも,不明という尺度が加われば,もう順序尺度ではありません.ジャンケンも順序尺度ではありません.この世界では演算は定義されませんので,平均という概念もありません. 名義尺度 職業分類で第1次産業,2次産業,3次産業等の分類. サッカー選手の背番号. 順序もなにも意味がありません.無論サッカー選手の背番号を平均して,計算しても意味もありません. 測定 数字(データ) 1,12,34,.... 数量化などをする場合の分類基準 比例尺度 ある具体的な基準の倍数として定義され,数値の間隔も比例関係で表現される尺度. 例:時間,密度等の物理量,年齢(時間とみなすことができます.) 上の連続型,離散型の場合はいずれもこの比例尺度になります.具体的には2つの演算+(そしてその逆演算ー),×(そしてその逆演算÷)が定義される尺度です.この尺度では自然な距離が定義され,実数または整数と同相な位相をあたえることができます. 間隔尺度 ある相対的な的な零点からの距離(差)のみに意味がある尺度. 例:摂氏による温度. 1つの演算+(加法)とその逆演算ー(マイナス)が定義される尺度です.弱い位相を与えるが可能です. 順序尺度 薬効などで”著効,有効,やや有効,無効,悪効”等の順序関係のある尺度. すべての尺度に順序関係が与えられることが条件です.この例にもしも,不明という尺度が加われば,もう順序尺度ではありません.ジャンケンも順序尺度ではありません.この世界では演算は定義されませんので,平均という概念もありません. 名義尺度 職業分類で第1次産業,2次産業,3次産業等の分類. サッカー選手の背番号. 順序もなにも意味がありません.無論サッカー選手の背番号を平均して,計算しても意味もありません.
順序尺度の場合の扱い (後で詳細は示します.) 順序統計量をつかった手法が必要 マン ホイットニー検定など しかし,ほぼ量的な尺度と同様な検定方法があるので心配は不要
順序の無い名義的尺度の扱い カテゴリカルデータと呼ぶ 林の数量化理論が有名 数量化1類<-> 回帰分析 数量化1類<-> 回帰分析 数量化2類<-> 判別分析 数量化3類<-> 因子分析 主成分分析
これからすすめる話 まず比例尺度について考える 使用する道具はEXCEL EXCELの機能 EXCELのアドイン機能
分析ツールの呼び出し方 概要 「分析ツール」とは,データ分析を簡単に行うためのExcel の「アドイン」の一つ 呼び出し方法 [ツール]-[アドイン...]をクリック([アドイン...]メニューが表示されていない場合は,[ツール]メニューの一番下の下向き二重矢印にマウスポインタをしばらく置く) 「アドイン」のチェックボックスで「分析ツール」(※)にチェックして<OK> [ツール]メニューに[分析ツール]というメニューが表示
記述統計 基本統計量を計算してみよう データ開いてみよう ファイル名 基本統計量
度数分布表とヒストグラムを作成(累積度数) 項目 概要 分散分析 一元配置(要因が1つだけの場合) 繰り返しのある二元配置 繰り返しのない二元配置 相関 2つの変数間の直線関係の指標としての相関係数を求める. 共分散 2変数の関係の指標 基本統計量 標本の各種代表値 指数平滑 変動を均らして標本の推移をみる F検定 2標本の分散検定 フーリェ解析 2^n個のデータのフーリエ変換・逆変換をします. ヒストグラム 度数分布表とヒストグラムを作成(累積度数) 移動平均 変動を考慮して標本の推移をみる 乱数発生 各種分布の標本データ生成 順位と百分位数 順位統計量を求める 回帰分析 変数Xと変数Yの関係の分析 サンプリング 母集団より標本を抽出する t検定 一対の標本による平均の検定 等分散を仮定した2標本の平均値検定 分散が等しくないと仮定した2標本の平均値検定 Z検定 2標本による平均値検定
基本統計の操作1
基本統計の操作(1/2) データ範囲とオプションの指定 入力元 入力範囲: 基本統計量を計算する列を指定します.ここではC列(身長)とD列(体重)の1行目から101行目ですので,$C$1:$D$101と指定します. データ方向: データの集合が列である場合は,列と指定します. 先頭行をラベルとして使用: 先頭行が数字以外の場合はここにチェックを入れます.今回は身長,体重等の説明があるのでチェックを入れておきます. 出力オプション 新規または次のワークシート(推奨です,チェックだけを入れておくと新しいシートに基本統計量を計算します.新規ブックも可能です. 出力先を指定したい場合は,その先頭アドレスだけを入れておきます. 統計情報: かならずチェックを入れておきます. 平均の信頼区間の出力: 信頼区間の長さの半分の大きさが必要な場合はチェックを入れます.ここでは95%の信頼
結果の見方
結果の意味 平均(x): 標本平均 1/nΣixi を意味します. 標準誤差 標準偏差をnの平方根で割ったもの 標準偏差 標本標準偏差を意味しています.分散の平方根です. 平均の周りの散らばりを意味しています. 中央値 データの真ん中の順位の値です.この場合は100なので,50番目と51番目の平均を計算しています. 最頻値 計算しても意味のないものを計算しています. 分析ツールでの計算結果は,離散的なデータや階級に分類されている場合等だけが意味を持ちます. 尖度 分布の裾の重さになる指標です. 歪度 左右の偏りを示します.正の場合は右に裾を引き,負の場合は左に裾を引くと言います. 分散(s2): 標本不偏分散です.二乗和を(n-1)で割った形式です. 信頼区間 正規分布近似計算で両側信頼区間です.(EXCEL2003) そうでない場合は信頼区間の半分の長さですの,平均±この数値が信頼区間です.
統計量の概念 右に裾をひいた分布(歪度が正) 単峰(やま1つ)なら モード≦メジアン ≦平均が成立する 左右対称分布の場合は3つ(平均,メジアン,モード)は一致して,歪度は0 日本人の現金(普通預金,定期預金,郵便貯金を含む) 平均所有額 1人あたり667万円
余裕があれば結果のお化粧 身長や体重が小数点1桁の数字です.計算結果も揃えましょう.(有効数字)
休憩
統計的仮説検定とは何か? 仮説検定→看護の世界でいえばスクリーニング・検査に相当します. もしも私が 主張:私は宝くじの1等に連続3年当たっているといえば この主張はだれも信じてくれないはずだ. それは もしも,“宝くじの1等に連続3年あたった”と仮定すればそれは稀有の確率だから
論理の詳細な分析 Ho : 橋本は3年連続で宝くじの1等にあったっている H1: 橋本は3年連続で宝くじの1等にあったっていない.
統計的仮説検定と同じような論理構成 状態は2つしかなく,必ず一方が成立すること. 証明したいのはH1であるが, H0を仮定する. 統計的仮説検定と同じような論理構成 状態は2つしかなく,必ず一方が成立すること. H0: 2つの群には差がない. (帰無仮説) H1: 2つの群には差がある. (対立仮説) 証明したいのはH1であるが, H0を仮定する. H0を仮定するとめったに起きないことが起きている. それゆえ, H1である. H0:帰無仮説 H1:対立仮説 めったに起きない
統計的仮説のたてかた H0: ....である.(等しい) H1:.....でない.(等しくない) H0:帰無仮説←捨てたい仮説
何で めったにおきないかを測るか? 統計量 カイ2乗 t統計量 F統計量 その他...
めったに起きない確率はどの程度にするべきか? 5%...伝統的 1% 0.3% 間違った結果になることもありますか? あります.5%の確率で本当はH0が正しくても棄却してH1を採択してしまいます.(危険率) めったに起きない確率は何で測るか? 検定統計量(後述) 5%でなく1%,0.3%をめったに起きないことであると目安にすることもできます. めったに起き証明したいのはH0ではなく,H1です.H0は駄目だ(棄却:Reject されること)ということ期待されている仮説です.帰無仮説(Null hypothesis)と呼ばれている仮説です.他方, H1は心の中では,立証したい仮説です.対立仮説(Alternative hypothesis)と呼ばれている仮説です.数学ではH0を仮定すると矛盾が起きることを示しましたが,統計学では,めったに起きないこと(確率が低い)が発生していることを示します.めったに発生しないことが観測されたのは,帰無仮説H0が適切でなかったからであると考え,対立仮説 H1を採択(Accept)します.では,めったに起きないことは確率の目安はどのくらいか?という疑問がわきますが,長い間の習慣として5%(確率 0.05)以下であれば,めったに起きないことであると扱うようです.無論,ない,起きやすいというのはどのような基準で測るか?という疑問が出てきますが,これは検定統計量と呼ばれる統計量の分布を基準として測定し,めったに起きないという尺度(確率)をP値で表現するのです.近年の多くの看護論文では,単に仮説が棄却されたという結果だけでなく,検定方式,その統計量とP値を記述しています.
めったに起きないことの図
論文ではどうやって書いたらよいのか? H0が棄却されて, H1が採択されたら H0が棄却されて無かった場合 有意な差が認められた. 有意水準5%で2群の平均は異なる. H0が棄却されて無かった場合 有意な差が認められなかった. 有意水準5%で仮説H0を棄却することはできなかった. ←今回の検査では,抗体を発見できなかった. ⇒ 感染していない証明ではない!! 論文ではどうやって書いたらよいのか? 医師の診断書に学ぶ
2種類の過誤 第1種の過誤 第2種の過誤 帰無仮説H0が正しいにもかかわらず帰無仮説を棄却するという誤り。 ←有意水準 帰無仮説 H0 が誤っているにもかかわらず,H0 を採択してしまう誤り
ネットワークを使った統計検定 群馬大の青木教授のサイト 時系列解析 STATLETS™ http://aoki2.si.gunma-u.ac.jp/ Networkがあればソフトはいらない? 時系列解析 http://ssnt.ism.ac.jp/inets2/title.html STATLETS™ http://espse.ed.psu.edu/espse/hale/507Mat/statlets/statlets.htm (英文)