統計学 試験問題 石川県会立歯科衛生士専門学校 統計学 試験問題 石川県会立歯科衛生士専門学校 平成21年 学年( )在籍番号( ) 氏名( ) 採点結果( ) ( )
グラフの特徴 ●折れ線グラフは・・・経過グラフ・歴史グラフとも呼ばれ、 ( 時系列 )に伴う変化傾向を捉えやすい ●棒グラフ ( 時系列 )に伴う変化傾向を捉えやすい ●棒グラフ ( 数量 )を比較するには最も優れたグラフ 1)単純比較棒グラフ 2)積み上げ棒グラフ ● ( 構成の比較 )を読むには 円グラフ や 帯グラフ が良い ●レーダーチャートは変化と( 比較・類型化 )など、使い方によって、さまざまな特徴が生まれる 回答候補 歴史グラフ 棒グラフ 折れ線グラフ 数量 構成の比較 帯グラフ 比較・類型化
標本調査 母集団と標本 母集団 標本 全数調査 →← 標本調査 標本抽出・・・母集団から標本を抽出すること 母集団 標本 全数調査 →← 標本調査 標本抽出・・・母集団から標本を抽出すること その際、母集団と等しい確率を持った標本を得るために ( 無作為抽出 )(random sampling)などが用いられる ●系統抽出法 母集団の全てに( 通し番号 )をつける。初めの番号だけは乱数票などで選ぶ。 ●( 集落抽出法 ) 事前に母集団に似たいくつかの小集団を作っておく その手段を無作為に抽出する方法 ●( 層別抽出法 ) 属性の似た者をいくつかの層に母集団を別けておき、その各層 ごとに無作為抽出する 例えば、20歳代、30歳代の年齢別 の層など ●( 多段抽出法 ) 母集団を一定の抽出単位に別けておく 例えば、日本を県単位・市町村単位・町内単位・各世帯 回答候補 多段抽出法 層別抽出法 通し番号 集落抽出法 無作為抽出
分布を考える 分布の中心の位置 (例) 65、53、44、78、50 の数値の算術平均は (65+53+44+78+50)/5=58 である。 此れだけでは、分布の状態がわからない。ばらつきの程度を表すには 最大値と最小値との差 (78-44)=34 があるともう少しわかりやすくなる・・・ これを( レンジ )(範囲)と言う。 しかし、両端の数字だけでは、その間にある分布状態は少しも 反映されていない。 すべての点の分布状態を反映させるには, 各点の重心( 算術平均 )からの距離を測れば良い。 しかし、それぞれの数値から算術平均を引いた値(『偏差』と言う)を加えると 以下の計算例のようにゼロになってしまう。 65-58=7 53-58=-5 44-58=-14 78-58=20 50-58=-8 合計 7+(-5)+(-14)+20+(-8)=0 したがって、ばらつきを表すには、偏差の符号をなくしてから平均化する必要がある。
偏差の絶対値の算術平均を( 平均偏差 )という。 (7+5+14+20+8)/5=10.8 ●偏差の符号を取るもうひとつの方法は、 ●そのひとつの方法は、 ①偏差の絶対値を用いることである。 偏差の絶対値の算術平均を( 平均偏差 )という。 (7+5+14+20+8)/5=10.8 ●偏差の符号を取るもうひとつの方法は、 ②それを2乗することです。 偏差の2乗の算術平均を計算し此れによりばらつきの程度を測ることが出きる。 此れを( 分散 )という。 ●しかし,分散は2乗するためもとの数字より高い次元の量を表してしまう。 ③与えられた数字と同じ次元の量としてばらつきを表すためには( 平方根 )を用いれば良い。 これを ( 標準偏差 )と呼ぶ ・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・・ 回答参考資料 標準偏差とは分散の平方根 平均偏差=偏差の絶対値の算術平均 分散=偏差の2乗の算術平均 標準偏差=分散の平方根 計算してみると 分散=146.8 標準偏差=√146.8=12.1
正規分布とは (Normal distribution)正規分布は平均値と分散を決めれば、その形が決まる性格をもち、平均値μを中心として左右対称である。 標準偏差σは曲線の形を決める。 σの値が大きければ曲線は扁平になり、値が小さければ( 狭く )、( 高く )なる。 どの場合も、μ-σとμ+σにおける曲線状の点は編曲点となる。 μ+σ、μ―σの間の正規曲線下の面積は、全面積の約68、3% 。 ±2σ 約(95、5 )% ±3σ 約(99.7 )% 標準誤差 とは ( 標本 )の ( 平均値 )のばらつきを示す 推定値Xの標本分布が近似的に正規分布とみなされる時は この標本の平均値,分散,標準偏差をE〔X〕、V〔X〕、δxと表す。 仮に、目指す母数AがE〔X〕に等しいか,其れにごく近いとすると、 X-1.96δx≦A≦X+1.96δx 此れがAの信頼率95%の( 信頼区間 )になる。 つまり、信頼率95%で、差(X-A)の標本誤差は せいぜい±1.96δxであると言える。
度数分布 ●度数分布表の作り方 (新しいテキストでは違う方法を紹介している) 1)最大値と最小値を求める 2)範囲を算出する ●度数分布表の作り方 (新しいテキストでは違う方法を紹介している) 1)最大値と最小値を求める 2)範囲を算出する 3)階級の数を決める 普通は10こ前後に・・・ ①( シャリエ )の方法(大標本) 階級の幅を標準偏差の( 1/3 )に ②フィシャーの方法(小標本) 階級の幅を標準偏差の1/4に ●相対度数(%)・・ 各階級の度数を総度数で割った値 累積相対度数(%)・・・・ 各階級の累積度数を総度数で割った値 この累積相対度数をもとに縦に百分率、横に階級を取った図 ・・・・累積相対度数曲線(グラフ)は別名( パーセンタイル曲線 )とも言うが、 50%にあたる当るデータは ( 中央値 )となる。 これを50パーセンタイル値(percentile)とよぶ 25、75パーセンタイル値は( 4分位 )(quartile)とも言う
相関 二つの事象において、一方が変化すると他方も変化すると言う関係を表すもの。 例えば 身長と体重、 勉強時間と試験の成績 例えば 身長と体重、 勉強時間と試験の成績 しかし、二つの事象の関係でも、その数量が3とか4等と少なく、限られているものは、この方法には適さない 相関係数 相関係数;rは ( -1 )から (+1 )までの値をとる 0から0,2 ・・・( ほとんど相関がない ) 0,2から0,4・・・やや関係あり 0,4から0,7・・・かなり相関がある 0,7から1.0・・・強い相関がある
カイ二乗検定 標本百分率の差の検定 A・B二つの工場の社員を対象にアンケート調査を実施した。歯磨きに関する項目で、時間をかけて丁寧に磨いているか否かを(ハイ 、イイエ)形式で調べた結果が下記にある。 両工場において差があるかを検定しなさい。2×2分割表とカイ二乗分布表を利用する。 ハイ イイエ A工場 10 30 (① 40 ) B工場 20 40 (② 60 ) ―――――――――――――――――――――――― (③ 30 ) (④ 70 ) (⑤ 100 ) カイ二乗=(⑥ 10×40-⑦ 20×30 )2 ×(⑧ 100)/(⑨ 30・70・40・60 ) =(⑩ 7、94 ) 計算した結果を比較する ・・カイ二乗分布表では、自由度1の有意水準5%と1%を見ると3,841 と 6,635 であるので・・・・・・有意の差が(⑪ ある )となる。
一般式から 疾病(歯磨き) あり なし 合計 要因 A工場 a b a+b B工場 c d c+d 疾病(歯磨き) あり なし 合計 要因 A工場 a b a+b B工場 c d c+d (a+c) (b+d) (a+b+c+d) カイ二乗= (adーbc)2乗×(a+b+c+d)/(a+c)・(b+d)・ (a+b)・(c+d) 上記の一般式を題材にして次の点の考察をしてみよう ①同じ率でもサンプル数が2倍なら?4倍なら? ② (adーbc)2乗 の値が大きければ? ①人数を大きくする A~dを 各2倍の・・・・・2a~2dとすると (adーbc)2乗 (a+b+c+d)/(a+c)・(b+d)・(a+b)・(c+d)は ↓ {(adーbc)・(2・2)}2乗 (a+b+c+d)・2/(a+c)・(b+d)・(a+b)・(c+d)・2・2・2・2 となる 結局 2・2・2・2・2/2・2・2・2=2 結果も ( 2倍 )になる サンプル数がN倍なら 最終的な計算結果も( N倍 )になる ②( a・d-c・b)の値を大きくする ↓ これは(adーbc)2乗の値が大きくなるということで、( b・c )と ( a・d )の差が大きければいいという事と同じ。 有意の差があるかどうかは、検定・計算する以前に、直感的に察知できるかもしれない。
研究デザインについて ●無作為化比較対照試験 Randomized Clinical Trial:RCT ●無作為化比較対照試験 Randomized Clinical Trial:RCT ●横断調査 Cross Sectional Study ●コホート研究 Cohort Study コホート研究はある特性(仮説要因)をもつ人間集団と( もたない )集団を、長期間、継続的に追跡調査し、一定期間後に結果を比較する。 つまり、仮説要因(+)集団から研究対象疾病の発生率と 仮説要因(ー)集団からの発生率を比較する コホート研究は、研究が現在から未来に向かって進められるので( 前向き)(prospective)研究、 研究が長期にわたるので継続的{longitudinal}研究,あるいは( 追跡 ){follow-up}研究とも言われる。 ●ケースコントロール研究 Case Control Study 研究対象疾患の( 罹患者 )群(症例群cases)と罹患していない群(対照群controls)とに別ける。 ・各群の患者について仮説要因の有無・程度を過去にさかのぼって調査する。 症例群が対照群に比べて仮説要因の保有が統計的に有意の差があるかないかを検討する。 過去にさかのぼるので、( 後ろ向き )(retrospective)研究と呼ばれる。(典型的な場合の研究) ケースコントロール研究の症例群の設定の第一条件は・・・診断基準が明確であること 均一な症例群の設定のためには、臨床診断・病理診断を明確にするほか、 性・年齢その他の条件を明確にするほうが良い。 つまり、症例の採用基準と除外基準を明確にすること また、症例の種類は有病例を避けて、新発生例とするほうが望ましい。 対照群の設定は、症例群と同数かそれ以上をマッチさせて、健康集団または、 病院患者から選定される
コホート研究とケースコントロール研究における相対危険度(オッズ比)の計算 症例(疾病あり) 対照群(疾病なし) 計 要因 あり a b (a+b) なし c d (c+d) 計 (a+c) (b+d) (a+b+c+d) → コホート ↓ ケースコントロール 相対危険度(relative risk)R R=要因あり群の発生率(Re)/要因なし群の発生率(Ro) Rは要因を有することで疾病が( 何倍 )多く発生するかを表す Rが1より多いときは疾病発生リスクを増大させることを意味する。 逆にRが1より小さいと疾病発生リスクを低下させることを意味する。 つまり、( 予防 )要因を意味する ●コホート研究では直接( 計算 )できる ●ケースコントロール研究では、要因(原因)がa,bにあり、c,dにはない。 この場合症例も対照も真の代表ではないので疾病発生率は不明である。 相対危険度はコホート研究のように計算できないのである。 しかし、ケースコントロール研究では、( オッズ比 )で近似することができる。 オッズ比=( a・d )/( b・c ) 回答候補・・全てがあるわけではない・・ オッズ比 計算 何倍 予防 感染
EBMのステップ 表1. EBMとは?その実践法は? 表1. EBMとは?その実践法は? What is EBM? Evidence Based Medicine by Guyatt G.H in 1991 EBMの実践法は? 第1の立場 ( 研究者 )→①個々のエビデンス;EVを作る→(臨床疫学 ) Clinical epidemiology ②エビデンスを集積し質を分析→ ( 系統的総説 ) Systematic Review 第2の立場 ユーザ→既存のEVを使う→データベース検索 Retrieve from Database 第3の立場 マネージャー→EVの系統的集積と伝達→共同計画 ex. Cochrane Collaboration 1.問題の定式化 PECO(PICO)とは? どんな患者に Patient and/or Problem ( 何をすると ) Exposure / Intervention ( 何と比べて ) Comparison Intervention(s) ( どうなるか ) Outcome(s) 2.問題についての情報収集 文献検索 3.情報(文献)の批判的吟味 文献読み 4.情報(文献)の適用 文献の内容が現場に適用できるかどうかの判断 5.上記プロセスの評価 回答候補 何をすると どうなるか 何と比べて 系統的総説 臨床疫学 研究者 EBM PECOの定式
交絡因子(Confounding Factor)とは? 滝口徹氏による作図 2002年 交絡因子(Confounding Factor)とは? 調べようとする因子以外の(背景因子)で疾患の出現頻度に影響を与える( 攪乱因子)(結果を歪める第3、4・・因子) ① マッチング ;Matching ② 対象者限定 ;Restriction RCT ;Randomized Controlled Trial) ④ 層化 ;Stratification ⑤ 多変量解析法 ;Multivariate Analysis 交絡因子の調整 相互比較性の確保(Comparability)
無作為配置によって交絡因子が均等に配置される結果、要因Fの真の効果(影響)が検出される。 滝口徹氏による作図 2002年 RCT;Randomized Controlled Trial 無作為化制御試験 交絡因子不完全調整 ( RCT )法 コントロール群 ( テスト )群 ( コントロール )群 テスト群 f2 F F f1 f0 f3 f0 無作為配置によって交絡因子が均等に配置される結果、要因Fの真の効果(影響)が検出される。 F;要因 f0;調整済み交絡因子 f1~f3;未調整交絡因子
バイアスと交絡因子 ●偏り(バイアス) 要因と結果の統計的関連の強さ・(相対危険度)を真の関連からどちらか に系統的に( 歪める )もの。 特に調査の企画時点や、情報の( 収集時 )に生じる。 研究対象の選択時点に発生するバイアスや研究資料の収集時点に発生 する偏りは、資料の解析時点で( 補正できない )ものである。 また、解析のときに生じる可能性もある。 ● ( 交絡因子 )(confounding factor) ①バイアスと同じように要因と結果の統計的関連の強さを歪めるもの であるが、資料の解析時点で、層別解析や 多変量解析で( 補正できる ) ものである。 ②また、仮説要因と研究対象に疾病の両方に関連しているが、 ( 真の )疾病発生要因となっていない要因である。 回答候補 相対的危険度 交絡因子 補正できない 補正できる 歪める 収集時 真の
発熱 肺炎 質問 グラフに記されているPの意味に関して 発熱と肺炎ではどのような違いがあるか?下段空白部分に論述しなさい。 発熱と肺炎ではどのような違いがあるか?下段空白部分に論述しなさい。 発熱 肺炎 ①JAGS 50:430-433,2002 ②日歯医学会誌 20,58-68,2001 ③Abstract The Lancet vol 354 August 7,1999
・間接年齢調整法・・基準人口の数字は判明しているが、調査人口の死亡数が年齢階級別には不明で、総数しか判明していないとき 比率の調整(標準化)年齢 直接年齢調整法 (母集団) 基準人口 調査人口 年齢階級 人口数 人数 死亡数 死亡率 期待死亡数 0~14 2000 50 1 0,02 2000×0,02=40 15~64 4000 150 3 0,02 4000×(0,02)=(80) 65~ 1000 200 20 0,10 1000×(0,10)=(100) 合計 7000 (400) (24) 0,06 ( 220) 年齢調整死亡率 =220/7000=0,03 調査集団の死亡数は合計で( 24 )人で、死亡率は調査人数の400人で平均すると、( 0、06 )だが、年齢構成の調整(加重平均)をすると期待死亡総数は( 220 )人となり・・・0,03となる。 ・間接年齢調整法・・基準人口の数字は判明しているが、調査人口の死亡数が年齢階級別には不明で、総数しか判明していないとき
設問 図6の男児の乳児の発育曲線で、身長や体重の曲線が 10%及び90%センタイル値を示すとすれば、月例3ヶ月の男児のうち5Kgの線より以下の男児は( 10 )%いることになる。 また、身長を示す曲線を読むと、12ヶ月では、70cm以上に( 90 )%が存在することになる。
設問 グラフの左にはどんな語句が入るべきか 上 ( 標準偏差 ) 中段 (標準誤差 ) 下段 ( 95%信頼区間 ) 上は 中段は 下段は 何を示す?