ロジスティック回帰による推測 (V.9 LOGISTICプロシジャの機能拡張)

Slides:



Advertisements
Similar presentations
統計学勉強会 ~カイ二乗検定~ 地理生態学研究室 3 年 髙田裕之. カイ二乗検定とは 期待値・理論値が存在するときに用いる。 一般的にはピアソンのカイ二乗検定のことを指す。 ノンパラメトリックな検定である。 適合度検定と独立性検定がある。
Advertisements

東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
橋本. 階級値が棒の中央! 階級値 図での値 階級下限階級上限
Maximal likelihood 法に基づく Matched filter について 田越秀行(阪大理) LCGT コヒーレンス解析 WG 修正 Ref: Finn, PRD63, (2001) Pai, Dhurandhar, Bose, PRD64,
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
1 調査データ分析 2003/5/27 第6回 堀 啓造(香川大学経済学部). 2 課題 (1) 解答 (1) Pearson のカイ2乗= 自由度= 1 漸近有意確率= 男女とコーヒー・紅茶の好み において連関がない( χ 2 (1)=0.084,p>0.05 )。 または.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
数理統計学(第ニ回) 期待値と分散 浜田知久馬 数理統計学第2回.
統計的仮説検定の手順と用語の説明 代表的な統計的仮説検定ー標準正規分布を用いた検定、t分布を用いた検定、無相関検定、カイ二乗検定の説明
寺尾 敦 青山学院大学社会情報学部 Fisher の直接確率法 寺尾 敦 青山学院大学社会情報学部
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
数理統計学(第十回) ノンパラ検定とは?1 浜田知久馬 数理統計学第10回.
一般化線形モデル(GLM) generalized linear Models
行動計量学研究分野B4 町田 透 対数線形モデルによる 分割表データの分析 行動計量学研究分野B4 町田 透
分割表データの分析 With the help of Mr. Machida
SASV9のLIFETESTとTPHREGを用いた メタアナリシス
数理統計学(第四回) 分散の性質と重要な法則
【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成.
数理統計学(第五回) 統計的推測とは? 浜田知久馬 数理統計学第5回.
第4章 MIXED Model 4.1 MIXED Model とは 4.2 反復測定データの分析1 分割法タイプのデータ
Rによる回帰分析 高崎経済大学 宮田 庸一.
日本行動計量学会主催 第4回春の合宿セミナー
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
H25年5月22日(水) 中央水研 「水産資源のデータ解析入門」 Terrapub
確率・統計Ⅱ 第7回.
ベイズ的ロジスティックモデル に関する研究
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
SAS/STAT プロシジャの 日本語翻訳プロジェクト
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
Nestedケース・コントロールデザインにおける擬似尤度によるパラメータ推定
ロジスティック回帰分析 with the assistance of Mr. M. Torii
クロス集計とχ2検定 P.144.
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
analysis of survey data 第3回 香川大学経済学部 堀 啓造
ガウス過程による回帰 Gaussian Process Regression GPR
応用数理工学特論 期末発表 西口健太郎 渡邉崇充
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
4章までのまとめ ー 計量経済学 ー.
分割表 Contingency table.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
顧客獲得.
一般化線型モデル generalized linear model; GLM
対立仮説下でのみ存在する 遺伝形式という母数を持つ 2x3分割表検定に関する考察 ~SNPによるケース・コントロール関連検定~
食中毒と疫学調査の統計 ~2×2表~ 岡山理科大学 山本英二 2002/02/20.
第10回授業(12/4)の目標 カイ2乗検定の実習 WEB を用いたカイ2乗検定と、授業で行った検定結果の正誤の確認方法(宿題)
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
疫学初級者研修  ~2×2表~ 平成12年2月14日(月) 13:00~ 岡山理科大学情報処理センター.
「パレスチナ社会の民主主義的価値観」 報告のアウトライン はじめに 民主主義的価値観 仮説とデータ 検証1:パレスチナ社会における民主化の
尤度の比較と仮説検定とを比較する ~P値のことなど~
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
経営学研究科 M1年 学籍番号 speedster
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
「カテゴリ変数2つの解析」 中澤 港 統計学第7回 「カテゴリ変数2つの解析」 中澤 港
分割表 Contingency table.
Foundations of Statistical Natural Language Processing 5. Collocations
Presentation transcript:

ロジスティック回帰による推測 (V.9 LOGISTICプロシジャの機能拡張) 東京理科大学工学部経営工学科 浜田知久馬

内容 ロジスティックモデル 最尤法による推定の原理 最尤法による検定の原理 条件付ロジスティック回帰の数理 V9のLOGISTIC の機能拡張  (STRATA文による    条件付ロジスティック回帰)

ロジスティック曲線とオッズ イベント発現確率p 1-p2  1-p1 p2 p1 -∞ X1 X2 +∞

例と一般化 薬剤 - + 計 イベント 5 10 15 95 90 185 100 200 薬剤 - + 計 イベント a c n-・ b d n+・ n・- n・+ n

説明変数が1つの場合 x=0:drug- x=1:drug+

説明変数が1つの場合 x=0:drug-      x=1:drug+

説明変数が1つの場合

likelihood(尤度) 最尤法:β0、β1の値を動かしてLが最も大きくなるようにする方法 薬剤 - + イベント 5 10 95 90 likelihood(尤度) 尤度(L)=モデルの下でデータが得られる確率 最尤法:β0、β1の値を動かしてLが最も大きくなるようにする方法 MLE:Maximum Likelihood Estimator

西遊記 ひたすら西を目指す.

最尤法 ひたすら尤度山の頂上を目指す.

尤度曲面 尤度 (-2.94,0.75)

対数尤度 対数尤度曲面 (-2.94,0.75)

絨毯爆撃 尤度

尤度山の頂上にいるのは?

尤 山の頂上では傾きは0

対数尤度 (-2.94,0.75)

薬剤 - + イベント a c b d 対数尤度とスコア関数

薬剤 - + イベント 5 10 95 90 対数尤度とスコア関数

薬剤 - + イベント+ a c イベント- b d 最尤推定量

薬剤 - + イベント 5 10 95 90 説明変数が1つの場合の 最尤推定量 粗オッズ比に一致

ロジスティック回帰のプログラム data data; do drug=0 to 1; do y=0,1; input w @@; do i=1 to w;output;end;end;end; cards; 95 5 90 10 ; proc logistic descending; model y=drug; 薬剤 - + イベント 5 10 95 90

Analysis of Maximum Likelihood Estimates ロジスティック回帰の出力 Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq Intercept 1 -2.9444 0.4588 41.1812 <.0001 drug 0.7472 0.5671 1.7359 0.1877 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits drug 2.111 0.695 6.416

帰無仮説の表現

[MedStat:002877] Raoのスコア検定をどのように計算するのでしょうか?

[MedStat:002878]浜田 Raoのスコア検定は説明変数が1つのときは帰無仮説の下でのUとその分散Vを 計算して, U**2/Vを カイ2乗分布と比べることで行うことができます。 しかし,説明変数が複数ある場合は行列演算が必要になりますので 手計算は困難です。 SASのPROC LOGISTIC等の統計ソフトウエアを利用することを お勧めします。

[MedStat:002879] プログラムを作成するスキルがあるため、SASを使わなくても行列計算を 手元でさせることはできます。残念ながらスコア検定の知識をはじめ統 計的な素養が不足して行き詰っているところです。 大学ではSASを使える環境ではあるものの、センターに行かないと使えず SASを使わないでスコア検定を行うことを希望します。

[MedStat:002881]大橋先生 医療関係の研究者が統計計算で時間を費やす必要は ないと思うのですがね。 統計家からの協力を得て、もっと生産的な仕事を された方が世のためです。

[MedStat:002886] 正直先週までRaoのスコア検定というものを全く知りませんでした。 尤度比検定とWald統計量を使おうと思っていたのですが、最尤推 定値が定まらず どうしようかと思案しているときに、研究室の方からスコア検定 を教えていただきました。 最尤推 定値が求まらないのに どうして検定できるのだろうか?

尤度山の頂点から帰無仮説の 離れ具合を測るには? β0 (2)傾斜角度を 測ってみる. (3)地図で位置を 確認する (1)高度を 測ってみる. 尤度比検定 スコア検定 Wald検定

三蔵法師が尤度山の最高天竺にいる.弟子たちは どれくらい離れているか.

尤度比検定 孫悟空  觔斗雲でひとっ飛び,如意棒で山の高さを測る. H0: β=0

 スコア検定 沙悟浄 水を流して 勾配を測る. H0: β=0

Wald検定 猪八戒 地図を頼りにひたすら掘り進み距離を測る. H0: β=0

尤度原理に基づく3種類の検定 尤度比検定,Wald検定,スコア検定 例 H0: β=0 の検定 1)尤度比検定 山の高さの違い 1)尤度比検定    山の高さの違い 2)スコア検定     β= 0における傾きが0に近いか 3) Wald検定     最尤推定量からの隔たり

薬剤 - + イベント 5 10 95 90 3種類の検定の模式図 スコア 尤度比 Wald

薬剤 - + イベント 50 100 950 900 セル度数が10倍になると

セル度数がk倍になると β0 ↓

母数空間 H1 H0 1 1

薬剤 - + イベント+ a c イベント- b d 尤度比検定

薬剤 - + イベント+ a c イベント- b d Wald検定

薬剤 - + イベント a c b d 帰無仮説の下でのU 薬剤+群における観測イベント数と期待イベント数の差

薬剤 - + イベント+ a c イベント- b d スコア検定

FREQプロシジャの出力 統計量 自由度 値 p 値 χ 2 乗値 1 1.8018 0.1795 尤度比χ 2 乗値 1.8341 薬剤 - + イベント 5 10 95 90 FREQプロシジャの出力 統計量 自由度 値 p 値 χ 2 乗値 1 1.8018 0.1795 尤度比χ 2 乗値 1.8341 0.1756 連続性補正χ 2 乗値 1.1532 0.2829 Mantel-Haenszel のχ 2 乗値 1.7928 0.1806 φ係数   0.0949 一致係数 0.0945 Cramer の V 統計量

Testing Global Null Hypothesis: BETA=0 LOGISTICの3種類の検定の出力 薬剤 - + イベント 5 10 95 90 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 1.8341 1 0.1756 Score 1.8018 0.1795 Wald 1.7359 0.1877

LOGISTICのSTRATA文 V.9からSTRATA文が追加 層,マッチングを行った場合の条件付の推測 (条件付ロジスティック回帰) PHREGのDISCRETEオプションによる解析と 等価 EXACT文と組み合わせて正確な解析も可能

1:1マッチングを行った ケース・コントロール研究 曝露 非曝露 Case Cont Cont E- E+ 計 Case 48 4 52 12 16 28 60 20 80 Cont E- E+ 計 Case a b c d N

McNemar検定 曝露 E+ 非曝露 E- Cont E- E+ 計 Case a b c d N

片側P値=Pr(12)+Pr(13)+Pr(14)+Pr(15)+Pr(16)=0.0384 2項分布 Bin(n=16,p=0.5) 片側P値=Pr(12)+Pr(13)+Pr(14)+Pr(15)+Pr(16)=0.0384 両側P値= 0.0384×2=0.0768

Bin(16,0.5)の正規近似 片側P値=0.0227 両側P値=0.0455

Cont E- E+ Case E- a b Case E+ c d McNemar検定

FREQプロシジャによるMcNemar検定 proc freq data=cc; tables case*control/agree; exact agree; Cont E- E+ Case 48 4 12 16

FREQプロシジャによる McNemar検定の出力 統計量 (S) 4.0000 自由度 1 Pr > S ( 漸近 ) 0.0455 Pr >= S ( 正確 ) 0.0768

ケース・コントロール研究データの2×2の分割表(曝露×疾患)での集計 Cont E- E+ 計 Case 48 4 52 12 16 28 60 20 80 E - + 計 Case 52 28 80 Cont 60 20 112 48 160

条件付きでない解析のプログラム proc logistic data=cc3 descending; class strata; model response=exposure strata; E- E+ 計 Case 52 28 80 Cont 60 20 112 48 160 strata 1,・・・,80 マッチング した層

Analysis of Maximum Likelihood Estimates 95% Wald Confidence Limits 条件付きでない解析の出力 Analysis of Maximum Likelihood Estimates Parameter   DF Estimate Standard Error WaldChi-Square Pr > ChiSq Intercept 1 -0.6592 0.2944 5.0135 0.0252 exposure 2.1972 0.8165 7.2417 0.0071 strata 0.6592 1.4271 0.2133 0.6442 ・・・ 2 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits exposure 9.000 1.817 44.591 strata 1 vs 80 3.000 0.040 223.087 ・・・ 正しいオッズ比:3 観測値:160 母数:81

条件付きの解析のモデル 非曝露 曝露 曝露なし 1 1 1 0 0 1 0 0 曝露あり 0 0 0 1 1 0 1 1 pix:疾患を発症する確率 i:マッチした層(i=1,・・・,80) x:曝露の有無     case cont   曝露なし 1 1 1 0 0 1 0 0 曝露あり 0 0 0 1 1 0 1 1    48(a) 4(b) 12(c) 16(d)

のパターンが得られる条件付確率 caseのみ曝露をうける確率 1 1 2 1 1 2 case E+  cont E- case E-  cont E+

条件付ロジスティック回帰の尤度と最尤推定量

条件付きロジスティック回帰のプログラム proc logistic descending data=cc3; class strata; model response=exposure; strata strata; exact exposure /estimate=both outdist=out;

条件付きロジスティック回帰の結果 Testing Global Null Hypothesis: BETA=0 Test Chi-Square DF Pr > ChiSq Likelihood Ratio 4.1860 1 0.0408 Score 4.0000 0.0455 Wald 3.6208 0.0571 Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq exposure 1 1.0986 0.5774 3.6208 0.0571

95% Wald Confidence Limits 条件付きロジスティック回帰の結果 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits exposure 3.000 0.968 9.302 Exact Odds Ratios Parameter Estimate 95% Confidence Limits p-Value exposure 3.000 0.909 12.762 0.0768

正確な推測 48 4 12 16 層を固定したものでの正確な条件付分布 ・・・ ー 16 ー 1 15 ー 2 14 Cont E- E+ 1 1 2 1 1 2 層を固定したものでの正確な条件付分布 ー 16 ー 1 15 ー 2 14 Cont E- E+ Case 48 4 12 16 ・・・ ー 14 2 ー 15 1 ー 16

OBS B C Score Prob 1 16 16.00 0.00002 2 15 12.25 0.00024 3 14 9.00 0.00183 4 13 6.25 0.00854 5 12 4.00 0.02777 6 11 2.25 0.06665 7 10 1.00 0.12219 8 9 0.25 0.17456 0.00 0.19638 17

スコアカイ2乗の 正確な分布とカイ2乗近似 P値=Pr(4)+Pr(6.25)+Pr(9)+Pr(12.25)+Pr(16)=0.0768 確率 P値=Pr(4)+Pr(6.25)+Pr(9)+Pr(12.25)+Pr(16)=0.0768

mid-p型の信頼区間の計算プログラム proc logistic descending data=cc3; class strata; model response=exposure; strata strata; exact exposure /estimate=both outdist=out cltype=midp;

Exact Parameter Estimates mid-p型の信頼区間の出力 Exact Parameter Estimates Parameter Estimate 95% Confidence Limits p-Value Type exposure 1.0986 0.004279 2.3773 0.0490 MidP(0.5) Exact Odds Ratios Parameter Estimate 95% Confidence Limits p-Value Type exposure 3.000 1.004 10.776 0.0490 MidP(0.5) exactP値=Pr(4)+Pr(6.25)+Pr(9)+Pr(12.25)+Pr(16)=0.0768 midP値=0.5×Pr(4)+Pr(6.25)+Pr(9)+Pr(12.25)+Pr(16)=0.0490

モンテカルロシミュレーションによる近似検定のプログラム proc logistic descending data=cc3 exactoptions (method=networkmc seed=4989 n=20000); class strata; model response=exposure; strata strata; exact exposure /estimate=both outdist=out cltype=exact;

モンテカルロシミュレーションによる近似検定の出力 Exact Parameter Estimates Parameter Estimate 95% Confidence Limits p-Value Type exposure 1.1151 -0.0885 2.7066 0.0745 Exact Exact Odds Ratios Parameter Estimate 95% Confidence Limits p-Value Type exposure 3.050 0.915 14.978 0.0745 Exact

結果のまとめ 条件無 条件付 正確法 カイ2乗 8.000 4.000 p値  0.003 0.046 0.077 オッズ比 9.000 3.000 信頼下限 1.817 0.968 0.909 信頼上限 44.591 9.302 12.762

尤 まとめ スコア 尤度比 Wald H0: β=0

スコア検定の利点 ・ MLEを求めるためには反復計算が必要 ・スコア検定はH0の下でのUがわかれば計算可能 ・Wald,尤度比検定はMLEが求まらないとできない. ・ MLEを求めるためには反復計算が必要 ・スコア検定はH0の下でのUがわかれば計算可能 ・多くのモデルについての計算が必要な総当り法では,スコア検定が行われる. ・単純な問題については,よく知られた検定に一致 ・スコア検定では収束しない場合でも,H0の検定が可能

次のうちスコア検定に相当するのはどれでしょう. 1)Z検定(分散既知のt検定) 2)Pearsonのカイ2乗検定 3)McNemar検定 4)Cochran-Armitage検定 5)Mantel-Haenzel検定 6)ログランク検定

[MedStat:002887]浜田 スコア検定は確かに 最尤推定値が求まらなくても 帰無仮説が検定できるのが 利点です. しかし最尤推定値が求まらないのは モデルが破綻しているということですし 帰無仮説の検定だけでは推測としては不十分です. 根本的に最尤推定値が求まらない原因(0セルがある等)を追究しとく 必要があるかと思います. やはり統計の専門家に相談した方がよいと思います.

参考文献 Derr, R.E.(2000) Performing exact logistic regression with the SAS System. SUGI'2000 Proceedings, Paper 254 Gail, M.H., Lubin, J.H., and Rubinstein, L.V. (1981) Likelihood Calculations for Matched Case-Control Studies and Survival Studies with Tied Death Times. Biometrika, 68, 703-07. Hirji, K.F., Mehta, C.R., and Patel, N.R. (1987) Computing Distributions for Exact Logistic Regression. Journal of the American Statistical Association, 82, 1110 - 1117. Hosmer, D.W, Jr. and Lemeshow, S. (2000), Applied Logistic Regression, Second Edition, New York: John Wiley & Sons, Inc. Mehta, C.R., Patel, N. and Senchaudhuri, P. (1992), Exact Stratified Linear Rank Tests for Ordered Categorical and Binary Data. Journal of Computational and Graphical Statistics, 1, 21 - 40. Mehta, C.R., Patel, N. and Senchaudhuri, P. (2000) Efficient Monte Carlo Methods for Conditional Logistic Regression. Journal of the American Statistical Association, 95, 99 - 108. Truett,J., Cornfield, J. and Kannel, W.(1967) A Multivariate Analysis of the Risk of Coronary Heart Disease in Framingham. J.Chron.Dis. 20, 511-524 浜田知久馬(1994)SASによる条件付きロジスティック回帰. 日本SASユーザー会94論文集,527-540 浜田知久馬(2000)LOGISTICのV. 8の機能拡張. 日本SASユーザー会2000論文集,13-38 浜田知久馬(2001)SAS V. 8における正確な推測とシミュレーションによる近似法. 日本SASユーザー会2001論文集,165-187

data likelihood; do b0=-2.9444; do b1=-0.4 to 1.2 by 0.05; p0=1/(1+exp(-(b0))); p1=1/(1+exp(-(b0+b1))); l=p0**10*(1-p0)**190*p1**20*(1-p1)**180; logl=log(l); output; end;end; proc gplot; plot l*b1; symbol1 i=spline ;run; plot logl*b1;

理想的な比較

data data;phi=0.50;n=16; do y=0 to 16; p=pdf('binomial',y,phi,n); fn=pdf('normal',y,n*phi,(n*0.25)**.5); output;end; proc gplot;plot p*y fn*y/vzero overlay; symbol1 i=needle c=red; symbol2 i=spline c=green; run;

data data; b=4;c=12; do beta=0 to 2 by 0.1; logl=c*beta-(b+c)*log(1+exp(beta)); output; end; proc gplot; plot logL*beta; symbol1 i=spline; run;

UNIVARIATEプロシジャによるMcNemar検定 data cc; input case control w @@; do i=1 to w; dif=case-control;output;end; cards; 0 0 48 1 1 16 0 1 4 1 0 12 ; proc univariate data=cc;var dif; case control dif 0 0 0 1 0 1 0 1 -1 1 1 0

UNIVARIATEプロシジャによる 対応のある検定の出力 位置の検定 : μ 0=0 検定 統計量 p 値 Student の t 統計量 t 2.039 Pr > |t| 0.0448 符号検定 M 4 Pr >= |M| 0.0768 符号付順位検定 S 34 Pr >= |S|

マッチングを無視した解析のプログラム data cc2; input response exposure w @@;   do i=1 to w;output;end;  cards;  1 0 60 1 1 20 0 0 52 0 1 28  ;  proc logistic data=cc2 descending;  model response=exposure;

Analysis of Maximum Likelihood Estimates 95% Wald Confidence Limits マッチングを無視した解析の結果 Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq Intercept 1 -0.1431 0.1895 0.5705 0.4501 exposure 0.4796 0.3487 1.8912 0.1691 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits exposure 1.615 0.816 3.200 正しいオッズ比:3 層を無視するため誤差的なバラツキが増大

正確な推測 層を固定したものでの正確な条件付分布 Cont E- E+ Case a B C d

結果のまとめ ロジ(1) 層無視 ロジ(2) 層条件無 条件付 正確法 カイ2乗 1.905 8.000 4.000 p値  0.122 0.003 0.046 0.077 オッズ比 1.615 9.000 3.000 信頼下限 0.816 1.817 0.968 0.909 信頼上限 3.200 44.591 9.302 12.762

良性乳癌に対する1:3マッチングを 行ったケースコントロール研究 ケース: 50人  コントロール:150人 STR:(層) 1~50 年齢と施設でマッチング AGMT(面接時年齢) FNDX(乳癌の有無) CHK(定期的な診断の有無) AGMN(初経年齢) HIGD(就学期間) DEG(学歴) NLV(死産児の数) LIV(生誕時の数) WT(体重ポンド) AGLP(閉経時の年齢) MST2(結婚歴) 1:婚姻歴有 2:婚姻歴無

変数減少法による変数選択 proc logistic descending; class str mst2/param=ref ref=last; model fndx= chk|deg|higd|agmn|aglp|wt|mst2@2 /selection=backward; strata str;

変数減少法による変数選択 定期的な診断 初経年齢 体重 結婚歴 Summary of Backward Elimination Step Effect Removed DF Number In Wald Chi-Square Pr > ChiSq 1 HIGD 6 2.3863 0.1224 2 DEG 5 1.7836 0.1817 3 AGLP 4 3.0579 0.0803 Type 3 Analysis of Effects Effect DF Wald Chi-Square Pr > ChiSq CHK 1 6.7503 0.0094 AGMN 7.8913 0.0050 WT 8.0069 0.0047 MST2 4.6865 0.0304 定期的な診断 初経年齢 体重 結婚歴

パラメータ推定値 Analysis of Maximum Likelihood Estimates Parameter DF   DF Estimate Standard Error Wald Chi-Square Pr > ChiSq CHK 1 -1.1613 0.4470 6.7503 0.0094 AGMN 0.3592 0.1279 7.8913 0.0050 WT -0.0282 0.00998 8.0069 0.0047 MST2 -1.5934 0.7360 4.6865 0.0304 CHK:定期的な診断 AGEN:初経年齢 WT:体重 MST2:結婚歴

条件付の解析 Odds Ratio Estimates Effect Point Estimate 95% Confidence Limits CHK 0.313 0.130 0.752 AGMN 1.432 1.115 1.840 WT 0.972 0.953 0.991 MST2 1 vs 2 0.203 0.048 0.860 定期的な診断 初経年齢 体重 結婚歴 条件無しの解析 Odds Ratio Estimates Effect Point Estimate 95% Confidence Limits CHK 0.185 0.064 0.536 AGMN 1.741 1.272 2.382 WT 0.959 0.935 0.983 MST2 1 vs 2 0.0840 0.014 0.512