自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第4回 関連2群と一標本t検定 問題例1 6人の高血圧の患者に降圧剤(A薬)を投与し、前後の収縮期血圧 を測定した結果である。
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
一般化線形モデル(GLM) generalized linear Models
第6回授業(5/17)での学習目標 1.2.1 実験計画法のひろがり(途中から) 1.2.2 節完全無作為化デザインをもっと知 ろう
【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成.
疫学概論 臨床生命表 Lesson 7. 生命表 §C. 臨床生命表 S.Harano,MD,PhD,MPH.
統計学第9回 「2群の差に関するノンパラメトリックな検定」 中澤 港
Rによる回帰分析 高崎経済大学 宮田 庸一.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
分散分析マスターへの道.
自己回帰モデルへの橋渡し 高崎経済大学 宮田庸一
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
RコマンダーでANOVA 「理学療法」Vol28(7)のデータ
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
第9回 二標本ノンパラメトリック検定 例1:健常者8人を30分間ジョギングさせ、その前後で血中の
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
第6章 2つの平均値を比較する 2つの平均値を比較する方法の説明    独立な2群の平均値差の検定   対応のある2群の平均値差の検定.
タレントの魅力測定とその分析.
ベイズ的ロジスティックモデル に関する研究
統計学勉強会 対応のあるt検定 理論生態学研究室 3年 新藤 茜.
臨床統計入門(3) 箕面市立病院小児科  山本威久 平成23年12月13日.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
母集団と標本調査の関係 母集団 標本抽出 標本 推定 標本調査   (誤差あり)査 全数調査   (誤差なし)査.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
早稲田大学大学院商学研究科 2016年1月13日 大塚忠義
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
相関分析.
リサーチカンファ 29 Aug, 2017.
Rコマンダーで分割プロットANOVA 「理学療法」Vol28(8)のデータ
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
一般化線型モデル generalized linear model; GLM
第8回授業(5/29日)の学習目標 検定と推定は、1つの関係式の見方の違いであることを学ぶ。 第3章のWEB宿題の説明
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
1.母平均の検定:小標本場合 2.母集団平均の差の検定
RでのScheffeの多重比較.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
確率と統計2009 第12日目(A).
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
経営学研究科 M1年 学籍番号 speedster
クロス表とχ2検定.
母集団と標本抽出の関係 母集団 標本 母平均μ サイズn 母分散σ2 平均m 母標準偏差σ 分散s2 母比率p 標準偏差s : 比率p :
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
RでのScheffeの多重比較.
疫学概論 カプラン・マイヤー法 Lesson 8. その他の生存分析 §A. カプラン・マイヤー法 S.Harano,MD,PhD,MPH.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
第2章 統計データの記述 データについての理解 度数分布表の作成.
サンプリングと確率理論.
森 裕一(岡山理科大学) 山本義郎(岡山大学自然科学研究科) 渡谷真吾,尾高好政(倉敷芸術科学大学) 垂水共之,田中 豊(岡山大学)
Mathematica Package (BimodalAnalysis.m)
Presentation transcript:

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

テキスト紹介 毎回恒例のテキスト枠 Rによるデータサイエンス 第11章 生存分析 pp183 – 199 http://bit.ly/jgtnBD 第11章 生存分析 pp183 – 199

テキストの無い方は HTML版 Web上で公開されています http://www1.doshisha.ac.jp/~mjin/R/36/36.html

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

本スライドの目的 生存分析とは何かわかるようになる 生存分析のグラフが読めるようになる Rを使って生存分析のグラフが作成できる ※数式はわからない時間の都合上省略しているので、気になる方はテキストの方を参考にしてください。

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

基本概念 生存時間分析とは 分析例 生存時間分析とは、イベントが起きるまでの時間とイベントの間の関係に焦点を当てる分析方法 新薬の効果を分析 イベント:死亡、故障、解約、倒産、破壊など 分析例 新薬の効果を分析 機械システムや製品の故障 LTV(顧客収益価値)の分析 例:プリペイド携帯電話の顧客がいつ離れるか

例:新薬の効果を分析 6-MPという薬を投与した場合とそうでない場合の白血病患者の生存時間のグラフ 縦軸が生存率 横軸が時間 新薬を投与した方が生存確率が高い

例:プリペイド携帯電話の顧客がいつ離れるか プリペイド携帯電話の解約と時間の関係 施策前と施策後の変化を比較する 施策後は生存確率が上がった (=解約率が減った) 引用:顧客収益価値の測定方法

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

用語説明 死亡 打ち切り 故障、破壊、倒産、死亡などのイベントの生起のことを 広義の死亡と呼ぶことにする 治療の中止や転院により試験・観察の途中で脱落する場合がある。このような場合を打ち切りが生じたという。 必ずしも最後まで観察データを取れるわけではない (・・あまり縁起のよくない用語が多い)

打ち切りを含むデータ 縦軸が被験者番号、横軸が生存時間を表す ×:死亡のケース △:打ち切り1は研究の途中で何らかの理由で観察が継続できなかったケース ○:打ち切り2は研究終了まで生存していたケース

生存関数とハザード関数 生存関数S(t) ハザード関数 生存関数とハザード関数は、どちらか片方が分かればもう片方も分かる関係。 累積確率分布関数F(t)で表すと、イベントがある時点tまで生起していない生存関数S(t)は   S(t) = Pr(T > t) = 1 - Pr(t ≦ T) = 1 – F(t)  で表される。 ハザード関数 イベントがある時点tまでに生起していないという条件の下で、次の瞬間にイベントが生起する瞬間死亡率 危険度とも呼ばれている。 生存関数とハザード関数は、どちらか片方が分かればもう片方も分かる関係。 (数式の詳細はp185参照)

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

生存時間分析の分類 生存時間に影響を与える時間以外の共変量(複数の要因、説明変数)が によって次の3種類に分類できる パラメータとして作成するモデルに導入されているか否か 生存時間の分布系に特定の確率分布を仮定するか否か  によって次の3種類に分類できる

生存時間分析の分類 共変量の導入 分布の仮定 ノンパラメトリック モデル × セミノンパラメトリック ○ パラメトリック

補足:パラメトリックとノンパラメトリック パラメトリックな手法 母集団の特性を規定する母数についてある仮説を設けるもので,平均値の差の検定(t 検定と略称されることが多い)や分散分析(F 検定と略称されることがある)などがこれに該当する。これらの検定手法では,母集団の正規性や等分散性が仮定される。 ノンパラメトリックな手法 母集団の分布型(母数)について一切の仮定を設けない。 このため,分布によらない手法 と呼ばれることもある。 特に,標本サイズが小さい場合には,それから求められた統計量の分布型は不正確なことが多く,パラメトリックな手法を適用することは不適切になりやすい。 しかし,ノンパラメトリックな手法は常に適用可能である。

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

ノンパラメトリックモデル 確率分布を仮定せずに生存時間を推定する方法 特徴 推定法 共変量を導入しない 分布の仮定をしない 経験分布による推定法 カプラン-マイヤー推定法が有名 ハザード関数による推定法 ネルソン-アーラン推定量 フレミング-ハリントン推定量

Rを使って生存解析 生存分析パッケージsurvivalを利用する データはMASSパッケージのgehanデータを用いる 白血病患者に対する薬の効果を調べるために被験者42名に対して行った臨床試験データ 解析にはSurv関数とsurvfit関数を用いる

gehanデータの中身 pair :投薬と比較対象のペア time:生存時間 cens:打ち切りか否か(1が打ち切り) library(survival);library(MASS); data(gehan);dim(gehan); [1] 42 4 gehan[1:6,] pair time cens treat   1 1 1 1 control   2 1 10 1 6-MP   3 2 22 1 control   4 2 7 1 6-MP   5 3 3 1 control   6 3 32 0 6-MP pair :投薬と比較対象のペア time:生存時間 cens:打ち切りか否か(1が打ち切り) treat:6-PM(抑癌薬)の投与か否か

解析:Surv, survfit関数 Surv(time, event) survfit(formula, data, type=“ “, …) formula : Survオブジェクト形式の目的変数と説明変数をセットする data : 解析対象のデータ type : 推定方法。デフォルトはカプラン-マイヤー推定法。他にフレミング-ハリントン推定法、fh2推定法がある メモ:Rからヘルプを出す場合はパッケージ名も指定する ?survival::Surv ?survival::survfit

解析結果 6-MPを投与したグループは生存期間の中央値が23と大幅に増えている records:対照郡, n.max:レコード数 ge.sf <- survfit(Surv(time,cens)~treat, data=gehan); ge.sf; Call: survfit(formula = Surv(time, cens) ~ treat, data =gehan) records n.max n.start events median 0.95LCL 0.95UCL treat=6-MP 21 21 21 9 23 16 NA treat=control 21 21 21 21 8 4 12 records:対照郡, n.max:レコード数 n.start:開始時の数, median:中央値 0.95LCL,0.95UCL : 95%信頼区間の上下限値 6-MPを投与したグループは生存期間の中央値が23と大幅に増えている

解析結果詳細 summary(ge.sf) treat=6-MP time n.risk n.event survival std.err lower 95% CI upper 95% CI 6  21 3  0.857 0.0764 0.720 1.000 7   17 1  0.807 0.0869 0.653 0.996 10 15 1   0.753 0.0963 0.586 0.968 13 12 1  0.690 0.1068 0.510 0.935 16 11 1  0.627 0.1141 0.439 0.896 22 7 1  0.538 0.1282 0.337 0.858 23 6 1  0.448 0.1346 0.249 0.807 項目左から 生存時間、リスクセット、イベントの数、推定された生存確率、 標準誤差、95%信頼区間の上下限値 時間が経つにつれ、推定された生存確率が下がっていく

解析結果をプロット plot(ge.sf) legend(locator(1), c("6-MP投与郡", "対照郡"), lty=c(1,2)); 図からも 6-PM投与郡のほうが 生存期間が長いことが わかる

投薬郡に対する90%信頼区間 信頼区間に納まっている ge2<-subset(gehan, treat=="6-MP"); ge2.s <- survfit(Surv(time, cens)~treat, conf.int=.9, data=ge2); plot(ge2.s, mark.t=F); legend(locator(1), lty=c(1,2), legend=c("生存曲線", "90%信頼区間")) 信頼区間に納まっている

信頼区間の推定法 servfit関数はconf.typeパラメータで信頼区間の推定法を変更することができる 種類は以下の通り plain log log-log conf.intパラメータで信頼区間を設定可能 デフォルトはconf.int=.95 (95%の信頼区間) コードはテキストp189参照

推定法の変更 servfit関数はconfパラメータで生存期間の推定法を変更することができる コードはテキストp189参照 種類は以下の通り デフォルト(カプラン-マイヤー) fh (フレミング-ハリントン) fh2 コードはテキストp189参照

検定:servdiff関数 2郡以上の観測値が得られた場合、その優位性の検定が必要する場合がある survdiff(…) 引数rho=0でログ・ランク検定 (デフォルト) 引数rho=1でゲーハン-ウィルコソン検定

検定:servdiff関数 実行結果 survdiff(Surv(time)~treat, data=gehan) Call: survdiff(formula = Surv(time) ~ treat, data = gehan) N Observed Expected (O-E)^2/E (O-E)^2/V treat=6-MP 21 21 29.2 2.31 8.97 treat=control 21 21 12.8 5.27 8.97 Chisq= 9 on 1 degrees of freedom, p= 0.00275 ログ・ランク検定のp値は約0.003なので、有意水準5%とすると 両群の生存曲線には優位な差が認められる。

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

セミノンパラメトリックモデル 共変量の導入 分布の仮定 ノンパラメトリック モデル × セミノンパラメトリック ○ パラメトリック

セミノンパラメトリックモデル 特徴 イベントに影響を及ぼす複数の因子(共変量)の影響を解析することを前提としたノンパラメトリックモデルのこと 共変量を導入する 分布の仮定をしない イベントに影響を及ぼす複数の因子(共変量)の影響を解析することを前提としたノンパラメトリックモデルのこと 共変量としては、年齢や血圧のような連続変数、性別や結婚の有無のようなカテゴリカル変数、これらの交差項などを含む変数ベクトル モデル コックス比例ハザードモデルが良く用いられる (数式はテキストp191)

コックス比例ハザードモデル パラメータの推定 Survivalパッケージには関数coxphがある 直接法 ブレスロー(Breslow)の近似法 エフロン(Efron)の近似法 イベントの数が増えると近似法のほうが計算が簡単であるが、同時に起こるイベントの数が多くなった場合妥当性を失うといわれている Survivalパッケージには関数coxphがある

推定:Coxph関数 coxph(formula, data, method, … ) formula:共変量など data:データ method : 以下の3種類。デフォルトは’efron’ efron breslow exact

データ:kidney ポータブル透析装置の使用と腎臓患者の生存時間に関して、38ペア(使用と不使用)に対する実験データ parent: ID time: 時間 status:打ち切りは0, その他は1 age: 年齢 sex: 男性=1, 女性=2 disease: 病気の種類 (GN, AN, PKD, Other) frail: オリジナル論文からのフレイルティの推定値

解析例:コックスハザードモデル 性別(sex)と病気の種類(disease)を説明変数とした解析例 data(kidney) kidney.cox<-coxph( Surv(time, status)~sex+disease, data=kidney) summary(kidney.cox); Call: coxph(formula = Surv(time, status) ~ sex + disease, data = kidney) n= 76 coef exp(coef) se(coef) z Pr(>|z|) sex -1.4774 0.2282 0.3569 -4.140 3.48e-05 *** diseaseGN 0.1392 1.1494 0.3635 0.383 0.7017 diseaseAN 0.4132 1.5116 0.3360 1.230 0.2188 diseasePKD -1.3671 0.2549 0.5889 -2.321 0.0203 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

解析例:コックスハザードモデル 3種類の検定統計量を返す 尤度比の検定、ワルド検定、スコア検定 exp(coef) exp(-coef) lower .95 upper .95 sex 0.2282 4.3815 0.11339 0.4594 diseaseGN 1.1494 0.8700 0.56368 2.3437 diseaseAN 1.5116 0.6616 0.78245 2.9202 diseasePKD 0.2549 3.9238 0.08035 0.8084 Rsquare= 0.206 (max possible= 0.993 ) Likelihood ratio test= 17.56 on 4 df, p=0.001501 Wald test = 19.77 on 4 df, p=0.0005533 Score (logrank) test = 19.97 on 4 df, p=0.0005069 3種類の検定統計量を返す 尤度比の検定、ワルド検定、スコア検定

生存時間の推定:survfit 構築したモデルによる生存時間の当てはめは、関数survfitを用いると便利 kidney.fit<-survfit(kidney.cox); summary(kidney.fit); Call: survfit(formula = kidney.cox) time n.risk n.event survival std.err lower 95% CI upper 95% CI 2 76 1 0.99018 0.00985 0.971059 1.000 7 71 2 0.96856 0.01831 0.933335 1.000  ・・・ 536 2 1 0.01224 0.01383 0.001336 0.112 562 1 1 0.00318 0.00613 0.000073 0.139

プロット plot(kidney.fit); survfitで推定された生存曲線および信頼区間 信頼区間内に納まっている

残差分析 打ち切りデータがあるため、残差分析が少々複雑になる 提案されている残差(カッコ内は指定パラメータ) マルチンゲール残差 (デフォルト)良く使われている シェーンフィールド残差 (type=“schoen-feld”) スコア残差 (type=“score”) デヴィアンス残差 (type=“deviance”) 関数coxphのモデルの残差はresiduals.coxph(略してresiduals)関数で呼び出す パラメータtypeを変えることで残差の種類を切り替えられる

マルチンゲール残差プロット scatter.smooth(residuals(kidney.cox)); abline(h=0,lty=3,col=2); 1が上限で下限値は無し 明らかに変化パターンがなければOK これを標準化したのが次のデヴィアンス残差

デヴィアンス残差プロット scatter.smooth(residuals(kidney.cox, type="deviance")); abline(h=0,lty=3,col=2); 標準化されている

ハザードの比例性の分析 コックス比例ハザードモデルは、ハザード比が時間によらず一定であることを前提としているため、その仮定を吟味する必要がある。 関数cox.zphを用いる デフォルトはKaplan-Meier推定量

比例性の分析:cox.zph kidney.zph<- cox.zph(kidney.cox); kidney.zph rho chisq p sex 0.18839 2.60676 0.106 diseaseGN -0.01392 0.01123 0.916 diseaseAN 0.06162 0.20036 0.654 diseasePKD 0.00701 0.00438 0.947 GLOBAL NA 4.20781 0.379

比例性の診断プロット スプライン平滑化曲線に、時間に伴う明らかな変化パターンが無ければ比例ハザードの仮定には問題がないといわれている。 op<- par(mfrow=c(2,2), mar=c(4.5,4,1,1)); plot(kidney.zph,df=2); par(op); スプライン平滑化曲線に、時間に伴う明らかな変化パターンが無ければ比例ハザードの仮定には問題がないといわれている。

交互作用と変数の選択 コックス比例ハザードモデルの場合でも、説明変数の交互作用を取りれたも出るの構築ガ可能。 詳細はテキスト参照。

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

パラメトリックモデル 共変量の導入 分布の仮定 ノンパラメトリック モデル × セミノンパラメトリック ○ パラメトリック

パラメトリックモデル 特徴 生存時間が確率分布に従うという仮定の下で構築したモデル 共変量を導入する 分布の仮定をする コックス比例ハザードモデルに比べると計算速度が速い ただし、制約のため応用範囲が限定される 生存時間が確率分布に従うという仮定の下で構築したモデル survreg(formula=formula(data), dist=“weibull”, …) 分布 指数分布 (dist=exponential) ワイブル (dist=デフォルト) 対数正規 (dist=log-normal) ロジスティック (dist=logistic) 対数ロジスティック (dist=log-logistic) (数式はテキストp198参照)

解析:survreg関数 survreg(Surv(time, status)~ sex+disease, kidney, dist="lognormal"); Call: survreg(formula = Surv(time, status) ~ sex + disease, data = kidney, dist = "lognormal") Coefficients: (Intercept) sex diseaseGN diseaseAN diseasePKD 1.7923643 1.5062960 -0.3334601 -0.5321264 0.6810495 Scale= 1.129394 Loglik(model)= -329.1 Loglik(intercept only)= -340 Chisq= 21.8 on 4 degrees of freedom, p= 0.00022 n= 76

自己紹介 テキスト紹介 本スライドの目的 基本概念 用語説明 生存時間分析の分類 まとめ ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル まとめ

まとめ 生存分析はイベントが起きるまでの時間を分析する手法 打ち切りが発生する 大きく3種類のモデルがある。 ノンパラメトリックモデル セミノンパラメトリックモデル パラメトリックモデル Rではそれぞれに対応した関数とデータが用意されている

ご清聴ありがとうございました。