【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成.

Slides:



Advertisements
Similar presentations
東京大学医学系研究科 特任助教 倉橋一成 1.  背理法を使った理論展開 1. 帰無仮説( H0 、差がない)が真であると仮定 2. H0 の下で「今回得られたデータ」以上の値が観測でき る確率( P 値)を計算 3. P 値が 5% 未満:「 H0 の下で今回のデータが得られる可 能性が低い」
Advertisements

第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
1 / 44 SPSS ハウツー 独立行政法人 大学入試センター 橋本 貴充 2007 年 3 月 30 日 ( 金 )
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
回答と解説.
データ分析入門(12) 第12章 単回帰分析 廣野元久.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
一般化線形モデル(GLM) generalized linear Models
寺尾 敦 青山学院大学社会情報学部 社会統計 第13回 重回帰分析(第11章後半) 寺尾 敦 青山学院大学社会情報学部
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
パネル分析について 中村さやか.
【MedR】第12回 東京大学医学系研究科 特任助教 倉橋一成.
ISDASインターネット分散観測: ワームの平均寿命はいくらか?
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
Bassモデルにおける 最尤法を用いたパラメータ推定
因子分析や3相因子分析による分析の問題点を整理する 狩野裕+原田章(行動工学講座)
回帰分析.
ベイズ的ロジスティックモデル に関する研究
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
回帰分析/多変量分析 1月18日.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
需要の価格弾力性 価格の変化率と需要の変化率の比.
第4章 線形識別モデル 修士2年 松村草也.
東京工業大学 機械制御システム専攻 山北 昌毅
補章 時系列モデル入門 ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
相関分析.
データ解析 静岡大学工学部 安藤和敏
市場規模の予測.
VII. 空間モデル.
第6章 連立方程式モデル ー 計量経済学 ー.
4章までのまとめ ー 計量経済学 ー.
顧客獲得.
一般化線型モデル generalized linear model; GLM
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
疫学概論 交絡 Lesson 17. バイアスと交絡 §A. 交絡 S.Harano, MD,PhD,MPH.
第14章 モデルの結合 修士2年 山川佳洋.
顧客維持に関するモデル.
市場規模の予測.
部分的最小二乗回帰 Partial Least Squares Regression PLS
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
データ解析 静岡大学工学部 安藤和敏
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析(Regression Analysis)
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
データ解析 静岡大学工学部 安藤和敏
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
実験計画法 Design of Experiments (DoE)
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Presentation transcript:

【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成

6.2 線形回帰 モデル:Y = Xβ + e パラメータを推定値する公式:β-hat = (XTX)-1XTY 最小二乗法 Y-hat = X(XTX)-1XTY X(XTX)-1XT:ハット行列 e = {1 - X(XTX)-1XT}Y E(e) = 0 V(e) = eTe/df(e) 残差が説明変数Xの分布に依存する 残差を標準化する 説明変数を前もって標準化しておく

6.3 分散分析 = 重回帰(幾何学的解釈) 観測値ベクトル(結果変数ベクトル) 残差 最小二乗法:残差を最小 モデルベクトル(説明変数の線形結合) モデル平面(説明変数行列が張る空間)

7章:ロジスティック回帰モデルと一般化線形モデル plasma 赤血球沈降速度(ESR)がリウマチ疾患、慢性的感染症、悪性疾患に関連している か 2つの血漿蛋白(fibrinogen, globulin)との関連を確認する womensrole 女性の社会的役割についての意識調査 「女性は家庭の切り盛りの注力し、国の切り盛りは男性の委ねておくべきである」に 賛成か反対か 教育年数と性別が回答に影響するかどうか polyps 家族性大腸腺腫症(FAP)治療における非ステロイド性抗炎症薬のプラセボ対照試 験 中間解析によって有効中止 12ヶ月の治療後のポリープの数に関心 packpain 車の運転が椎間板ヘルニア(AHLID)の危険因子であるかどうか ケースコントロール研究(症例対照研究) ケース:AHLIDと診断された対象者 コントロール:同じ病院に来院した脊柱に関連しない疾患を持つ患者 性、年齢でのマッチングデータ

ロジスティック回帰 2値の結果変数を予測したい 結果変数に適当な変数変換を行う logit(P) = β0 + β1x1 + … 2値変数に線形回帰をしたら0,1の範囲外の予測値が計算される 結果変数に適当な変数変換を行う ロジット変換 オッズの対数 log{p/(1-p)} logit(P) = β0 + β1x1 + … exp(β1)はx1が1単位変化したときのオッズ比 x1が1単位変化すると、y=1となる確率がexp(β1)倍大きくなる logit(p) p

条件付きロジスティック回帰 マッチングされたケースコントロール研究 モデル:logit(pi) = αi + βx 各マッチング層で切片が異なるというモデル αの数はマッチングの数だけ存在する 推定しきれない αiは推定する必要のないパラメータ(局外パラメータ) αiで条件付けた条件付き尤度を最大化する

結果変数が「指数型分布族」の回帰モデル 一般線形モデルと一般化線形モデル 一般線形モデル(general linear model; GLM、じーえるえむ) 5章の分散分析、6章の重回帰は全く同じモデル lm()関数 一般化線形モデル(generalized linear model; GLIM、ぐりむ) ロジスティック回帰も「結果変数を変数変換している」点以外は同じ 他にはポアソン回帰(結果変数:カウント)など glm()関数 結果変数が「指数型分布族」の回帰モデル

GLIM 誤差分布 リンク関数 分散関数 最尤法でパラメータ推定 デビアンスと尤度比検定でモデル評価と比較 結果変数の期待値が従う分布 重回帰:正規分布 ロジスティック回帰:2項分布 リンク関数 結果変数の変数変換 重回帰:恒等変換(無変換、identity link) ロジスティック回帰:ロジット変換 分散関数 分散と期待値の関係を評価する 擬似尤度による近似計算によって超過変動(overdispersion)に対処す る 最尤法でパラメータ推定 デビアンスと尤度比検定でモデル評価と比較

データ解析の手順

Phase III:データ解析(モデル作成) 多重共線性(マルチコ、multi-colinearity)に気を付ける 説明変数同士の相関が高いと推定値が変になる あまりに相関の高い変数同士は、同時に説明変数にしない まずはその分野で妥当だなと思われるモデルを作る 説明変数は少な目に モデルの探索 説明変数を全て入れる 交互作用項を入れる 変数選択を行う ステップワイズ:解釈不能な結果が出ることが多い leaps()関数:変数の数ごとに最良の変数セットが確認でき、解釈しやすい 結果変数に関連の強い「順番」も吟味しやすい 機械学習 モデルの説明力をチェック 連続値:R2乗、分散の説明割合、キャリブレーションプロット 2値:ROC曲線、AUC

プログラムへ