最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.

Slides:



Advertisements
Similar presentations
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
Advertisements

放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど
データ分析入門(12) 第12章 単回帰分析 廣野元久.
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2009年度.
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
第2章 単純回帰分析 ー 計量経済学 ー.
重回帰分析入門 経済データ解析 2011年度.
回帰分析.
寺尾 敦 青山学院大学社会情報学部 社会統計 第12回 重回帰分析(第11章前半) 寺尾 敦 青山学院大学社会情報学部
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
? ? ? ? ? ? ? ? 多変量解析とは? 問題となっている現象 ●問題の発生原因がわからない(因果関係)
高校数学の知識から、 人工知能・機械学習・データ解析へ つなげる、 必要最低限の教科書
変数選択手法っていろいろあるけど 何を使えばいいの?
Generative Topographic Mapping (GTM) でデータの 可視化・回帰分析・モデルの 逆解析を一緒にやってみた
回帰モデル・クラス分類モデルを 評価・比較するための モデルの検証 Model validation
補章 時系列モデル入門 ー 計量経済学 ー.
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
スペクトル・時系列データの前処理方法 ~平滑化 (スムージング) と微分~
ガウス過程による回帰 Gaussian Process Regression GPR
相関分析.
データ解析 静岡大学工学部 安藤和敏
VII. 空間モデル.
慶應義塾大学 理工学部 数理科学科 南 美穂子 データから情報を引き出そう 慶應義塾大学 理工学部 数理科学科 南 美穂子
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
モデルの適用範囲 モデルの適用領域 Applicability Domain (AD)
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
最小自乗法.
主成分分析 Principal Component Analysis PCA
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
部分的最小二乗回帰 Partial Least Squares Regression PLS
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第3章補足2 多変量データの記述 統計学基礎 2010年度.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第7章 単回帰で「消費関数」を計測する 1.所得の定義 1.1 国民純生産 国内総生産(GDP) ⇔ 所得
線形判別分析 Linear Discriminant Analysis LDA
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
Stepwise (ステップワイズ) 法による 説明変数 (入力変数・記述子・ 特徴量) の選択
データ解析 静岡大学工学部 安藤和敏
サポートベクターマシン Support Vector Machine SVM
自己組織化マップ Self-Organizing Map SOM
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析(Regression Analysis)
データ解析 静岡大学工学部 安藤和敏
リッジ回帰(Ridge Regression, RR) Least Absolute Shrinkage and Selection Operator (LASSO) Elastic Net (EN) 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
誤差逆伝播法による ニューラルネットワーク (BackPropagation Neural Network, BPNN)
重回帰分析入門 経済データ解析 2008年度.
実験計画法 Design of Experiments (DoE)
Locally-Weighted Partial Least Squares LWPLS 局所PLS
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析入門 経済データ解析 2011年度.
Boruta 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
高校数学の知識から、 人工知能・機械学習・データ解析へ つなげる、 必要最低限の教科書
転移学習 Transfer learning
混合ガウスモデル Gaussian Mixture Model GMM
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌

最小二乗法による線形重回帰分析 Multiple Linear Regression (MLR) Ordinary Least Squares (OLS) Classical Linear Regression (CLS) などと呼ばれます

Xによってyがどれだけ説明できるのかを定量的に分析すること 回帰分析ってなに? 目的変数(y)と説明変数(X)の関係をモデル化し、 Xによってyがどれだけ説明できるのかを定量的に分析すること 例 目的変数 (y) ビール注文数[個] 説明変数 (X) 最高気温[℃] y = 12.9X + 4.2 どうやってモデル化する(式を作る)のか?

説明変数が2つのときの線形重回帰分析 y: 目的変数 x1, x2: 説明変数 (記述子) b0: 定数項 b1, b2: 回帰係数 yC: yの、xで表すことができる部分 f: yの、xで表すことができない部分 (誤差、残差)

オートスケーリング(標準化)のメリット y, x1, x2 にオートスケーリングを行えば、b0 = 0 よって、

サンプルが n 個のとき サンプル n 個のとき、 y(i):i 番目のサンプルにおける 目的変数の値 xj(i) : i 番目のサンプルにおける j 番目の説明変数の値 f (i):i 番目のサンプルにおける 誤差の値

行列で表す

回帰係数を求めたい b1, b2、つまり b を求めたい

残差 f (i) の二乗和 (G) が最小という条件で b を求める方法 最小二乗法 残差 f (i) の二乗和 (G) が最小という条件で b を求める方法 最小値を取る 極小値を取る G を b1, b2 で偏微分したものが 0

誤差の二乗和を回帰係数で偏微分して 0 まとめて行列で表すと、

回帰係数、ついに求まる 両辺に左から XTX の逆行列 (XTX)-1 を掛ける

回帰モデルの精度の指標 r2 r2 (決定係数、説明分散) 1に近いほど精度の高い回帰モデル 相関係数 r を二乗したものとは異なる y(i):i 番目のサンプルにおける 目的変数の値 yC(i):i 番目のサンプルにおける 目的変数の計算値 yA:目的変数の平均値 n:サンプル数

回帰モデルの精度の指標 RMSE RMSE (Root Mean Square Error) 回帰モデルの誤差の指標 0に近いほど精度の高い回帰モデル 異なるデータセットの間で RMSE を比較してはいけない y(i):i 番目のサンプルにおける 目的変数の値 yC(i):i 番目のサンプルにおける 目的変数の計算値 n:サンプル数

回帰モデルの精度の指標 MAE MAE (Mean Absolute Error) 回帰モデルの誤差の平均 0に近いほど精度の高い回帰モデル y(i):i 番目のサンプルにおける 目的変数の値 yC(i):i 番目のサンプルにおける 目的変数の計算値 n:サンプル数