主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど

Slides:



Advertisements
Similar presentations
Mathematica による固有値計算の高速化 Eigenvalue calculation speed by Mathematica 情報工学部 06A2055 平塚翔太.
Advertisements

社会統計 第 14 回 主成分分析 寺尾 敦 青山学院大学社会情報学部
数理統計学(第七回) 線形模型とは? 浜田知久馬 数理統計学第7回.
グラフィカル多変量解析 ----目で見る共分散構造分析----
データ解析
生物統計学・第4回 全体を眺める(3) 各種クラスター分析
因子分析,共分散構造分析 Factor Analysis Structural Equations Model
阪神・中日選手の 時系列傾向分析  福元 祥二  渡部 達朗.
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
9. 主成分分析 Principal Component Analysis (PCA)
データ解析 静岡大学工学部 安藤和敏
得点と打率・長打率・出塁率らの関係 政治経済学部経済学科 ●年●組 ●● ●●.
林俊克&廣野元久「多変量データの活用術」:海文堂
生物統計学・第3回 全体を眺める(2) 主成分分析
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
回帰分析.
第12章 連続潜在変数 修士 1年 村下 昇平.
データ分析入門(13) 第13章 主成分分析 廣野元久.
主成分分析                     結城  隆   .
回帰分析/多変量分析 1月18日.
主成分分析と因子分析 による競馬の勝因の研究
高校数学の知識から、 人工知能・機械学習・データ解析へ つなげる、 必要最低限の教科書
プロセスデータ解析学2 -単回帰分析- 担当:長谷部伸治     金 尚弘.
2016年度 植物バイオサイエンス情報処理演習 第10回 情報解析(3) Rを使った主成分分析
ガウス過程による回帰 Gaussian Process Regression GPR
相関分析.
データ解析 静岡大学工学部 安藤和敏
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
プログラミング論 II 2008年吉日 主成分分析 数値積分
第9章 混合モデルとEM 修士2年 北川直樹.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
主成分分析 (Principle Component Analysis)
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
データ解析 静岡大学工学部 安藤和敏
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
独立成分分析 (ICA:Independent Component Analysis )
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
主成分分析 Principal Component Analysis PCA
プログラミング論 主成分分析
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Black Litterman Modelによる最適化
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
対応のある共分散分散行列の同時分析 ーー 震災ストレスデータの同時分析 ーー
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
資料 線型変換のイメージ 固有値、固有ベクトル 平賀譲(209研究室) 資料
逆運動学:手首自由度 運動学:速度、ャコビアン 2008.5.27
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
データ解析 静岡大学工学部 安藤和敏
土木計画学 第12回(1月14日) 計画における代替案の作成2 担当:榊原 弘之.
データ解析 静岡大学工学部 安藤和敏
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
相関分析 2次元データと散布図 共分散 相関係数.
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
プログラミング論 相関
実験計画法 Design of Experiments (DoE)
Locally-Weighted Partial Least Squares LWPLS 局所PLS
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
パターン認識特論 カーネル主成分分析 和田俊和.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
rd-7. 主成分分析 (Rシステムでデータサイエンス演習)
生物統計学・第11回 全体を眺める(3) -主成分分析1:分析の基本-
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど    より低い次元で表現できるようにする。 データがばらついている方向ほど        多くの情報を含んでいると考える。    相関係数(分散と共分散)を元に計算する。

[テーマ] 講義の構成 主成分分析のイメージ 主成分の導出 Rでの計算 まとめ

主成分分析のイメージ

主成分分析とは

主成分分析とは

主成分分析とは

主成分分析とは

主成分分析とは

主成分の導出

主成分分析の導出 中心化 標準化

主成分分析の導出 中心化(または、標準化)

主成分分析の導出 中心化(または、標準化)

主成分分析の導出

主成分分析の導出(1)

主成分分析の導出(1)

主成分分析の導出(1)

主成分分析の導出(1)

主成分分析の導出(2)

主成分分析の導出(2)

主成分分析の導出(2)

主成分分析の導出(2) + N (または N - 1 )で割る 中心化した場合

主成分分析の導出(2) + N (または N - 1 )で割る 標準化した場合

ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで が最大となるような を求める ,

ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで が最大となるような を求める , ラグランジュの未定乗数法

ラグランジュの未定乗数法 中心化されたデータの場合 で偏微分 という条件のもとで が最大となるような を求める , ラグランジュの未定乗数法

ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法

ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 分散共分散行列の 固有値,固有ベクトルを求める

ラグランジュの未定乗数法 中心化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 分散共分散行列の 固有値,固有ベクトルを求める

ラグランジュの未定乗数法 標準化されたデータの場合 という条件のもとで これをまとめると が最大となるような を求める , で偏微分 という条件のもとで これをまとめると が最大となるような を求める , ラグランジュの未定乗数法 相関行列の 固有値,固有ベクトルを求める

固有値と寄与率 中心化後のデータの場合 標準化後のデータの場合

固有値と寄与率 中心化後のデータの場合 ・値の大きい固有値 から順に考える。 ・値の大きい固有値に 対応した軸(主成分) を順に  対応した軸(主成分)     を順に   第1主成分、第2主成分  という。   ・固有ベクトルが   互いに直交する。 標準化後のデータの場合

主成分分析の導出(寄与率,累積寄与率) 一般(r 次元) 中心化後のデータの場合 寄与率 累積寄与率 ,  中心化後のデータの場合 寄与率 累積寄与率 , 分散共分散行列の固有値・固有ベクトル

主成分分析の導出(寄与率,累積寄与率) 一般(r 次元)  標準化後のデータの場合 寄与率 累積寄与率 , 相関行列の固有値・固有ベクトル

主成分分析のまとめ 一般(r 次元)   中心化後のデータの場合 累積寄与率 m 個の固有値・固有ベクトルを計算し , を求める。

主成分分析のまとめ 一般(r 次元)   標準化後のデータの場合 累積寄与率 m 個の固有値・固有ベクトルを計算し , を求める。

Rでのシミュレーション

Rによる主成分分析の計算 > w1 <- read.table (“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))

データについて 標準化後 体格データ

Rによる主成分分析の計算 > w1 <- read.table(“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))

Rによる主成分分析の計算 > w1 <- read.table(“w0.dat”,header=TRUE, row.names=1) > w2 <- prcomp(w1,center=TRUE, scale=TRUE) > summary(w2) >plot(w2$x,type=“n”) >text(w2$x,rownames(w2$x))

まとめ

まとめ 主成分分析のイメージ データのばらつき,主成分 主成分の導出 中心化,標準化 分散, 共分散,相関係数 固有値,固有ベクトル,寄与率

補足1 r次元(中心化後)の場合 r個 r(r - 1)個