わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数

Slides:



Advertisements
Similar presentations
はじめてのパターン認識 第1章 第4グループ 平田翔暉. パターン認識 パターン認識 o 観測されたパターンを、あらかじめ定められ たクラスに分類すること クラス o 硬貨: 1 円玉、 5 円玉、 10 円玉、 50 円玉、 100 円玉、 500 円玉 o アルファベット: 26 種類 o 数字:
Advertisements

Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
主成分分析 主成分分析は 多くの変数の中を軸を取り直すことで より低い次元で表現できるようにする。 データがばらついている方向ほど
BRIEF: Binary Robust Independent Elementary Features
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
「わかりやすいパターン認識」 第1章:パターン認識とは
セキュアネットワーク符号化構成法に関する研究
「Self-Organizing Map 自己組織化マップ」 を説明するスライド
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
回帰分析.
データ分析入門(13) 第13章 主成分分析 廣野元久.
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
主成分分析                     結城  隆   .
3次元での回転表示について.
データの可視化 ~高次元データを見る~ 三枝 亮 (早稲田大学).
ガウス過程による回帰 Gaussian Process Regression GPR
原子核物理学 第4講 原子核の液滴模型.
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
サポートベクターマシン によるパターン認識
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
音高による音色変化に着目した音源同定に関する研究
ICML2006勉強会 2006年7月29日 局所フィッシャー判別分析 東京工業大学 計算工学専攻 杉山 将.
第14章 モデルの結合 修士2年 山川佳洋.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
音色空間の音高依存性を考慮した 楽器音の音源同定
独立成分分析 (ICA:Independent Component Analysis )
醜いアヒルの子の定理 平成15年6月6日(金) 発表者 藤井 丈明.
3次元での回転表示について.
主成分分析 Principal Component Analysis PCA
プログラミング論 主成分分析
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Data Clustering: A Review
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
様々な情報源(4章).
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
プロセスデータ解析学5 -主成分分析- 担当:長谷部伸治     金 尚弘.
ガウシアン確率伝搬法の 近似精度に対する理論解析
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
楽器音を対象とした音源同定: 音高による音色変化を考慮する識別手法の検討
第3章 線形回帰モデル 修士1年 山田 孝太郎.
データ解析 静岡大学工学部 安藤和敏
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
音色空間の音高依存性を考慮した 楽器音の音源同定
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
第2章 統計データの記述 データについての理解 度数分布表の作成.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
パターン認識特論 カーネル主成分分析 和田俊和.
線形符号(10章).
第4日目第2時限の学習目標 検査(テスト)の信頼性について学ぶ。 (1)検査得点の構成について知る。 (2)検査の信頼性の定義を知る。
ランダムプロジェクションを用いた音響モデルの線形変換
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数 平成15年6月6日(金) 発表者 藤井 丈明

表現のための次元削減と判別のための次元削減 〔1〕 KL展開と線形判別法 KL展開の軸 線形判別法の軸 表現のための次元削減と判別のための次元削減

KL展開と線形判別法の違い KL展開ー表現、圧縮のための次元削減 線形判別法ー判別のための次元削減 線形判別法はクラスの分布の分離度を考慮している

KL展開の有用性 ・KL展開の有用性 1)高次元の特徴ベクトルを必要とする高度な認識(文字認識、音声認識etc)の、次元の呪いを防ぐために次元削減が必要 2)相関の高い特徴がある時、次元削減により冗長な情報を減らす。また計算誤差が大きくなるのを防ぐことができる

KL展開の問題点 KL展開の問題点 ・KL展開によって特徴空間の次元数を減らすことは識別に必要な情報を落としてしまう危険性を常にはらんでいる

〔2〕 KL展開と学習パターン数 学習パターンから共分散行列を求め、その固有値と固有ベクトルを求める 〔2〕 KL展開と学習パターン数 学習パターンから共分散行列を求め、その固有値と固有ベクトルを求める KL展開の計算に学習パターン数がどのような影響を及ぼすか次の2つの実験で調べる

実験 実験1-16次元の特徴空間上に多次元正規分布をするパターンを人工的に発生させ、KL展開によって定まる主軸と正しい主軸とのずれが、パターン数の増加とともにどのように変化するか調べ、二つの軸のなす角を とし、ずれを   で評価する 実験2-人口的な特徴ベクトルではなく、実際の文字パターンから得られた特徴を用いて上と同様の実験を行う。文字として手書き数字の「5」を400パターン収集、Glucksmanの特徴を加工して得られる16次元特徴を用いた

実験1 グラフ (a) 多次元正規分布パターン パターン数 パターン数と主軸方向の精度

実験1、結果 パターン数が次元数に等しい時 求められた主軸は63.7のずれがある パターン数が次元数の4倍の時 求められた主軸は50.5のずれがある 次元数に比して十分なパターン数を用意する必要がある

実験2 グラフ 多次元正規分布パターン 実文字パターン パターン数 パターン数と主軸方向の精度

実験2、結果 パターン数が比較的少なくても、ほぼ正しい主軸が得られた      実際、互いに独立な特徴を用意する       事は困難であり、必ず相関を持ってしまう この例も、Glucksmanの特徴上、特徴間で相関を持つものがかなりの部分を占めていると考えられる

累積寄与率 (cumulative proportion) 固有値を大きい順にある個数まで加算した値が、固有値の総和に対して占める割合。ある限られた主成分だけで元の分布をどの程度忠実に記述できるかという目安になる

累積寄与率 グラフ 累積寄与率 多次元正規分布パターン 実文字パターン 特徴数 特徴数と累積寄与率

累積寄与率、結果 (実文字パターン) 最初の8個でほぼ99%に達した 実際には8次元程度の部分空間にパターンが分布している 見かけ上の次元数は大きくても、実際はより小さな次元の空間にパターンが分布しているとき、この実際上の次元数を固有次元数(intrinsic dimensionality)と呼ぶ

累積寄与率、結果 (多次元正規分布パターン) 累積寄与率が途中で急激に増大し、飽和する事はない     ・用いたものは人工的なパターン     ・16個の特徴間の独立性が高いため    固有次元数も16に近いと考えられる よって必要とされるパターン数ははるかに多くなる

まとめ 結果的にパターンが少数次元の部分空間にしか分布していないとしても、その事実を確認するには次元数に比べて大量のパターンが必要であることに注意する必要がある