『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.

Slides:



Advertisements
Similar presentations
放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
Advertisements

Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
「わかりやすいパターン認識」 第1章:パターン認識とは
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
Pattern Recognition and Machine Learning 1.5 決定理論
統計解析 第9回 第9章 正規分布、第11章 理論分布.
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
大数の法則 平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
第2章補足Ⅱ 2項分布と正規分布についての補足
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
統計解析 第10回 12章 標本抽出、13章 標本分布.
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
第4章 線形識別モデル 修士2年 松村草也.
ガウス過程による回帰 Gaussian Process Regression GPR
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
ニューラルネットは、いつ、なぜ、どのようにして役立つか?
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
第14章 モデルの結合 修士2年 山川佳洋.
第3章 統計的推定 (その1) 統計学 2006年度.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
1.標本平均の特性値 2.母分散既知の標本平均の分布 3.大数法則と中心極限定理
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
パターン認識と機械学習 第2章:確率分布(後半)
主成分分析 Principal Component Analysis PCA
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
Data Clustering: A Review
ベイズ・アプローチによる グラフィカル・テスト理論
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
不完全な定点観測から 真の不正ホストの分布が分かるか?
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
富山大学 公開講座 2008 「QRコードを作ろう!」 ~ ハミング距離 ~.
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
人工知能特論II 第8回 二宮 崇.
ポッツスピン型隠れ変数による画像領域分割
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
物理フラクチュオマティクス論 応用確率過程論 (2006年4月11日)
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
パターン認識特論 カーネル主成分分析 和田俊和.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
3 一次関数 1章 一次関数とグラフ §4 方程式とグラフ         (3時間).
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一

最近傍決定則の誤り確率 ベイズ誤り確率を求めたい 確率密度関数が既知の場合解析的に求めることができる 一般に確率密度関数は未知 観測できるものは、確率密度関数の実現値 (確率密度関数に基づいて生成される個々のパターン) NN 法によってベイズ誤り確率 の近似が可能 !! : NN 法の誤り確率 c :クラス数 NN 法の誤り確率はベイズ法によるものの 2 倍を超えない

ベイズ誤り確率と最近傍決定則 ベイズの誤り確率: 『分布の重なり』が 誤り確率を表す 最近傍決定則

2 クラスにおける近似の式の導出 〔 1 〕 クラスのわかっている n 個のプロトタイプを用意 : 入力パターン x に対する最近傍を x ’ で表す 入力パターンとその最近傍の属するクラスが異なる場合に誤りが生 ずる( NN 法) NN 法でパターン x を識別したときの誤り確率( n 個のプロトタイ プ): 起こりうる全ての x に対する誤り誤差: これらを用いて の関係を求める

2 クラスにおける近似の式の導出 〔 2 〕 プロトタイプ数 n を無限大に近づけるとする 上式より、 ただし、次の関係式を用いた 最近傍 x ’ は入力パターン x に限りなく近づくとする

2 クラスにおける近似の式の導出 〔 3 〕 NN 法の誤り確率: の分散

2 クラスにおける近似の式の導出 〔 4 〕 近似の式の導出〔 3 〕より まとめると以下の ようになる 先に示した近似の式の 3 項目に c=2 を代入することでこの関係が導かれる

coffee break ベイズ決定則による決定境界は事後確率が等しい以下の式を満たす点として定 まる 誤識別は決定境界付近で発生することが多い 決定境界付近ではパターンの確率密度が低い 例. が正規分布で表される場合、正規分布の裾野近くに設定される  NN 法のためにプロトタイプを収集したとする 確率密度の高いところに多くのプロトタイプが集まる ( 決定境界付近には少数のプロトタイプしか集まらない ) NN 法で高い識別率を達成するためには 決定境界を決めるのに寄与するプロトタイプのみを残せばよい パターンの分布を忠実に反映することと高い識別性能を実現することが 相反する要求となっている 編集アルゴリズム ( 効率的な識別が可能な新しい プロトタイプの集合を作り出す )

誤り確率の計算例 [1]  2つのクラスが 1 次元特徴空間上の [1 , 0] 上に分布しているとする  両クラスの事前確率 :  両クラスの確率密度関数 ( 下図のように ) : x : 1 次元の特徴値

誤り確率の計算例 [2] x の確率密度関数 一様分布のパターン ベイズの定理より N 個のプロトタイプ を用いて 未知パターンを識別

誤り確率の計算例 [3] NN 法での誤り確率 x ’ で平均したものを とおく q (x,x ’ ): 最近傍が x ’ となる確率

誤り確率の計算例 [4] q(x,x ’ ) を求める の場合 0 1 1/2 x x’x’ 2x-x ’ x x’x’ x 2x x’x’ n 個のプロトタイプの 1 つが座標値 x ’ に存在し、残り (n-1) 個が 太線の区間に存在しなければならない

誤り確率の計算例 [5]

誤り確率の計算例 [6] q(x,x ’ ) を求める の場合 0 1 1/2 x x’x’ 2x-1 x x’x’ 2x-x ’ x x’x’ n 個のプロトタイプの 1 つが座標値 x ’ に存在し、残り (n-1) 個が 太線の区間に存在しなければならない

誤り確率の計算例 [7]

誤り確率の計算例 [8] 各範囲での の時

 NN 法の誤識別率 誤り確率の計算例 [9]  ベイズ誤識別率 n=1 のとき n→∞ のとき

coffee break NN 法の誤り確率はベイズ誤り確率の 2 倍を超える !! 推定値・・・推定に用いたパターンの偏りと分散を伴う NN 法における偏り → パターン数とは独立に特徴空間の次元、距離尺度、 パターンの分布に大きくかかわってきた 誤り確率に大きな偏りが付加されベイズ誤り確率の 2 倍をはるかに超えてしまう  パターン x と最近傍パターン x ’ の関係 特徴空間が 2 次元・・・ n→∞ で限りなく近づく 特徴空間が高次元・・・ x と x ’ の距離が 0 という仮定は正しくない ( 球面集中現象などによって ) NN 法を望ましい識別機として使用するためには、特徴空間の次元、 パターン数、距離尺度をうまく設定することが重要