第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

Slides:



Advertisements
Similar presentations
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Advertisements

放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
データ解析
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
Pattern Recognition and Machine Learning 1.5 決定理論
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
Bias2 - Variance - Noise 分解
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
論理式の表現を数学的に取り扱いやすくするために代数学の助けを借りる.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
Probabilistic Method 6-3,4
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
母集団と標本:基本概念 母集団パラメーターと標本統計量 標本比率の標本分布
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
第4日目第3時限の学習目標 検査の信頼性(続き)を学ぶ。 妥当性について学ぶ。 (1)構成概念妥当性とは? (2)内容妥当性とは?
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
教師なしデータ 学習データ  X1, X2, …, Xn   真の情報源 テストデータ  X  .
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
7.4 Two General Settings D3 杉原堅也.
第3章 統計的推定 (その1) 統計学 2006年度.
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
Basic Tools B4  八田 直樹.
訓練データとテストデータが 異なる分布に従う場合の学習
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
計測工学 -誤差、演習問題 計測工学(第6回) 2009年5月26日 Ⅱ限目.
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
Data Clustering: A Review
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
ベイズ・アプローチによる グラフィカル・テスト理論
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
ベイズ最適化 Bayesian Optimization BO
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
クロスバリデーションを用いた ベイズ基準によるHMM音声合成
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第5回 確率変数の共分散 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
回帰分析(Regression Analysis)
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
ベイズ音声合成における 事前分布とモデル構造の話者間共有
ポッツスピン型隠れ変数による画像領域分割
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
1.基本概念 2.母集団比率の区間推定 3.小標本の区間推定 4.標本の大きさの決定
わかりやすいパターン認識 第3章 誤差評価に基づく学習 3.3 誤差逆伝播法.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限 「わかりやすいパターン認識」 発表日:5月23日 担当:脇坂恭志郎 第5章 特徴の評価とベイズ誤り確率  5.5 ベイズ誤り確率の推定法    [1] 誤識別率の偏りと分散    [2] ベイズ誤り確率の上限および下限

[1] 誤識別率の偏りと分散① ベイズ誤り確率 ・特徴の評価基準として重要。 ・分布が一般に未知である為、直接推定は困難。  ・特徴の評価基準として重要。  ・分布が一般に未知である為、直接推定は困難。 定義式からではなく学習パターンに基づいて間接的に 推定する。そのために「偏り」と「分散」を用いる。

・誤識別率の偏りと分散② ・偏り(真値に対する平均推定量の偏り) ・分散(推定値間でのばらつき) ―定義: パターン集合をχ、χに依存する推定量をS(χ)、真値を  とおく。 ・偏り(真値に対する平均推定量の偏り)   ―定義:   ― Bias = 0 →不偏、不偏推定量   ―偏りが小さいほど推定量は真値に近い。 ・分散(推定値間でのばらつき)   ―定義:   ―分散が小さいほど推定量の信頼性が高い。

・誤識別率の偏りと分散③ 偏りと分散は、推定量の良さの尺度として用いられる。 また、偏りは学習パターン数が有限である事に起因し、 分散はテストパターン数が有限である事に起因している。

[2] ベイズ誤り確率の上限及び下限① 誤識別率は、一般に学習パターンとテストパターンの関数。 真の分布の集合をPとし、 ベイズ誤り確率は       と書き表す。 (εの第一引数は学習パターンの分布、第二引数はテストパターン) 一方、有限個の学習パターンで推定された分布を  とおくと、 という二つの不等式が成り立つ。 それぞれの分布が異なると、誤識別率が増加している事が分かる。

ベイズ誤り確率の上限及び下限② ・誤識別率はテストパターンに関して不偏なので、学習パターンと 独立なテストパターンに関する期待値は、真の分布Pでテストした 誤識別率と等しい。 学習パターンと独立なテストパターンの分布を   とおくと 前出の不等式から、ベイズ誤り確率の上限は、 と表せられる。

ベイズ誤り確率の上限及び下限③ 同様に、ベイズ誤り確率の下限は、 このとき、テストパターンに関する期待値は不偏なので、 右辺は       と等しくなる。 これまでの式から、 という関係式が成り立つ。

再代入法(resubstitution method) ・実際の応用では期待値計算は出来ないので、 誤識別率の下限値、上限値を近似的に求める。 →ベイズ誤り確率推定の下限値は学習パターンで識別部を設計 し、同じ学習パターンでテストして誤識別率を算出するという方法 で近似する。(この方法は学習パターンを識別機に再度入力する ことから、再代入法、R法と呼ばれる) →ベイズ誤り確率推定の上限値を             とすると、 要素数が一つとなるように分割するL法が用いられる。 ・このように、与えられた有限個のパターンを用いてR法とL法の 挟みうちによりベイズ誤り確率を間接的に推定できる… (しかし、むやみにパターン数、次元数を増やすと、推定は困難に)