「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

Slides:

Advertisements

Similar presentations

1 小暮研究会２第１章ベイジアンアルゴリズム２値選択ベルヌーイ試行尤度原理同一性交換可能性尤度についてのまとめ環境情報学部３年渡邊洋一.

Advertisements

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

土木計画学第３回：１０月１９日調査データの統計処理と分析２担当：榊原弘之. 標本調査において，母集団の平均や分散などを直接知ることはできない．母集団の平均値（母平均）母集団の分散（母分散）母集団中のある値の比率（母比率） p Sample 標本平均標本分散（不偏分散）標本中の比率.

データ解析

第1回確率変数、確率分布確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

確率･統計Ⅰ 第12回統計学の基礎1 ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

補章時系列モデル入門ｰ計量経済学ｰ.

ウェーブレットによる信号処理と画像処理宮崎大輔 2004年11月24日（水） PBVセミナー.

Pattern Recognition and Machine Learning 1.5 決定理論

「Self-Organizing Map 自己組織化マップ」を説明するスライド

土木計画学第５回（１１月２日）調査データの統計処理と分析３担当：榊原　弘之.

統計解析第9回第9章正規分布、第11章理論分布.

奈良女子大集中講義バイオインフォマティクス (6) モチーフ発見・隠れマルコフモデル

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

大数の法則平均 m の母集団から n 個のデータ xi をサンプリングする n 個のデータの平均 <x>

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

ベイズ的ロジスティックモデルに関する研究

クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--

確率モデルによる画像処理技術入門 --- ベイズ統計と確率的画像処理 ---

第12章　連続潜在変数修士 1年村下昇平.

京都大学化学研究所バイオインフォマティクスセンター

最尤推定によるロジスティック回帰対数尤度関数の最大化.

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

ベイジアンネットワーク概説第3章　ベイジアンネットワークモデルの　　　　　数学的基礎 3.5 情報量基準を用いた構造学習岩崎唯史.

【小暮研究会２】「ベイズのアルゴリズム」：序章【１，２：計量経済分析と統計分析】【３：ベイズ定理】

補章時系列モデル入門ｰ計量経済学ｰ.

ガウス過程による回帰 Gaussian Process Regression GPR

ニューラルネットは、いつ、なぜ、どのようにして役立つか？

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

Statistical Physics and Singularity Theory

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

第9章　混合モデルとEM 修士２年北川直樹.

教師なしデータ学習データ　X1, X2, …, Xn 　真の情報源テストデータ　X 　.

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

モデルの逆解析明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

確率論の基礎「ロジスティクス工学」第3章鞭効果第4章確率的在庫モデル補助資料

第14章　モデルの結合修士２年山川佳洋.

顧客維持に関するモデル.

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

第５章特徴の評価とベイズ誤り確率５．５ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限

第7章　疎な解を持つカーネルマシン修士２年山川佳洋.

完全２部グラフ型ボルツマンマシンにおける平均場近似自由エネルギーの漸近的挙動

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

ボルツマンマシンの定義ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

ベイズ･アプローチによるグラフィカル･テスト理論

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

第3章　線形回帰モデル修士1年山田　孝太郎.

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

経営学研究科 M1年学籍番号 speedster

クロスバリデーションを用いたベイズ基準によるHMM音声合成

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

第5回確率変数の共分散確率･統計Ⅰ ここです！確率変数と確率分布確率変数の同時分布、独立性確率変数の平均確率変数の分散

回帰分析（Regression Analysis)

データ解析静岡大学工学部安藤和敏

HMM音声合成における変分ベイズ法に基づく線形回帰

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで渡辺一帆（東大・新領域）

人工知能特論II　第8回二宮　崇.

ベイズ音声合成における事前分布とモデル構造の話者間共有

データ解析静岡大学工学部安藤和敏

JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」

ベイジアンネットワーク概説第3章ベイジアンネットワークモデルの数学的基礎 3.１ベイジアンネットワークモデルの概要

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

阿久津達也京都大学化学研究所バイオインフォマティクスセンター

Q状態イジング模型を用いた多値画像修復における周辺尤度最大化によるハイパパラメータ推定

混合ガウスモデル Gaussian Mixture Model GMM

Presentation transcript:

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習報告者佐々木　稔 2003年5月21日第2章学習と統計的推測　2.1 データと学習　 2.1.1 学習とは　 2.1.2 同時確率密度関数の学習　 2.1.3 学習法の意味　 2.1.4 学習の尺度

学習とは入力出力組(X, Y) が同時密度関数 q(x, y) をもつ確率変数独立な n 回の試行での n 組の実現値（データ、学習データ、サンプル）

学習データ X, Y に関する情報の獲得獲得した情報からの予測推定対象真の密度関数 q(x, y) 条件付き密度関数 q(y | x) 回帰関数 y = E(Y | x) ☆目的によって推定対象も変化

例27 学習を利用した応用例画像や音声の認識を行うシステム時系列予測システム信号の圧縮・復元を行うシステム人間の言語獲得広い意味で学習生物の進化

同時確率密度関数の学習 p(x, y | w) : 同時確率密度関数 w : パラメータ（母数）データを発生している確率変数の（真の）密度関数 q(x, y) を推定 p(x, y | w) : 学習モデルの密度関数 p(x, y | w0) = q(x, y) となるパラメータ w0 が存在「学習モデルは真の密度関数を含む」

ここでは、両者は同じものとして p(x, y | w) 確率変数条件付き確率 p(x, y | w) 確率変数ではない p(x, y : w) または、 pw(x, y) ここでは、両者は同じものとして p(x, y | w)

実問題では… 密度関数は複雑なことが多く、学習モデルに含まれる保証はないアルゴリズムの考案時やその特徴解析時モデルが真の密度関数を含むと仮定真の密度関数を含む場合のモデルを明らかにし、一般的な場合を考察学習データは有限個ある程度の解像度までの密度関数しか分からない

学習データ q(x, y) 情報源 p(x, y | w) 学習モデル p(x, y | w0) 学習結果似てる？

最尤推定法損失関数損失関数を最小にする（最尤推定量）を q(x, y) の推定密度関数とする

事後確率最大化法 p(w) : パラメータ w に関する密度関数損失関数損失関数を最小にするを q(x, y) の推定密度関数とする（事後確率最大化推定量）を q(x, y) の推定密度関数とする

ベイズ法 p(w) : パラメータ w に関する密度関数損失関数 Ln(w) をエネルギー関数とするギブス分布 Zn : ρn(w) がパラメータ集合 Rd 上の確率密度関数となる正規化定数 β : 逆温度と呼ばれる正の定数

pn(x,y) を q(x, y) の推定密度関数とするギブス分布の平均で作られる密度関数 pn(x,y) を q(x, y) の推定密度関数とする固定したパラメータ w 定めないパラメータ w も確率変数として扱うパラメータ w の密度関数 p(w) （事前分布）が必要学習の目的により設定（モデル選択、予測精度最大化）

{xi; i = 1, 2, ･･･, n} 例２８ R1 上の確率変数から独立な学習データモデル（平均 a、分散 1 の正規分布） 3つの推定方法がどのくらい異なる結果となるか比較

最尤推定法パラメータと関係のない項を省略して、 a に関して下に凸の2次関数なのでこれより、最尤推定量は

a の事前密度関数 p(a) 事後確率最大化法より事後確率最大化推定量

ベイズ法の場合 a に関係しない項をまとめて

モデルの尤度を最大化するパラメータを選択学習法の意味最尤推定法データ (xn, yn) がモデル p(x, y | w) から得られる確率密度（モデルの尤度）モデルの尤度を最大化するパラメータを選択

事後確率最大化法 X, Y, W : 確率変数同時確率密度関数推定するモデルの密度関数このモデルが真の密度関数であれば、 q(x, y) = p(x, y)

(xn, yn) が得られた条件の下での W の密度関数 P(w) : 事前確率密度関数 P(w | xn, yn) : 事後確率密度関数 P(w | xn, yn) を最大にする w を求める

ベイズ法仮定は事後確率最大化法と同じ β= 1 のとき、 (xn, yn) が得られた条件下 (X, Y) の密度関数 P(x, y | xn, yn) が求める確率密度関数

学習の尺度これらの方法でなぜ学習が可能になるのかカルバックの擬距離による最適化最尤推定、事後確率最大化の場合データ数 n が十分大きいとき、

損失関数の最小化 ≒ K(q || pw) の最小化ベイズ法の場合データ数 n が十分大きいとき、最尤推定と同様に、 p(x, y | w) が q(x, y) に近くなる w の近くに集中する密度関数となる