「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. ….. 3.1.3 ３層パーセプトロン
第３章複雑な学習モデル 3.1 関数近似モデル … ３層パーセプトロン ….. 6月25日（水）発表者新納浩幸

３層パーセプトロンとは関数近似モデルの代表例任意の関数を近似できるから中間層の各ユニットの入出力をつくり、そこから
をつくる。結局、関数を作っている。任意の関数を近似できる

ユニットの入出力第 j 番目の中間ユニットの入出力第 i 番目の出力ユニットの入出力 σはシグモイド関数バイアス求めるべきパラメータ
H は中間層のユニット数 σはシグモイド関数バイアス求めるべきパラメータ

バイアスの削除求めるべきパラメータ常に１を出力する中間ユニットを考えると、そこから出力ユニット i への重みが、となる
の重みが、となる常に１を出力する入力ユニットを考えると、そこから中間ユニット j への重みが、となる求めるべきパラメータ

誤差逆伝播法（１）パーセプトロンのパラメータを求めるアルゴリズム最急降下法を利用 (参照 pp.41)
この部分を求めることができるかどうかかポイント

誤差逆伝播法（２）シグモイド関数には以下の性質がある！出力 i の差分：中間ユニット j ：を定義するとが求まる
合成関数の部分を繰り返せば簡単に導けるを定義するとが求まる

誤差逆伝播法（３）中間ユニット j から出力ユニット i への重みの誤差が、中間ユニット j の出力に
入力ユニット k から中間ユニット j への重みの誤差が、入力ユニット k の出力に中間ユニット k の誤差をかけた形出力層の誤差が中間層、入力層に伝播してゆく

注20 （学習誤差と予測誤差）パーセプトロンの実際の学習過学習適当に学習を止めないとだめ

例39 （誤差の変化と学習の変化）英語の文章をモールス信号に変換する仕事を学習１文字単位の変換の学習から単語単位の変換の学習へ
誤差が変化しない状態からある時期に変化が生じる学習の質の変化

例40（雑音の効用）画像や音声の識別は特徴量が高次元普遍性のある学習は困難入力に雑音を加えて学習データを増やすことで
振る舞いがかなり改善されることがある

例41 (学習対象の特性の学習) 学習対象の特性までを含めて学習させることは不可能ではないが、効率的ではない。
特性がわかっている対象については、データをそれに応じて変換しておくか、モデルをその変化に依存しないように作成していた方がよい。

モデル選択の問題階層型の学習モデルでは、正則モデルの情報量規準を、原理的に、適用できない。
無理に情報量規準を用いると、何もしないよりも予測誤差は小さくなるが、導入せずに適度な反復回数で停止する場合に比べて予測誤差が小さくなるとは限らない。モデル選択を行っても、学習回数を増やすと予測誤差は悪化する。モデル選択を行うと小さなモデルが構成でき、データからの法則発見には役立つこともある。

荷重減衰と事前確率密度関数荷重減衰法（忘却つき学習法）事前確率密度関数を設定することに相当する？損失関数として以下を利用する方法
小さなパラメータ、突出して大きなものが少なくなる突出して大きなものと0 になるものとに分かれる情報量規準によるモデル選択と同じ効果が得られる

荷重減衰についてのメモ適度な反復で学習を停止する場合と比較して、必ずしも予測誤差は減少しない。
荷重減衰を行う場合でも、学習を適当に停止した方がよい。小さなモデルが得られることもあり、法則発見には役立つこともある。学習を繰り返し行ってもパラメータの崩壊は起こりにくい。 λの定め方は4章。

アンサンブル学習とベイズ推定アンサンブル学習ただしベイズ法を一般化したもの３層パーセプトロンにアンサンブル学習を用いると
複数得られたパラメータの重み付き平均により関数を作る方法ただしベイズ法を一般化したもの３層パーセプトロンにアンサンブル学習を用いると予測誤差を小さくできる。原因は不明。また、当然、データ中の法則発見はさらに困難になる。

応用工夫が必要な点特徴量を何にするか入力データ固有の変形を吸収できるようなモデルの設計応用例例42：文字認識例43：音声認識
複雑なモデルを使うと、学習対象の性質をそれほど検討しなくてもまずまずの認識精度が得られる。これは学習したい対象に対する知識を持っていてもモデルの設計に盛り込むことが困難であることも意味する。工夫が必要な点特徴量を何にするか入力データ固有の変形を吸収できるようなモデルの設計応用例例42：文字認識例43：音声認識例44：パーセプトロンについては非常に多くの応用例がある

注21（隠れマルコフモデル）時系列を学習するモデル N個の状態状態 i から状態ｊへ移る確率
する確率が観測値を学習 EMアルゴリズムが有効音声認識、形態素解析などに効果的なモデル

砂時計型モデル＊5層（以上）になっている。＊中間層のユニット数が少ない。＊中間層のユニットはデータが本質的に持っている自由度に対応。
主成分分析に相当非線形主成分分析と呼ばれる

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

Similar presentations

Presentation on theme: "「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

「データ学習アルゴリズム」 第３章 複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

Similar presentations

Presentation on theme: "「データ学習アルゴリズム」 第３章 複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン"— Presentation transcript:

Similar presentations

About project

フィードバック

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

Presentation on theme: "「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン"— Presentation transcript: