第13章　系列データ修士 1年村下昇平.

Slides:

Advertisements

Similar presentations

PRML読書会第11回 8.4 グラフィカルモデルによる推論 SUHARA YOSHIHIKO (id:sleepy_yoshi)

Advertisements

1 小暮研究会２第１章ベイジアンアルゴリズム２値選択ベルヌーイ試行尤度原理同一性交換可能性尤度についてのまとめ環境情報学部３年渡邊洋一.

『わかりやすいパターン認識』第 5 章特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則発表日： 5 月 23 日（金）発表者：時田陽一.

2016 年度計量経済学講義内容担当者：河田正樹

潜在クラス分析入門山口和範. 内容条件付独立シンプソンのパラドックス対数線形モデルにおける表現局所独立潜在変数モデル Lem 入門.

０章　数学基礎.

コンピュータビジョン特論第８回対象追跡２００６年１１月２２日加藤丈和.

補章時系列モデル入門ｰ計量経済学ｰ.

Pattern Recognition and Machine Learning 1.5 決定理論

統計解析第9回第9章正規分布、第11章理論分布.

Bassモデルにおける最尤法を用いたパラメータ推定

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

時空間データからのオブジェクトベース知識発見

上坂吉則尾関和彦文一総合出版宮崎大輔2003年6月28日（土）

放射線の計算や測定における統計誤差「平均の誤差」とその応用（1H) 2項分布、ポアソン分布、ガウス分布（1H）最小二乗法（1H）

「データ学習アルゴリズム」第2章学習と統計的推測報告者佐々木稔 2003年5月21日 2.1 データと学習

確率･統計輪講資料 6-5　適合度と独立性の検定 6-6　最小2乗法と相関係数の推定・検定 M1　西澤.

第12章　連続潜在変数修士 1年村下昇平.

HMM:隠れマルコフモデル電子情報工学科伊庭斉志奈良女子大集中講義バイオインフォマティクス (6)

京都大学化学研究所バイオインフォマティクスセンター

最尤推定によるロジスティック回帰対数尤度関数の最大化.

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

10．通信路符号化手法2 （誤り検出と誤り訂正符号）

(ラプラス変換の復習) 教科書には相当する章はない

【小暮研究会２】「ベイズのアルゴリズム」：序章【１，２：計量経済分析と統計分析】【３：ベイズ定理】

補章時系列モデル入門ｰ計量経済学ｰ.

ガウス過程による回帰 Gaussian Process Regression GPR

第6章　カーネル法修士2年藤井　敬士.

第６章連立方程式モデルｰ計量経済学ｰ.

7. 音声の認識：高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.

奈良女子大集中講義バイオインフォマティクス (9) 相互作用推定

確率･統計Ⅰ 第3回確率変数の独立性／確率変数の平均ここです！確率論とは確率変数、確率分布確率変数の独立性／確率変数の平均

第9章　混合モデルとEM 修士２年北川直樹.

混合ガウスモデルによる回帰分析および逆解析 Gaussian Mixture Regression GMR

人工知能特論９．パーセプトロン北陸先端科学技術大学院大学　鶴岡慶雅.

7.4 Two General Settings D3 杉原堅也.

第14章　モデルの結合修士２年山川佳洋.

独立成分分析５　アルゴリズムの安定性と効率２００７/１０/２４　　　名雪　勲.

6. ラプラス変換.

第7章　疎な解を持つカーネルマシン修士２年山川佳洋.

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

パターン認識と機械学習第2章：確率分布（後半）

主成分分析 Principal Component Analysis PCA

東北大学大学院情報科学研究科応用情報科学専攻田中和之(Kazuyuki Tanaka)

ボルツマンマシンの定義ボルツマンマシン(Boltzmann machine)は、スピン・システムをヒントに作られたモデルである。

分子生物情報学(3) 確率モデル（隠れマルコフモデル）に基づく配列解析

様々な情報源（４章）.

部分的最小二乗回帰 Partial Least Squares Regression PLS

ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部佐々木稔

4.　システムの安定性.

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年6月25日 3.1 関数近似モデル

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

第3章　線形回帰モデル修士1年山田　孝太郎.

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

経営学研究科 M1年学籍番号 speedster

サポートベクターマシン Support Vector Machine SVM

クロスバリデーションを用いたベイズ基準によるHMM音声合成

最尤推定・最尤法明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

HMM音声合成における変分ベイズ法に基づく線形回帰

ベイズ基準による隠れセミマルコフモデルに基づく音声合成

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

パターン認識ークラスタリングとEMアルゴリズムー担当：和田俊和部屋 A513

人工知能特論II　第8回二宮　崇.

JNNS-DEX-SMI-玉川公開講座「交換モンテカルロ法とその応用」

プログラミング言語論第１０回情報工学科　篠埜　功.

パターン認識特論ｶｰﾈﾙ主成分分析和田俊和.

わかりやすいパターン認識第６章特徴空間の変換６．５ KL展開の適用法〔１〕 KL展開と線形判別法〔２〕 KL展開と学習パターン数

「データ学習アルゴリズム」第3章複雑な学習モデル報告者佐々木稔 2003年8月1日 3.2 競合学習

混合ガウスモデル Gaussian Mixture Model GMM

Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神諭

Presentation transcript:

第13章　系列データ修士 1年村下昇平

* もくじ「系列データ」とは？マルコフモデル隠れマルコフモデル(HMM) 連続潜在変数モデル EMアルゴリズムによる最尤推定フォワード-バックワードアルゴリズム Viterbiアルゴリズム HMMの応用連続潜在変数モデル線形ガウスモデル粒子フィルタ

0. 系列データ：「系列データ」とは？これまでは独立同時分布に従うと仮定するデータ点の集合について考えてきたが… 本章では系列データを取り扱う。金融予測、音声認識などに用いる時系列データ文章における文字の系列 …など、連続した観測値の間に相関が見られるデータのこと。こうした系列データ（=過去の観測値）を用いて次の値を予測することがこの章の目的！

0. 系列データ：用いられるモデルある時点での値を予測するときに、それまでの全てのデータを考慮に入れることは現実的でない。過去のデータのなかでも、直近の観測に最も強く依存していると考えるのが自然。 …というわけで、この章で扱うマルコフモデルでは、未来の予測値が直近の観測値のみに依存し、それ以外の過去の観測値に対しては独立であるという仮定のもとに立っている。さらにこれを発展させたものとして、状態空間モデルである隠れマルコフモデルおよび線形動的システムについて考察する。これによってより複雑なモデルを構成することができる。以上のモデルはいずれもグラフィカルモデルの枠組みを用いて特徴付けられ、積和アルゴリズムを用いて推論が行われる。

1. マルコフモデル：一次マルコフ連鎖最も簡単なマルコフモデルのとして、最も近い観測値のみに依存し、それ以外の過去の観測値から独立であると仮定したモデルが、以下の一次マルコフ連鎖である。このような一次マルコフ連鎖においては遊向分離の性質から、時刻 n までの全ての観測値 xn の条件付き確率はとシンプルに表すことができる。こうしたマルコフ連鎖の応用では、ほとんどの場合 p(xn|xn-1) がみな同一であるという制約を課すが、そういったモデルは均一マルコフ連鎖として知られる。

1. マルコフモデル：高次マルコフ連鎖さらに一般性を求めるならば、次の値を予測するときに、いくつかの連続した観測データに見られる傾向を考慮したくなる…ここで出てくるのが高次マルコフ連鎖。たとえば直前のさらに一つ前の値にも依存する、すなわちである場合、これを二次マルコフ連鎖と呼ぶ。先ほどと同様有向分離を用いると結局、xn はx1 からxn-3 のすべての観測データから独立であることがわかる。ただし、次数を上げると計算量が指数的に増大してしまう。

1. マルコフモデル：状態空間モデルこれまで出てきたようなマルコフモデルに対して、マルコフ連鎖を構成するような潜在変数を導入することで、比較的単純でより表現力の高いモデルを作ることができる。これが状態空間モデルであり、このモデルの同時分布は以下で与えられる。ここでxn は観測値であり、zn はそれに対応する潜在変数である。このとき、zn を与えたとき、zn-1 とzn+1 が独立であるという重要な条件付き独立性を満たす。状態空間モデルでは、潜在変数を介して2つの観測変数xnとxmをつなぐ経路は常に存在し、この経路は決して遮断されない（有向分離によって示される）。したがって、過去のすべての観測値を与えたときの、観測xn+1の予測はすべての過去の観測値に依存する。しかしながら、観測変数はどの次数のマルコフ性も満たさない。つまり、表現力が高いモデルなのだ！

2. 隠れマルコフモデル先の状態空間モデルのうち、潜在変数が離散変数であるとき隠れマルコフモデル(HMM)を得る。（ここで、観測変数は離散でも連続でもよい） HMMは以下のように広く用いられている。音声認識自然言語モデルオンライン手書き文字認識タンパク質やDNAなどの生物学的配列の解析 …などなど

2. HMM：遷移確率行列状態空間モデルであるので、潜在変数zn の確率分布は、条件付き分布p(zn|zn-1)を通して直前の状態に依存する。この潜在変数はK次元の二値変数なので、この条件付き分布は遷移確率を要素にもつ数表Aに対応する。ここで遷移確率 Ajk≡p(znk=1 | zn-1,j=1) すなわちAのjk要素は、zn-1での状態がj であったときにznでの状態がkになる確率となる。とうぜん、確率であるため0≦Ajk≦1とΣkAjk=1 を満たす。 (例)今日の天気から明日の天気を予測明日晴雨曇今日 p[f|f]=3/4 p[r|f]=1/4 p[c|f]=0 p[f|r]=1/4 p[r|r]=1/2 p[c|r]=1/4 p[f|c]=1/4 p[r|c]=1/2 p[c|c]=1/4

2. HMM：一対K符号化法による条件付き分布の表現従って、例えば zn-1=(1,0,0) (昨日が晴)、zn=(0,1,0) (今日が雨)である確率はとなり、結局求めたい A12 =1/4だけが残る。（指数の両方とも1であるものだけ！）

2. HMM：状態遷移図と格子図遷移行列は状態遷移図、あるいは格子図（遷移行列を時間的に展開したもの。トレリス図とも呼ばれる）によって図示することができる。

2. HMM：出力確率観測変数の条件付き確率分布 p(xn|zn,φ) を出力確率と呼ぶ。ここでφはこの確率分布を支配するパラメータである。（以下の例での1/5やら2/3やらのこと！） xn は観測されるので、φの値が与えられたとき、分布 p(xn|zn,φ) は二値のベクトル zn のK個の可能な状態に対応した、K個の要素をもつベクトルからなる。 (例)その日の行動から天気を予測「観測される」ということは、観測変数がいずれかに固定されるということなので、例えば「散歩」が観測された場合、p(x=散歩)=(2/5, 0, 1/5) と、確かに3つの要素をもつベクトルになっている。観測変数買い物散歩掃除潜在変数 zn=晴 p(x=s|z=f)=2/5 p(x=w|z=f)=2/5 p(x=c|z=f)=1/5 zn=雨 p(x=s|z=r)=1/3 p(x=w|z=r)=0 p(x=c|z=r)=2/3 zn=曇 p(x=s|z=c)=2/5 p(x=w|z=c)=1/5 p(x=c|z=c)=2/5

2. HMM：一対K符号化法による出力分布の表現先ほどの潜在変数についての条件付き分布の時と同様に、出力確率は以下の形でかける。従って先ほどの例、すなわち zn=(0,1,0)（雨）, xn=(0,1,0)（散歩）の場合はとなり、結局求めたいp=0だけが残る。 …1対K符号化法は便利だね！

2. HMM：潜在/観測変数の同時確率分布これらの式より、HMMにおける潜在変数と観測変数の同時確率分布は以下のようにかける。ここで、Xは各時点における観測変数の、Zは各時点における潜在変数の集合であり、θは「最初の遷移確率（親ノードを持たないためAと区別される）π」、「状態遷移行列A」、「出力確率のパラメータφ」といったパラメータ集合である。

2. HMM：left-to-right HMM 遷移行列 A の k<j となるAjk 成分をゼロ、すなわちとすることで、left-to-right HMM の遷移行列を得る。これは「次（あるいはそれ以降）の状態には遷移しうる」が「以前の状態には戻らない」ようなマルコフ連鎖を生成する。状態遷移図および格子図は以下のように描ける。（特に、格子図のほうは留まるか直近の次の状態に移るかの二択しかないものを表す）このようなHMMは音声認識やオンライン文字認識など多くの分野で応用されている重要なモデルである。

2.1. HMMの最尤推定というわけで、HMMについて最尤推定によってパラメータθ={π, A, φ}を決定したい。この尤度関数の最大化には様々な困難がつきまとう（詳細は下巻p.133を参照）。以下ではこれを効率的に扱う手法としてEMアルゴリズムを考えることにする。

2.1 HMMの最尤推定：EMアルゴリズム EMアルゴリズムでは以下のステップで尤度関数を最大化する。第9章でやったのと基本的には同じだと考えてよい。 0. 最初にモデルパラメータをある初期集合に設定する。（これをθold とする） 1. Eステップまず潜在変数p(Z|X, θold)の事後分布をを求め、この事後分布を用いて、パラメータ集合 θ の関数としての、完全データに対する尤度関数の対数の期待値（次式）を求める。ここで潜在変数 zn の周辺事後分布をγ、2つの連続した潜在変数に対する同時事後分布をξとする、すなわち以下のように定めると… どちらも確率であるから総和は1となり、また潜在変数の有り得る状態の個数はKであるから、γはK個の要素を持つベクトル、ξはK×K行列となる。

2.1 HMMの最尤推定：EMアルゴリズムこれらは結局 γ(zn)のk番目の要素znkはznの状態がk（すなわちznk=1）となる条件付き確率 ξ(zn-1,zn)のjk要素ξ(zn-1,j, znk)は、zn-1がj（すなわちzn-1,j=1）であたっときにznがk（すなわちznk=1）となる確率であるといえる。二値の確率変数であるzn の期待値を考えると、単にそれが値1をもつ確率がそのまま出てくるため、以下の式が得られる。 zn が1対K符号化されているんだから、確かにそうなるよな…

2.1 HMMの最尤推定：EMアルゴリズムちょっと前に出てきた隠れマルコフモデルにおけるXとZの同時分布（上左式）をQ（上右式）に代入し、先ほどのγ, ξを代入することで次式を得る。以上でEステップが終了する。

2.1 HMMの最尤推定：EMアルゴリズム 2. Mステップ次のMステップでは先ほど求めたγ(zn)とξ(zn)を定数とみなし、パラメータθ={π, A, φ}に関してQ(θ, θold)を最大化する。ここで、遷移確率についてのパラメータであるπとAに関する最大化は適当なラグランジュ乗数を用いることにより簡単に求められ、以下のようになる。

2.1 HMMの最尤推定：EMアルゴリズム出力分布についてのパラメータφを求める場合、例えば、出力分布がガウス密度分布のときには、p(x|φ)=N(x|μk, Σk)となり、Q(θ,θold)の最大化により以下を得る。

2.2. フォワード-バックワードアルゴリズム以下ではフォワード-バックワードアルゴリズムと呼ばれる、EMアルゴリズムのEステップにあたる上式を効率的に求める方法について議論する。まず、有向分離を用いれば以下の条件付き独立が証明できる。

2.2. フォワード-バックワードアルゴリズム以下の変形では次の2つを頭にたたき込んでおきましょう。 1. 確率の乗法定理 P{A,B} = P{A} × P{B|A} = P{B} × P{A|B} 特にAとBがCについて条件付き独立であるとき P{A,B|C} = P{A|C} × P{B|C} 2. 同時確率のある変数についての総和をとると周辺確率となる。たとえば p(zn)=Σzn-1p{zn-1, zn} とか。

2.2. フォワード-バックワードアルゴリズムまずベイズの定理より次式を得る。これを先ほどの式を用いて変形すると、p(X|zn)=p(x1...xn|zn)p(xn+1...xN|zn)の前半部分とp(zn)の積は確率の乗法定理よりp(x1...xn, zn)という同時確率となり… を得る。ただしここでと定義した。αは時刻nまでの過去全ての観測データとznの同時確率、βはznが与えられたときの時刻n+1からNまでの全ての未来のデータの条件付き確率となっている。

2.2. フォワード-バックワードアルゴリズム：フォワードα再帰 αについて考える。目標はαをnに関する再帰式として計算量をNについて線形にすることであるまず確率の乗法定理を用いて出力分布 p(xn|zn) をくくり出したい。以下のように変形すると… {x1...xn-1}と xn とは zn について条件付き独立である(13.25)から、以下のようにくくり出せる。ここで、{x1...xn, zn}について周辺化されたzn-1を明示的に総和の形で表してやることで次式を得る。

2.2. フォワード-バックワードアルゴリズム：フォワードα再帰さらに確率の乗法定理を用いて遷移確率をくくり出す。ここで {x1...xn}と zn とが zn-1 について条件付き独立(13.26)であることに注意すると、以下のように変形できて… p(x1...xn-1,zn-1) がα(zn-1)であることから結局αは以下の再帰式で表される。

2.2. フォワード-バックワードアルゴリズム：フォワードα再帰式変形はまあ、置いといて…この再帰式は以下の格子図のように解釈できる。 (n-1)ステップでのα(zn-1)の要素α(zn-1,j)について、p(zn|zn-1)の値に相当するAj1で与えられる重みを用いて、重み付け和をとり、さらにそれにデータの寄与p(xn|zn+1)をかけることで、α(zn,1)を得る。この回帰式に対して以下の初期条件を与え、順次計算していくことによってすべての潜在ノードのαを求めることができる。

2.2. フォワード-バックワードアルゴリズム：バックワードβ再帰つぎにβについて考える。ここで、先ほどと同様に周辺化されたzn+1を明示的に総和の形で表してやると、さらに確率の乗法定理より以下のように遷移確率をくくり出せる（両方ともにznが条件として入っていることに注意！） {xn+1...xN}とznとがzn+1について条件付き独立(13.27)であることより

2.2. フォワード-バックワードアルゴリズム：バックワードβ再帰さらに{xn+2...xN}と xn+1 とが zn+1 について条件付き独立(13.28)であることより出力確率をくくり出すことができる p(xn+2...xN|zn+1) がβ(zn+1)であることから結局βも以下の再帰式で表される。

2.2. フォワード-バックワードアルゴリズム：バックワードβ再帰この再帰式は以下の格子図で表すことができ、β(zn+1)を用いてβ(zn)を求める後ろ向きのアルゴリズムとなっている。各ステップでxn+1の観測の影響を出力確率p(xn+1|zn+1)で吸収し、遷移行列p(zn+1|zn)を掛け、そしてzn+1について周辺化している。 (n+1)ステップのβ(zn+1)の要素β(zn+1,k)についての重み付け和をとることで、β(zn,1)を得る。ここで、各β(zn+1,k)に対応する重みは、p(zn+1|zn)の値に対応する出力密度p(xn|zn+1,k)の値を乗じたものである。また、βに関する初期条件は次式で与えられる。これでγが求まる。

2.2. フォワード-バックワードアルゴリズム： ξ(zn-1, zn) の求め方ちなみにξについても、これまでのα再帰とβ再帰で得られた結果をそのまま用いることができる。まずベイズの定理によって次のように変形する。 (13.29)を用いると次式を得る。ここに現れたαおよびβの定義式の部分を置き換えると結局ξは次式で表される。以上のようにしてα再帰およびβ再帰の結果を用いて直接ξを求めることができ、Eステップが終了する。

2.2. フォワード-バックワードアルゴリズム： Mステップ

2.2. HMMの最尤推定まとめまずパラメータの初期値θoldの値を定める。 Eステップ Mステップここでθ={π, A, φ}である。フォワードα再帰およびバックワードβ再帰を行い、その結果を用いてγ,ξを求める。この段階ではγおよびξが得られるため、尤度関数Qも求めることができる。 Mステップすでに説明したとおり、γとξを代入するだけでθが求まる。 ※ちなみに、先ほど条件つき独立から求められたα-β再帰式は、積和アルゴリズムによってもっと簡単に求められるらしい。詳細は13.2.3を参照。実際のフォワード・バックワードアルゴリズムの利用の際には、適切なスケーリング係数を適用する必要がある（αやβはむちゃくちゃ小さな値となるから）。詳細は13.2.4を参照。

2.5 Viterbiアルゴリズム隠れマルコフモデルにおける潜在変数は通常何らかの意味をもっているはず。 …ってことは、その隠れ状態の最も確からしい系列を求めたくなりますよね。というかむしろそのためにやってたりすることも多い。ただし「個々の潜在変数に対して最も確からしい状態(=γが最大)の集合を求める」ことと「潜在状態の最も確からしい系列を求める」こととはぜんぜんちがう。 …そこで出てくるのがViterbiアルゴリズム。

2.5 Viterbiアルゴリズム Viterbiアルゴリズムは… 単純にやってしまうとNの大きさに従ってあり得る経路の数は指数的に増加してしまう。 …が、Viterbiアルゴリズムを使うと、Nに対してたかだか線形に増加する計算量で最も確からしい系列を見つけることができる！イメージとしてはダイクストラ法に近いっぽい。 max-sumアルゴリズムとして定式化されてるが、積和アルゴリズムの知識が必要そうなので省略。

2.6. HMMの拡張自己回帰隠れマルコフモデルたくさんの時刻ステップだけ離れている観測変数間の相関をとりたいときに利用。出力確率について、潜在変数だけでなく以前の観測変数（の部分集合）も条件として付け加える。

2.6. HMMの拡張 input-output隠れマルコフモデルこれまでの出力変数に加えて、潜在変数や出力変数に影響を与えるような新たな観測変数を考えるモデル。

2.6. HMMの拡張階乗隠れマルコフモデルお互いに独立な、複数の潜在変数のマルコフ連鎖があり、与えられた時刻のステップの観測変数の分布が同じ時刻ステップにおけるすべての潜在変数の状態に依存するようなモデル。潜在状態をかなり少なく抑えることができるが、学習が複雑になるという欠点も持つ。

3. 線形動的システム線形動的システムとは？直感的な説明。状態空間モデルのうち、潜在変数と観測変数の両方が連続変数、特にガウス分布に従う、というモデル。12章の連続潜在変数モデルの一般化と見ることができる。隠れマルコフモデルとの重要なちがいは、潜在変数が離散か連続（ガウス分布）か、ということ。直感的な説明。時間軸上で変化している未知の量 {z1...zN} の値（位置とか）を、平均がゼロのガウスノイズを載せた観測値 {x1...xN} で返すセンサ（GPSとか）で計測したいとき、znの値の推定のために、いちばん最近の数回の観測値を平均するとよいように思える…！もしセンサのノイズレベルが高い場合には、平均をとるときに比較的長い観測窓幅をとったほうがよいだろうし、ノイズレベルが低い場合には観測値を比較的そのまま使うほうがよいだろうし…というあたりを定式化したモデル。

3. 線形動的システム遷移確率分布と出力確率分布はどちらもガウス分布であり、以下の一般的な形に書くことができる。このモデルパラメータ推定に対してはEMアルゴリズムを使うのが一般的である。このEステップについては、線形動的システムにおけるフォワード-バックワード再帰のような効率的な推論アルゴリズムが積和アルゴリズムより導かれ、以下のように呼ばれる。フォワード再帰についてはカルマンフィルタ方程式バックワード再帰についてはカルマンスムーザ方程式あるいはRauch-Tung-Striebel (RTS) 方程式くわしいメッセージの形については省略。

3.4. 粒子フィルタもちろん線形ガウスでない動的システムも考えられる。これは、以下のような状況下で効果を発揮する。時系列に急激な構造変化が見られるとき異常値が存在するとき分布に非対称性や非正規性があるとき非線形システムこのような非線形・非ガウスの状態空間モデルに対する扱いやすい推論アルゴリズムとしてサンプリング手法による定式化を用いたものが粒子フィルタ（ブートストラップフィルタ、モンテカルロフィルタ等とも呼ばれる）。