静止背景における動物体の検出と追跡 陳 謙 2004年10月19日
問題の定義 関心のある物体を除いて移動物体は存在しない。 カメラの位置、方向は固定、焦点距離などの内部パラメータも固定 この場合、移動物体は存在しない場合、カメラが撮影していた画像は不変(静止)である この前提のもとで、画像の中の画素を ① 背景 ② 移動物体 の2種類に分類して、移動物体の抽出と追跡を行う。
処理の手順 背景のモデリング(背景画像の構築) 入力画像と背景画像との画素間の差を計算して、移動物体の画素を抽出する フィルタリング処理によりノイズを除去 隣接している画素をグルーピングする フレーム間における物体の追跡を行い、物体の軌跡を求める
入力画像(背景モデリング)
背景のモデル(背景画像)
抽出した移動物体
実画像の例 入力画像 抽出した移動物体の領域 背景画像
Segmentation Results Foreground extraction of first target at 20mph Foreground extraction of second target at 20mph
Results
背景のモデリング 画像内に移動物体が存在しない瞬間があれば、その瞬間の画像を背景画像とすることができる。 しかし、一般的に、移動物体の存在の判断が難しくて、しかも、背景像が変化することが多い。
背景が変化している 光源の位置が変化する(太陽!!) 外部照明条件が変化する。(雲、影、反射など) 内部照明条件が変化する(扉、窓の開閉、照明灯のOn/Off) 移動物体が絶えることはない。(交差点など) 背景物体の変動(木の揺れ、水面の波 カメラの露出の変化(自動露出など)
背景のモデリング 画像系列から静止画像を構築すること 背景画像の動的更新 拡張した背景モデリング 複数の画素値 画素値モデリング(分布、変動など)
動物体の対処 一般的に、静止環境に設定しているカメラから撮影された画像には、次の特徴がある: 画像全体の中に、移動物体が示す面積が少ない 移動物体が停止しないし、静止している時間はきわめて短い このことから、動画像の中の画素には、背景が写っている時間(回数、頻度、確率)が圧倒的に長い ことが言える
移動物体の存在する環境における背景の獲得 数秒間から数分間の動画像を撮影する 画像の各画素に対して、出現頻度(確率)について分析を行う 出現頻度が最も高い明るさ・色をその画素の背景の明るさ・色とする 具体的に、ヒストグラムに基く方法 と 確率モデリングに基く方法がある。
背景のモデリング4 (Gaussian分布による背景のモデリング) 画像の各画素に現れる画素値が 正規分布に従うと仮定する 各画素に対して、ひとつのGaussian分布を割当て、 入力画素値により、そのGaussian分布のパラメータ(平均・分散)を調整する 分散が基準値を超えた画素は、モデリング不能の画素とする(画素値が常に変動しているか、変動しない時間が短すぎる) Gaussian分布の平均値を背景の画素値とする。
Gaussian分布 式: 可視化: (2-Dimensional)
背景のモデリング5 (ヒストグラムによる背景モデリング) 各画素に現れる画素値のヒストグラムを構築する 出現頻度の最も高い画素値(あるいは上位N個の画素値の平均)をその画素の背景の画素値とする
色空間 RGB色空間を用いると、背景モデリングの処理は、影の影響に敏感に影響される 明るさ情報と色情報が分離している色空間を用いれば、陰の影響を軽減することが可能である たとえば、YUV色空間
色空間 背景画像と入力画像: 各成分(Y, U, V)の差分画像:
Track objects Objects are tracked from frame to frame using: Location Direction of motion Size Colour
Gaussian Mixture Model Stauffer & Grimson (2000) 各画素のにおけるK 個 gaussian分布を管理する 平均値 µ, 標準偏差 と 重み 入力画素はどれかのgaussian分布にマッチしていれば、背景と判別する
中間値モデル(Median Value Model) Cucchiara, Grana, Piccardi & Prati (2003) 各画素について、N フレーム前までの履歴を管理する 背景画素値は中間値である 入力画素の画素値と背景画素値との差が閾値以下であれば、背景と判別する |I(p), B(p)| < T
適応(Adaptation) GM と MV はともに照明の変動に適応する GM モデルの適応は遅いが、複数の背景値に対応できる しかし、適応の途中、誤検出が多く発生する 従って、画像中の多くの領域は、“動物体”として抽出されてしまう GM モデルの適応は遅いが、複数の背景値に対応できる
静止背景における移動物体の検出の応用 監視 セキュリティ(保安、警備)監視カメラ 交通状況の監視 人数の統計 など 形状計測 視体積交差法 人数の統計 など 形状計測 視体積交差法 ユーザインタフェース 目の検出、指の検出など