Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定

Slides:



Advertisements
Similar presentations
静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
Advertisements

自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
ユーザーイメージ収集 インターフェイスの開発
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パノラマ動画像モデルによる 仮想空間表現システムの研究
CGアニメーションの原理 基本技術 対象物体の動きや変形の設定方法 レンダリング技術
コンピュータビジョン特論 第7回対象追跡 2006年11月15日 加藤丈和.
雑音重み推定と音声 GMMを用いた雑音除去
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
OpenCV を使った画像処理コンポーネントの作成例 田窪 朋仁(大阪大学)
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
顔部品の検出システムの構築 指導教員 廉田浩 教授 1DS04188W  田中 甲太郎.
相関分析.
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
Hough変換 投票と多数決原理に基づく図形の検出
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
東京農業大学 東京情報大学 附属第一高等学校・中等部 附属第二高等学校 附属第三高等学校・中等部
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
複数特徴量の重み付け統合による一般物体認識
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
1-Q-9 SVMとCARTの組み合わせによる AdaBoostを用いた音声区間検出
部分的最小二乗回帰 Partial Least Squares Regression PLS
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
Number of random matrices
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
HMM音声合成における 変分ベイズ法に基づく線形回帰
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
ベイズ音声合成における 事前分布とモデル構造の話者間共有
時間連続性を考慮した 動画からの人物の姿勢推定
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
ロボットから人に話しかける 判断モデルの構築
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
CSP係数の識別に基づく話者の 頭部方向の推定
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
ランダムプロジェクションを用いた音響モデルの線形変換
Presentation transcript:

Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定 神戸大学 大西克則,滝口哲也,有木康雄

研究背景 人間を見るビジョン技術のニーズが高まっている 人体の姿勢推定 仮想世界の構築 人体全身の姿勢推定 画像監視 ロボットとのインタラクション ゲーム,映画等のエンターテインメント 仮想世界の構築 人体全身の姿勢推定

研究目的 3次元姿勢推定方法 モーションキャプチャ 身体の動きのデータを正確に収集できる 問題点 体にマーカを装着する 複数個のカメラに囲まれた環境での撮影 画像情報に基づく姿勢推定 CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

人体の姿勢推定アプローチ Bottom-up アプローチ Top-down アプローチ 2D画像 3Dボーンモデル 3D人体モデル 事前知識 学習 2D画像 3Dボーンモデル 3D人体モデル モデルを変形 フィッティング 2D入力画像

姿勢推定方法 Bottom-up アプローチ Top-down アプローチ 双方向からアプローチすることにより 精度を向上させる メリット 高速 メリット いかなる姿勢でも推定可能 デメリット 学習データに強く依存 学習データと極端に異なる入力には誤差が大きくなる デメリット 初期値の決定が困難 計算量が膨大 双方向からアプローチすることにより 精度を向上させる

姿勢推定方法 Bottom-up で大まかな姿勢の推定 Top-down で修正を行い,精度を向上させる x 3D姿勢を変形 x 尤度評価 入力画像 z 出力(3D人体姿勢) x

Bottom-up アプローチ 重回帰分析による推定 2D画像→3D姿勢 3D人体モデル特徴: 画像特徴: 変換行列Rは最小二乗推定により決定する 学習データをn個用意

Top-down アプローチ Particle Filter (Condensation法) [1998:Isard,Blake]  多数の粒子によって確率分布を離散的に近似 粒子の状態空間と尤度評価 状態量:3D人体モデルの特徴(56次元ベクトル)に PCAをかけたもの   (14次元) 最も尤度の高い粒子を姿勢として決定する

Top-down アプローチ 粒子の尤度評価 各粒子の尤度:全粒子からCGで2D画像を生成 Bottom-upで初期状態を推定し, その付近に粒子を生成 繰り返し推定を行うことで 状態を収束させる Bottom-up による初期値 前状態の 重み付き平均 真値

画像特徴 体の輪郭だけではなく 内部のエッジ情報も考慮した特徴量が必要 画像の人体特徴抽出方法:シルエット画像 体の変形等により隠れ部分が発生する(自己オクルージョン)に弱い 体の輪郭だけではなく 内部のエッジ情報も考慮した特徴量が必要 HOG (Histograms of Oriented Gradients) 従来,人や物体の検出に用いられてきた特徴量 物体の大まかな形状を表すことが可能 HOGのブロック特徴に対しBoFしたものを用いる N.Dalal and B.Triggs,CVPR 2005

人体3Dモデル →関節角を与えることで人体が表現可能 画像からマーカを装着せず 関節角を推定することで姿勢推定を行う 人体は多関節物体であり,様々な形に変形する 各関節間の体節部分は剛体とみなせる →関節角を与えることで人体が表現可能 人体の関節角度を特徴ベクトルとして用いる 画像からマーカを装着せず 関節角を推定することで姿勢推定を行う CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

実験条件 CMU Graphics Lab Motion Capture Database で 公開されているモーションキャプチャデータベースを使用 モーションキャプチャデータからCG画像を生成し,学習に用いる 歩く,走る,キック の3種類の姿勢を8方向から見た画像を使用 学習データ:1265枚 を 8 方向→10120枚 テストデータ:「歩く」,「走る」の2種類の姿勢.合計140枚 パーティクルの数は800,BoFによる画像特徴次元数は500

評価実験 Root mean square(RMS) error で評価

実験結果 入力画像 Bottom-up のみ Bottom-up → Top-down

まとめと今後の予定 まとめ 今後の予定 Bottom-up, Top-down を組み合わせることで精度を向上させた 特徴量にはHOGのBoF 今後の予定 Bottom-up の方法の改良 Top-down の高速化 CGの生成に計算コストがかかる

ご静聴ありがとうございました

マーカレスモーションキャプチャシステム 単眼画像から得られる情報のみで姿勢推定を行う 従来手法 Bottom-up アプローチ 特殊な環境・装置が不要 応用範囲の拡大 従来手法 Bottom-up アプローチ Top-down アプローチ 学習ベースの推定手法 モデルフィッティング 人体モデル

HOG特徴 輝度勾配を計算 入力画像 輝度勾配画像 HOG (Histograms of Oriented Gradients) 従来,人や物体の検出に用いられてきた特徴量 物体の大まかな形状を表すことが可能 内部のエッジ情報も考慮 N.Dalal and B.Triggs,CVPR 2005 輝度勾配を計算 入力画像 輝度勾配画像

HOG特徴 勾配方向を 9方向に量子化 照明や影の影響を受けにくい 局所的な幾何学変化に頑健

HOGにBoF … … … … … HOGブロック特徴(81次元) +ブロックのポジション(2次元) =83次元 画像数×特徴点数 次元 画像数×特徴点数 次元 … … … … … HOGブロック特徴(81次元) +ブロックのポジション(2次元) =83次元 K-meansによるベクトル量子化 HOG特徴空間 (83次元)

各パラメータの値 画像サイズ:70×130画素 HOG特徴 人体3次元モデル特徴次元:56 粒子数:800 セルサイズ:9×9画素 ブロックサイズ:3×3セル 特徴次元:8748 BoFで500次元に量子化 人体3次元モデル特徴次元:56 PCAをすることで14次元 粒子数:800