Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定

Slides:



Advertisements
Similar presentations
静岡大学情報学研究科 戸根木千洋 ユーザーイメージ収集 インターフェースの開発. 2 目次 背景と目的 研究の構成 研究の詳細 イメージ収集インターフェースの提案 映画イメージ収集システムの開発 システムの評価 今後の課題.
Advertisements

自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Determining Optical Flow. はじめに オプティカルフローとは画像内の明る さのパターンの動きの見かけの速さの 分布 オプティカルフローは物体の動きの よって変化するため、オプティカルフ ローより速度に関する情報を得ること ができる.
ユーザーイメージ収集 インターフェイスの開発
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
豊洲 304教室 15 JULY コンピュータグラフィックス 2008年度版.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts
Building text features for object image classification
高精度画像マッチングを用いた SAR衛星画像からの地表変位推定
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
静止背景における動物体の検出と追跡 陳 謙 2004年10月19日.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パノラマ動画像モデルによる 仮想空間表現システムの研究
CGアニメーションの原理 基本技術 対象物体の動きや変形の設定方法 レンダリング技術
コンピュータビジョン特論 第7回対象追跡 2006年11月15日 加藤丈和.
Nonrigid Structure from Motion in Trajectory Space
雑音重み推定と音声 GMMを用いた雑音除去
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
OpenCV を使った画像処理コンポーネントの作成例 田窪 朋仁(大阪大学)
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
相関分析.
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
視点移動カメラにおけるカメラキャリブレーション
Hough変換 投票と多数決原理に基づく図形の検出
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
Specmurtを利用した調波構造行列による 混合楽音解析の検討
NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘 ・ 滝口哲也 ・ 有木康雄 (神戸大) 概要 従来手法の問題点 提案手法
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
Data Clustering: A Review
複数特徴量の重み付け統合による一般物体認識
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
Number of random matrices
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
多重ベータ混合モデルを用いた調波時間構造の モデル化による音声合成の検討
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
画像処理工学 2011年12月1日 担当教員 北川 輝彦.
HMM音声合成における 変分ベイズ法に基づく線形回帰
距離空間ピラミッドを用いた LLCによる3次元物体認識
重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析
バイラテラルフィルタによる実雑音下音声認識 のための音声特徴量抽出
時間連続性を考慮した 動画からの人物の姿勢推定
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
音響伝達特性を用いたシングルチャネル音源方向推定
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
ロボットから人に話しかける 判断モデルの構築
多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
自己縮小画像と混合ガウス分布モデルを用いた超解像
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
ランダムプロジェクションを用いた音響モデルの線形変換
Presentation transcript:

Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定 神戸大学 大西克則,滝口哲也,有木康雄

研究背景 人間を見るビジョン技術のニーズが高まっている 人体の姿勢推定 仮想世界の構築 人体全身の姿勢推定 画像監視 ロボットとのインタラクション ゲーム,映画等のエンターテインメント 仮想世界の構築 人体全身の姿勢推定

研究目的 3次元姿勢推定方法 モーションキャプチャ 身体の動きのデータを正確に収集できる 問題点 体にマーカを装着する 複数個のカメラに囲まれた環境での撮影 単眼カメラからの姿勢推定 CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

画像特徴 体の輪郭だけではなく 内部のエッジ情報も考慮した特徴量が必要 画像の人体特徴抽出方法:シルエット画像 体の変形等により隠れ部分が発生する(自己オクルージョン)に弱い 体の輪郭だけではなく 内部のエッジ情報も考慮した特徴量が必要 HOG (Histograms of Oriented Gradients) 従来,人や物体の検出に用いられてきた特徴量 物体の大まかな形状を表すことが可能 内部のエッジ情報も考慮 N.Dalal and B.Triggs,CVPR 2005

人体3Dモデル →関節角を与えることで人体が表現可能 モーションキャプチャシステム 画像からマーカを装着せず 人体は多関節物体であり,様々な形に変形する 各関節間の体節部分は剛体とみなせる →関節角を与えることで人体が表現可能 モーションキャプチャシステム 体にマーカを装着し,人体の関節角を推定 画像からマーカを装着せず 関節角を推定することで姿勢推定を行う CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

姿勢推定方法 Bottom-up アプローチ Top-down アプローチ 双方向からアプローチすることにより 精度を向上させる 比較することにより推定する 高速 未学習の姿勢にも柔軟に推定 未知の姿勢でも推定可能 学習データに強く依存 学習データと極端に異なる入力には誤差が大きくなる 初期値の決定が困難 計算量が膨大 双方向からアプローチすることにより 精度を向上させる

姿勢推定方法 Bottom-up で大まかな姿勢の推定 Top-down で修正を行い,精度を向上させる Bottom-up 3D姿勢 x 入力画像 z Bottom-up 複数生成 評価 出力 3D姿勢 x

Bottom-up アプローチ 重回帰分析による推定 2D画像→3D姿勢 3D人体モデルの関節: 画像特徴(HOG): 変換行列Rは最小二乗推定により決定する 学習データをn個用意

Top-down アプローチ Particle Filter (Condensation法) [1998:Isard,Blake]  多数の粒子によって確率分布を離散的に近似 粒子の状態空間と尤度評価 状態量:3D人体モデルの関節 (38次元ベクトル) 状態量には人体の関節可動域による制限がある 最も尤度の高い粒子を姿勢として決定する

Top-down アプローチ 粒子の尤度評価 各粒子の尤度:全粒子からCGで2D画像に変換し,シルエット画像を生成 粒子から生成された画像と、入力を画素単位で一致度を測る Bottom-upで初期状態を推定し, その付近に粒子を生成 繰り返し推定を行うことで 状態を収束させる Bottom-up による初期値 前状態の 重み付き平均 真値

実験条件 CMU Graphics Lab Motion Capture Database で 公開されているモーションキャプチャデータベースを使用 モーションキャプチャデータからCG画像を生成し,学習に用いる 歩く,走る,キック の3種類の姿勢を8方向から見た画像を使用 学習データ:1265枚 を 8 方向→10120枚

実験結果 入力画像 Bottom-up のみ Bottom-up → Top-down

まとめと今後の予定 まとめ 今後の予定 Top-down ではパーティクルフィルタを用いることで,真値に収束 画像によっては収束しない場合がある 特徴量,手法 今後の予定 データ数を増やして実験 様々な姿勢に対応 Bottom-up の方法の改良 特徴量の改良

ご静聴ありがとうございました

HOG特徴 輝度勾配を計算 入力画像 輝度勾配画像 HOG (Histograms of Oriented Gradients) 従来,人や物体の検出に用いられてきた特徴量 物体の大まかな形状を表すことが可能 内部のエッジ情報も考慮 N.Dalal and B.Triggs,CVPR 2005 輝度勾配を計算 入力画像 輝度勾配画像

HOG特徴 勾配方向を 9方向に量子化 照明や影の影響を受けにくい 局所的な幾何学変化に頑健

各パラメータの値 画像サイズ:70×130画素 HOG特徴 人体3次元モデル特徴次元:38 粒子数:800 セルサイズ:9×9画素 ブロックサイズ:3×3セル 特徴次元:8748 人体3次元モデル特徴次元:38 粒子数:800

評価 従来手法と比較すると,推定誤差が約5.35度減少