Bottom-UpとTop-Down アプローチの統合による単眼画像からの人体3次元姿勢推定

Slides:

Advertisements

Similar presentations

静岡大学情報学研究科戸根木千洋ユーザーイメージ収集インターフェースの開発. 2 目次背景と目的研究の構成研究の詳細イメージ収集インターフェースの提案映画イメージ収集システムの開発システムの評価今後の課題.

Advertisements

自動映像生成のためのパーティクルフィルタによるボールの追跡 2007 年 3 月 21 日神戸大学大学院自然科学研究科矢野一樹.

Determining Optical Flow. はじめにオプティカルフローとは画像内の明るさのパターンの動きの見かけの速さの分布オプティカルフローは物体の動きのよって変化するため、オプティカルフローより速度に関する情報を得ることができる.

ユーザーイメージ収集インターフェイスの開発

画像処理学習用RTコンポーネントライブラリ田窪朋仁，大原賢一，吉岡健伸（大阪大学）

豊洲 304教室 15 JULY コンピュータグラフィックス　2008年度版.

コンピュータビジョン特論第８回対象追跡２００６年１１月２２日加藤丈和.

画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts

Building text features for object image classification

高精度画像マッチングを用いた SAR衛星画像からの地表変位推定

点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上

HOG特徴に基づく単眼画像からの人体3次元姿勢推定

静止背景における動物体の検出と追跡陳　謙 2004年10月19日.

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第四回　演習課題画像中からの物体抽出処理（背景情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/15.

パノラマ動画像モデルによる仮想空間表現システムの研究

ＣＧアニメーションの原理基本技術対象物体の動きや変形の設定方法レンダリング技術

コンピュータビジョン特論第７回対象追跡２００６年１１月１５日加藤丈和.

Nonrigid Structure from Motion in Trajectory Space

雑音重み推定と音声ＧＭＭを用いた雑音除去

顔表情認識のための顔特徴点抽出徳島大学大学院工学研究科長野信男.

状況の制約を用いることにより認識誤りを改善同時に野球実況中継の構造化

OpenCV を使った画像処理コンポーネントの作成例田窪朋仁（大阪大学）

CV輪講姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡

ベイズ基準によるHSMM音声合成の評価 ◎橋本佳，南角吉彦，徳田恵一（名工大）.

3次キュムラントのバイスペクトラムと PCAによる音声区間検出

高山建志五十嵐健夫テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp

複数尤度を用いた３次元パーティクルフィルタによる選手の追跡 IS1-39

内視鏡画像からの奥行き情報提示による視覚支援システムの開発

視点移動カメラにおけるカメラキャリブレーション

Hough変換投票と多数決原理に基づく図形の検出

高度情報演習1A “テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第二回演習課題

雑音環境下における非負値行列因子分解を用いた声質変換

音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定

構造情報に基づく特徴量を用いたグラフマッチングによる物体識別情報工学科藤吉研究室　EP02086　永橋知行.

Specmurtを利用した調波構造行列による混合楽音解析の検討

NMF と基底モデルを用いた多重楽音解析 2-P-10 中鹿亘･滝口哲也･有木康雄（神戸大）概要従来手法の問題点提案手法

内視鏡画像からの奥行き情報提示による視覚支援システムの開発

２つの平行光の観測による内部カメラパラメータの安定なキャリブレーション

Data Clustering: A Review

複数特徴量の重み付け統合による一般物体認識

SURF+BoFによる特定物体認識卒業研究1 1 11/27/11.

1-P-25 3次キュムラントバイスペクトラム特徴とReal AdaBoostによる音声区間検出

顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識

Number of random matrices

文化財のデジタル保存のための偏光を用いた透明物体形状計測手法

SIFTとGraph Cutsを用いた物体認識及びセグメンテーション

Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション

Bottom-UpとTop-Down アプローチの組み合わせによる単眼画像からの人体3次元姿勢推定

わかりやすいパターン認識第７章：部分空間法　7.1　部分空間法の基本　7.2　ＣＬＡＦＩＣ法　　　　　　　　　　　　　　　　　６月13日（金）　　　　　　　　　　　　　　　　　大城　亜里沙.

第3章　線形回帰モデル修士1年山田　孝太郎.

多重ベータ混合モデルを用いた調波時間構造のモデル化による音声合成の検討

過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による顔・視線方向同時推定顔・視線同時推定研究背景

画像処理工学 2011年12月1日担当教員　北川　輝彦.

HMM音声合成における変分ベイズ法に基づく線形回帰

距離空間ピラミッドを用いた LLCによる3次元物体認識

重みつきノルム基準によるF0周波数選択を用いた Specmurtによる多重音解析

バイラテラルフィルタによる実雑音下音声認識のための音声特徴量抽出

時間連続性を考慮した動画からの人物の姿勢推定

１ーQー１８音声特徴量抽出のための音素部分空間統合法の検討

音響伝達特性を用いたシングルチャネル音源方向推定

制約付き非負行列因子分解を用いた音声特徴抽出の検討

ロボットから人に話しかける判断モデルの構築

多重関数を用いた調波時間スペクトル形状のモデル化による音声合成 1-P-4

音響伝達特性を用いた単一チャネル音源位置推定における特徴量選択の検討

自己縮小画像と混合ガウス分布モデルを用いた超解像

ＡＡＭと回帰分析による視線、顔方向同時推定

市松模様を使用したカメラキャリブレーション

グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識

ランダムプロジェクションを用いた音響モデルの線形変換

Presentation transcript:

Bottom-UpとTop-Down アプローチの統合による単眼画像からの人体3次元姿勢推定神戸大学大西克則，滝口哲也，有木康雄

研究背景人間を見るビジョン技術のニーズが高まっている人体の姿勢推定仮想世界の構築人体全身の姿勢推定画像監視ロボットとのインタラクションゲーム，映画等のエンターテインメント仮想世界の構築人体全身の姿勢推定

研究目的３次元姿勢推定方法モーションキャプチャ身体の動きのデータを正確に収集できる問題点体にマーカを装着する複数個のカメラに囲まれた環境での撮影単眼カメラからの姿勢推定 CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

画像特徴体の輪郭だけではなく内部のエッジ情報も考慮した特徴量が必要画像の人体特徴抽出方法：シルエット画像体の変形等により隠れ部分が発生する(自己オクルージョン)に弱い体の輪郭だけではなく内部のエッジ情報も考慮した特徴量が必要 HOG (Histograms of Oriented Gradients) 従来，人や物体の検出に用いられてきた特徴量物体の大まかな形状を表すことが可能内部のエッジ情報も考慮 N.Dalal and B.Triggs，CVPR 2005

人体3Dモデル →関節角を与えることで人体が表現可能モーションキャプチャシステム画像からマーカを装着せず人体は多関節物体であり，様々な形に変形する各関節間の体節部分は剛体とみなせる →関節角を与えることで人体が表現可能モーションキャプチャシステム体にマーカを装着し，人体の関節角を推定画像からマーカを装着せず関節角を推定することで姿勢推定を行う CMU Graphics Lab Motion Capture Database (http://mocap.cs.cmu.edu/)

姿勢推定方法 Bottom-up アプローチ Top-down アプローチ双方向からアプローチすることにより精度を向上させる比較することにより推定する高速未学習の姿勢にも柔軟に推定未知の姿勢でも推定可能学習データに強く依存学習データと極端に異なる入力には誤差が大きくなる初期値の決定が困難計算量が膨大双方向からアプローチすることにより精度を向上させる

姿勢推定方法 Bottom-up で大まかな姿勢の推定 Top-down で修正を行い，精度を向上させる Bottom-up 3D姿勢 x 入力画像 z Bottom-up 複数生成評価出力 3D姿勢 x

Bottom-up アプローチ重回帰分析による推定 2D画像→3D姿勢３D人体モデルの関節：画像特徴（HOG）：変換行列Rは最小二乗推定により決定する学習データをn個用意

Top-down アプローチ Particle Filter （Condensation法） [1998:Isard,Blake] 　多数の粒子によって確率分布を離散的に近似粒子の状態空間と尤度評価状態量：３D人体モデルの関節 (38次元ベクトル) 状態量には人体の関節可動域による制限がある最も尤度の高い粒子を姿勢として決定する

Top-down アプローチ粒子の尤度評価各粒子の尤度：全粒子からCGで2D画像に変換し，シルエット画像を生成粒子から生成された画像と、入力を画素単位で一致度を測る Bottom-upで初期状態を推定し，その付近に粒子を生成繰り返し推定を行うことで状態を収束させる Bottom-up による初期値前状態の重み付き平均真値

実験条件 CMU Graphics Lab Motion Capture Database で公開されているモーションキャプチャデータベースを使用モーションキャプチャデータからCG画像を生成し，学習に用いる歩く，走る，キックの3種類の姿勢を8方向から見た画像を使用学習データ:1265枚を 8 方向→10120枚

実験結果入力画像 Bottom-up のみ Bottom-up → Top-down

まとめと今後の予定まとめ今後の予定 Top-down ではパーティクルフィルタを用いることで，真値に収束画像によっては収束しない場合がある特徴量，手法今後の予定データ数を増やして実験様々な姿勢に対応 Bottom-up の方法の改良特徴量の改良

ご静聴ありがとうございました

HOG特徴輝度勾配を計算入力画像輝度勾配画像 HOG (Histograms of Oriented Gradients) 従来，人や物体の検出に用いられてきた特徴量物体の大まかな形状を表すことが可能内部のエッジ情報も考慮 N.Dalal and B.Triggs，CVPR 2005 輝度勾配を計算入力画像輝度勾配画像

HOG特徴勾配方向を 9方向に量子化照明や影の影響を受けにくい局所的な幾何学変化に頑健

各パラメータの値画像サイズ:70×130画素 HOG特徴人体3次元モデル特徴次元:38 粒子数：800 セルサイズ:9×9画素ブロックサイズ:3×3セル特徴次元:8748 人体3次元モデル特徴次元:38 粒子数：800

評価従来手法と比較すると，推定誤差が約5.35度減少