HOG特徴に基づく 単眼画像からの人体3次元姿勢推定

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
コンピュータビジョン特論 OpenCVについて
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
豊洲 304教室 15 JULY コンピュータグラフィックス 2008年度版.
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
Building text features for object image classification
高精度画像マッチングを用いた SAR衛星画像からの地表変位推定
Learning Appearance in Virtual Scenarios for Pedestrian Detection
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
静止背景における動物体の検出と追跡 陳 謙 2004年10月19日.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パノラマ動画像モデルによる 仮想空間表現システムの研究
ロボットビジョン(ロボットの視覚能力)のための デジタル画像処理
リアルタイム単語認識技術を利用した カメラベース情報取得システム
CGアニメーションの原理 基本技術 対象物体の動きや変形の設定方法 レンダリング技術
Pose Tracking from Natural Features on Mobile Phones
画像処理工学 2012年2月2日 担当教員 北川 輝彦.
コンピュータビジョン特論 第7回対象追跡 2006年11月15日 加藤丈和.
イラストの著作権保護のためのHOG特徴量を用いた複製検出
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
OpenCV を使った画像処理コンポーネントの作成例 田窪 朋仁(大阪大学)
CV輪講 姿勢変化に対応したSoft Decision Featureと Online Real Boostingによる人物追跡
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
顔部品の検出システムの構築 指導教員 廉田浩 教授 1DS04188W  田中 甲太郎.
画像処理 基礎.
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
視点移動カメラにおけるカメラキャリブレーション
Hough変換 投票と多数決原理に基づく図形の検出
人間の教示動作の視覚処理に基づく物体機能の抽出
画像処理工学 2013年1月23日 担当教員 北川 輝彦.
Songzhu Gao, Tetsuya Takiguchi, Yasuo Ariki (Kobe University) 
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
雑音環境下における 非負値行列因子分解を用いた声質変換
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 第六回 最終課題 画像処理による動物体自動抽出、モーションキャプチャ
中京大学 工学部 電気電子工学科 白井研究室 4年 T 為房直人
主成分分析 Principal Component Analysis PCA
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
人物の顔情報に基づくコンテンツの解析 岡田朋子 滝口哲也 有木康雄 神戸大学 …という題目で神戸大学の岡田が発表致します。
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
複数特徴量の重み付け統合による一般物体認識
一方向画像からの 3Dモデル生成 電気電子工学科 白井研究室 T215049 田原 大輝.
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
2007年度 長岡オープンハウス クロマキー合成 小山高専 電子制御工学科4年                       針谷 尚裕.
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
画像処理工学 2011年12月1日 担当教員 北川 輝彦.
距離空間ピラミッドを用いた LLCによる3次元物体認識
ETPB: Extraction of Context from Pedestrians' Behavior
時間連続性を考慮した 動画からの人物の姿勢推定
ステレオカメラを用いた歩行者の行動解析.
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
ロボットから人に話しかける 判断モデルの構築
自己縮小画像と混合ガウス分布モデルを用いた超解像
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Presentation transcript:

HOG特徴に基づく 単眼画像からの人体3次元姿勢推定 神戸大学 工学研究科 情報知能学専攻 大西 克則

研究背景 人間を見るビジョン技術のニーズが高まっている 人体の姿勢推定 仮想世界の構築 人体全身の姿勢推定 ハードウェアの進歩:2D→3D 画像監視 ロボットとのインタラクション ゲーム,映画等のエンターテインメント 仮想世界の構築 人体全身の姿勢推定 ハードウェアの進歩:2D→3D

研究目的 3次元姿勢推定方法 モーションキャプチャ 身体の動きのデータを正確に収集できる 問題点 体にマーカを装着する 複数個のカメラに囲まれた環境での撮影 単眼カメラからの姿勢推定

従来手法 画像の人体特徴抽出方法 シルエット画像を用いる 体の変形等により隠れ部分が発生する(自己オクルージョン)に弱い 体の輪郭だけではなく 内部のエッジ情報も考慮した特徴量が必要

HOG特徴 輝度勾配を計算 入力画像 輝度勾配画像 HOG (Histograms of Oriented Gradients) 従来,人や物体の検出に用いられてきた特徴量 内部のエッジ情報も考慮 N.Dalal and B.Triggs,” Histograms of Oriented Gradients for Human Detection”, CVPR 2005 輝度勾配を計算 入力画像 輝度勾配画像

HOG特徴 勾配方向を 9方向に量子化 照明や影の影響を受けにくい 局所的な幾何学変化に頑健

PCAによる背景領域の次元削減 PCA 背景領域 人物領域 HOGは画像全体の特徴量であり,背景領域にも不必要な特徴が多く存在する 人物領域の重要な領域のみ特徴量を使用したい PCA HOGのブロック毎にPCAを行う 背景領域 人物領域 高 低 特徴次元 あまり 削減されない 大きく次元削減

人体3Dモデル 人体は多関節物体であり,様々な形に変形する 各関節間の体節部分は剛体とみなせる 関節角を3次元人体モデル の特徴量とする →関節角を与えることで人体が表現可能 関節角を3次元人体モデル の特徴量とする 画像から関節角を推定することで 姿勢推定を行う

姿勢推定方法 回帰分析に基づく姿勢推定 3Dモデル特徴: 画像特徴: 変換行列Aは最小二乗推定により決定する 学習データをn個用意

実験条件 一般的な家庭用カメラを用いて人体を撮影 人体を水平方向に回転させ,8方向から撮影する 直立,歩く,走る,手を上げる,手を広げる,の5姿勢 学習データ:240枚 テストデータ:123枚 従来手法であるシルエットの輪郭から抽出される Shape Contexts 特徴との比較 評価は推定誤差で行う

実験結果 走る 歩く 手を広げる 手を上げる

評価 従来手法と比較すると,推定誤差が約5.35度減少

まとめと今後の予定 まとめ 今後の予定 シルエット画像ではなく,HOG特徴を用いた3次元姿勢推定を行った ブロック毎にPCAをすることで,背景領域の特徴次元を削減した 従来手法と比較すると,推定誤差が約5.35度減少 今後の予定 姿勢推定の方法を改良する

ご静聴ありがとうございました

Shape Contexts シルエット画像から輪郭を離散点で表す 各点に対して逆log-polarマッピングを行い,参照している点から近い点を細かく,遠い点を粗く参照する 1点に対して60次元ヒストグラム特徴

特徴抽出 … … … … … 画像数×特徴点数 次元 60次元 Shape Contexts 特徴量を抽出 画像数×特徴点数 次元 … … … … 60次元 … Shape Contexts 特徴量を抽出 K-meansによるベクトル量子化 Shape Contexts 特徴空間 (60次元)

各パラメータの値 画像サイズ:150×200画素 HOG特徴 人体3次元モデル特徴次元:24 セルサイズ:10×10画素 ブロックサイズ:3×3セル 特徴次元:18954 PCA(累積寄与率90%)後の次元:4867 人体3次元モデル特徴次元:24

実験データの詳細 姿勢 画像枚数 学習 データ テストデータ (a) (b) (c) 直立 16 8 手を上げる 40 手を広げる 24 手を上げる 40 手を広げる 24 歩く 80 11 走る (a) 学習データと同じ条件で撮影された画像 (b) ノイズが多い画像 (c) http://www.nada.kth.se/~hedvig/data.html のデータ

失敗例

処理時間 実験環境 Windows XP Intel(R) Core(TM)2 CPU 6600 2.4GHz, 2.0GB RAM 学習(sec) 推定(sec) Shape Contexts (従来手法) 20.53 0.07 HOG 27.59 0.33 HOG (PCA) 290.03 1.34

評価