人間の教示動作の視覚処理に基づく物体機能の抽出

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

ステレオ画像を用いた距離測定 小山高専 坪田 真延. Ⅰ. 概要  平行にずらした 2 つのステレオ画像を用いて 対象(人)物までの距離認識を行う。 図 1.1. 左から見た対象 ( 人 ) 物図 1.2. 右から見た対象 ( 人 ) 物.
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
BRIEF: Binary Robust Independent Elementary Features
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
高精度画像マッチングを用いた SAR衛星画像からの地表変位推定
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パネル型クエリ生成インタフェース画像検索システムの改良
パノラマ動画像モデルによる 仮想空間表現システムの研究
ロボットビジョン(ロボットの視覚能力)のための デジタル画像処理
「わかりやすいパターン認識」 第1章:パターン認識とは
Pose Tracking from Natural Features on Mobile Phones
11章 ボリュームレンダリングを学ぶ 本来は目に見えない内部情報をレンダリングし可視化する技術
コンピュータビジョン特論 第7回対象追跡 2006年11月15日 加藤丈和.
班紹介 描画班一同.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
顔表情認識のための顔特徴点抽出 徳島大学 大学院 工学研究科 長野 信男.
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
日本大学 文理学部 情報システム解析学科 谷研究室 益田真太郎
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第三回 演習課題 画像中からの物体抽出処理(色情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/08.
3次元剛体運動の理論と シミュレーション技法
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
ベイジアンネット混合モデルによる 強化学習エージェントの方策改善
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
ひび割れ面の摩擦接触を考慮した損傷モデル
ビデオデータベース.
視点移動カメラにおけるカメラキャリブレーション
第11回   ディジタル画像(2) ディジタル画像処理(2)
ステレオカメラを用いた人の行動解析.
画像処理工学 2013年1月23日 担当教員 北川 輝彦.
利用関係に基づく類似度を用いたJavaコンポーネント分類ツールの作成
OpenGLライブラリを用いた3次元フラクタルの描画
教示動作の視覚処理に基づく 物体の機能情報の抽出
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
Computer Graphics 第10回 レンダリング(4) マッピング
高度情報演習1A “テーマC” 実践 画像処理プログラミング 第六回 最終課題 画像処理による動物体自動抽出、モーションキャプチャ
ETPB:歩行者行動コンテクストの抽出 申請学生1: 諸富 賢 総合政策学部3年 申請学生2: 佐藤 文啓 環境情報学部1年
内視鏡画像からの奥行き情報提示による 視覚支援システムの開発
2つの平行光の観測による 内部カメラパラメータの安定なキャリブレーション
複数特徴量の重み付け統合による一般物体認識
Thesis Supervisor: Katsushi Ikeuchi 池内克史
一方向画像からの 3Dモデル生成 電気電子工学科 白井研究室 T215049 田原 大輝.
SURF+BoFによる特定物体認識 卒業研究1 1 11/27/11.
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
実空間における関連本アウェアネス 支援システム
Number of random matrices
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
Handel-Cを用いた パックマンの設計
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
ETPB: Extraction of Context from Pedestrians' Behavior
教示動作の視覚処理に基づく 物体の機能情報の抽出
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
コンピュータ教育開発センター Eスクエア・アドバンス ◆産業協力情報授業◆ CGアニメ入門 株式会社 ドーガ.
AAMと回帰分析による視線、顔方向同時推定
市松模様を使用した カメラキャリブレーション
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Presentation transcript:

人間の教示動作の視覚処理に基づく物体機能の抽出 〇佐藤啓宏(電通大) 小川原光一(東大) 田貫富和(小松製作所) 木村浩(電通大) 池内克史(東大)

背景 ~人とロボットの協調~ 視覚による動作理解に基づく人とロボットの協調作業 背景 ~人とロボットの協調~ 視覚による動作理解に基づく人とロボットの協調作業 パーツやツール上に設定された機能(Function: 軸,穴,ネジ)へのハンドの操作を自動抽出 (1996年・木村) タスクモデルを自動生成し,作業モデルと補助動作計画に基づいて,人の動作に対応してロボットの協調動作を生成 (1998年・堀内)

本研究の目的 高度な3次元視覚処理が必要 パーツやツール上の機能(=機能の座標系とそれへの操作)の自動抽出 物体の機能部レベルの作業モデルの枠組みの拡張 高度な3次元視覚処理が必要

3次元認識 ~従来の手法~ 連続画像処理へ拡張 見え方モデルと微小テンプレート・クラスタリング (1996年) カラートラッキングビジョンシステム(CTRV)を用いた3次元追跡処理の基礎実験 (1997年) 固有空間法による手形状認識 (1998年) 連続画像処理へ拡張

Topics 3次元テンプレートマッチング リアルタイム9眼ステレオビジョンシステム Mark.D.Wheeler 1995 M推定法を利用したICP(Iterative closet point)法による3次元物体認識アルゴリズム リアルタイム9眼ステレオビジョンシステム コマツ中央研究所1999 マルチベースラインステレオ法 ハードウェアにより毎秒15枚の距離画像を出力可能

3次元テンプレートマッチング ICP(Iterative closet point)法を用いた 3次元対応点探索アルゴリズムの一種 1995年 Mark.D.Wheeler ICP(Iterative closet point)法を用いた  3次元対応点探索アルゴリズムの一種 1.モデルの可観測点の計算 3.ポーズ推定 <R,t>回転・並進行列 hm:モデルのパッチ数 β:任意の3次元ベクトル 2.対応点関係 4.頑健なポーズ最適化 V(p)モデルの可観測点の集合 D:計測データ点群 Mi:モデル点 Rj:最近傍点 Zi(p)I番目のモデルと計測データ間の距離 P:モデルポーズ

リアルタイム 9眼ステレオビジョンシステム 1999年 コマツ中央研究所 マルチベースラインステレオ法 1999年 コマツ中央研究所 マルチベースラインステレオ法 ハードウェアにより毎秒15枚の距離画像を出力可能

3次元トラッキングシステム 概要 モデルベースの物体認識 ・幾何モデル(1モデル当り100~500点) ・色モデル 性能  毎秒4~9回(1物体当り)  位置精度 約5mm  トラッキング性能 若干難あり?

システム構成

問題点と解決 距離画像の物体輪郭が膨張 計測領域範囲外の誤対応 色ヒストグラムによる2次元画像上での物体領域の切り抜き ステレオ計測のブロックマッチングの影響により 距離画像の物体輪郭が膨張 計測領域範囲外の誤対応 色ヒストグラムによる2次元画像上での物体領域の切り抜き SSADを利用した膨張確度係数による補正

色ヒストグラムによる2次元画像上での物体領域の切り抜き ①モデルと入力画像のヒストグラムを求める モデルヒストグラム 入力画像ヒストグラム Pixel Pixel RGB RGB ②ヒストグラムの比を求める ③入力画像をRに置き換える R:ヒストグラムの比 M:モデルヒストグラム I:入力画像ヒストグラム モデルに近い色ほど白くなる

Movie

SSADを利用した膨張確度係数による補正 SSAD2-SSAD1 < threshold の画素を無効化 SSAD1 SSADの極小値からなる画像 SSAD2 2番目に小さい極少値からなる画像 Movie

3次元トラッキング実験

物体機能の抽出 物体の動きの軌跡から、意味のセグメンテーションをする。 動作の拘束軸・拘束面 接触の解析 曲率・捩率から評価 Octreeを使った高速かつラフな衝突判定を行う。

実装のために現在進行中 (一時停止中?)の仕事 CVで微分系の計算をするには工夫が必要! カルマンフィルタによるデータの補正 スプラインによる補間 CVでの幾何解析はノイズ対策が重要! ラフな(いい意味でノイズを吸収できる)接触判定

まとめ リアルタイム9眼ステレオビジョン 3次元テンプレートマッチング  を利用して、高速・高精度な自由曲面物体の3次元トラッキングを実現した.  処理を単純・高速化することで、物体の移動速度の制限を取り除くことができた.

結論 発展 トラッキングはスピードが命! 処理を単純化して高速化すると、比例するように精度も上がる  処理を単純化して高速化すると、比例するように精度も上がる 発展 トラッカビリティの評価による追跡モードの切り替え 色のクラスタリングによる複数物体のセグメンテーションの精度向上

現在と未来の仕事 過去のシステムをドットちゃんに実装中。 ロボットのタスクモデルの枠組みの拡張 タスクオリエンテッドビジョン 7月ぐらいをめどにロボット学会に投稿する ロボットのタスクモデルの枠組みの拡張 現在止まってしまっている物体機能の話を何としてでもまとめる。 タスクオリエンテッドビジョン その他、たくさんの雑用。。。。

CVLロボット ~ドットちゃん~

Options ~タスクオリエンテッドビジョンの一例~ ステレオ電子ズーム

Q.CVってなんですか? A.CV(コンピュータビジョン)は、主に3次元視覚処理のことです。2次元の画像から3次元を扱う学問の分野です。  対として3次元から2次元への画像処理をCG(コンピュータグラフィックス)と呼びます。

Q.なぜ9台のカメラが必要なのですか? A.ステレオ計測は、異なる視点から実物体上の同じ点を見て、その視差を計算することにより行います.   2つのカメラでは、隠れ(オクルージョン)により見えない点が多く生じてしまいますが、9台のカメラでいろいろな視点から見ることでその影響を抑えることができます.

Q.SSADって何ですか? A.ステレオ計測の対応候補点の類似度評価に用いる値です. ・基準画像と探索画像の探索画素の明度差の絶対値(AD)  (Absolute Difference) ・ウィンドウ内重み付け加算した値(SAD)  (Sum of ADs) ・全てのステレオ画像対の和(SSAD)  (Sum of SADs)

物体機能についての考察 視覚による理解とは、観察した事象を言語(シンボリックな表現)で表すことである。