ステレオカメラを用いた歩行者コンテキストのリアルタイム推定システム

Slides:



Advertisements
Similar presentations
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Advertisements

コンピュータビジョン特論 OpenCVについて
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
Chapter11-4(前半) 加藤健.
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
NFCを利用した登山者間DTNの構築 Building DTN for Climbers by using NFC
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
「わかりやすいパターン認識」 第1章:パターン認識とは
Pose Tracking from Natural Features on Mobile Phones
クラスタ分析手法を用いた新しい 侵入検知システムの構築
Flashプレイヤーを使った動画配信 情報工学科 宮本 崇也.
Deep learningによる 読唇システム
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
応用情報処理V 第1回 プログラミングとは何か 2004年9月27日.
SMSを利用した コミュニケーションシステムの開発
感情推測システム構築のための顔表情認識の実践
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
ストリーム処理エンジンを用いた 顔映像に対する 補助情報提供システム
応用情報処理V 第1回 プログラミングとは何か 2003年9月29日.
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
センサネットワークにおける グルーピング機構
IPv6アドレスによる RFIDシステム利用方式
チーム FSEL 立命館大学情報理工学部 ソフトウェア基礎技術研究室
高度情報演習1C 実践 画像処理プログラミング
長岡技科大オープンハウス 岐阜高専4年電子制御工学科 森 永二郎.
RT-Linuxを用いた 多入力パルス波高分析システムの開発
高速剰余算アルゴリズムとそのハードウェア実装についての研究
Leap Motionを用いた実世界指向 アプリランチャの設計と開発
視点移動カメラにおけるカメラキャリブレーション
WIP中間発表 画像解析を用いた メイドの為の 無許可撮影通知システム
ステレオカメラを用いた歩行者の行動解析.
ステレオカメラを用いた人の行動解析.
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
実行時情報に基づく OSカーネルのコンフィグ最小化
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
高度情報演習1A “テーマC” 実践 画像処理プログラミング 第六回 最終課題 画像処理による動物体自動抽出、モーションキャプチャ
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
中京大学 工学部 電気電子工学科 白井研究室 4年 T 為房直人
ETPB:歩行者行動コンテクストの抽出 申請学生1: 諸富 賢 総合政策学部3年 申請学生2: 佐藤 文啓 環境情報学部1年
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
デジタル画像とC言語.
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
OpenCV について OpenCV とは OpenCV の Python プログラム例 配列 画像の B, G, R の 3成分
Intel SGXを用いた仮想マシンの 安全な監視機構
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
ステレオカメラを用いた歩行者の行動解析 ステレオカメラを用いた歩行者の行動解析.
音声情報とベイジアンネットを 用いた感性情報処理システム
各会話シーン毎に、発話(音源)方向を推定
Cell/B.E.のSPE Isolationモードを用いた監視システム
福岡工業大学 情報工学部 情報工学科 種田研究室 于 聡
iSeries Site 人事・給与C/S版のハードウェア・ソフトウェア要件
過学習を考慮した IS1-60 AAMパラメータの選択と回帰分析による 顔・視線方向同時推定 顔・視線同時推定 研究背景
設計情報の再利用を目的とした UML図の自動推薦ツール
ETPB: Extraction of Context from Pedestrians' Behavior
ステレオカメラを用いた歩行者の行動解析.
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
クラスタリングを用いた ベイズ学習モデルを動的に更新する ソフトウェア障害検知手法
2018年度ビジョン研究室 ゼミナール・卒研紹介 指導教員:張善俊 6月20日(水) 6-209.
欠陥検出を目的とした類似コード検索法 吉田則裕,石尾隆,松下誠,井上克郎 大阪大学 大学院情報科学研究科
1-Q-12 Buried Markov Modelを用いた構音障害者の音声認識の検討
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
勾配画像処理に基づく動画中の流体部分抽出
MAUI Project 2009 インターネットにおける近接性
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
ネットワークを介した 計測制御システムの開発
Presentation transcript:

ステレオカメラを用いた歩行者コンテキストのリアルタイム推定システム 慶應義塾大学大学院 政策・メディア研究科   鈴木慧 メディアとう各 ステレオカメラを用いたリアルタイム歩行者コンテキスト推定システム

背景 近年、ビデオカメラで撮影した映像から歩行者を検知する研究が行われている リアルタイムな異常検知に応用されている ビデオカメラの普及や機械学習の進化 リアルタイムな異常検知に応用されている

問題 単なる異常検知ではなく,歩行者のコンテキストのリアルタイム抽出は難しい

目的 歩行者コンテキストをリアルタイムに抽出する 街角の複数歩行者を監視し複数コンテキストを抽出 異常検知! 転んだ人がいます

運動領域注視型ステレオカメラシステム 中央大学梅田研究室で開発された3 次元的な移動を検知可能なステレオカメラシステム 本システムで利用する 運動領域の特徴量を取得できる 距離, 3次元重心座標,高さ,幅,タイムスタンプ,ラベル番号 背景差分処理で運動領域を抽出 本システムで利用する 運動領域がわかりずらい

運動領域注視型ステレオカメラシステムを用いた歩行者コンテキストのリアルタイム抽出 アプローチ 運動領域注視型ステレオカメラシステムを用いた歩行者コンテキストのリアルタイム抽出 歩行者の3次元的な移動情報に着目 歩行者の移動情報解析モデルとしてベイジアンネットを用いる カメラから取得する情報にはノイズが入りやすいが、不確実な要因下でも妥当な推論を実行できる

プロトタイプのターゲットコンテキスト 普通の歩行 小走り 転んだ 転んだ 屯っている こぜりあい ひったくり 仲間同士で歩いている 目標とするコンテキスト 対象 今回実際に推定するコンテキスト 普通の歩行 小走り 転んだ 転んだ 移動体個々 屯っている こぜりあい ひったくり 仲間同士で歩いている グループ 混んでいる 閑散としている 場の雰囲気 今回はやらない

システム要件 Input&Processing Output 歩行者移動情報を時系列データとしてリアルタイム解析 時間条件: 歩行者移動情報レートを満足する Output 推定結果をユーザにGUIで示す 今回は2種類のコンテキストに対応 詳細 イベントトリガ方式によるコンテキスト推定 転ぶコンテキストの場合、急にz座標値が下がったらイベントとして検出する 監視対象を絞る 仲間同士のグループは監視対象からはずす 監視対象を優先して推論 コンテキスト推定用の優先度キューで実装 Inputとしてなに Outpuとしてなに 時間条件がなに? 何種類のコンテキストが識別できること

ハードウェア構成図 ネットワーク ステレオカメラ コンテキスト 推定処理PC 画像処理PC コンテキスト推定結果表示 街角の歩行者 ステレオカメラシステム 歩行者コンテキスト リアルタイム推定部

コンテキスト推定部のプロトタイプの設計 Picture Data Flow Infer contexts row data Data Client DataPreProcessor Data Channel Context Infer Controller Bayesian Network Engine row data Model Manager context read, update Bayesian Models ハードウェア構成 ソフトウェア構成 矢印の太さに意味を持たせる Context Observer Context Map Viewer Context List Viewer user feedback user input

モジュール間通信プロトコルの設計 データフォーマット データ長 [0:15] timestamp [16:79] sec [16:47] millisec[48:79] ペイロード長 [80:95] データ数 [96:103] データ長 16bit timestamp 64bit ペイロード長 16bit データ数 8bit ペイロード

コンテキスト推定の流れ 仲間同士グループを推定する例 半分ずつオーバーラップさせて解析していく スライドウィンドウバッファ A: 速度ベクトルの類似度 B: 距離の平均 C: ベクトルの挟角の平均 イベント検出スレッド (距離が一定化になるとトリガ) ベイズモデルへの変数入力 コンテキスト推定スレッド (検出されたイベントに対応した コンテキストを推定)

実装環境 実行環境 実装言語 使用ライブラリ Windows Vista カメラ:Point Grey Research製            のBumblebee2 320×240画 実装言語 C++ 3500行 プログラムの全般を実装 Java 500行 プログラムの一部を実装(ベイズエンジン部) JNI経由でコールする 使用ライブラリ GUI部のみで使用: QT4 Library Windows,UNIX,MacOSの               マルチプラットフォームに対応するため ステレオカメラ 分けたほうが Cross-Platform Rich Client Development Framework

実験 概要 実験環境 転ぶ、仲間同士コンテキストを2人の歩行者について抽出 屋外での実験 動作環境 CPU: Core2Duo E6850(2.6GHz 2 core) OS: Windows Vista 作ったソフトウェアがちゃんと動いているという信憑性がない スクリーンショットを取って、動いているソフトウェアの様子出す アウトプットがわからない 全てのウィンドウの話

基本性能評価 ステレオカメラシステムのデータレート 実験時の評価データ コンテキスト推定の最大負荷時 14 frame/sec (1人あたり7 frame/sec) 実験時の評価データ 平均コンテキスト推定時間 32 msec CPU使用率 5% コンテキスト推定の最大負荷時 コンテキスト同時推定数 2 平均40msec, CPU使用率100% コンテキスト同時推定数 4 平均160msec 最悪200msec, CPU使用率100%

実験結果に対する考察と課題 考察 課題 最悪でも160msecなのでリアルタイム性を満足する 実際にはイベントモデルを用いているのでコンテキストを複数同時推定する場面は少なくなる 歩行者数や推定コンテキスト数が増えるとスケールしない 課題 コンテキスト推定精度の評価を取る 対象とするコンテキスト数が増えてもスケールするようにする 仲間同士のモデルを用いたことを示す 動きの2倍の周波数でサンプリングしないとだめ

まとめ ステレオカメラシステムを用いた歩行者コンテキストのリアルタイム抽出を行った プロトタイプ実装し、実験を行い有効性を確認した

ベイズモデル例 仲間グループコンテクスト 仲間グループ (True,False) A: 速度ベクトルの類似度 B: 距離 C: ベクトルの挟角 C’’ B’’ A’’ 分かりずらい このスライドはなくても良い A’の意味をちゃんと書く B’ A’ C’ C B A 高い 低い

それぞれのコンテキストを表す歩行者モデルを作るのが大変そうだ 質疑応答 それぞれのコンテキストを表す歩行者モデルを作るのが大変そうだ 仲間同士のグループを抽出する場合でも、歩行の邪魔にならないように、並んで歩かない ステレオカメラじゃないと抽出できないコンテキストって何かきちんと考えてる? 街角でシステムを使いたいと言ったが、遠くの人にも対応できるのか?

Wikipediaのデータ構造を用いた用語のオントロジー作成 おもしろかった発表 Wikipediaのデータ構造を用いた用語のオントロジー作成 Webで公開されているオントロジーとしては初 ユーザがWebから自由に編集可能 Is-Aなどの関係が自動生成できる PC is a computer