ビデオデータベース.

Slides:



Advertisements
Similar presentations
地図の重ね合わせに伴う 位相関係の矛盾訂正手法 萬上 裕 † 阿部光敏* 高倉弘喜 † 上林彌彦 ‡ 京都大学工学研究科 † 京都大学工学部 * 京都大学情報学研究科 ‡
Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
プレゼンテーションからホームページ作成まで 情報システム入門 A 総合情報センター 非常勤講師 :中山 進.
コンピュータビジョン特論 OpenCVについて
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
プレゼンテーションからホームページ作成まで
静止背景における動物体の検出と追跡 陳 謙 2004年10月19日.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
パネル型クエリ生成インタフェース画像検索システムの改良
ロボットビジョン(ロボットの視覚能力)のための デジタル画像処理
画像処理工学 2012年2月2日 担当教員 北川 輝彦.
Deep learningによる 読唇システム
3DCGコンテンツの基礎 第5回授業:最終課題制作
デジタルポートフォリオ作成支援ツール PictFolio 使用マニュアル
画像処理論.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
時空間データからのオブジェクトベース知識発見
F5 を押すか、または [スライド ショー] > [最初から] をクリックして、コースを開始してください。
DB マルチメディア・コンテンツの組織化機構 マルチメディア・コンテンツ ①組織化機構 解体・整理の仕事 現実世界に流通するマルチ
HTTPプロトコルとJSP (1) データベース論 第3回.
有人撮影講義ビデオの閲覧・編集支援のための画像・音声切り出し手法の検討
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第三回 演習課題 画像中からの物体抽出処理(色情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/08.
表紙 MATLAB 応用講習会(A) 情報アシスタント M1 山本幸司.
活動を しましょう あいさつ しましょう 指示を しましょう はげましましょう Scene1. Scene2. Scene3.
Microsoft Office クイックガイド ~OneNote 2013~
プロモデル 使用カメラ 更新.
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
高度情報演習1C 実践 画像処理プログラミング
長岡技科大オープンハウス 岐阜高専4年電子制御工学科 森 永二郎.
顔部品の検出システムの構築 指導教員 廉田浩 教授 1DS04188W  田中 甲太郎.
~Lookie~ WEBカメラを用いた対話時における 視線不一致問題の解決手法の提案と 解決支援機構の開発
相川研究室 ~信号処理は世界を変える~.
画像処理 基礎.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
Leap Motionを用いた実世界指向 アプリランチャの設計と開発
画像の内容検索.
第11回   ディジタル画像(2) ディジタル画像処理(2)
領域ベースの隠れ変数を用いた画像領域分割
画像処理工学 2013年1月23日 担当教員 北川 輝彦.
マルチメディア・コンテンツの 組織化機構 ー映像メディアに対する知的構造化ー 有木康雄 龍谷大学理工学部 電子情報学科
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
コードクローン検出ツールを用いた ソースコード分析システムの試作と プログラミング演習への適用
東京農業大学 東京情報大学 附属第一高等学校・中等部 附属第二高等学校 附属第三高等学校・中等部
予測に用いる数学 2004/05/07 ide.
アルゴリズムとプログラミング (Algorithms and Programming)
複数特徴量の重み付け統合による一般物体認識
画像データベース.
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
各会話シーン毎に、発話(音源)方向を推定
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
動画配信捕捉のためのWEBサーバ構築 06A1058 古江 和栄.
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
数理科学Ⅰ 大阪府立天王寺高等学校 大西 義一 2019/5/4.
アナログとデジタル.
基礎技術ー3 : Webページの標準規格について
シニアPCマザーズ 平成29年度第5回会員相互勉強会 2017年11月24日(金) 13:30~ 於:雁宿公民館 発表者:吉田恭子
ポッツスピン型隠れ変数による画像領域分割
ステレオカメラを用いた歩行者の行動解析.
映像のワーピングと モーフィングの技法 福島研究室 中島良平 勝田恒士郎 上野義貴.
ビデオデータベースを用いた 流体画像に基づくアニメーション生成
領域ベースの隠れ変数を用いた決定論的画像領域分割
窪田進太郎 有木康雄(神戸大) 熊野雅仁(龍谷大)
市松模様を使用した カメラキャリブレーション
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
Presentation transcript:

ビデオデータベース

ビデオの基本操作 再生 早送り/巻き戻し 早送り/巻き戻ししながら再生 任意の時点へ移動 停止 再生の終了 再生の一時停止

ビデオデータベース インデックス 検索 データベース 投入 データベース 使用 インデックス付けを行う 検索時に,インデックスを使う

ビデオデータベースの機能 索引付けと検索  索引 検索 キーワード付け  キーワードによる検索 内容情報 内容検索 分類 比較

ビデオの「キーワード付け」の課題 キーワード付けは困難 人手が必要 主観が入る 不完全 見方が偏る 不正確 時間/費用がかかる

ビデオの「内容検索」の課題 ビデオ フレーム ・各フレームを「静止画像」とみなし,  色,テクスチャ,形状などの情報を(自動的に)取り出すことは可能 → 取り出した情報は冗長    (ビデオの「近い」フレームは中身が似ている)

ビデオの内容情報 フレーム単独のもの 色 (color) テクスチャ (textute) 形状 (shape) エッジ (edge)

ビデオの内容情報 空間/時間の要素を含むもの 動き (action) 出来事 (event) story → フレーム単位で,色,テクスチャ,形状,エッジの情報を取り出すことは十分でない → シーン,ショットのような,フレームより大きな単位で内容情報を扱う

ビデオ内容検索の技術 Parsing 特徴抽出 分割 1つのビデオ 基本単位の集まり (シーン,ショット) 信号処理,画像処理 画像理解 内容情報

ショット, シーン parsing abstraction キーフレーム ビデオ 特徴抽出 特徴抽出 インデックス

ショット,シーン ビデオを「時間方向」に,より小さい単位に分割した単位 ショット: ひと続きのフレーム ショット: ひと続きのフレーム  シーン: 意味的につながりのある,ひと続き   のショット

ショット カメラの切り替わり 1つのビデオ 「カメラの切り替わり」を単位とする 1つのビデオの中では,頻繁にカメラが切り替わる

カメラ操作 1ショット内では,パン,チルト,ズームなどの カメラ操作が行われることがある パン (panning) 左右に振る チルト (tilting)     上下に傾ける ズーム (zooming) 拡大/縮小

シーンを判別する手がかり ショットをまたがった「視覚効果」などは,「同一のシーンである」と判定するヒントになる 視覚効果 (transition effect) dissolve, wipe, fade-in, fade-out など 効果音/音楽 「同じ」ショットの繰り返し カメラの切り替わり

ビデオの構造 ビデオ シーン ショット フレーム

キーフレーム ショットを代表する静止画像 ビデオ シーン ショット フレーム キーフレーム

「理想」のキーフレームは?  面白い「もの」が写っている 面白い「出来事」や「動き」が写っている ビデオの中身そのものをよく表現している

特徴抽出までのプロセス ビデオ Parsing シーン 特徴抽出 ショット abstraction 特徴抽出 登場物の動き, カメラ操作,出来事, ストーリーに関する 情報も(可能な限り) 抽出 abstraction キーフレーム 特徴抽出

ビデオ内容検索の技術 Parsing Abstraction 特徴抽出 時間方向の分割 キーフレーム取り出し ショットを代表する静止画像(フレーム)の取り出し 特徴抽出 シーン,ショット,キーフレームに対する特徴抽出 動き,出来事,ストーリーに関する情報も抽出する

http://disney.ctr.columbia.edu:8021/VisualSEEk/VisualSEEk.html

ショットの切れ目 ショットの切れ目でない カメラ操作(パン,チルト,ズーム) ショットの切れ目である カメラの切り替え transition effect (dissolve, wipe, fade-in, fade-out など)

ショット検出法 Pixel-based Statistical-based Histogram-based Trasform-based 画素の「変化量」を計る.ある閾値を超えて変化する画素の数を数える. Statistical-based フレームを領域に分割.各領域の「統計量の変化」を計る(明るさの平均,分散など). Histogram-based 各フレームごとに「ヒストグラム」(明るさ,色の分布など)を作り,2つの連続するフレームのヒストグラムを比較 Trasform-based DCT係数(MPEG データ内などに存在)を使用 Edge-based エッジの位置と数を比較 Motion-based ブロックマッチングの結果得られる motion vector を使用

ショット検出法 Pixel-based, Statistical-based, Histogram-based, Trasform-based, Edge-based では ショット検出 結果 隣り合う2フレームで比較.閾値を 超えたら「切れ目」であると判定 フレーム単位で 情報を取り出し

キーフレーム抽出法 特定フレームを使用 visual content complexity indicators ショットの先頭 ショットの末尾 ショットの中間 visual content complexity indicators shot activity indicators shot motion indicators

キーフレーム抽出で使用される情報 Color フレームごとの色の分布 明るさの平均 色のばらつき具合 主に登場する色の種類 2. Motion カメラ操作 登場物の動き など

関連研究 VideoQ Columbia Univ. http://ives.ctr.columbia.edu:8888/VideoQ/about.html 機能:  ビデオから object, scene, subject を検索する機能 検索法: キーワードによるテキスト検索 color, shape, texture, motion による内容検索

VideoQ の Browse デモ,http://www.ctr.columbia.edu/videoq/

関連研究 Screening Room Convera http://www.convera.com 機能: ビデオの capture, 解析, インデックス付与,インターネットでの配布

関連研究 Virage Virage, San Mateo http://www.virage.com 機能 ビデオの capture, 解析, インデックス付与,インターネットでの配布 ビデオ内の「顔」,「テキスト」の認識

リンク集http://viper.unige.ch/video/index.html Content-based Video Retrieval に関する よい解説の Web ページ http://viper.unige.ch/~marchand/CBVR/

おわりに ビデオの内容検索 → 特徴抽出の技術が必要(自動化したい) → 特徴抽出の技術が必要(自動化したい) → ビデオデータに含まれる「音声」,「音」,「テキスト」,「顔の認識」,「カメラの動き」,「登場物の動き」の情報をすべて使うことが鍵になる