Download presentation
Presentation is loading. Please wait.
1
大量の映像分析と 抽出した知識に基づく映像合成
2011年9月 岡部 誠 電気通信大学 / JST さきがけ
2
お話の流れ 自己紹介 映像データを分析してCGに応用する技術
3
お話の流れ 自己紹介 映像データを分析してCGに応用する技術 ビデオデータベースに基く映像合成 画像中の流体を動かす
楽曲を演奏しているように見える動画生成
4
自己紹介 CG製作のためのユーザインタフェース 例:3次元CGの照明編集ツール(0:19) レンダリング ライトの配置と調節
5
自己紹介 CG製作のためのユーザインタフェース 例:3次元CGの照明編集ツール(0:19)
6
自己紹介 CG製作のためのユーザインタフェース 映像製作を効率化したい 例:3次元CGの照明編集ツール(0:19)
人にとって直感的な入力を扱いたい
7
背景 大量の動画が利用可能 デジタルビデオカメラ、携帯電話のカメラ YouTube、他の動画データベース
8
背景 大量の動画が利用可能 有効利用されていない デジタルビデオカメラ、携帯電話のカメラ YouTube、他の動画データベース
ダウンロード、切り貼り
9
やりたいこと 大量の動画を分析、利用
10
やりたいこと 大量の動画を分析、利用 写真を動かす エキストラ合成 背景音合成
11
既存研究 大量音声の利用は高い実用性 text to speech、楽曲との合成
12
既存研究 大量音声の利用は高い実用性 text to speech、楽曲との合成 大量画像の利用 検索と画像処理による穴埋め
13
既存研究 大量音声の利用は高い実用性 大量画像の利用 大量動画の利用はこれから text to speech、楽曲との合成
検索と画像処理による穴埋め 大量動画の利用はこれから
14
映像データの分析に 基づくCG合成手法
15
A morphable model for the synthesis of 3D faces Volker Blanz and Thomas Vetter, SIGGRAPH 99
200個の顔のスキャンデータを主成分分析 男女100ずつ、70000頂点のポリゴン(0:36)
16
A morphable model for the synthesis of 3D faces Volker Blanz and Thomas Vetter, SIGGRAPH 99
200個の顔のスキャンデータを主成分分析 男女100ずつ、70000頂点のポリゴン(0:36) 写真1枚で顔の3次元形状が推定できる(2:10) 推定すべきパラメータが200個に削減(4:20,4:52)
17
体格の編集 MovieReshape Arjun Jain, Thorsten Thormählen, Hans-Peter Seidel, Christian Theobalt, SIGGRAPH Asia 2010 550個の人体のスキャンデータを主成分分析 人体モデルでビデオをトラッキングする 体格を編集可能(0:06,0:54,2:50)
18
Automatic Photo Pop-up(0:16,1:16) Derek Hoiem et al., SIGGRAPH 2005
空、建物、地面の3種類にセグメンテーション 建物と地面の間で、90度に折り曲げる セグメンテーション済みの画像データセット 3つのどの領域に入るかを学習
19
Scene Completion Using Millions of Photographs James Hays, Alexei A
Scene Completion Using Millions of Photographs James Hays, Alexei A. Efros, SIGGRAPH 2007 画像の気に入らないところを削除&穴埋め GIST特徴量による検索 候補を出して選ばせる 2千枚→100万枚で性能アップ
20
Photo Clip Art Jean-Francois Lalonde, et al., SIGGRAPH 2007
LabelMeユーザによるアノテーション 人や車等、タグ付けされ、領域も分かっている オブジェクトを取り出して新しい画像を作る 画像の合成に使えそうな物体を検索 照明条件やサイズを推定
21
Sketch2Photo: Internet Image Montage Tao Chen et al
Sketch2Photo: Internet Image Montage Tao Chen et al., SIGGRAPH Asia 2009 カンバスにスケッチとテキストを入れる 背景画像の検索 形状を考慮した物体検索 自然な合成を生成 前景・背景の組み合わせを最適化
22
Sketch2Photo: Internet Image Montage Tao Chen et al
Sketch2Photo: Internet Image Montage Tao Chen et al., SIGGRAPH Asia 2009 カンバスにスケッチとテキストを入れる 背景画像の検索 形状を考慮した物体検索 自然な合成を生成 前景・背景の組み合わせを最適化
23
大量の画像を使ったお絵描き支援(0:20) スケッチに似たエッジ画像の検索
ShadowDraw: Real-Time User Guidance for Freehand Drawing Yong Jae Lee, Larry Zitnick, Michael Cohen, SIGGRAPH 2011 大量の画像を使ったお絵描き支援(0:20) スケッチを描くと参考画像が浮き上がってくる スケッチに似たエッジ画像の検索 パッチに切ってにBiCE特徴(ECCV 2010)を記述 似たパッチをたくさん持つものを候補
24
Data-driven enhancement of facial attractiveness Tommer Leyvand et al
Data-driven enhancement of facial attractiveness Tommer Leyvand et al., SIGGRAPH 2008 顔写真を入れると自動的に整形する
25
Data-driven enhancement of facial attractiveness Tommer Leyvand et al
Data-driven enhancement of facial attractiveness Tommer Leyvand et al., SIGGRAPH 2008 顔写真を入れると自動的に整形する データセット:顔の美しさを7段階で評価したもの 8つの顔パーツの位置を自動検出 特徴ベクトルは特徴点間のエッジ距離(234次元) SVRによる顔空間の学習 スコアを上げるようなメッシュの変形
26
Data-driven enhancement of facial attractiveness Tommer Leyvand et al
Data-driven enhancement of facial attractiveness Tommer Leyvand et al., SIGGRAPH 2008 顔写真を入れると自動的に整形する データセット:顔の美しさを7段階で評価したもの 8つの顔パーツの位置を自動検出 特徴ベクトルは特徴点間のエッジ距離(234次元) SVRによる顔空間の学習 スコアを上げるようなメッシュの変形
27
Exploring Photobios Ira Kemelmacher-Shlizerman et al., SIGGRAPH 2011
最初と最後の顔画像を入れると(1:10) その間をつなぐようなアニメーションを生成 顔の3次元姿勢推定 3つの特徴による類似度検索
28
研究中の内容 写真中の流体を動かす 楽曲を演奏しているように見える動画生成
29
モチベーション 流体画像を元にアニメーションを作りたい
30
モチベーション 流体画像を元にアニメーションを作りたい 画像の質感を保ったまま
31
モチベーション 流体画像を元にアニメーションを作りたい 画像の質感を保ったまま 難しい問題
32
モチベーション 流体画像を元にアニメーションを作りたい 画像の質感を保ったまま 難しい問題 デザイナは1枚の流体の絵は描ける
33
モチベーション 流体画像を元にアニメーションを作りたい デザイナは1枚の流体の絵は描ける 画像の質感を保ったまま 難しい問題
独特の面白いスタイル
34
モチベーション 流体画像を元にアニメーションを作りたい デザイナは1枚の流体の絵は描ける 画像の質感を保ったまま 難しい問題
独特の面白いスタイル 何枚も描くのは困難 or 時間が掛かる
35
既存研究 流体シミュレーション
36
既存研究 流体シミュレーション 多くの物理パラメータ
37
既存研究 流体シミュレーション 多くの物理パラメータ 流体の動き 流体の見た目 ?
38
既存研究 流体シミュレーション 多くの物理パラメータ 流体の動き 流体の見た目 ビデオテクスチャ合成 既存のビデオを切り貼り ?
39
既存研究 流体シミュレーション ビデオテクスチャ合成 多くの物理パラメータ 既存のビデオを切り貼り 指定された見た目の 再現が難しい
流体の動き 流体の見た目 ビデオテクスチャ合成 既存のビデオを切り貼り 指定された見た目の 再現が難しい ? ?
40
提案手法 入力 単一の水、炎、煙の流体画像
41
提案手法 入力 単一の水、炎、煙の流体画像 ユーザは流れ方向と速さを指定しても良い
42
提案手法 入力 単一の水、炎、煙の流体画像 ユーザは流れ方向と速さを指定しても良い 流体領域を指定するアルファマット
43
提案手法 入力 出力 単一の水、炎、煙の流体画像 ユーザは流れ方向と速さを指定しても良い 流体領域を指定するアルファマット
ビデオデータベースを用いてアニメーション合成
44
ビデオデータベースの利用 流体ビデオを収集
45
ビデオデータベースの利用 流体ビデオを収集 入力画像を元に 流体ビデオの検索
46
ビデオデータベースの利用 流体ビデオを収集 入力画像を元に 流体ビデオの検索 部分的な類似性
47
ビデオデータベースの利用 流体ビデオを収集 入力画像を元に 流体ビデオの検索 部分的な類似性 コピー&ペーストして アニメーションを生成する
48
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万)
49
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万)
50
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成
51
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成 ビデオフレームの平均を取る
52
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成 SIFT特徴の抽出
ビデオフレームの平均を取る SIFT特徴の抽出
53
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成 SIFT特徴の抽出
ビデオフレームの平均を取る SIFT特徴の抽出
54
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成 SIFT特徴の抽出
ビデオフレームの平均を取る SIFT特徴の抽出 各パッチをヒストグラムで表現
55
ビデオパッチ検索 ビデオと画像を48x48のパッチに切る(ビデオ:24万) 各ビデオパッチの代表画像の作成 SIFT特徴の抽出
ビデオフレームの平均を取る SIFT特徴の抽出 各パッチをヒストグラムで表現 200種類のSIFT → 200次元のヒストグラム
56
最適なビデオパッチの割り当て 動きの滑らかさを考慮した最適化 マルコフ・ランダム場を使用する
57
最適なビデオパッチの割り当て 動きの滑らかさを考慮した最適化 マルコフ・ランダム場を使用する 見た目の類似度
58
最適なビデオパッチの割り当て 動きの滑らかさを考慮した最適化 マルコフ・ランダム場を使用する 見た目の類似度 動きの類似度
59
最適なビデオパッチの割り当て 隣接するパッチ間の動きの滑らかさ
60
最適なビデオパッチの割り当て 隣接するパッチ間の動きの滑らかさ 流れの速度 :平均
61
最適なビデオパッチの割り当て 隣接するパッチ間の動きの滑らかさ 流れの速度 :平均 流れの激しさ :分散
62
アニメーションの生成 入力画像 割当てられたビデオパッチ
63
アニメーションの生成 入力画像 割当てられたビデオパッチ
64
まとめ ビデオデータベースを用いた 流体画像のアニメーション手法の提案 ビデオのより直接的な利用法を検討中
65
研究中の内容 写真中の流体を動かす 楽曲を演奏しているように見える動画生成
66
目的 自分の好きな曲の演奏動画を作りたい 楽器を演奏する技術はない あたかも演奏しているように見える動画の生成
67
今回、どのような動画を作るか バイオリンソロに絞って実験 データベース作成上の問題 単音なので、音楽の解析が容易 演者の動作が大きい ビデオ
Youtube等では、十分な長さの動画が入手不可 演奏動画を独自に撮影
68
既存研究 人のCGモデルを音楽に同期させて踊らせる研究 CG業界では割と盛ん
3次元モデルの動き、音楽のテンポ・雰囲気を同期 → 割と適当な同期で、見た目は良い
69
Future Work 複数楽器の利用 ユーザインタフェース 将来性 音源分離・・・、全自動は困難? 音源分離の手助け、好みに合わせた編集
素人に楽器を演奏させるようなCG技術の確立 バンドの一員になれるような エンターテインメントシステムの構築
70
まとめ 大量の映像を分析して知識を抽出し、 新たな映像を合成するための研究 大量データに基づくCG技術 流体画像のアニメーション
楽器を演奏しているように見える動画の生成 大量データに基づくCG技術 3次元の顔と人体形状モデル 近年の大量画像データのCG応用
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.