嗜好分類に基づく 個人適応型サッカー映像の 自動生成技術 神戸大学 有木研究室  窪田進太郎.

Slides:



Advertisements
Similar presentations
自動映像生成のための パーティクルフィルタによるボールの追 跡 2007 年 3 月 21 日 神戸大学大学院自然科学研究科 矢野 一樹.
Advertisements

ユーザーイメージ収集 インターフェイスの開発
顔表情クラスタリングによる 映像コンテンツへのタギング
島根大学法文学部 野田哲夫 (情報経済論担当)
電子透かしにおける マスキング効果の主観評価
画像処理学習用RTコンポーネントライブラリ 田窪 朋仁,大原 賢一,吉岡 健伸(大阪大学)
Learning Appearance in Virtual Scenarios for Pedestrian Detection
最新ファイルの提供を保証する代理FTPサーバの開発
Webカメラを利用した 研究室の利用頻度調査
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
Pose Tracking from Natural Features on Mobile Phones
Flashプレイヤーを使った動画配信 情報工学科 宮本 崇也.
Deep learningによる 読唇システム
Intelligent Computing Systems Laboratory
教育人間科学部 マルチメディア文化課程 竹内達哉
神奈川大学大学院工学研究科 電気電子情報工学専攻
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
クロストーク成分の相互相関に 着目した音場再生システム
高解像度カメラ監視システム OS Box FHDシリーズ(仮称)
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
OpenCV を使った画像処理コンポーネントの作成例 田窪 朋仁(大阪大学)
PSOLA法を用いた極低ビットレート音声符号化に関する検討
安心してネット上でコンテンツを流通できる環境の形成
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
クレーム管理、動画教育 システムご参考資料
有人撮影講義ビデオの閲覧・編集支援のための画像・音声切り出し手法の検討
3次キュムラントのバイスペクトラムと PCAによる音声区間検出
固定カメラ映像からの音声情報を 用いた映像コンテンツ生成
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
自閉症スペクトラム障害児と定型発達児の識別に関する音響特徴量選択の検討
個人適応型サッカー映像の 自動生成技術 神戸大学 有木研究室  窪田進太郎.
長岡技科大オープンハウス 岐阜高専4年電子制御工学科 森 永二郎.
複数尤度を用いた 3次元パーティクルフィルタによる選手の追跡 IS1-39
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
ビデオデータベース.
視点移動カメラにおけるカメラキャリブレーション
RoboCupサッカーにおける 戦術的パターンの抽出
日本VR学会/VRコンソーシアム 最先端表現技術利用推進協会 中村 真之助
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第二回 演習課題
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
情報検索(6) メディア検索の仕組み 教員 岩村 雅一
高度情報演習1A “テーマC” 実践 画像処理プログラミング 第六回 最終課題 画像処理による動物体自動抽出、モーションキャプチャ
ルーブリック・チャート(評価) の活用と課題
Data Clustering: A Review
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
顔特徴点移動量・点間距離変化量の組み合わせに基づく顔表情認識
適応的近傍を持つ シミュレーテッドアニーリングの性能
Number of random matrices
各会話シーン毎に、発話(音源)方向を推定
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
SIFTとGraph Cutsを用いた 物体認識及びセグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
ユーザコンテキストを反映した セマンティックキャストの基盤技術
ブースティングとキーワードフィルタリング によるシステム要求検出
設計情報の再利用を目的とした UML図の自動推薦ツール
保守請負時を対象とした 労力見積のためのメトリクスの提案
A-17 検索履歴のプライバシーを秘匿した ユーザクラスタリング
欅田 雄輝 S 北陸先端科学技術大学院大学 知識科学研究科
音響特徴量を用いた自閉症児と定型発達児の識別
ボールと選手に着目したディジタルカメラワークの実現法
ビデオデータベースを用いた 流体画像に基づくアニメーション生成
視覚補助のための物体検出 白井研究室 T 若松大仁
窪田進太郎 有木康雄(神戸大) 熊野雅仁(龍谷大)
自己縮小画像と混合ガウス分布モデルを用いた超解像
勾配画像処理に基づく動画中の流体部分抽出
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Normalized Web Distanceを用いた音声認識の誤り訂正法 301-4in
Presentation transcript:

嗜好分類に基づく 個人適応型サッカー映像の 自動生成技術 神戸大学 有木研究室  窪田進太郎

放送の多様化 現代の映像放送は、従来の地上波・数チャンネルではなく、BS、CS、地上波デジタルなども加わり膨大な数に増大している Ex.)スカイパーフェクTV:数百チャンネル 現在の配信型放送ではなく、放送局から配信された映像を各家庭に保存してそれを視聴するサーバ型放送移行するためのインフラの整備が整ってきている Ex.)DVD・HDDレコーダーの普及

放送の多様化による問題点 撮影チャンネルの増大につれ撮影の人員、機材、コストなど放送局の負担の増大 多チャンネル化による映像資源の不足 ↓ 自動処理でコストを削減でき 人間とは違った処理による 質の高い映像を簡易に生成をできる デジタルカメラワークの提案

デジタルカメラワークとは 高解像度固定映像から、映像処理により画像を切り出し、その位置を連続的に変化させることによって新たな映像を生成する手法

デジタルカメラワークとは 長所 映像の先読みが可能なので、人間のように映像の取りこぼしが起こりにくい 元映像さえあれば何種類もの映像が生成できる 短所 視点がひとつしかなく面白みに欠ける →スイッチング技術の研究 画質の制限 →画質の低下しにくい高解像度化の研究

テレビ映像用にプロカメラマンが撮影した映像を、パン処理とズーム処理を用いて模倣 従来手法と提案手法 テレビ映像用にプロカメラマンが撮影した映像を、パン処理とズーム処理を用いて模倣 誰にでも受け入れられる映像 ↓ 誰にでも最適な映像ではなく、 個人に対して最適な映像の生成

処理の流れ 入力映像 画像処理 状況認識 カメラワーク 出力映像 背景差分 ルール適応 嗜好分類 膨張・縮小処理 イベント認識 フレームサイズ 孤立点除去 内枠位置 領域ラベリング フレーム座標 ボール認識

デジタルカメラワークの概要1 ルーズショット、ミドルショット、タイトショットの3種類のフレームサイズを用いる。以下の図が示すようにミドルショットとズームアウトは相互に連続的に変化し、ズームインのシーンを合間に断続的に挿入することによってカメラワークを実現する。   *このルールは嗜好分類によって可変 ミドルショット ルーズショット タイトショット

デジタルカメラワークの概要1 タイトショット ミドルショット ルーズショット

デジタルカメラワークの概要2 画面内に内枠を設け、その中にボールが収まるようにクリッピング座標を移動させていく。これによりボールの微小な動きには反応しない視聴しやすい映像を生成する。 内枠の位置は基本的には中心に設置するが、状況によって移動させることによってボール以外の注目部も映像に収めることができる。

状況認識 フレームサイズの変化のタイミングのルールを設け、それに当てはまるときにフレームサイズを変化させる ルーズショット→ミドルショット ゴール前 ボール付近に選手が密集している時 ミドルショット→ルーズショット ボール付近にロングパスなどでボールが高速に長距離動く時 選手が散開している時 タイトショット ボールの取り合いなどでボールがほとんど動かない状況

状況認識 ルーズショット→ミドルショットの例 →ゴール前に選手が集まっている例

イベント認識 ボール座標が一定時間変化しないようなイベント、すなわち、 フリーキック コーナーキック スローイン ゴールキック ペナルティキック を検出する。ボール座標の継続時間と、ボール座標、オブジェクトとの位置関係によって検出する。 Ex) ボール座標・コーナースポット、選手の集団が比較的近くに存在 → コーナーキック イベントごとにフレームサイズ、内枠の位置を定めておき、それを適応する。 Ex)コーナーキックであればカメラがミドルショットでゴール前を押さえ、ゴールが入るように内枠を上下に移動

イベント認識 イベント認識の例:スローイン ボールの座標:サイドライン 選手の密集地:ボールから離れている ↓ ルーズショットで 内枠を移動

生成映像

個人適応技術 カメラワーク変化パラメータの内、4種類を変化させる→ズーム速度、ズーム処理、画面サイズ、イベント評価 ①ズーム速度:デフォルトは15フレームでそれを変化 ②ズーム処理:三種類の解像度の比率を変化 ③画面サイズ:デフォルトは240*180のものを変化 ④イベント評価:イベントに関して特別な処理を行うかどうか 例)それぞれのプレイを見るのではなく、高解像度映像に近い映像がみたい     →ズーム速度:DOWN(15→24) ズーム処理:高解像度の頻度をUP 画面サイズ:UP(320*240) イベント評価:なし

嗜好分類 個人適応技術に用いたパラメータの入力状況から個人嗜好を6つに分類 望遠:ルーズショットを多用して全体を撮影 個人:タイトショットを多用して全体を撮影 イベント:イベントを重視した撮影 瞬間:望遠と個人の中間の撮影 オフェンス:攻撃側を重視した撮影 ディフェンス:防御側を重視した撮影

嗜好分類 視聴者の生成映像選択による嗜好の学習

嗜好分類 望遠映像

AHP法を用いた映像の評価① AHP法(Analytic Hierarchy Process) 不確定な状況や多様な評価基準における    不確定な状況や多様な評価基準における    意思決定手法であり、評価基準に    個人の嗜好を反映させることができる。 評価項目 ズーム処理 パン処理 ショットサイズ ショット持続時間 画質 試合の流れ 評価対象 提案手法映像(適応前) 高解像度固定映像 TV映像

実験結果・考察① フリースロー以外は認識率90%以上 試合の流れを把握することが最重要 ズーム処理の付与 →映像の基本構成を備え、TV映像と各嗜好の評価の割合が類似 ズーム処理の低評価 →ズーム処理の他基準への影響 フリースロー以外は認識率90%以上 試合の流れを把握することが最重要 ズーム処理の付与 →映像の基本構成を備え、TV映像と各嗜好の評価の割合が類似 ズーム処理の低評価 →ズーム処理の他基準への影響

実験結果・考察② 個人の嗜好に大きくかかわるズーム処理などをなくすことができることにより、ショットサイズ、ショット持続時間の評価向上、 広角を要求する被験者が多かったために画質評価も若干向上 試合の流れに関しては双方変わらず TV映像と比較して、プロの技術が有効なズーム処理・パン処理に関しては劣るものの、個人によって好みが変わるショットサイズ・ショット持続時間には有効

課題 画質の大幅な劣化に対して、質の下がりにくいデジタルズーム 高度なボール追従技術 状況に左右されないイベント認識 主観的な評価だけではなく、TV映像との比較にカメラワークをどれだけ再現できているかという客観的な評価 全景映像を用いての映像生成 より詳細なルールの設定 ズーミング、パンニングに、スイッチングを追加 各評価項目の重みから個人の嗜好を逆算