画像情報特論 (6) - ディジタル圧縮 (3) その他のコンテント 電子情報通信学科 甲藤二郎

Slides:



Advertisements
Similar presentations
シミュレーション演習 G. 総合演習 ( Mathematica 演 習) システム創成情報工学科 テキスト作成: 藤尾 光彦 講義担当: 尾下 真樹.
Advertisements

Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Computer graphics 入門 VRML を使用したCG. 2 1.1 Computer の歴史 (1)自動計算システム ブール代数(1854年)+2進法 +スイッチ回路 ⇒ 1940年後半 (2)プログラム内臓式 computer (現在の もの) 集合論(1895年、カントール)+ ラッセルのパラドックス+ヒルベルトの.
XML ゼミ 独習 XML ~ 第 6 章 XHTML~ 6.1 XHTML の概要 6.2 XHTML の構造 谷津 哲平.
JT-H 265(第 1 版) 高効率ビデオ符号化方式 HIGH EFFICIENCY VIDEO CODING メディア符号化専門委員会 JT- H 265第 1.0 版 OHP- 1.
授業展開#3 アナログとデジタル.
第2章 第2節 情報通信の効率的な方法 1 情報の容量と伝送の特性 2 データの圧縮 3 エラー検出とエラー訂正
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮 情報ネットワーク専攻 甲藤二郎
Signal Masterによる フィルタバンクの実装
第9回放送授業.
画像情報特論 (13) - インターネット放送の実際 (2) - 授業のまとめ RealSystem
工学部 電子情報工学科 T21E        テンジン  ツェリン TENZIN TSERING                  指導教員 吉田 清繁.
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
画像情報特論 (4) - ディジタル圧縮 (1) ビデオ圧縮 電子情報通信学科 甲藤二郎
画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮 電子情報通信学科 甲藤二郎
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
パノラマ動画像モデルによる 仮想空間表現システムの研究
画像情報特論 (5) ディジタル圧縮とメディア表現 (2) 音声・オーディオ、SMIL、グラフィクス 情報ネットワーク専攻 甲藤二郎
3DCGコンテンツの基礎 第5回授業:最終課題制作
Lync Web App クイック リファレンス カード: 会議にコールインする
アプレット (Applet)について.
経営情報 #1 デジタル表現 / 2003 (春) 安田豊 1.
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
大阪工業大学 情報科学部 情報システム学科 宇宙物理研究室 B 木村悠哉
WWW上の3次元空間表現 A three-dimesional space expression on WWW
画像情報特論 (10) - シグナリング - インターネット電話の実際 (1) ITU-T H
VR開発環境の開発 長谷川晶一.
オブジェクト指向言語論 第十三回 知能情報学部 新田直也.
マルチメディア情報の ディジタル表現と処理
Webを利用した授業支援システムの開発 北海道工業大学 電気電子工学科 H 渋谷 俊彦.
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
コンピュータビジョン Computer Vision(CV) パワーポイント 抜粋
大量の映像分析と 抽出した知識に基づく映像合成
NC-2 情報通信基礎実験 WEBデザイン基礎実験 (1日目) 担当:清水,田代 副手:浦辺,石井.
コンテンツ配信 エンコード (符号化) CBR (Constant Bit Rate) VBR (Variable Bit Rate)
第11回 オブジェクト(ベクトル,頂点,面)のクラス化とフラットシェーディング
授業展開#3 アナログとデジタル.
3D散歩ゲーム 08A2043 谷口盛海 種田研究室.
Computer Graphics 第3回 座標変換 芝浦工業大学情報工学科 青木 義満
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
ビデオデータベース.
動画ファイル形式 コンピュータでは、文字や画像、動画、音声といった様々な種類の情報を扱うことができるが、記憶装置に記録されるデータそのものは0と1の情報でしかない。動画ファイルの形式としてはMPEGやAVIです。
多重ベータ分布を用いた音色形状の数理モデリングによる
画像情報特論 (8) - アダプテーション (2) パケット廃棄対策 電子情報通信学科 甲藤二郎
5章  3次元形状を2次元面に投影する 3次元空間内に定義した形状を,2次元面上(ディスプレイのスクリーン面,プリンタの紙面など)に投影して表示するために必要になる変換について説明する.
構造情報に基づく特徴量を用いた グラフマッチングによる物体識別 情報工学科 藤吉研究室  EP02086 永橋知行.
タグを使ったウェブページ作成 兵庫県立伊丹北高等学校 佐藤 勝彦.
Computer Graphics 第10回 レンダリング(4) マッピング
情報コミュニケーション入門e 第11回 Part2 Web入門(1)
端末およびサービス透過的な 情報閲覧支援システムの構築
情報スキル活用 第4週 基礎技術-4 : その1(タグのまとめ).
VRML とJavaによる 3次元動作シミュレーションの実現
CGと形状モデリング 授業資料 1,2限: 大竹豊(東京大学) 3,4限: 俵 丈展(理化学研究所)
Spatial Linker - 空間コンテンツ融合の研究 -
画像情報特論 (1) - インターネット電話とインターネット放送 はじめに 電子情報通信学科 甲藤二郎
音声合成.
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
画像情報特論 (1) - インターネット電話とインターネット放送 はじめに 情報ネットワーク専攻 甲藤二郎
独習XML ~第1章 XMLの基礎~ 1.1 XML文書の基礎 1.2 XMLとHTML
ここにタイトルを入力 ここにサブタイトルを入力 草原 (初級)
エラー訂正符号を含むシステム CD, DAT, MD, DVD, ディジタルVTR等 ディジタル(衛星)TV放送 ディジタル・セルラ
プログラミング言語論 第十四回 理工学部 情報システム工学科 新田直也.
ヒープソート.
ビデオデータベースを用いた 流体画像に基づくアニメーション生成
ソースフィルタモデル.
オブジェクト指向言語論 第十三回 知能情報学部 新田直也.
画像情報特論 (1) - インターネット電話とインターネット放送 はじめに 電子情報通信学科 甲藤二郎
市松模様を使用した カメラキャリブレーション
Presentation transcript:

画像情報特論 (6) - ディジタル圧縮 (3) その他のコンテント 2001.05.22 電子情報通信学科 甲藤二郎 電子情報通信学科 甲藤二郎 E-Mail: katto@katto.comm.waseda.ac.jp

ストリーミングとコンテンツ

コンテンツの進化 ストリーミング (リアルタイム) 将来? 3D ビデオ AV CGストリーミング プレゼンテーション 記述 ゲーム CG ウェブ ダウンロード 受動的 能動的 (インタラクティブ)

3D ムービー ... ? 視聴者参加型映画 ? 視点移動、 インタラクション、 ... テクスチャ (静止画 or 動画) サウンド 三次元シーン記述 (CG) アニメーション記述 シナリオ記述 “Toy Story 2” © Disney/Pixar

いろいろな試み プレゼンテーション記述 (SMIL 等) CG 記述フォーマット (VRML 等) CG ストリーミング (MPEG4 等)

SMIL ・ リアルタイムメディアのプレゼンテーション記述 * Synchronized Multimedia Integration Language ・ リアルタイムメディアのプレゼンテーション記述 <smil> <head> <layout> レイアウト記述 </layout> </head> <body> <par> メディア記述 </par> </body> </smil> * XML ベース ... HTML に慣れていれば習得は簡単

レイアウト記述 表示画面 レイアウト記述 root a b SMIL レイアウト記述 root a <root-layout width=“500” height=“400”/> <region id=“a” top=“50” left=“50” width=“100” height=“80” /> <region id=“b” top=“200” left=“50” width=“400” height=“200” /> b 表示画面 レイアウト記述

メディア記述 <par> メディア1, メディア2, … </par> 複数メディアの「並列」再生 SMIL メディア記述 ストリーミング <par> <video region=“b” src=“rtsp://www.foo.ac.jp/guide.sdp” /> <seq> <img region=“a” src=“http://www.foo.ac.jp/point0.jpg” dur=“10s” /> <img region=“a” src=“http://www.foo.ac.jp/point1.jpg” dur=“10s” /> <img region=“a” src=“http://www.foo.ac.jp/point2.jpg” dur=“10s” /> </seq> </par> <par> メディア1, メディア2, … </par> 複数メディアの「並列」再生 <seq> メディア1, メディア2, … </seq> 複数メディアの「逐次」再生 <video>, <audio>, <img>, ... 各種メディアタグ

VRML ・ 三次元CGの記述フォーマット * Virtual Reality Modeling Language VRML記述 Transform { translation 15 10 0 Shape { geometry Box 2 2 2 } translation 0 0 -1 geometry Cylinder ... シーングラフ “Hello” シーン合成

VRML 2.0 のノード一覧 グループ: Billboard Group Inline LOD Switch Transform 形状特性: Coordinate Color Normal TextureCoordinate センサ: Anchor Collision CylinderSensor PlaneSensor ProximitySensor SphereSensor TimeSensor TouchSensor VisibilitySensor その他: AudioClip Background Fog FontStyle NavigationInfo Script Sound WorldInfo アピアランス: Appearance Material ImageTexture PixelTexture MovieTexture TextureTransform 形状: Shape Box Cone Cylinder ElevationGrid Extrusion IndexedFaceSet IndexedLineSet PointSet Sphere Text インタポレーター: ColorInterpolator CoordinateInterpolator NormalInterpolator OrientationInterpolator PositionInterpolator ScalarInterpolator 光源、視点: DirectionalLight PointLight SpotLight Viewpoint

MPEG-4 Systems/SNHC 目的: 従来の AV 系システムへの CG、コンピュータミュージック等の取り込み MPEG4 自然音響符号化 多重化 多重化分離 自然音響復号 合成 自然画像符号化 自然画像復号 グラフィクス符号化 グラフィクス復号 出力 合成音響符号化 合成音響復号 テキスト符号化 テキスト復号 シーン符号化 シーン復号 インタラクション 目的: 従来の AV 系システムへの CG、コンピュータミュージック等の取り込み

(1) シーン記述 (MPEG4 BIFS) VRMLのストリーミング拡張 Hello + * Binary Format for Scene ネットワーク 蓄積媒体 シーン記述 シーン合成 VRMLのストリーミング拡張 シーングラフ (VRML) シーングラフのストリーミング 合成シーン Hello + CG 従来のAVストリーミング ビデオ オーディオ 顔画像アニメーション

(2) 顔画像アニメーション 顔画像パラメータ: 顔画像 パラメータ 顔画像 合成 MPEG4 (2) 顔画像アニメーション 顔画像 パラメータ 顔画像 合成 ネットワーク 蓄積媒体 顔画像パラメータ: FAP (Facial Animation Parameter) 顔の基本的な動きの表現。 FAP 初期値で基本的な顔を転送。以下は差分を転送 (ストリーミング)。 FAP を与えない場合には「ニュートラルフェイス」を使用。 FDP (Facial Definition Parameter) FAP で与えられる一般的な顔画像のカスタマイズ。 セッション開始時に転送 (オプション)。

FAP 頭、眉、まぶた、目、鼻、唇、耳、 歯、舌、あご、頬などについて、 計68個のFAPが定義される。 各FAPは、あご、目、舌、耳、鼻 MPEG4 FAP 頭、眉、まぶた、目、鼻、唇、耳、 歯、舌、あご、頬などについて、 計68個のFAPが定義される。 各FAPは、あご、目、舌、耳、鼻 などを表す10個のグループのい ずれかに属する。 最小パラメータでアニメーションを 行うために、Visime、Expression と呼ばれるマクロも定義されている。 (グループ番号、サブグループ番号)

FDP 顔画像のカスタマイズ: 顔の形状情報の修正、テクスチャ マッピング等。計83個の特徴点が 定義されている。 MPEG4 FDP 顔画像のカスタマイズ: 顔の形状情報の修正、テクスチャ マッピング等。計83個の特徴点が 定義されている。 パラメータ記述は、BIFS (VRML) のシーングラフ構造に従う。特徴 点座標、テクスチャ座標、テクス チャ画像、などが与えられる。 キャリブレーション: セッション開始時にFDPを転送 すること。

(3) 人体アニメーション 人体パラメータ: 人体 パラメータ 人体合成 BAP (Body Animation Parameter) MPEG4 (3) 人体アニメーション 人体 パラメータ ネットワーク 蓄積媒体 人体合成 人体パラメータ: BAP (Body Animation Parameter) 人体の基本的な動きの表現。 BAP 初期値で基本的な人体を転送、以下は差分を転送 (ストリーミング)。 BAP を与えない場合には「デフォルト人体」を使用。 BDP (Body Definition Parameter) BAP で与えられる一般的な人体のカスタマイズ。 セッション開始時に転送 (オプション)。

BAP BDP 腰、膝、足首、踵、肩、肘、手首、指 などについて、計186個のBAPが 定義されている。 各BAPは、足、腕、背骨などを表す MPEG4 BAP 腰、膝、足首、踵、肩、肘、手首、指 などについて、計186個のBAPが 定義されている。 各BAPは、足、腕、背骨などを表す 19個のグループのいずれかに属す る。 BDP VRML 記述に従って、形状、テクス チャをカスタマイズする。 VRML Humanoid ワーキンググルー プとのジョイント。 デフォルト人体モデル

(4) 三次元メッシュ符号化 三次元メッシュ: 三次元メッシュ符号化: MPEG4 (4) 三次元メッシュ符号化 三次元メッシュ: ポリゴンの頂点座標 + 頂点間の接続情報 + 各種特性情報、として表される 三次元メッシュ符号化: 上記のメッシュ記述の圧縮&バイナリ変換。 G.Taubin: “Geometric Compression Through Topological Surgery,” ACM Trans on Graphics.

ブロック構成 三段階の符号化: 1. ポリゴン頂点の接続情報 (connectivity) の符号化 MPEG4 ブロック構成 3次元 メッシュ 接続情報 符号化 多重化 多重化分離 接続情報 復号 3次元 メッシュ 再構成 頂点 頂点 頂点座標 符号化 頂点座標 復号 三段階の符号化: 1. ポリゴン頂点の接続情報 (connectivity) の符号化 2. ポリゴン頂点の三次元座標 (geometry) の符号化 3. 色、法線、テクスチャ座標などの特性 (property) の符号化

接続情報の符号化 [1] シンプルメッシュ 頂点木 頂点の接続関係 三次元メッシュ 一頂点の選択と 頂点木の作成 二次元平面に展開 MPEG4 接続情報の符号化 [1] シンプルメッシュ 頂点木 頂点の接続関係 三次元メッシュ 3 5 2 4 11 一頂点の選択と 頂点木の作成 9 7 12 10 二次元平面に展開 (一番外側が選択頂点) デュアルグラフ (三角木) の作成 三角木の符号化 (次ページ) (カットスルー) ポリゴンループ デュアルグラフ (三角木) G.Taubin: “Geometric Compression Through Topological Surgery,” ACM Trans on Graphics.

接続情報の符号化 [2] ポリゴン 接続関係の符号化 ルート (開始線) 左エッジ (1) 両方 (3) 符号化ルール 右エッジ (2) MPEG4 接続情報の符号化 [2] ポリゴン 接続関係の符号化 ルート (開始線) 左エッジ (1) 両方 (3) 符号化ルール 右エッジ (2) 現在のエッジ G.Taubin: “Geometric Compression Through Topological Surgery,” ACM Trans on Graphics.

頂点座標の符号化 (1) ポリゴンによる予測 符号化対象の頂点を、ポリゴン を構成する頂点の一つと仮定し て、座標を外挿予測。 MPEG4 頂点座標の符号化 (1) ポリゴンによる予測 符号化対象の頂点を、ポリゴン を構成する頂点の一つと仮定し て、座標を外挿予測。 (2) 平均による予測 符号化対象の頂点を、それを囲 むポリゴンの重心と仮定して、座 標を内挿予測。 仮想的なポリゴン

(5) 合成オーディオ オーディオ合成パラメータ: オーディオ 合成 パラメータ オーディオ MPEG4 (5) 合成オーディオ オーディオ パラメータ 合成 オーディオ ネットワーク 蓄積媒体 オーディオ合成パラメータ: SAOL (Structured Audio Orchestra Language): 楽器の特徴、信号処理方法を記述する言語 ... 音源物理モデルに相当。 SASL (Structured Audio Score Language): 楽譜情報を記述するフォーマット ... MIDI に相当。 SABSF (SA Bank Sample Format): 音源波形をそのまま使うフォーマット ... PCM 音源に相当。

その他の試み 三次元形状圧縮: 三次元ストリーミング: Metastream (階層化メッシュ + CGストリーミング) http://www.metastream.com XVL (曲面記述を活用した形状圧縮) http://www.lattice.co.jp 三次元ストリーミング: SpaceStream (VRML + AV/CGストリーミング) http://www.sony.co.jp/SpaceStream ほか、面白そうな試みがあれば甲藤まで