画像情報特論 (4) - ディジタル圧縮 (1) ビデオ圧縮電子情報通信学科甲藤二郎

Slides:

Advertisements

Similar presentations

JT-H ２６５（第 1 版）高効率ビデオ符号化方式 HIGH EFFICIENCY VIDEO CODING メディア符号化専門委員会ＪＴ－ H ２６５第 1.0 版 OHP- １.

Advertisements

授業展開＃３アナログとデジタル.

量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化･符号化）.

画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮情報ネットワーク専攻甲藤二郎

Signal Masterによるフィルタバンクの実装

第9回放送授業.

動画像処理特論１動画像の獲得と保存.

画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮情報ネットワーク専攻甲藤二郎

第四章　情報源符号化の基礎４・１　情報量とエントロピー４・２　エントロピー符号化４・３　音声符号化４・４　画像符号化.

J107　マルチメディアとは②　動画と音声マルチメディアとは② 動画と音声 J107 中３情報.

Motion-JPEG2000を使ったノードに最適な動画像配信

画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮電子情報通信学科甲藤二郎

画像セグメンテーションにおけるウェーブレット係数の局所テクスチャ特徴を用いたGraph Cuts

Chapter11-4(前半) 加藤健.

HOG特徴に基づく単眼画像からの人体3次元姿勢推定

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第四回　演習課題画像中からの物体抽出処理（背景情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/15.

パノラマ動画像モデルによる仮想空間表現システムの研究

第1章第1節情報のディジタル化のしくみ 4 音の表現 5 画像の表現

LZ圧縮回路の設計とハード・ソフト最適分割の検討電子情報デザイン学科高性能計算研究室４回生　中山　和也 2009/2/27.

第1章第1節情報のディジタル化のしくみ 4 音の表現 5 画像の表現

平成23年8月情報学群岡田守このスライドは，前川佳徳編著による「コンピュータグラフィックス」(オーム社）を基に作成されている．

符号化のための重み付きジョイントバイラテラルフィルタを用いた奥行き画像超解像

「データ学習アルゴリズム」第３章複雑な学習モデル 3.1 関数近似モデル ….. … ３層パーセプトロン

第三章　ディジタル符号変換の基礎３・１PCMパルス符号変換３・２符号変換３・３通信路符号形式３・４スクランブル.

時空間データからのオブジェクトベース知識発見

クロストーク成分の相互相関に着目した音場再生システム

画像情報特論 (7) アダプテーション (2) パケット廃棄対策、TCPフレンドリ情報ネットワーク専攻甲藤二郎

マルチメディア情報のディジタル表現と処理

首都大学東京都市教養学部数理科学コース関谷博之

ワイヤレス通信におけるMIMO伝送技術.

コンピュータビジョン Computer Vision(CV) パワーポイント抜粋

実時間動画像マルチキャストのためのフィルタリング手法の実装と評価

ディジタル回路 1. アナログとディジタル五島正裕.

表紙 MATLAB 応用講習会（A）情報アシスタント　M1　山本幸司.

※DES／RSA暗号に関する計算問題（演習・レポート課題）と似た問題は出題しません。

授業展開＃３アナログとデジタル.

画像処理　基礎.

画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮電子情報通信学科甲藤二郎

ビデオデータベース.

動画ファイル形式コンピュータでは、文字や画像、動画、音声といった様々な種類の情報を扱うことができるが、記憶装置に記録されるデータそのものは0と1の情報でしかない。動画ファイルの形式としてはMPEGやAVIです。

視点移動カメラにおけるカメラキャリブレーション

2008年度情報数理～様々なデジタル情報～.

情報数理～様々なデジタル情報～２００７年度担当教員：幸山直人.

デザイン情報学科メディア情報設計河原英紀

画像情報特論 (8) - アダプテーション (2) パケット廃棄対策電子情報通信学科甲藤二郎

高度情報演習1A “テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第二回演習課題

高度情報演習1C 実践画像処理プログラミング第二回演習課題

デザイン情報学科メディア情報設計河原英紀

東京農業大学東京情報大学附属第一高等学校・中等部附属第二高等学校附属第三高等学校・中等部

QRコードを用いたIDカードに適した電子透かし

－画像処理（空間フィルタリング）－画像処理（空間フィルタリング）のモデルとその基本操作雑音除去・平滑化への適用

2012年度情報数理～様々なデジタル情報（１）～.

アナログとディジタルアナログ，ディジタル：情報処理の過程：記録/伝送と処理において，媒体（メディア）の持つ物理量と

Hoffman符号 2011/05/23.

画像情報特論 (1) - インターネット電話とインターネット放送はじめに電子情報通信学科甲藤二郎

Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション

Bottom-UpとTop-Down アプローチの組み合わせによる単眼画像からの人体3次元姿勢推定

2010年度情報数理～様々なデジタル情報（１）～.

適応信号処理とその応用大阪府立大学大学院工学研究科電気・情報系専攻大松　繁.

アナログとデジタル.

画像情報特論 (7) アダプテーション (2) パケット廃棄対策、TCPフレンドリ電子情報通信学科甲藤二郎

第２回標本化と量子化.

画像情報特論 (1) - インターネット電話とインターネット放送はじめに情報ネットワーク専攻甲藤二郎

エラー訂正符号を含むシステム CD, DAT, MD, DVD, ディジタルVTR等ディジタル（衛星）TV放送ディジタル･セルラ

ソースフィルタモデル.

画像情報特論 (1) - インターネット電話とインターネット放送はじめに電子情報通信学科甲藤二郎

※演習や小テスト（DES／RSA暗号に関する計算問題）と似た問題は出題しません。

2019年度情報数理特論B ～様々なデジタル情報（１）～.

アナログとディジタルアナログ，ディジタル：情報処理の過程：記録/伝送と処理において，媒体（メディア）の持つ物理量と

Presentation transcript:

画像情報特論 (4) - ディジタル圧縮 (1) ビデオ圧縮 2001.05.08 電子情報通信学科甲藤二郎電子情報通信学科甲藤二郎 E-Mail: katto@katto.comm.waseda.ac.jp

ビデオ圧縮の原理

ディジタル動画 (1) 時間方向・空間方向のサンプリング RGB / YUV 変換カメラビデオキャプチャ時間 R Y G U B V フレーム時間フレーム周期 (1/30秒～) RGB / YUV 変換 R Y G U B V RGB各８ビット YUV各８ビット

ディジタル動画 (2) CCIR 601 フォーマット 4:4:4 4:2:2 4:2:0 通常のビデオ圧縮： 4:2:0 フォーマット Y Y Y U U U V V V YUV解像度同じ UV垂直解像度半分 UV水平・垂直解像度半分通常のビデオ圧縮： 4:2:0 フォーマット高画質ビデオ圧縮： 4:2:2 フォーマット

ディジタル動画 (3) 莫大な情報量用途解像度データ量 TV会議 352x240 21Mbit/s TV 720x480 HDTV 1920x1080 498Mbit/s データ圧縮の必要性

ビデオ圧縮の基本 MC+DCT ハイブリッド予測符号化 (20年間変わらない方式) - + 符号量制御 YUV入力圧縮ストリーム DCT 量子化エントロピー符号化 - 逆量子化逆DCT 時間方向の相関除去： MC (動き補償： motion compensation) 空間方向の相関除去： DCT (離散コサイン変換： discrete cosine transform) + 動き補償メモリ局所デコーダ動き検出 Q: 局所デコーダが必要な理由を説明せよ

フレーム内符号化 DCT フレーム画像信号の性質：隣接画素間の相関が非常に高い (相関係数: 0.9 ～) ブロック直交変換空間方向の相関除去フレーム内符号化 DCT フレーム画像信号の性質：隣接画素間の相関が非常に高い (相関係数: 0.9 ～) ブロック直交変換 DCT (離散コサイン変換) 特定の変換係数にエネルギーが集中隣接ブロック間でさらに予測 (特に直流成分)

直交変換 (1) DCTが使われる理由 KLT, DCT, DFT の符号化利得の比較空間方向の相関除去圧縮効率理論的最適値 3 4 5 6 7 8 9 10 11 2 12 14 16 GAIN (dB) OPTIMUM ( r=0.95 ) KLT, DCT DFT KLT: 理論的に最適な直交変換。 DCT: 相関の高い入力に対する KLTへの漸近性、及び高速アルゴリズムが存在。通常は 8x8 サイズのDCTを使用。 SIZE 直交変換のブロックサイズ

直交変換 (2) Wavelet 変換 (対抗) LL LH H 2分割フィルタバンクのツリー接続 p 長所：ブロックひずみが少ない空間方向の相関除去直交変換 (2) Wavelet 変換 (対抗) h0(n) LLL 2 h0(n) 2 h1(n) h0(n) LLH 2 2 x(n) h1(n) LH 2 h1(n) 2 H 2分割フィルタバンクのツリー接続 p 角周波数 LLL LLH LH H LL LH 長所：ブロックひずみが少ない短所：ブロック動き補償と相性が悪い H ピラミッド表現

直交変換 (3) DCT と Wavelet の比較 DCT：動画 (ビデオ) 圧縮 Wavelet: 静止画圧縮 (JPEG-2000) 空間方向の相関除去直交変換 (3) DCT と Wavelet の比較理論的最適値圧縮効率 DCT, Wavelet の符号化利得 11 OPTIMUM ( r=0.95 ) 10 DCT(16) DCT(8) 9 8 DCT(4) GAIN (dB) 7 6 5 Wavelet: 4 ●　直交CQF (16tap) ▲　SSKF (5/3) 3 1 2 3 4 STAGES Wavelet の多段接続数 DCT：動画 (ビデオ) 圧縮 Wavelet: 静止画圧縮 (JPEG-2000)

フレーム間符号化 (1) IP 予測 I P P P P P P ビデオ信号の性質：フレーム間の予測誤差がほとんどゼロ時間方向の相関除去フレーム間符号化 (1) IP 予測 I P P P P P P ビデオ信号の性質：隣接フレーム間の相関が非常に高い (相関係数: 0.9 ～) フレーム間の予測誤差がほとんどゼロ I: I ピクチャ (フレーム内符号化) P: P ピクチャ (フレーム間符号化) さらに動き検出・動き補償予測

フレーム間符号化 (2) IPB 予測 I B B P B B P 片方向で予測を行うより、両方向で時間方向の相関除去フレーム間符号化 (2) IPB 予測 I B B P B B P 片方向で予測を行うより、両方向で予測を行うほうが予測効率が高い (ただし、フレーム間の距離に依存) I: I ピクチャ (フレーム内符号化) P: P ピクチャ (片方向予測) B: B ピクチャ (両方向予測) → 予測効率の改善

フレーム間符号化 (3) フィールド予測 I B B P B B P 奇数フィールド偶数フィールド時間方向の相関除去フレーム間符号化 (3) フィールド予測 I B B P B B P 奇数フィールド偶数フィールドディジタルTV放送に対応 (MPEG-2) 動き補償：フィールド予測、フレーム予測、デュアルプライム予測 DCT: フレームDCT、フィールドDCT

動き検出と動き補償 (1) 動き検出 (ブロックマッチング)：時間方向の相関除去動き検出と動き補償 (1) 動き検出 (ブロックマッチング)：　過去の画像 (参照フレーム) から、現在の画像 (カレントフレーム) に最も類似　しているブロックを探索し、動きベクトルを求める。動き補償：　動き検出で求めた動きベクトルから、カレントフレームの予測画像 (予測フレーム) 　を作成する。 ③ 予測誤差 ① 動き検出 - 参照フレームカレントフレーム予測フレーム類似動きベクトルブロックブロック ② 動き補償

動き検出と動き補償 (2) 半画素精度動き補償: 線形内挿を行い、0.5 画素精度の動きベクトルを算出し、予測画像を作成。線形内挿画素時間方向の相関除去動き検出と動き補償 (2) 半画素精度動き補償: 　線形内挿を行い、0.5 画素精度の動きベクトルを算出し、予測画像　を作成。線形内挿画素内挿フィルタ：画素 0.5 0.5 各々0.25 (注) 1/4精度、1/8精度の効果はほぼ飽和

動き検出と動き補償 (3) オーバーラップ動き補償: 隣接ブロックの動きベクトルも利用し、ブロックの平滑化加算によって予測画像を作成。時間方向の相関除去動き検出と動き補償 (3) オーバーラップ動き補償: 　隣接ブロックの動きベクトルも利用し、ブロックの平滑化加算によって　予測画像を作成。通常のブロックマッチング参照フレーム予測フレームオーバーラップ動き補償参照フレーム予測フレーム平滑化：台形ウィンドウ、コサインウィンドウなど。平滑化

動き検出と動き補償 (4) 特性比較時間方向の相関除去予測誤差の低減効果動き予測しにくい画像の場合動き予測しやすい画像の場合整数画素精度・ブロック動き補償に対する半画素精度・オーバーラップ動き補償の予測利得 0.5 1 1.5 2 2.5 3 3.5 4 0.7 0.75 0.8 0.85 0.9 0.95 Estimation Reliability Gain (dB) オーバーラップ+半画素半画素のみオーバーラップのみ予測誤差の低減効果整数精度ブロックマッチング動き予測しにくい画像の場合動き予測しやすい画像の場合

動き検出と動き補償 (5) 動き補償の難しさ： (1) 予測誤差を下げるだけならばブロックサイズを小さくすればよいが、時間方向の相関除去動き検出と動き補償 (5) 動き補償の難しさ：　(1) 予測誤差を下げるだけならばブロックサイズを小さくすればよいが、　　　動きベクトルの情報量が増加する。　(2) ブロックではなく、任意形状の動き検出を行うことで予測誤差を小さ　　　くできるが、形状表現のための情報量が増加する。動き補償の現状：　(1) 予測誤差と動きベクトルの情報量のトレードオフを考慮し、通常は　　　16x16 のブロックを使用。8x8 の適応選択も可能。　(2) 実現の容易性から、半画素動き補償を採用。計算の複雑性から、　　　オーバーラップ動き補償はオプション。 (参考) AIC基準、MDL基準：オーバーヘッドも含めたデータ最小化の評価尺度

国際標準方式

国際標準方式 (1) ITU-T H.261 ISDN用テレビ電話団体名称当初の用途 H.263 アナログ回線用テレビ電話 1990年時期 1996年 MPEG-1 CD-ROM 1992年 MPEG-2* ディジタル放送 1995年 MPEG-4 インターネット、移動体 1999年 ISO H.263+ 1998年 64kb/s～2Mb/s 符号化レート数十kb/s～～1.5Mb/s 数Mb/s～数十Mb/s * MPEG-2/H.262はISOとITU-Tのジョイント規格

国際標準方式 (2) 82 84 86 88 90 92 94 96 98 00 MC (動き補償) DCT MC+DCT の基本構成 H.120 Sub-rate H.261 H.262 H.263 / H.263+ H.26L ITU-T 1.5M 384K 64K - 1.5M ATM モデム, Internet, 移動体 ISDN MPEG-1 MPEG-2 MPEG-4 MPEG CD-ROM 放送、DVD、 HDTV Internet, 移動体、ゲーム MPEG-7 cf. 画像検索

国際標準方式 (3) 代表的な機能の比較名称 MC+DCT 1/2画素 IPB予測フィールド再同期 H.261 ○ - - - - - 形状符号化再同期スケーラビリティ H.261 ○ - - - - - - H.263 ○ ○ △ - - - - MPEG-1 ○ ○ ○ - - ○ - MPEG-2 ○ ○ ○ ○ - ○ ○ H.263+ ○ ○ △ - △ ○ ○ MPEG-4 ○ ○ ○ ○ ○ ○ ○ インターネット放送で有効 + 符号量制御 (後述)

形状符号化 (1) オブジェクト合成シーン合成 Hello “Hello” 前景 (形状符号化) 背景テキスト MPEG-4 形状符号化 (1) オブジェクト合成前景 (形状符号化) シーン合成 Hello 背景テキスト “Hello” (注) 形状取得方法 (領域分割方法) は標準化の対象外

形状符号化 (2) 境界マクロブロック通常のフレーム (CIF, QCIF, …) オフセット (x, y) VOP領域 (w, h) スキップマクロブロック境界マクロブロック通常のマクロブロック

形状符号化 (3) 境界マクロブロックにおけるパディング処理境界MBの動き検出・動き補償 (1) 形状範囲外をパディング水平パディング垂直パディング境界MBの動き検出・動き補償 (1) 形状範囲外をパディング (2) ポリゴンマッチング (3) 予測画像作成境界マクロブロック境界MBのテクスチャ符号化 (1) I-ピクチャ：ブロック内平均値でパディングしたブロックに DCT (2) P-ピクチャ：形状範囲外を0でパディングしたブロックに DCT

形状符号化 (4) 形状の符号化 (1) バイナリ符号化 (2) グレイスケール符号化 2値画像 (0,1) として符号化 (0, 255) の画素とみなして符号化 (DCT) (参考) (R, G, B, A)、(Y, U, V, A) フォーマット A: アルファマップ (コンピュータグラフィックス用語) A = 0: 透過、形状無し (transparent) A = 255: 形状あり (opaque) A = 1 ～ 254: アルファブレンディング (前景と背景の混合)

ビデオ圧縮の今後？

ビデオ圧縮の今後 (1) 圧縮効率の飽和： MC+DCT ハイブリッド方式は、大枠として20年間変わらない。国際標準　化と共に進化し、圧縮効率は実用レベルに到達、各種の商品化。反面、　圧縮効率はほぼ飽和 (現状)。ニーズの変化：　圧縮率の改善、ハードウェア化の時代から、付加機能の充実とソフトウ　ェアプレイヤの時代へ。次のブレークスルーは？　？ただし、現在のスタイルに拘る必要はない。これまで関係の無かった　分野の技術の応用が重要かもしれない。

ビデオ圧縮の今後 (2) 回路規模 SW SW / HW 小 HW (mpegplay) (DSP+RISC) (MPEG2) ラック数個！アクセラレーションカード HW MMX (mpegplay) マルチコーデックソフトウェアデコーダシステム取込み (DSP+RISC) 高解像度化 (MPEG2) シングルチップマルチチップラック数個！ (ME, DCT, 制御CPU) ワイアド・ロジック大 80 90 00