An Algorithm for Low Memory Bandwidth Wavelet Video Compression and its VLSI Implementation 大阪大学大学院工学研究科 情報システム工学専攻 情報システム工学基礎論講座 情報システム構成学領域 博士後期課程3年.

Slides:



Advertisements
Similar presentations
生体情報を利用したオンライン認証システムに関する研 究 情報工学科 大山・山口・小尾研究室 学士課程4年田中 丈登.
Advertisements

JT-H 265(第 1 版) 高効率ビデオ符号化方式 HIGH EFFICIENCY VIDEO CODING メディア符号化専門委員会 JT- H 265第 1.0 版 OHP- 1.
授業展開#3 アナログとデジタル.
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
電子透かしにおける マスキング効果の主観評価
Signal Masterによる フィルタバンクの実装
第9回放送授業.
画像情報特論 (4) - ディジタル圧縮 (1) ビデオ圧縮 電子情報通信学科 甲藤二郎
Motion-JPEG2000を使ったノードに最適な動画像配信
画像情報特論 (4) ディジタル圧縮とメディア表現 (1) ビデオ圧縮 電子情報通信学科 甲藤二郎
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
Chapter11-4(前半) 加藤健.
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
計算機システムⅡ 主記憶装置とALU,レジスタの制御
計算機アーキテクチャ特論Chapter.6.6~6.9
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
平成23年8月 情報学群 岡田 守 このスライドは, 前川佳徳編著による「コンピュータグラフィックス」(オーム社)を基に作成されている.
符号化のための重み付きジョイントバイラテラルフィルタを用いた 奥行き画像超解像
神奈川大学大学院工学研究科 電気電子情報工学専攻
第三章 ディジタル符号変換の基礎 3・1PCMパルス符号変換 3・2符号変換 3・3通信路符号形式 3・4スクランブル.
Solid State Transformer (SST)
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
クロストーク成分の相互相関に 着目した音場再生システム
TCPデータ通信との公平性を考慮した 輻輳適応能力を有する MPEG動画像通信のための品質調整機構
ウェーブレット変換と 非線形適応信号処理を用いた 電子透かしの研究
マルチメディア情報の ディジタル表現と処理
首都大学東京 都市教養学部数理科学コース 関谷博之
コンピュータビジョン Computer Vision(CV) パワーポイント 抜粋
画像処理ボード上での 高速テンプレートマッチングの 実装と検証
実時間動画像マルチキャストのための フィルタリング手法の実装と評価
コンテンツ配信 エンコード (符号化) CBR (Constant Bit Rate) VBR (Variable Bit Rate)
Ibaraki Univ. Dept of Electrical & Electronic Eng.
プロキシ協調型動画像配信システムの検討 大阪大学 若宮 直紀.
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
2005年11月2日(木) 計算機工学論A 修士1年 No, 堀江準.
第7回 2006/6/12.
周波数領域での非線形適応システムを用いた電子透かしの耐性評価
大阪大学 大学院工学研究科 極限光通信工学領域 井上研究室 欅田 直也・橘 遼太郎・隅田 拓也・高 祥史
授業展開#3 アナログとデジタル.
画像処理 基礎.
高速剰余算アルゴリズムとそのハードウェア実装についての研究
デザイン情報学科 メディア情報設計 河原英紀
高度情報演習1C 実践 画像処理プログラミング 第二回 演習課題
巡回冗長検査CRC32の ハード/ソフト最適分割の検討
QRコードを用いたウェーブレット変換による 電子透かし
コンピュータの基本構成について 1E16M001-1 秋田梨紗 1E16M010-2 梅山桃香 1E16M013-3 大津智紗子
QRコードを用いたIDカードに 適した電子透かし
Simulink で NXT を 動かしてみよう Simulink で NXT を動かす 微分値算出とフィルタ処理 ノーマルモード
2012年度 情報数理 ~ 様々なデジタル情報(1) ~.
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
適応信号処理とその応用 大阪府立大学大学院工学研究科 電気・情報系専攻 大松 繁.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
コンピュータアーキテクチャ 第 9 回.
画像処理工学 2011年12月1日 担当教員 北川 輝彦.
コンピュータアーキテクチャ 第 5 回.
Cソースコード解析による ハード/ソフト最適分割システムの構築
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
計算機アーキテクチャ1 (計算機構成論(再)) 第二回 命令の種類と形式
1ーQー18 音声特徴量抽出のための音素部分空間統合法の検討
コンピュータアーキテクチャ 第 9 回.
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
コンピュータアーキテクチャ 第 5 回.
ILC衝突点ビームモニターのための 読み出し回路の開発
ソースフィルタモデル.
自己縮小画像と混合ガウス分布モデルを用いた超解像
並列処理プロセッサへの 実数演算機構の開発
2019年度 情報数理特論B ~ 様々なデジタル情報(1) ~.
情報システム基盤学基礎1 コンピュータアーキテクチャ編
Presentation transcript:

An Algorithm for Low Memory Bandwidth Wavelet Video Compression and its VLSI Implementation 大阪大学大学院工学研究科 情報システム工学専攻 情報システム工学基礎論講座 情報システム構成学領域 博士後期課程3年 大巻 ロベルト 裕治

発表内容 1.研究の背景 2.離散ウェーブレット変換とその画像圧縮へ の 応用 3.ハードウェア向き DWT アルゴリズムの概要 3.1 離散ウェーブレット変換 3.2 埋め込みゼロツリー 3.3 評価結果 4.アーキテクチャおよび実装結果 5.結論

背景 (1) マルチメディアデータの様々な分野に おける利用 静止・動画像符号化アルゴリズムに要求される 機能の多様化 スケーラビリティ 解像度 ビットレート 従来の符号化アルゴリズムでは対応が困難

背景 (2) 離散ウェーブレット変換 ( DWT : Discrete Wavelet Transform ) 自然画像の圧縮に適している 解像度のスケーラビリティ 埋め込みコードの出力によるビットレートのス ケーラビリティ ハードウェア実装に適した DWT ベースの動画像符号化手法 の考案,およびその VLSI 化実現 大容量のメモリが必要 VLSI 化が困難

発表内容 1.研究の背景 2.離散ウェーブレット変換とその画像 圧縮への応用 3.ハードウェア向き DWT アルゴリズムの概要 3.1 離散ウェーブレット変換 3.2 埋め込みゼロツリー 3.3 評価結果 4.アーキテクチャおよび実装結果 5.結論

ウェーブレット変換 「小さな波」へのシフトとスケール操 作によって生成される関数基底による 信号の近似 シフト スケール

2次元離散ウェーブレット変 換 原画像 水平方向1次元 DWT 垂直方向1次元 DWT 低周波成分と高周波成分に分割 (情報は低周波成分に集中) 空間情報の保存

EZW ( Embedded Zerotree Wavelet) アルゴリズム DWT 係数の特徴 絶対値が小さい値が多い サブバンド間の相関性 ゼロツリーデータ構造を導入 埋め込みコードを生成することにより、1つのビットストリーム であらゆるビットレートに対応 データアクセスが複雑なため、 DWT 係数を格納するために 大容量バッファが必要

EZW による DWT 係数の符号化 2次元 DWT EZW 算術符号化 係数 バッファ bitstream Pixel val. 転置 メモリ DWT coef. EZW code メモリ容量 / バンド幅 の増大

DWT と DCT( 離散コサイン変 換) DCTDWT ブロック ノイズ 有り (低ビットレート 時) 無し レート 制御 複雑 EZW により容 易に実現 処理単位 ブロック単位 (8  8) フレーム全体 DWT では大容量のメモリが必要

2次元 DWT におけるメモリ削減 Overlapped Block-based DWT overlap 水平1- D DWT と垂直1- D DWT を並行して行う Line-Based DWT 互いにオーバーラップする ブロックを単位に2次元 DWT を実行

従来方式の問題点 オーバーラップブロックベース DWT で は大量のレジスタが必要 制御回路の増大 DWT , EZW 間に必要となるバッファに ついては考慮されていない

まとめ 離散ウェーブレット変換 DCT よりも高い圧縮効率 大容量のメモリが必要 2- D DWT のメモリ容量の削減法は 提案されているが,符号化器全体を考 慮した研究は少ない

発表内容 1.研究の背景 2.離散ウェーブレット変換とその画像圧縮へ の応用 3.ハードウェア向き DWT アルゴリズムの概 要 3.1 離散ウェーブレット変換 3.2 埋め込みゼロツリー 3.3 評価結果 4.アーキテクチャおよび実装結果 5.結論

提案符号化アルゴリズムの概 要 メモリの容量および帯域幅の削減 低メモリバンド幅2次元 DWT による転置メ モリの削減 部分ゼロツリー EZW によるバッファの削減 ハードウェア量の削減 フレーム内圧縮のみ スケーラビリティ EZW による柔軟なレート制御

提案2次元 DWT アルゴリズム Horizontal lev.1 提案方式 従来方式 Vertical lev.1Horizontal lev.2Vertical lev.2 Horizontal lev.1 Horizontal lev.2 Vertical lev.1Vertical lev.2

転置メモリ容量の比較 従来 Overlapped block Line- based 提案 メモリー (ワード 数) 262,1442,5554,09632,768 種別 memoryregistermemory 512×512 ピクセル画像 (5,3) フィルター

ゼロツリーデータ構造 PS IZ NS ZRIZ-- ZR --IZPS MSB ビットプレーン単位で処理を行う 全ての子孫が0であるサブツリー は ZR ( Zerotree Root) という単独 シンボルとして符号化

部分ゼロツリー EZW 探索 Partial zerotree PS ZRIZ -- PS Input to vertical DWT Horizontal lev.3 (Low-freq.) PS IZ NS ZRIZZR IZ ZR Vertical DWT coefs

システム全体のメモリ容量の比 較 従来 Overlappe d block Line- based 提案 DWT 262,1442,5554,09632,768 EZW 262,144 32,768 合計 524,188264,699266,24065, ×512 ピクセル画像 (5,3) フィルター

性能評価 ( Football)

性能評価( Mobile)

復元画像 DWT (PSNR:30.2 dB) MPEG-2 (PSNR:28.2 dB) Football frame # 10

DWTMPEG2 DCT によるブロックノイズ MPEG -2提案方式

まとめ 低メモリバンド幅 2-D DWT アルゴリズ ム 部分ゼロツリー EZW 探索 転置メモリの削減 DWT , EZW 間のバッファ容量の削減 水平方向と垂直方向の DWT 係数を 独立に処理 フレーム内圧縮のみで高い圧縮効率を実現

発表内容 1.研究の背景 2.離散ウェーブレット変換とその画像圧縮へ の応用 3.ハードウェア向き DWT アルゴリズムの概要 3.1 離散ウェーブレット変換 3.2 埋め込みゼロツリー 3.3 評価結果 4.アーキテクチャおよび実装結果 5.結論

提案符号化器アーキテクチャ リフティングアルゴリズムによる DWT フィルタ 部分ゼロツリー EZW による水平,垂直 方向 ゼロツリー探索を独立に処理 ビットプレーン処理 r の並列化

提案符号化器の全体構成 Stage 1 FU Stage 2 FU DWT Unit MUXMUX EZWUnitEZWUnit Line Buffer Control MUXMUX AC Unit Line Buffer Output Buffer DMADMA Pixel data Horizontal lev. 3L Horizontal lev. 3L Dominant Path code Horizontal Partial zerotrees Compressed dominant code External SDRAM

DWT 演算器のアーキテクチャ (1) 演算数を50%削減 C 2k-2 C 2k-1 C 2k+1 C 2k+2 C 2k+3 C 2k-2 C 2k C 2k+2 H LHkHk LHLH High Freq. Low Freq. C 2k HkHk 1 H k+1 3 5 2 4 6 C 2k-2 C 2k-1 C 2k+1 C 2k C 2k+2 HkHk LkLk ・ ・ ・・ ・ ・・ ・ ・・ ・ ・ Low Freq. FIR による演算 リフティングアルゴリズム High Freq. 高周波成分と低周波成分 を独立に演算 高周波成分の演算結果を 低周波成分の計算に利用

DWT 演算器のアーキテクチャ (2) DWT FILTER レベル1 レベル2、3 リフティングフィルタ 3レベルの1次元 DWT を 1係数 / サイクルで実行

EZW ユニット Update 00+1(MSB) Sub. Bits Gen. 10 Compare ビットストリーム Dominant Path Code Subordinate Path Code bitplane 1(MSB)bitplane 2bitplane 3bitplane 4bitplane 5(LSB) メモリアクセス回数の削減: 全てのビットを並列に処理

EZW ユニット (2) 部分ゼロツリーアルゴリズム を用いることにより水平 EZW と垂直 EZW を独立に処理 レベル間比較のパイプライン化 が可能

AC (arithmetic coder) ユニット 全てのビットプレーンの処理を並列に行う bitplane i output code new state bitplane i symbol (PS/NS/ZR/IZ) bitplane i-1 symbol state register state transition table current state new state bitplane i+1 symbol (PS/NS/ZR/IZ) bitplane i symbol state register state transition table bitplane i +1 output code current state

水平モードにおける動作 Stage 1 FU Stage 2 FU DWT Unit MUXMUX EZWUnitEZWUnit Line Buffer Control MUXMUX AC Unit Line Buffer Output Buffer DMADMA Dominant Path code Horizontal lev. 3L Horizontal Partial zerotrees Compressed dominant code External SDRAM Pixel Data

垂直モードにおける動作 Stage 1 FU Stage 2 FU DWT Unit MUXMUX EZWUnitEZWUnit Line Buffer Control MUXMUX AC Unit Line Buffer Output Buffer DMADMA Horizontal lev. 3L Dominant Path code Horizontal Partial zerotrees Compressed dominant code External SDRAM

実装結果 テクノロジー 0.35 um 3LM CMOS 動作電圧 3.3 V チップサイズ 4.93  4.93 mm 2 パッケージ 160 pin QFP トランジスター数 341,440 動作周波数 33.0 MHz 消費電力 210 mW ターゲット画像 NTSC (720  480) 4:2:0 YCbCr 30fps

まとめ リフティングアルゴリズムによる DWT フィルタのゲート数の削減 水平,垂直各方向の 1-D DWT と EZW 探 索処理をパイプライン化 ビットプレーン処理を並列化 実時間処理と小面積を両立

発表内容 1.研究の背景 2.離散ウェーブレット変換とその画像圧縮へ の応用 3.ハードウェア向き DWT アルゴリズムの概要 3.1 離散ウェーブレット変換 3.2 埋め込みゼロツリー 3.3 評価結果 4.アーキテクチャおよび実装結果 5.結論

結論 DWT による動画像符号化アルゴリズム およびその VLSI 化実現 低メモリバンド幅2次元 DWT 部分ゼロツリー EZW によるモジュール間のバッ ファ容量の削減 メモリの容量とバンド幅を削減することにより 小面積ハードウェアによる実時間処理を実現