周波数領域での非線形適応システムを用いた電子透かしの耐性評価

Slides:



Advertisements
Similar presentations
効率的に計算可能な 加法的誤りの訂正可能性 安永 憲司 九州先端科学技術研究所 SITA 2012 @ 別府湾ロイヤルホテル
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
静脈画像を鍵とする暗号化手 法に関する研究 大山研究室 安藤のぞみ. 研究の背景、目的 近年、バイオメトリクス認証が注目されて いる 静脈は身体内部の情報 → 偽造に強い 環境に左右されることが少ない 利用者の心理的抵抗が軽減される オープンなネットワークへのバイオメトリ クス認証の適用 : Double.
Information Hiding ~RQLミーティング発表~
量子化(Mid-riser型) 出力y 入力x 通信ネットワーク特論(量子化・符号化).
電子透かしにおける マスキング効果の主観評価
第四章 情報源符号化の基礎 4・1 情報量とエントロピー 4・2 エントロピー符号化 4・3 音声符号化 4・4 画像符号化.
~Information hiding -meta data hiding- ~
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
「わかりやすいパターン認識」 第1章:パターン認識とは
ウェーブレットによる 信号処理と画像処理 宮崎大輔 2004年11月24日(水) PBVセミナー.
多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
PSOLA法を用いた極低ビットレート音声符号化に関する検討
ウェーブレット変換と 非線形適応信号処理を用いた 電子透かしの研究
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
マルチメディア情報の ディジタル表現と処理
クラスター変分法と確率的情報処理 --Belief Propagation と画像処理アルゴリズム--
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
2012年度 情報数理 ~ QRコードを作ろう!(1) ~.
ディジタル信号処理 Digital Signal Processing
ワイヤレス通信におけるMIMO伝送技術.
コンピュータビジョン Computer Vision(CV) パワーポイント 抜粋
実時間動画像マルチキャストのための フィルタリング手法の実装と評価
表紙 MATLAB 応用講習会(A) 情報アシスタント M1 山本幸司.
ー 第1日目 ー 確率過程について 抵抗の熱雑音の測定実験
~Information hiding -meta data hiding- ~
感性情報と インフォメーションハイディング
線形フィルタと畳み込み積分 マスクによる画像のフィルタリング 1.入力画像中の関心の画素のまわりの画素値
パターン認識とニューラルネットワーク 栗田多喜夫 2018/11/8 早稲田大学大学院理工学研究科講義.
サポートベクターマシン によるパターン認識
画像処理 基礎.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
画像情報特論 (5) - ディジタル圧縮 (2) 音声・オーディオ圧縮 電子情報通信学科 甲藤二郎
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
第6章 特徴空間の変換 6.1 特徴選択と特徴空間の変換 6.2 特徴量の正規化 平成15年5月23日(金) 発表者 藤井 丈明
深層学習を用いた音声認識システム 工学部 電気電子工学科 白井研究室 T213069 林健吉.
QRコードを用いたウェーブレット変換による 電子透かし
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
QRコードを用いたIDカードに 適した電子透かし
Data Clustering: A Review
物体検出による視覚補助システム T215085 若松大仁 白井研究室.
アナログ と ディジタル アナログ,ディジタル: 情報処理の過程: 記録/伝送 と 処理 において, 媒体(メディア)の持つ物理量 と
Number of random matrices
ノイズ.
音声合成.
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
第3章 線形回帰モデル 修士1年 山田 孝太郎.
アナログとデジタル.
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
HMM音声合成における 変分ベイズ法に基づく線形回帰
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
わかりやすいパターン認識 第3章 誤差評価に基づく学習 3.3 誤差逆伝播法.
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
音響伝達特性を用いた単一チャネル 音源位置推定における特徴量選択の検討
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
ソースフィルタモデル.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
CSP係数の識別に基づく話者の 頭部方向の推定
線形符号(10章).
アナログ と ディジタル アナログ,ディジタル: 情報処理の過程: 記録/伝送 と 処理 において, 媒体(メディア)の持つ物理量 と
グラフ-ベクトル変換を用いたグラフ構造表現による一般物体認識
コンピュータと音 B3 入野仁志(irino).
Presentation transcript:

周波数領域での非線形適応システムを用いた電子透かしの耐性評価 慶應義塾大学 政策・メディア研究科 直江健介 安藤類央 武藤佳恭

電子透かし 従来の手法 画像に対して周波数変換処理を行い、信号をスペクトラム拡散方式を用いて埋め込む 透かし情報信号を組み込む。 その信号を取り除くと、作品の質が損なわれてしまう技術を開発した。 仕組みは、配信する映像や音声を周波数に変換し、所有者独自の信号を拡散させながら混ぜ、この周波数を再度変換して元の映像や音声に戻す。この方法で、データを劣化させないで所有者の信号が混入される。この信号はデジタル・データからアナログ・データに、アナログ・データからデジタル・データに変換を繰り返しても消えない。もし、無理に消そうとすると、元の情報も壊れるようになっている。 これはいわゆるフラジャイルウォーターマーク 従来の手法 画像に対して周波数変換処理を行い、信号をスペクトラム拡散方式を用いて埋め込む

本研究の概要 1.適応信号処理を用いた非対称鍵の生成により情報秘匿を高度化 透かし情報を埋め込む際に必要になる情報と復元する際に必要になる情報が同じではない 非線形適応信号処理システムにより透かし情報を復元 2.鍵穴の位置情報のみを埋め込むため、少ない埋め込み情報によって多くの情報の復元を可能 鍵生成に必要となる鍵ブロックの位置情報を埋め込む ・秘匿情報(透かし情報)そのものを埋め込むわけではないので堅牢である ・スペクトラム拡散で使うPseudo Random(擬似乱数)係数よりもランダム性が高い ・周波数分割することをサブバンド分割といいます ・フーリエ変換、DCTなどが周波数成分の分解をするのに対して、ウェーブレットという小さな並の単位の集まりとして元の信号を表現しようとする方法。 ・ウェーブレット変換を用いた場合、画像の不連続部分では大きな値を取り、滑らかな部分では小さな値となります。 画像の性質で係数値が変わってきますので、ある値以下は捨て去る、とすればウェーブレット変換により画像の圧縮が実現できる。 ・離散コサイン変換同様、画像データを周波数成分に変換する直交変換の1つ。ウェーブレット変換では、画像の周波数成分を広域と低域成分に分割し、次に垂直方向を分割、そして水平方向を分割する。   ・離散コサイン変換と比べて、ブロック歪みが目立たなく、モスキート雑音が比較的小さいといわれている。急激な変化である広域成分は小さなブロックで細かく分析でき、緩やかな変化の低域成分は大きなブロックで大まかに分析できるという特徴を利用して、波形分析や計測にも応用されている。 多重解像度表現 一枚の画像を複数の解像度を有する画像成分の重ね合せにより、階層的に表現することができる。 例えば、現行テレビとハイビジョンテレビのように、解像度の異なる画像の相互変換や、圧縮・伝送の両立性が容易に実現できる。(スケーラビリティとコンパチビリティ) 変換に伴うひずみが目立ちにくい JPEG方式のブロックひずみ等、ブロック構造に起因する特有のひずみ・雑音が少ない。 ウェーブレット変換では、一般的なサブバンド符号化の分割法と異なり、高域側の分割を繰り返さない。このため、高域成分に対応する基底の長さ(≒フィルタのタップ数)が短くなり、動画像におけるモスキート雑音(ブロック境界で蚊が飛んでいるように見える)が目立ちにくいという長所がある。 このように、ウェーブレット変換(サブバンド符号化)にはスケーラビリティとコンパチビリティ等、従来方式にはない特長を有していることから、JPEG2000等の方式に採用されている。

先行研究 ●スペクトラム拡散を用いた電子透かし コンテンツの信号を周波数変換し、特定のエリアの係数にP N係数を掛け、スペクトラム拡散を行い透かし情報を埋め込む →本研究では直接拡散時のPN係数の変わりに 非線形適応信号処理時に生成された鍵を用いる(秘匿性の向上) ●LVQ(学習ベクトル量子化)を用いた電子すかし 画像に対してはではなく、コードブックに透かし情報をエンコードする。 スペクトラム拡散の場合は通信の場合エンコードをしなくてはいけない 透かし情報をエンコードする方法としてスペクトラム拡散 1.符号化を工夫する事で向上>スペクトラム拡散 2.画質を変えない     >LVQ →本研究ではコードブックの変わりに、 非線形適応信号処理(Back Propagation)によって階層ネットワークに透かし情報をエンコードする(透かし埋め込み後の画質の劣化防止)

提案手法の手順 埋め込み処理 画像の周波数変換処理 鍵穴ブロックと鍵穴の位置情報埋め込みブロックの選定 鍵穴の位置情報の埋め込み 鍵の生成 復元処理 5. 画像の周波数変換処理 6. 鍵穴の位置情報の取り出し 7. 4.で作った復号鍵を用いて透かし情報の復元

鍵の生成 鍵は画像のある領域の特徴情報を非線形適応信号処理システムに入力することで生成 鍵は位置情報と分類器(Classifier)によって構成される

確率密度分布の推定からの非線形適応信号処理の位置付け パラメトリックモデル 確率密度分布を推定するには、データからパラメータを推定する必要がある 統計的に学習データの分布を考えて識別境界を引く 最尤法、ベイズ推定 ノンパラメトリックモデル 関数系を特定しないで、データに依存して分布系を決める。 与えられた学習データをすべて正しく識別出来るようにする K-Nearest-Neighbours法、kernel-based法 セミパラメトリックモデル 複雑な分布を表現するためにパラメータの数を系統的に増やせるようにする。 仮定する分布がパラメトリックモデルより、より一般的>抽象度が高い しかし、データに依存して分布を決める パラメトリックモデルは特定の分布を仮定するのだが、 分布が間違っていると応答が望ましい結果が出ない。 ノンパラメトリックモデルは特定の分布を仮定しないでデータ依存し データから分布を決めるのだが パラメータの数が増えてしまうため計算量が増えて処理に負荷がかかる (つまりパラメータを推定しない) セミパラメトリックモデル 両者の中間 仮定する分布系がパラメトリックモデルより、より一般的>抽象度が高い だけど、データに依存して分布系を決める  パラメトリックモデルに基づく方法は、新しいデータに対する確率密度の計算が比較的簡単であるが、真の分布と仮定したモデルが異なる場合には必ずしも良い推定結果が得られるとは限らない。  一方、ノンパラメトリック手法は真の確率密度分布がどんな関数系であっても推定できるが、新しいデータに対して確率密度を評価するための計算量が学習用のデータ数が増えるとどんどん増大してしまう。 SVMやバックプロップなどの階層ネットワークモデルはセミパラメトリックモデルに位置付けられる

階層ニューラルネットワーク(逆誤差伝播法) 特徴 ノイズへの耐性 誤り訂正と補完性 追加学習性

1.ノイズへの耐性 強力な汎化能力により、ノイズがある程度加わったパターンに対しても、正しい応答を出力する。 非線形の分離が可能 並列に、さらに情報を分散してエンコード

2.誤り訂正と補完性 学習の過程で情報が多数のニューロンに分散され、各々が最終出力応答に影響を与える構造になっている 入力情報や各ユニットがダメージをうけていても補完的に適切な信号を出力することができる。

3.追加学習性 学習後に新たなパターンが追加されても、以前に獲得したパターンに関する知識への影響を最小限にとどめ、効率よく追加学習が行える性能。 透かし情報を追加したいときに特長を発揮する。

提案手法の手順 埋め込み処理 画像の周波数変換処理 鍵穴ブロックと鍵穴の位置情報埋め込みブロックの選定 鍵穴の位置情報の埋め込み 鍵の生成 復元処理 5. 画像の周波数変換処理 6. 鍵穴の位置情報の取り出し 7. 4.で作った復号鍵を用いて透かし情報の復元

鍵穴ブロックと 鍵穴の位置情報埋め込みブロックの選定 Bブロック 8 8x32 中間層 低周波 高周波 A 1.鍵穴ブロックとしてA(7,3)を選択 AC係数の行列 B 2.鍵穴ブロックの位置情報を埋め込むブロックとしてB(4,5)を選択 拡大 8x32

鍵穴の位置情報の埋め込み 8 7 (30,35) 鍵穴となるブロックの位置情報が 埋め込まれている画素の位置 8 3 (28,33) 鍵穴となるブロックの位置情報が   埋め込まれている画素の位置 8 3 (28,33) Bブロック

適応信号処理(3層 Back Propagation) 3層構造により収束を保証するわけではないが

埋め込み3:鍵の生成 1.鍵穴ブロックに着目し 対角線のAC係数をBack Propagationの入力とする (例:helloのh>10110101) 3.結合係数を復号鍵とする 鍵穴ブロックA

透かし情報の復元 A B ブロックA 復号に必要となる鍵穴ブロックAの位置情報を持つブロックBの位置を知っているためブロックAを探索可能 透かし情報の入っている画像 ブロックA 復号に必要となる鍵穴ブロックAの位置情報を持つブロックBの位置を知っているためブロックAを探索可能 鍵穴ブロックAの対角線上のAC系列を入力信号とし結合係数を用いて出力すると透かし情報得ることが出来る

手法のまとめ:埋め込みと復号に使う情報(鍵) 1.埋め込む情報:                       鍵穴ブロックの位置情報 2.透かし情報を復元する際に必要になる情報:     鍵である結合係数と鍵穴ブロックの位置情報が埋め込まれている座標

実験1:透かし情報の認識率 透かし情報(ビット列):10110101 の復号実験 認識率 認識率 bit bit 透かし情報(ビット列):10110101  の復号実験 認識率 認識率 bit bit 図1.透かし情報の入っているブロックから復号(1byteのデータ) 図2.まったく関係ないブロックから復号(1byteのデータ)

透かし情報の入った画像にデジタルフィルタをかけた後に透かし情報を復号できるか 実験2:フィルタの耐性評価 透かし情報の入った画像にデジタルフィルタをかけた後に透かし情報を復号できるか 認識率 図1.フィルタ処理前の画像 bit ハイパスフィルター処理後の認識率 図2.フィルタ処理後の画像

手法の特徴と期待される効果 特徴 期待される効果 非線形適応信号処理によるエンコード 入力信号の位置情報の埋め込み 画像の劣化を抑え、フィルタへの耐性を向上 スペクトラム拡散よりも、冗長性が高まる 少ない埋め込み情報から多くの情報を復号可能 エンコードとデコードの手法に特徴 冗長性の高める(手順を増やす)>ロバストになる ◎鍵の埋め込みと検出手法 1.画像に直接透かし信号を埋め込まず、非線形適応システム内にエンコードして、 復号に必要な入力信号の位置情報を埋め込む

Future Work 周波数変換処理にウェーブレット変換 Back Propagationの代わりにSupport Vector Machineの利用 パッチワーク法との連携により透かし情報を画像全体へ拡散 サンプルの増加と解析的な裏づけ 耐性評価 ツール:Stirmark、UnZign SVMの最大の特徴は「マージン最大化」 バックプロパゲーション学習は学習アルゴリズムの本質として「与えられた教師データ」に関してのみ学習結果を保証する。 SVMはノンパラメトリックな手法である

Appendix:DCTによる周波数変換処理 256 ・・・ 256 8x32 DCTによる 周波数変換処理 ・ 8 JPEGは画像信号を周波数に変換してから処理を行ないます 通常DCTは2^N個のデータを計算する必要があります。 画像は二次元ですのでN個×N個の画素数に対してDCT計算をすることになります。 通常8×8画素単位に分割しDCT計算を行い、それを全画面について繰り返します。 256×256がその場合には1024個のブロックについてこの計算を行なう この大きさが計算時間がとノイズの目立ちにくさのバランスが最良だからです 8 量子化

Appendix:量子化 a.原画像の一部 (8×8画素) b.DCT計算後 c.量子化テーブルで割った後 a. g. f. b. 113 77 40 25 73 59 48 34 36 41 49 20 13 14 120 66 38 22 82 49 39 19 40 45 14 25 44 53 a.原画像の一部 (8×8画素) b.DCT計算後 c.量子化テーブルで割った後 a. g. 16 11 10 12 14 19 13 24 17 22 29 245 177 112 48 -156 -80 -32 -27 84 6 -16 0 23 116 102 22 480 176 110 48 -156 -84 -28 -19 84 13 -16 0 28 119 29 b. f. 量子化テーブル 量子化テーブルは高周波成分ほど大きな値で割り算をする これは高周波成分を積極的に0にするため>データ圧縮が可能になる反面、可逆性が失われる e.ハフマン符号から復号 f.逆DCT計算後 g.復号された画像 30 16 11 3 -13 -7 -2 -1 6 1 0 2 7 5 30 16 11 3 -13 -7 -2 -1 6 1 0 2 7 5 c. e. d.ハフマン符号化

Appendix 評価項目 比較対象 提案方式 透かし情報の圧縮 ハフマン符号(8bit情報は3bitに圧縮で、埋め込むのに3画素分24bit必要) 圧縮比が固定(8bitの情報を埋め込むのに2画素分16bit必要) 画質と耐性 (画像への影響) LVQ   画像全域にある          局所的にある 秘匿性(スクランブルによる情報拡散大きさ) スペクトル拡散    8bit 情報拡散の大きさ  2^8 適応信号システム    8bit            (10^m)^8*3             mは桁数