~Information hiding -meta data hiding- ~ Damage-less watermark extraction using non-linear feature extraction scheme trained on frequency domain ~Information hiding -meta data hiding- ~ Graduate School of Media and Governance Kensuke Naoe
Agenda 今までの研究の話 電子透かしとは ニューラルネットワークについて 修士時代の研究 今やっている(やってみた)研究 発見したこと
Background コンピュータやインターネットの急激な普及に伴い,マルチメディアコンテンツを容易に作成,配布できるようになった. 注目されてきているのが,ディジタルコンテンツの販売. iPod,Gyao,いまだとYouTubeとか? コピーコントロール技術は敬遠される 電子透かしの創世記 NapstarやGnutellaなどのP2Pファイル共有システムが問題 コピーコントロールとよく勘違いされる. 国内でもWinMXやWinnyが流行り,著作権という問題が注目されている.
電子透かしの用途 不正な複製,改変,配布 正当なユーザへの所有権,著作者の真贋,トラッキング 暗号(PKI,電子署名)や電子透かしを組み合わせたセキュリティ強度の高い著作権処理システム
電子透かしとは 「人間の知覚(視覚・聴覚)の特性を利用し,静止画,動画像,オーディオなどのディジタルコンテンツに対して,コンテンツ自体とは別の情報を,人間に知覚出来ないように埋め込む技術をいう」 電子透かし技術に関する調査報告書 平成13年3月 社団法人 電子情報技術産業協会
暗号技術との類似性 暗号 電子透かし コンテンツが暗号化されていることは明らかに認識できる.また,コンテンツを秘匿したい. コンテンツは出来るだけ影響されずにそのままの状態.コンテンツとは別の情報が埋めこめられていることが認識できない.埋め込むデータを秘匿したい.
デジタル署名との類似性 別の情報をコンテンツに添付する デジタル署名 メタデータ 電子透かし コンテンツに添付するのでファイルサイズ(ビット数)が増加し,署名部分だけを削除することが容易 メタデータ 多くの場合がデジタル署名と似た性質がある 電子透かし ファイルサイズは増加せず,透かしだけの除去も困難
電子透かしに関する勘違い 電子透かし技術は暗号・デジタル署名と併用できる デジタル署名を電子透かし技術で埋め込む 電子透かしの入ったコンテンツを暗号化して配布 電子透かしはそれらの技術を補完する技術であって,代替するものではない.
電子透かしの特徴 コンテンツの種類によって埋め込み・抽出手法が異なる. 利用形態に応じて,柔軟に対応出来たほうがいい 画像なのか,動画なのか,音声なのか ファイルサイズや利用条件 利用形態に応じて,柔軟に対応出来たほうがいい 複数の可変要素を持たせる アルゴリズムで対応させる 数学的理論によって強度を保証出来る暗号と違う アルゴリズムを独自の非公開のものにすることが多い
インフォメーションハイディングとは コンテンツに対してデータを秘匿的に埋め込む技術 Robust watermark Fragile watermark Semi-fragile watermark Steganography 電子あぶり出し,深層暗号
別のカテゴライズとして 不可視・高耐性 著作権保護 不可視・低耐性 改ざん防止 可視・非可逆 所有権者表示 可視・可逆 コンテンツ配布
電子透かしの要件 コンテンツ自体への埋め込み 耐性 コンテンツ品質 埋め込み情報容量
電子透かし応用例 付属情報付加モデル 機器制御モデル コピープロテクション 有害コンテンツのフィルタリング メタ電子透かし 著作権主張モデル 撮影情報付加 説明付加 字幕付加 吹き替え音声付加 CM付加 立体情報付加 議事録発言付加 個人情報付加 機器制御モデル コピープロテクション 有害コンテンツのフィルタリング メタ電子透かし 著作権主張モデル 不正利用の心理的抑制 不正利用の監視 著作権明示,サンプル画像の配布 原本性確認モデル 写真画像の改ざん検知 デジタル画像の改ざん位置検出 Webページの真正性確認 情報の復元 メディアリンクモデル 商品の販売促進 現代版ステガノグラフィー
埋め込み抽出技術の概要 デジタル画像 動画像 音声 文章
埋め込む情報の形態 数字,文字コード,バイナリデータ 図形 識別のためのパターンやマーク
電子透かしの仕組み(画像での例) 直江健介 透かし情報 直江健介 透かし情報 透かしの復元に 必要となる 復号鍵の生成 復号鍵がないと 透かしを復元できない 透かしの埋め込み 透かしの復元 元の画像 電子透かしが 埋め込まれた画像 (不可視) 電子透かしが 埋め込まれた 画像が改変 著作権管理に用いるためには、透かし情報がいかなる処理を施しても頑健にコンテンツに存在し続ける必要がある =ロバスト性
直江の研究 Damage-less watermark extraction using コンテンツに対して埋め込みをまったく行わない Non-linear feature extraction scheme 埋め込まないとなると,ある程度特徴を認識しないと 画像は多次元かつ複雑な要素を持っているので,分類するには非線形分離 Trained on frequency domain ニューラルによる学習で実現しよう
どこにニューラルの入る余地があるか 周波数変換後の画像の、特定領域の特徴情報を入力とし、透かし情報を応答とするパターン認識問題として捉える 学習による分類器(鍵)の生成 パターン分類(認識)による透かし情報の復元 画像の特徴情報は複雑かつ似た性質を持つ可能性があるため、非線形分離が必要 階層型ニューラルネットワークの多層パーセプトロンによるパターン分離 バックプロパゲーション学習 教師付き学習,パターン分離や関数近似が得意 三層以上は非線形分離が可能 Watermarkとsteganographyの両方になりうる
XOR問題をbackpropagation学習で解いてみる
3層パーセプトロン 3層構造 フィードフォワード型 ニューロンの入出力関数 Backpropagation 学習 出力層 中間層 (隠れ層) シグモイド関数 Backpropagation 学習 入力層
シグモイド関数 多層パーセプトロンのニューロン入出力関数 シグモイド(sigmoid) = S字 x y
ネットワークの計算 ニューロンの入力値 前層のニューロン出力と結合係数の積和 yj j xj wNj w1j wij y1 yN yi
パーセプトロンの動作 結合係数(Wij)の値によって最終出力が変わる どのように結合係数を決めてやるか? → 学習させる 0.88 0.62 0.89 1.0 -1.0 2.0 2.0 0.5 0.67 0.18 結合係数(Wij)の値によって最終出力が変わる どのように結合係数を決めてやるか? → 学習させる
Backpropagation 学習 多層パーセプトロンの学習則 教師付き学習 教師信号との誤差を逆方向に伝播して結合係数を修正する 1.0 入力 信号 2.0 0.5 0.9 -0.8 1.9 1.3 -0.9 1.0 -1.0 2.0 出力 信号 0.67 誤差
提案手法(修士論文) フィルタ処理に特化したロバスト性の高い電子透かしの実現を最大の目標 JPEG圧縮やフィルタ処理に対応するために特化した
提案手法の手順 埋め込み処理 画像の周波数変換処理 鍵穴ブロックと鍵穴の位置情報埋め込みブロックの選定 鍵穴の位置情報の埋め込み 鍵の生成 画像の再構成 復元処理 1. 画像の周波数変換処理 2. 鍵穴の位置情報の取り出し 3. 埋め込み処理4.で作った復号鍵を用いて透かし情報の復元
提案手法の手順(埋め込み処理) B A 1.画像の周波数変換処理(変換、量子化) 2.鍵穴ブロックと 鍵穴の位置情報埋め込みブロックの選定 鍵穴の位置情報埋め込みブロックの選定 鍵穴の位置情報 B 4.鍵穴ブロックから透かし情報を認識する 分類器の生成 3.鍵穴の位置情報の 埋め込み A 透かし情報 学習後の 結合係数群 鍵穴の位置情報を埋め込んだ画素の位置情報 5.画像へ再構成(量子化>逆量子化、変換>逆変換)
鍵穴ブロックから鍵を生成(1) 8 鍵穴ブロックA 8x64 A 1. 鍵穴ブロックAに着目 拡大 B 8x64
鍵穴ブロックから鍵を生成(2) 1.鍵穴ブロックに着目し 対角線の係数をBack Propagationへの入力とする 例:10110101) 3.学習後の結合係数と鍵穴の 位置情報を復号鍵とする
階層型ニューラルネットワーク 1 0 1 1 0 1 0 1 3層構造により収束を保証するわけではないが ある程度で学習を止めます。 透かし情報 1 0 1 1 0 1 0 1 3層構造により収束を保証するわけではないが バックプロパゲーション学習モデルでは、入力信号として連続値を取り、 出力として離散的な応答をするために、閾値を設ける必要がある。 間違いパターンと比べて、概ね高い認識率を示した時点で学習が収束したとする。 ある程度で学習を止めます。 その閾値でパターン認識 ・鍵穴の対角線の係数を入力、透かし情報を教師信号とし 学習を行う。学習が収束した時の2対の結合係数U,Vを鍵として 外部で保持する
提案手法(復元処理) 1.画像の周波数変換処理(変換、量子化) 2.鍵穴の位置情報の取り出し 3.鍵穴ブロックの特徴情報を適応信号処理の 入力とし、復号鍵である結合係数を用いて 出力応答として透かし情報を得る 鍵穴の位置情報を埋め込んだ画素の位置情報 透かし情報 復号鍵である 2対の結合係数群
復元処理 A B ブロックA 透かし情報 画像を周波数変換し、ブロックに分割する 鍵穴の位置情報を埋め込んだ画素の位置情報 ブロックA 透かし情報 A B 復号鍵である 2対の結合係数群 周波数変換後の画像 (ブロック分割) 画像を周波数変換し、ブロックに分割する 復号に必要となる「鍵穴ブロックA」の位置情報を持つ「ブロックBの位置」に関する位置情報を復号者は知っているためブロックAを探索可能 3. 「鍵穴ブロックA」の対角線上の係数を適応信号処理の入力信号とし、復号鍵である結合係数群を用いて出力することで透かし情報得ることが出来る
評価実験 実験1 透かし情報の認識率 実験2 フィルタに対する耐性評価
実験1:透かし情報の認識率 透かし情報(ビット列):10110101 の復号実験 認識率 認識率 bit bit 透かし情報(ビット列):10110101 の復号実験 認識率 認識率 bit bit 図1.透かし情報の入っているブロックから復号(1byteのデータ) 図2.まったく関係ないブロックから復号(1byteのデータ) 正しく復号できた 正しく復号できない
透かし情報の入った画像にデジタルフィルタをかけた後に透かし情報を復号できるか 実験2:フィルタに対する耐性評価 透かし情報の入った画像にデジタルフィルタをかけた後に透かし情報を復号できるか 認識率 図1.フィルタ処理前の画像 bit ハイパスフィルター処理後の認識率 図2.フィルタ処理後の画像
問題点 識別率が悪かった 学習の収束が遅かった フィルタ処理を施さない段階においても,正しい入力に対する出力の認識率は隔たりがあり,いいブロックを選択する必要があった すくなくとも正しい入力のときは必ず正しい出力を得たい 学習の収束が遅かった 何を持って学習が収束したかの判断が難しかった
現在の研究 全く埋め込みをせず,特に特別な前処理をしないで学習,識別を目標とする 各種フィルタ処理に対する耐性がどの程度なのかを検討する 識別したい個数分を確実に分類できる分類器の生成を目的 ネットワークの構造をどう設計するかが鍵 学習の収束問題 バイアスニューロンを導入することで解決 各種フィルタ処理に対する耐性がどの程度なのかを検討する
実験要件 識別したい識別子は32個(とりあえず) 512*512の画像には8*8pixelのサブブロックが4096個 5bitで実現できる それぞれ入力は特徴情報の8画素の値(入力は8ユニット) 出力が5ユニット x 1個のネットワークに32種の学習 出力が1ユニット x 5個のネットワークに32種の学習 出力が32ユニット x 5個のネットワーク 1回学習 512*512の画像には8*8pixelのサブブロックが4096個 ブロック全体の反応としてはノイズが好ましい
5bitとしての例: 1 a 2 b 3 c 4 d 5 e 6 f 7 g 8 h 9 i 10 j 11 k 12 l 13 m 14 n 15 o 16 p 17 q 18 r 19 s 20 t 21 u 22 v 23 w 24 x 25 y 26 z 27 . 28 , 29 ~ 30 @ 31 / 32
個々のブロックの出力イメージとして 8x64 31 25 12 32 17 14 6 11 15 29 22 13 7 27 18 19 24 2 28 1 21 30 3 16 26 8 5 23 20 10 4 9 1 =4096個のサブブロック 8x64
実験 32個のパターンを学習 画像に対して直接改変処理 4096個のブロックは32のどれかを出力する 画像に対して直接改変処理 個々のブロックが改変前に出力していた値と改変後に出力する値が変わっているかどうかを確認 入力を位置をランダムで決定した実験を20回行い,平均値を求めた
実験1 誤認識率
実験2 全体の誤認識ブロック
実験3 学習の閾値による違い
実験4 誤認識率 N=20
まとめ 画像に対して何も改変処理を施さない場合は,入力が正しものに関しては対応した正しい値が,それ以外の部分ではノイズになる 素直な使い方をすると攻撃に若干弱いようである Fragile watermarkに使えるかも しかし,ある程度保持し続けるので,すぐには透かしは壊れないので,semi-fragileといえる 全体ブロックの中には画像改変後にも同じ値を持ち続けるものが多数ある 逆にこのブロックを利用できないか