感性情報と インフォメーションハイディング 政策・メディア研究科修士二年 武藤研究室INASセキュリティグループ 直江健介(naoe@sfc.keio.ac.jp)
電子透かしとは Degital watermarking デジタル情報化時代の流通形態に対応した主に著作権の保護を目的とする技術 (Information Hiding,Covert Channel,Subliminal Channel) 対して電子あぶり出しのことをSteganographyと呼ぶ デジタル情報化時代の流通形態に対応した主に著作権の保護を目的とする技術 簡単に知覚できる透かしもあるが、ここでは知覚できない程度に情報を埋め込みデジタルコンテンツの質を損なわせない技術 透かしというとお札の透かしを思い浮かべるでしょう。しかしお札のすかしのように誰が見ても分かるような透かしはデジタルコンテンツの場合コンテンツ自身を改変してしまいます。またすかしが入っていることがすぐに分かってしまうと、それを消す技術がすぐに出てくる可能性が高くなります。 電子透かしで扱う技術はいろいろな用途で使うため 呼び方は一緒でもその意味合いや求められている機能が違います 元のデータではなく、埋め込まれたデータのほうが重要度・秘匿度が高い場合は電子透かしでなく 電子あぶり出し>Steganographyを使う
電子透かしをマッピングする空間
耐性 imperceptible(知覚が困難) 埋め込めるデータ量 検出の信頼性 耐久性の強さ すべてがコンテナの品質とトレードオフの関係 コンテナが画像の場合であればいろんな画像処理に強いことなど(フィルタリング、圧縮と非圧縮、切り取り、幾何学的変換、レタリング) 次に話に行く前に電子透かしの分野でしばしば聞く耐性という単語の説明をします。 http://www.trl.ibm.com/projects/RightsManagement/datahiding/dhimg.htm
電子透かしの用途 デジタルコンテンツにすかし(署名・情報)を埋め込むことで 著作権の主張、保護。本物の証明 コピーコントロール 秘密通信(ステガノグラフィ) 改ざん検知 著作権の主張、保護。 1.コンテンツの著作権を主張するために電子透かしを入れておく利用方法。不正コピーに対しては抑止力として作用。 2.不正利用された場合現場を発見する必要がある。それを補助する機能として不正利用コンテンツを探索するシステムを利用。例)特定のURLを指定して探索するシステム や 自動的にすべてのURLに対してロボット型探索を行ない検査するシステム。 3.利用者を特定するためのデジタル指紋 ユーザから購入希望があった場合、例えばユーザ情報などを電子すかし入りコンテンツに追記することでユーザ情報が記述されたデジタルコンテンツがユーザに届く 4.配信システムへの応用 例として音楽に透かしを埋め込みそれを暗号化したものを配信コンテンツサーバに格納。利用側は暗号を複合化しコンテンツを利用。このコンテンツにはすかしが入っているため不正配布にも対応できる。 コピーコントロール DVDやIEEE1394などの機器同士でのコピーコントロール。もともとDVDなどの機器間のインターフェイスのコピー制御については暗号を使ったシステムの仕様がある。CCI(CopyControlInformation)コンテンツのコピー制御を管理する情報があるがこれに電子すかし情報を追加することで安全性が高まる。 秘密通信 電子透かしがキャリアであるのに対してステガノグラフィはおとりです。用いる技術は同じですが電子透かしの用途は著作権の主張などに対して、コンテンツに忍び込ませて情報を送ることを目的としています。どちらかというと著作権の主張に持ちいりたい電子透かしでは、忍び込ませた電子透かしが簡単に取り除かれては困るが、ステガノグラフィでは取り除かれる分には構わないが、第三者に埋め込まれた情報を読まれることは困ります。そのためこの場合の電子すかしに求められる性能が違ってきます。 改ざん検知 コンテンツが公開したそのままの状態で伝えることに意味があるとケースに適用。例えば画像などであればPhotoshopなどの画像加工処理ソフトウェアなどをつかい一部分を切り取ったり改変するといった行為を防止することが出来ます。この目的の電子透かしは特殊である必要があり、少しでもコンテンツに対して処理を施した場合電子透かしが消えてなくなるといったものを使わないといけません。
電子透かしの具体的な性質 (求められる機能) 電子透かしの具体的な性質 (求められる機能) 1.コンテンツ自身に埋め込まれる 2.編集、圧縮、伝送などの処理を行なっても変質、消失しない 3.改ざん・消去攻撃に対して強固である 4.すかしの埋め込みと抽出が容易(かつ高速)であること 5.結託攻撃に強い 6.コンテンツ全体に隅々にランダムに埋め込む 7.コンテンツの使用に制約をつけない。多くのメディアで共通し、多用なフォーマットにも適合 8.上記を満たした上で人間の知覚が出来ない程度の劣化に抑える 1.前提として 2.3.6.8.耐性 4.利用効率の良い 5.結託攻撃>>正規に入手した複数のコピーを用いてすかし情報を不正に解読すること。 7.仕様として
現状での問題点 デジタル情報の利点 データの一部に知覚できる情報(ロゴ)を埋め込むときの問題点 Steganographyとの類似点 コピーによる品質の劣化がない 不正コピーから情報の発信者の権利を守るのが難しい データの一部に知覚できる情報(ロゴ)を埋め込むときの問題点 もとデータの品質が劣化する 付加した情報を簡単に消去されてしまう Steganographyとの類似点 あるデータに対して人間が気が付かない範囲で加工を行なうことでデータを埋め込むこと
Steganographyとの相違点 電子透かしの技術 電子あぶり出し 両方の良いとこ取りをしたい。だからDataHidingだ 表面に現れるデータに価値がある そのデータの品質を保ったまま少量で除去しにくい秘密データを埋め込む 電子あぶり出し 表面に現れるデータはダミーであり、あまり価値がなく、隠されているデータに価値がある 秘密情報が第三者に消されたとしても、秘密が漏れるわけではないので問題にはならない 両方の良いとこ取りをしたい。だからDataHidingだ
研究の目的 少ない埋め込みデータで、大量の秘匿データを復号できるようにする! 従来方式より(スペクトラム拡散法など)より秘匿性を高める!
提案手法の概要 コンテナへの攻撃(フィルタ)がかかっても、同じ画像であると認識することができるなら、その認識の仕組みを利用する。 もともとノイズなので情報量は変わらない 加工や圧縮に耐性がある(これ重要) 認識の仕組みとは、結合係数をPN係数の変わりにつかう。つまり、結合係数を鍵にする。
電子透かしの手法 電子透かしは併用される圧縮や伝送を考えて 方法を選択する必要がある。 電子透かしには2段階の処理を踏みます。まず画素か周波数領域にマッピングする方法で、それから上の4つの方法を使って埋め込みます。今はウェーブレット変換をした後にCDMA技術で埋め込む方法が一番秘匿性(ひとくせい)が高いといわれています。 電子透かしは併用される圧縮や伝送を考えて 方法を選択する必要がある。
周波数空間で処理するのが 良い理由 画素領域上で直接画素値に埋め込むのは計算コストがかからないが、反面画像処理に対して耐性が落ちる。 特に、マルチメディアデータを圧縮し、伝送する際に埋め込んだはずのデータが散逸して透かしが完全に復号できないことがある。 圧縮と伝送処理には周波数解析を行うため、特にCDMA系の技術は電子透かしとの相性がよい。 なぜ、周波数空間を使うと圧縮などに強いのか
周波数処理 (下に行くほどいい感じ) DCT(離散コサイン変換)がいい理由:フーリエ変換と比べて 余弦波のみで分解するので虚数計算がいらない。JPEGで つかわれている。 ウェーブレットがいい理由:フーリエ変換/DCTは基底として無限 に続く局所性をもたない 三角関数を想定しているためフーリエ変換 後の周波数領域では 時間的な情報は完全に失われる。 ウェーブレット変換では局所的な周波数情報が得られるため 効率的な時間周波数解析が可能になる。 ウェーブレットがいい理由
離散コサイン変換 まず、画像を行列のデータに変換します。これにDCTをかけると、適当なまとまったブロックの 行列の行列ができます。各ブロックを拡大してみると、左上が低周波、右下が高周波の成分の構成比 になります。JPEGなどの圧縮に使われる際には、ここの高周波の部分が削られます。
スペクトラム拡散 スペクトル拡散システムでは、情報を伝送するのに必要な帯域幅を、情報とは独立した信号により広帯域に拡散されて通信している。 これにより干渉や妨害を与えたり受けたりすることが少なくなる。 WINDOWS XPの無線でも使われている。 直接拡散については、乱数生成と乗算のみで行うことができる。
スペクトラム拡散の使い方 ウェーブレット変換したあとにスペクトラム拡散をする。 LL成分(左下の部分)の値にPN係数という乱数系列をかける。 復元ができない。 本研究では、PN係数の変わりに結合係数を使ってみる。 ウェーブレット変換後にLL成分にスペクトラム拡散して逆拡散して画像を戻す>埋め込んだ スペクトラム拡散の場合はどんなにばらばらにしても
従来手法 埋め込む情報:電子透かしなら著作権情報、ステガノグラフィなら秘匿情報 復号する側が持つ情報:埋め込みデータの位置情報/復号の方法(直交変換、PN係数の乗算など) 復号する際にする処理:周波数解析 *埋め込みと変更が行われる。
検出の手順 と必要な情報 逆拡散>>拡散 間違え
提案手法 埋め込む情報:ブロックの位置を埋め込む 復号する側がもつ情報:ブロックの位置情報が格納されたメタな位置情報 復号の際にする処理:周波数変換とAD変換(結合係数の乗算)
提案手法詳細1(鍵穴の作成)
提案手法詳細2(鍵の作成) !スペクトラム拡散法のPN係数(鍵)が、ここで結合係数にあたる。
復元の手順と必要な情報 この方法だと処理手順も復号する側が持っている情報も少なくてすみます。
スペクトラム拡散法との比較 ブロックの位置情報:どのブロックのDC,AC係数を入力信号 にするのか ブロックのメタ位置情報:どの座標軸のブロック位置情報をみて、 どの順番で適応信号処理を行うのか
○適応信号処理
入力信号と出力信号 DCT変換後のDC係数:これは画像の骨格なので多少のフィルタがかかっても出力信号はぶれないはず ウェーブレット係数:上を同じ理由で、さらに局所的な情報も保持しているので良好 出力信号は、埋め込みたいメッセージ 例)A00100101
入力信号の用意 周波数変換したあとのブロックのシリアルなデータを使う。対角線上のデータが望ましい感じ。(鍵の作成参照) !あるいは、クラスタリングしたグループの画素集合について変換を行ったものを利用する(画像が復元されるか要実験。。。)
○提案手法のまとめ PN係数の変わりに、結合係数を使う。 あとは、位置情報の埋め込み
提案手法まとめ2
提案手法の効果 少ない埋め込みビット数で、大量のデータを復号できる。たとえば、Aという文字を埋め込む場合、通常では8ビットの変更が必要だが、この手法だとメタ位置情報→X,Yで2ビットでよい。 ウェーブレット/DCTというレガシイの手法にadd-onするため、構築が容易で画像が劣化しない。 秘匿性が高い PN係数より結合係数のほうがランダム性が高いから。 復号手順が少ない パリティを見てデコードする手順がない。 結合係数の方が秘匿性が高い:結合係数は、-1から1までの乱数とくらべ秘匿性がたかく、画像そのものの特徴を入力とするため大量のデータを埋め込むことができる。 (入力データを画素の位置情報として使いまわすことができるので)
試行錯誤しております 量子化(圧縮)後の離散コサイン係数の変化は処理にどれくらい影響するか? 復号側の負担 PN係数 対 結合係数のデータ量とランダム性 クラスタリングの処理のレイヤが入れられないだろうか。。。? 従来手法なら3文字なら24bit変更する
現在の作業
適応信号処理 ↑VC VCで作ったライブラリの利用 とMATLAB(使い方をまだ把握していません。。。)
今後の予定
2003年6月時点でのテーマ 実装評価にはStirmark watermarking benchmarkなどで、PSNRなどを測定する。 電子透かしの耐性や、画像そのものの適正などの評価基準は、まだあまり厳密なものは決まっていない。 関連論文のサーベイ(国外)をさらにする。 テストベンチの作成(緊急!)