デジタル情報学概論 2004年11月4日 第6回資料 担当 重定 如彦
デジタルデータと著作権 デジタルデータの「コピーが容易である」、「いくらデータをコピーしても劣化しない」と いう性質は著作権の保護という立場からみると欠点となってしまう アナログデータの複製の場合 カセットテープやビデオテープのような、アナログ情報のコピーには以下のような問題があった コピーを重ねると情報の劣化が起こる ⇒ 良い品質を求める人は製品を購入するだろう カセットテープやビデオテープのコピーには時間と手間がかかる デジタルデータの複製 デジタルデータは複製しても劣化せず、複製が非常に容易であるため、音楽データ、動画データ、コンピュータプログラムなどの不正なコピーが大きな問題となっている 著作権侵害の問題点 このような著作権を侵害する不正なコピーがまかり通ってしまうと クリエイターの製作意欲の減退 ⇒ 新しい作品や製品が作られなくなってしまう 消費活動の減退。製品を買わずに不正コピーを行ってしまうと、その製品を扱う業界が不景気になる。 ⇒ 業界が大きければ社会全体の景気が悪くなってしまう場合もある 実際に、音楽業界、コンピュータソフト業界などでは、不正コピーの問題が深刻になっている
不正コピーの影響 「グローバル経済の発展: ソフトウェア違法コピー削減によるメリット」 (http://www.bsa.or.jp/file/CU200170whitepaperJreviewed.pdf)によると 世界では4 本に1 本の割合でソフトウェアが違法コピーされている 各国の違法コピー率は25%から94%と様々である 4 年間で違法コピー率が40%から30%に下がった場合(10 ポイント減)のメリット 150 万人の雇用 640 億ドルの税収 4,000 億ドルの追加経済成長 違法コピーが少ない国はすでにその受益を実証済み 日本、エジプト、イギリスなど、違法コピー削減に熱心に取り組んでいる国では、大きな経済メリットをすでに体現しているか、または、IT 景気が急騰しつつある
著作権の保護 そこで、著作権を保護する為の様々な方法が考案されている そこで、著作権を保護する為の様々な方法が考案されている 不正コピーを防止するシステム デジタルデータの不正なコピーを行えないようにする為の様々なシステムの考案 不正を検出する為のシステム 不正が行われたことを発見する為のシステムの考案 法律の制定 デジタル社会の到来にあわせてデジタルな著作権に関する様々な法律の制定 ただし、法律を制定するだけでは不十分(ばれなければ罰することは不可能) 不正の防止や不正の検出のためのシステムが必要
コピーを防止する著作権保護技術 その1 SCMS(Serial Copy Management System) オーディオ分野のデジタル録音機器(例えばMD等)のコピー制御機構で、それらの 製品はこの機構を組み込むことを義務付けられている デジタルデータに、コピーの可否情報を付加し、コピーする際にその情報を見てコピーが可能かどうかを判断する。コピーの可否情報には「コピー可」、「コピー不可」、 「1回だけコピー可」の3種類があり、「1回だけコピー可」のデータをコピーした場合、 コピーされたデータの情報を「コピー不可」にすることでコピーの回数を制限する 音楽データ 音楽データ コピー コピー + + コピー可否情報 1回だけーコピー可 コピー可否情報 コピー不可
コピーを防止する著作権保護技術 その2 CSS(Contents Scramble System) DVDの著作権保護システム。以下の複数の著作権保護技術の集まり 階層暗号機能 マスターキー(鍵を管理する機構が管理)とディスクキー(それぞれのDVDディスクに特有の鍵)とタイトルキー(著作権者が管理)を使ってDVDのデータを暗号化する方式 暗号化の鍵や方法は秘密になっており、DVDプレーヤーのハードやソフトの開発には、鍵を秘密にするという契約を結んだ上でなければ開発を行えないようになっている ⇒ DVDを他のDVDにコピーしてもDVDの鍵が異なるので復号化できない 地域設定機能 DVDに地域コードを埋め込み、特定の国でしか内容を見ることが出来ないようにする機能 アメリカで購入したDVDを日本のDVDプレーヤーでみることが出来ないのはこの機能による
コピーを防止する著作権保護技術 その3 CSS(つづき) コピーを防止する著作権保護技術 その3 CSS(つづき) アナログコピー制御機能 DVDの内容をアナログデータとしてコピーする際に、わざとコピーを劣化させる機能 多少品質が落ちても良いから DVD ⇒ アナログデータ ⇒ デジタルデータ という手順で著作権保護機能のないデジタルデータに変換してからコピーするという方法を防止 デジタルコピー制御機能 DVD-RAMなどにコピーできる回数を制限するための機能 バス認証機能 パソコンを使ってDVDを閲覧する場合、いくらコピー保護機能をつけても、DVDの中身を見るためにはコンピュータ内に暗号化されていない生のデジタルデータを送る必要がある バス認証機能はコンピュータ内を流れる生のデジタルデータのコピーを防止する
コピーを防止する著作権保護技術 その4 メモリカードを使った技術 デジタルデータの入った特殊なメモリカードと、そのメモリカードを読み込むための 特殊な装置を使ってコピーを防止する。 メモリカード内のデータは暗号化されており、メモリカード自体に埋め込まれた鍵を 使わなければ復号化できない ⇒ 中身だけをコピーしてもメモリカードとセットでなければ復号化できない その他の技術 CDにわざと傷をつけておき、その傷を考慮にいれてデジタルデータをCDに保存する他のCDにコピーした場合、傷がないのでうまくコピーできない 他にも、様々な著作権保護技術があり、今もなお新しい技術が研究されている
著作権保護技術の問題点 その1 不正コピー防止技術は破られやすい どんな方式で不正コピーを防止する場合でも、これらのデジタルデータは、暗号と異なり不特定多数の人間が閲覧することを目的として作られているため、コピーを防止する機構は暗号とくらべてはるかに破られやすい ⇒不正コピー防止技術を解除する方法が発見されてしまった場合、解除装置をつけた装置を使えば簡単にコピーされてしまう SCMSキャンセラー 文字通り、SCMSを解除するための装置。一時期実際に売られており、誰でも購入することができたが、法律の規制により一般には売られなくなった DeCSS CSSで暗号化されたDVDのデータを解読するプログラム DeCSSを作ったプログラムの作者がプログラムをインターネットに公開してしまったため、DeCSSは一気に世界に広まり、当時(1999年)DVDメーカーはDVDプレーヤー製品の 出荷を延期した。これに対抗するため、CSSを拡張したCPPMなどが生まれた
著作権保護技術の問題点 その2 一度コピーされてしまえば無意味 どんなにがんばってコピーを防止する機構を組み込んでも、一度それが破られて、 保護されていないデジタルデータに変換されてしまえば無意味になってしまう 実際に、インターネットではP2Pと呼ばれる不特定多数の個人同士でパソコンの中のファイルを交換するソフトによって、巨大な量の不正なデジタルデータが交換されている Napster 1999年にNapster社が開発したシステム。ユーザはNapster社が管理するサーバに自分のコンピュータをつなぐ。サーバはつながれたコンピュータの中のファイルの検索機能などを提供するだけであり、データの転送自体は個人同士で行う。Napsterは音楽配信サービスとして利用され、不正なコピーが問題となり、アメリカで大きな議論を巻き起こし裁判にもなった Gnutella Napsterと異なり、サーバを置かず直接個人同士でデータの交換を行うソフト。ユーザを管理するサーバが存在しないので、不正なデータの転送を発見するのが困難 類似するソフトには WinMX, Winny などがある。 なお、日本で実際にこれらを使って違法なコピーデータを転送し、逮捕された例も存在する
著作権保護技術の問題点 その3 正当な利用の為のコピーが阻害される 著作権保護技術の問題点 その3 正当な利用の為のコピーが阻害される バックアップの為のコピー CDやDVDに格納されたコンピュータソフトやDVDのデータは、物である以上 何らかの原因で破損する可能性がある。そのような場合に備え、バックアップの為のコピーを行うのは正当な権利であるが、コピー防止機能によってそのような正当なバックアップが行えなくなってしまう 注:著作権法ではバックアップなど個人利用の為のコピーは認められている 引用の為のコピー 著作権法によって認められた正当なコピーである引用が行えなくなる 2次著作物 元の作品を独自に編集加工した結果作られたオリジナリティのある新しい作品を2次著作物と呼ぶが、コピーが行えないと編集や加工することができない これらの問題に対しては現在もなお様々な議論が行われている
電子透かし 電子透かしは、不正なコピーを検出する技術であり、デジタルデータの中に、製作者などの著作権に関する情報を隠れた情報として埋め込むことにより 不正を検出する。電子透かしには以下の性質が求められる 品質維持 電子透かしをデジタルデータに付加しても、元のデータが劣化しない 編集耐性 編集、加工、圧縮などを行っても電子透かしがなくならないこと 攻撃耐性 電子透かしの内容を第三者が勝手に書きかえることが出来ないこと これらの性質が守られていれば、電子透かしをみることで、デジタルデータを誰が作成したかについて管理することが可能になる 例:音楽データを不正コピーしてインターネットで公開した場合、そのファイルの電子 透かしを調べることによって、不正なコピーであることを検出することが可能
電子透かしの作り方 電子透かしはデータの形式を変更せずにデータの中に電子透かしのデータを埋め込むという方法で埋め込まれる。おおまかな原理は前回の最後で紹介した、データの中に別の情報を隠すという方法が使われる 電子透かしの作成方法に関しては、まだ標準化された方法は存在せず、様々な方法が考案され、今もなお新しい方法が研究されている いずれの方法も、具体的な方法については高度な数学の知識が必要となるので、この授業では説明は省略する。興味のある方は教科書の25Pやインターネットの検索などを参照のこと
電子透かしを使った不正の検出 その1 プログラムによる検出 インターネットに公開されたデータを一つ一つ調べるコンピュータプログラムを作成し、それを使って各データの電子透かしをチェックする 原理的にはインターネットに公開されたすべてのデータをチェック可能 実際には全てをチェックするのは不可能 爆発的な勢いで年々増え続けるインターネット上のデータをすべてチェックすることは不可能。具体的にどの範囲のデータを調べるかを決めるかが問題 公開されていないデータに対しては無力 インターネットに公開せず、個人同士でデータを転送した場合、この方法で見つけることは不可能。また、CDやDVDなどで直接データを交換した場合も検出はできない
電子透かしを使った不正の検出 その2 転送データの監視 インターネットのデータを中継する機器などに、インターネットを流れるデータを監視する装置をつけ、インターネットを流れるデータの電子透かしをチェックする 個人同士のデータ転送もチェック可能 監視装置の設置の費用の問題 暗号化されたデータは監視できない 監視による転送の負荷(転送速度が遅くなる)の問題 利用者の協力による探索 不正コピーが行われるということは、必ず不正なコピーを利用する人間がいるということである。そこで、データのコピーサービスの利用者が、コピーされたデータの電子透かしのチェックに協力し、不正であった場合は報告するという方法をとる 広範囲の不正を探索することが可能になる 発見者に対する謝礼などの問題
個人のモラルの向上 最近では、あまりにも簡単に音楽データやコンピュータソフトなどがインターネットなどを使って不正に無償で手に入れることができるため、多くの人間がデジタルデータはただで手に入って当然だと錯覚している風潮がある 実際には他人が苦労して作成したものがなんでもただで手に入るというような都合の良い話は存在せず、誰かがただで何かを手に入れるということは、一方で誰かがその分損をしているということに他ならない デジタルデータの不正コピーは、発見されにくいので、万引きのような犯罪を行わない普通のモラルを持った人間でも、つい行ってしまうケースが多い。しかし、デジタルデータの不正コピーも万引きと同じくれっきとした犯罪である どんな技術を使っても、人間が運用する限り何らかの抜け道が存在するため、著作権保護技術においても、保護しようとする側と、それを何とか破ろうとする側のいたちごっこが続いているのが現状である。この問題を解決する為には、防止する技術を磨くだけでなく、システムを使う人間そのもののモラルを向上することも重要である
HTML インターネット上で最も良く使われているデータ形式の一つ HTML(Hyper Text Markup Language)は主にウェブページを記述する為に使われ、以下のような特徴がある ハイパーテキストを記述可能 リンクをクリックすれば他のウェブページへ飛ぶというハイパーテキストを容易に記述することが可能 マルチメディアデータを記述可能 文章だけではなく、画像データ、表、音声など様々な種類のデータ(マルチメディアデータ)を記述することが可能 比較的容易に記述することが可能 HTMLは、プログラム言語などと異なり、比較的容易に記述することが可能 Windowsの場合メモ帳を使って誰でも簡単なウェブページを記述可能 表示が環境にあまり依存しない OSの違い関わらず、ウェブブラウザを使えばほぼ同じ表示がされる
HTMLの特徴と問題点 HTMLはタグと呼ばれるものによって文章の構造を記述 例:<P>:段落を表すタグ <A>:リンクを表すタグ 注:構造を記述できるといっても、目次、章、作者などのような細かい構造を表すことはできない。おおまかな構造を表すことができる程度である タグは意味を表すことはできない 例:以下のHTML文章は本のデータを箇条書きのためのタグ(<UL>,<LI>)を使って表したものであるが、それぞれのタグは箇条書きの内容(意味)には関与しない 文章の意味を理解する為にタグを使うことはできず、文章のそのものを解釈する必要がある <UL> <LI>書名 デジタル情報学概論</LI> <LI>著者 奥川峻史、桜井哲真</LI> <LI>出版社 共立出版</LI> <LI>価格 2900円</LI> <LI>判 A5</LI> </UL> 書名 デジタル情報学概論 著者 奥川峻史、桜井哲真 出版社 共立出版 価格 2900円 判 A5 ウェブブラウザでの表示
XML XML(eXtensible Markup Language)は、ウェブ上のデータを表現する新しい形式の言語である。XMLはHTMLと同様にタグを使って文章を記述するが、以下の点が異なる 独自のタグを設定することが可能 HTMLでは使うことができるタグは決まっていたが、XMLでは文章の作成者が自分で独自のタグを新しく作成し、それを使うことが可能 タグに意味を持たせることが可能 一つ一つのタグに、意味を持たせることが可能 タグの表示方法は別途指定する HTMLではタグの表示方法はそれぞれ決まっているが、XMLではそれぞれのタグをウェブブラウザでどのように表示するかをそれぞれ指定する 注:HTMLでも実はそれぞれのタグの表示方法を別途指定することが可能
意味を記述するできることの利点 その1 データの受け渡しを行う前に、あらかじめ使うタグとその意味を決めておけば、タグをみるだけで機械的に文章データの意味を含めて交換可能 HTMLで記述した場合 XMLで記述した場合 <UL> <書籍> <LI>書名 デジタル情報学概論</LI> <書名>デジタル情報学概論</書名> <LI>著者 奥川峻史、桜井哲真</LI> <著者>奥川峻史、桜井哲真</著者> <LI>出版社 共立出版</LI> <出版社>共立出版</出版社> <LI>価格 2900円</LI> <価格>2900円</価格> <LI>判 A5</LI> <判>A5</判> </UL> </書籍> HTMLの場合:文章の意味を理解するには例えば「書名 デジタル情報学概論」という文章の中から「書名」が文章の意味、「デジタル情報学概論」が文章の内容であることを理解する必要がある XMLの場合:あらかじめ<書名>というタグの中に書名のデータを記述するという取り決めをしておけば、文章を受け取った人は<書名>というタグを探し、その中の文章を取り出すことで書名のデータを取り出すことが可能
意味を記述するできることの利点 その2 データを検索する際に、データの意味を使って検索することが可能になる 意味を記述するできることの利点 その2 データを検索する際に、データの意味を使って検索することが可能になる HTMLの場合 HTMLは、文章の意味を記述することができないので、例えばサーチエンジンを使って書籍名の中に「デジタル」という単語が入った本を検索しようとしても、「デジタル」という単語が入った文章がすべて検索されてしまう ⇒検索された文章を人間が見て、書籍名であるかどうかを振り分ける必要がある XMLの場合 XMLは、タグが意味を持つので、記述された文章の意味を調べることが可能 書籍名を必ず<書籍名>というタグで囲って記述するという決まりをつくっておけば、 上記と同様の検索を行う際に、「書籍名」という意味を持つ文章の中から「デジタル」 という単語が入った本を検索するという方法で、書籍名以外で「デジタル」という単語が使われている文章が検索されないようにすることが可能
XMLの適用例 その1 XMLは人間が読みやすく、記述しやすい形で文章を記述することができるというHTMLの利点を持ったまま、文章の意味を記述することが可能 そのため、様々な分野でXMLが活発に利用されていくことが予想される 電子商取引(EC) コンピュータやインターネットを使って、デジタルデータをやり取りすることによって商品の取引を行う電子商取引(EC)が近年活発におこなわれるようになっている デジタルデータを使ってスムーズに電子商取引を行うには、やり取りを行うデジタルデータの意味を受け取り側が確実に、機械的に理解できる必要がある そのような電子商取引のデジタルデータを誰でも、簡単に作ることが出来るようにする為に、電子商取引で使うXMLのタグの標準化を行うという動きが活発になっている
XMLの適用例 その2 知識管理 会社などの組織で、個人や部門などが持つ知識を社内で共有するという知識管理(knowledge management)にXMLを使うという動きが出ている XMLでそのような文書を記述し、社内のネットワーク上に公開することで、社内に散在するXML文章の検索などを行うことが可能になる 文書管理 以前はXML文章を記述する為のツールが少なく、高価なものが多かったが、最近では様々なアプリケーションがXMLに対応し、XML形式でデータを保存することができるようになっており、文書の管理をXMLで行おうという動きが活発になっている 例:ワープロ、表計算、プレゼンテーションなど多くのソフトがXML形式に対応
XMLとタグの標準化 XML文章をグローバルに活用する場合、誰でも記述されたタグの意味を理解することができるように、タグの意味を標準化する事が重要になる そこで、様々な分野で、タグの標準化の動きが活発になっている MathML 数式をXMLで表現する為の仕様 cXML ECの為のXMLの仕様 RWML 道路情報を記述するための仕様 参考: 意味を記述する言語としてSGMLとよばれる言語があるが、SGMLは非常に複雑な言語であり、人間が直接書いたり読んだりするような言語ではない そこで、SGMLをベースに複雑な部分をそぎ落として誰でも簡単にハイパーテキスト文章を記述できるように作られたのがHTMLである XMLも同様の方法でSGMLをベースに作られたものであるが、HTMLがわかりやすさと 記述のしやすさを重視したためSGMLの作法の多くを無視して作られたのに対し、XMLは厳密にSGMLの作法に従って作成されている また、HTMLをSGMLの作法に従うように作り直したXHTMLと呼ばれる言語も存在する