検索エンジンを利用した Covert Channelの検出

Slides:



Advertisements
Similar presentations
ウィキについて 1 1040431 1 1040431 植木貴宏 植木貴宏. ウィキとは? ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 ウェブブラウザを利用して Web サーバ 上のハイパーテキスト文書を書き換え るシステムの一種。 Wiki とは、ハワイ語で「速い」を意味.
Advertisements

IBMユーザ研究会九州研T3 3.Web2.0を実際に使ってみた. Web2.0を実際に使ってみました 研究会をプロジェクトに見立 てて “ Google SpreadSheet ” で会議を開く “ SNS ” でコミュニケーションを補助する “ Wiki ” で成果物を共有する.
著作権管理のための 関係の地図の記述について 200702887 市川 俊介. 研究背景 コンピューターやネットワーク機器の開発に より、文書や図面をネットワーク上で公開し たりすることが多くなる。 どんな著作物があるのかを知らずに公開し、 著作権を侵害したとされる例もあり、そのよ うな問題をどうすれば防ぐことができるのか.
Software Engineering Laboratory, Department of Computer Science, Graduate School of Information Science and Technology, Osaka University 1 ソフトウェア部品推薦のための.
XML ゼミ 独習 XML ~ 第 6 章 XHTML~ 6.1 XHTML の概要 6.2 XHTML の構造 谷津 哲平.
MOSA プログラミングセミナー Mac OS X プログラミング 事始め 新居雅行( MOSA 理事) 2002/4/28.
1 ネットワークでかわる社会 第1節 社会で利用されている情報シス テム 情報 プレゼン用資料 ( C401 ) 第2章.
WEB デザイン基礎実 験 担当:清水,田代 副手:浦辺,石井 ( 1 日目) NC-2 情報通信基礎実験.
大規模コーパスから獲得した 名詞の出現パターンを用いた 事態名詞の項構造解析
システム開発におけるユーザ要求の 明示的表現に関する一検討
北海道大学理学部地球科学科地球物理学 惑星物理学研究室 B4 加藤 学
ウェブの時空間解析技術 東京大学生産技術研究所 戦略情報融合国際研究センター 成果概要 ウェブアーカイブ ウェブ空間解析 ウェブ時系列解析
ファイルキャッシュを考慮したディスク監視のオフロード
検索エンジン最適化.
Webサービスに関する基本用語 Masatoshi Ohishi / NAOJ & Sokendai
第2章 ネットサービスとその仕組み(前編) [近代科学社刊]
国内線で新千歳空港を利用している航空会社はどこですか?
情報処理基礎 2006年 6月 1日.
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
第1回レポートの課題 6月19日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕
ホームページの作り方.
報告 (2006/9/6) 高橋 慧.
テキストマイニング, データマイニングと 社会活動のトレース
検索エンジンに関して The Anatomy of a Large-Scale Hypertextual Web Search Engine
1.自然言語処理システム 2.単語と形態素 3.文節と係り受け
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
SMSを利用した コミュニケーションシステムの開発
形態素解析および係り受け解析・主語を判別
セマンティクスを利用した 図書検索システム
Googleツールを用いた新しいWebシステムの開発
動詞の共起パターンを用いた 動作性名詞の述語項構造解析
基礎プログラミング演習 第1回.
オントロジーを使用した プログラム開発支援システムの提案
DNSトラフィックに着目したボット検出手法の検討
非文字資料を対象とした Ontologyデータベースに対する RDF推論の適用
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
資料1-6 平成26年度 第1回技術委員会資料 支援ツール群整備方針
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
環境リスクマネジメントに関する 検索システム
只見町 インターネット・エコミュージアムの「キーワード」検索の改善
WWW上の効率的な ハブ探索法の提案と実装
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
群知能を適用した アクセス制御システム 木下研究室 久保直也                                                     
予測に用いる数学 2004/05/07 ide.
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
エピソード記憶に訴えるBookmarkless Bookmarkの実現
個人情報の流出の危険性とその対策について
テキストマイニング, データマイニングと 社会活動のトレース
バイトコードを単位とするJavaスライスシステムの試作
早稲田大学大学院 基幹理工学研究科 情報理工学専攻 後藤研究室 修士1年 魏 元
基礎プログラミング演習 第12回.
RDFの生産工程管理システムへの適用 情報処理学会 第74回全国大会 2012年3月6日 松江工業高等専門学校  情報工学科 越田 高志.
JavaScriptを含んだHTML文書に対する データフロー解析を用いた構文検証手法の提案
設計情報の再利用を目的とした UML図の自動推薦ツール
セマンティックWebの 生産管理システムへの適用
東京工科大学 コンピュータサイエンス学部 亀田弘之
東京工科大学 コンピュータサイエンス学部 亀田弘之
第14回放送授業.
自然言語処理2015 Natural Language Processing 2015
シソーラス情報を用いた童話文章登場人物の 感情情報読み取りシステム
複数活動履歴を基にしたユーザの関心情報の抽出
セマンティックWebの 生産管理システムへの適用
形態素解析と構文解析 金子邦彦.
自然言語処理2016 Natural Language Processing 2016
単語登録(1) ◎MS-IMEの「単語登録」に、単語、語句、記号など自分がよく使うものを登録しておくと、便利である。
mi-8. 自然言語処理 人工知能を演習で学ぶシリーズ(8)
オブジェクト指向言語における セキュリティ解析アルゴリズムの提案と実現
識別子の読解を目的とした名詞辞書の作成方法の一試案
Presentation transcript:

検索エンジンを利用した Covert Channelの検出 木下研究室 200602824 久保直也

研究の背景・目的 近年、ネットワークの巨大化によりアクセス権限も複雑に絡み合っている。 ネットワーク内では不正な情報経路が発生し、情報流出の危険性が増大してしまっている。 このような情報流出経路の解析法としてCovert Channel解析があるが従来のように把握したコミュニティーのACL(Access Control List)のみを用いたCovert Channelの解析だけでは検出できないアクセス権の矛盾が存在する場合がある。

研究の背景・目的 検索エンジンで得られた情報にオントロジーを用いたセマンティックな解析手法を適用することでACLの矛盾や経路を効率よく見つけることを目的とする。 検出できない可能性のあるアクセス権の矛盾を検出するため オントロジーDBを作成し検索エンジンで収集した情報を形態素解析・構文解析しRDF化し意味まで考慮したマッチングを行うことで外的要因まで考慮したACLの矛盾や経路を見つける方法を提案する。

Covert Channel Covert Channelは意図しない情報経路のことで、 アクセス行列において、Subject、Object、permissionを アクセストリプルと定義した時始点から 終点への流れで、情報流出が発生してしまうことを言う。 始点 終点 S1 S2 O1 φ R O2 W 中間点2 中間点1 アクセス行列 S:Subject O:Object R:READ W:WRITE

検索エンジンとCovert Channel

内的なACLではS3はO1を読むことができない。 検索エンジンとCovert Channel 内的とはコミュニティ内のこと 外的とはコミュニティ外のこと 内的なACLではS3はO1を読むことができない。

外的要因を考慮した場合O1を読み書きできるS2がO8にコピペすることで 検索エンジンとCovert Channel 外的要因を考慮した場合O1を読み書きできるS2がO8にコピペすることで

検索エンジンとCovert Channel SOthersに読まれてしまう

それをクローラが収集しそれをサーチする、またはO8から直接S3はO1を読むことができるようになってしまう。 検索エンジンとCovert Channel それをクローラが収集しそれをサーチする、またはO8から直接S3はO1を読むことができるようになってしまう。

研究の概略 全体図 検索エンジン クローラ 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB 解析エンジン S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL ACL

研究の概略 ・Web上を自動的に巡回してWeb ページを収集する検索ロボット プログラムのこと。 ・既知のHTML文書の新しいコ ピーを要求 検索エンジン ・Web上を自動的に巡回してWeb              ページを収集する検索ロボット   プログラムのこと。                          ・既知のHTML文書の新しいコ      ピーを要求 ・文書中に含まれるリンクをたどる ・別の文書を収集する。という動   作を繰り返す。 ・新しい文書を見つけた場合は  データベースに登録する。 クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL ACL

研究の概略 詞タグ付けをする。単語分割 とは、文中の単語を同定する 作業である。例えば 子供|の|体力|低下 と単語分割される。品詞タグ 検索エンジン 全体図 クローラ ・形態素解析では単語分割、品   詞タグ付けをする。単語分割  とは、文中の単語を同定する  作業である。例えば  子供|の|体力|低下  と単語分割される。品詞タグ   付けとは各単語の品詞を同定   する作業である。 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL

研究の概略 ・構文解析では主に係り受けを 解析する。先程の例を係り受け では 子供→体力 体力→低下 と表される。 検索エンジン ・構文解析では主に係り受けを  解析する。先程の例を係り受け  では  子供→体力 体力→低下  と表される。  形態素解析、構文解析両方か   ら検索することによって検索の  精度が上がる。 クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL ACL

研究の概略 ・Hadoopは,Google検索 システムにおいて大量の 「メタ言語のインデック ス」を整理分類する。 検索エンジン ・Hadoopは,Google検索  システムにおいて大量の  「メタ言語のインデック  ス」を整理分類する。 ・インターネット内に散ら  ばったリソースのファイ  ル名,ファイル内容の語  を収集分析する。 ・インデックスとしてまとめ  る機能Mapフェーズと  Reduceフェーズの2つか  ら成り,計算処理を分散  して行う。 クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB 解析エンジン S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL

研究の概略 検索エンジン 主語Xを変えるとそれに応じた命題P(X)が得られるのだが、変数Xを具体的に指定することなしに   P(X) という命題を考えるのが述語論理である ここでは意味まで考慮したマッチングを行うために述語論理化します クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop RDF オントロジーDB 解析エンジン S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL

る枠組みで,SPO のトリプ ルでリソースとオブジェク ト間の関係を厳密に記述 することができる。 ・RDF は,リソースを表記す  る枠組みで,SPO のトリプ  ルでリソースとオブジェク  ト間の関係を厳密に記述  することができる。 例http://www.kanzaki.comの作者は神崎正英です。といった文があった場合。 研究内容 検索エンジン クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop 主語(Subject) リソース http://www.kanzaki.com 述語(Predicate) プロパティ 作者 目的語(Object) プロパティの値 神崎正英 RDF オントロジーDB 解析エンジン S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL

研究内容 義があるが, 工学的には 「概念化の明示的な記述」 とされている. 全体図 ・その目的は,自然言語に よって記述されたメタデー ・Ontology にはさまざまな定  義があるが, 工学的には  「概念化の明示的な記述」  とされている. ・その目的は,自然言語に  よって記述されたメタデー  タに存在する曖昧さを排  除することである. ・それによりコンピュータが  知識を意味論的に扱うこと  を可能とすることである. 研究内容 検索エンジン クローラ 全体図 形態素解析 構文解析 述語論理化 Hadoop? RDF オントロジーDB S1 コンテンツ R 電番 ACL ACL S1 電番 ×R ACL

研究の概略 全体図 内的なACLでは電話番号は読めないことになっている Web検索の結果を解析して得られた外的要因まで考慮した実質的なACL 検索エンジン クローラ 全体図 内的なACLでは電話番号は読めないことになっている Web検索の結果を解析して得られた外的要因まで考慮した実質的なACL 形態素解析 構文解析 述語論理化 Hadoop? RDF オントロジーDB 解析エンジン 矛盾している S1 コンテンツ R 電番 外的要因を考慮ACL 内的なACL S1 電番 ×R ACL ACL

Covert Channelの検出手順 1 ・クローラで収集された情報のタグを取り除き形態素解析、構  文解析を行う。  形態素解析, 構文解析を行うことで, 検索の精度を上げることがで  きる。 ・ここではHTMLファイルからタグ部分を取り除き、検索対象とな  る文章を取りだし形態素解析を行う。

・先程のHTMLファイルから Koganeの日記携帯ホームページ02/01の日記11:53研究として使用します久保直也の個人情報は090-4216-0000です。 という文を取りだし形態素解析を行う

2 ・形態素解析, 構文解析された情報を述語論理化RDF化する.   ・例えば久保直也の電話番号は090-4216-0000 です, という文があっ    た場合久保直也を主語(リソース) 電話番号を述語(プロパティ)090-  4216-0000 を目的語(プロパティの値) となる.

3 オントロジーDBを記述しておく. 例えば090-4216-0000instance-of電話番号is-a 個人情報is-a 久保直也といった記述ができる. ここではオントロジーDBの記述にはprotege を使用する.

さらに矛盾があった場合Covert Channel の経路を表示される. 4 ACL を導く RDF で検索された処理結果とオントロジーDBから外的要因を考 慮したACL を導き出す解析エンジンによりACL を検出する. 5 Covert Channelの検出 以上により,内的なACL では読めないことになっている情報がWeb検索の結果を解析して得られた外的要因まで考慮した実質的なACLでは読めると言ったような矛盾を見つけることができる. さらに矛盾があった場合Covert Channel の経路を表示される.

4 ACL を導く RDF で検索された処理結果とオントロジーDBがら外的要因を考 慮したACL を導き出す解析エンジンによりACL を検出する. 5 Covert Channelの検出 S1 が読み書きのできない電話番号情報をS2 が読み書きすることができた場合S2 がその情報を読みS1 が読み書きのできるコンテンツにコピペしてそこからS1 が本来読み書きのできない電話番号情報を読み書きすることができるようになってしまった.といった経路を表示する.

まとめ ・本稿では検索エンジンを用いたCovertChannel の検出方法を提案 した。  した。 ・これにより従来のように把握したコミュニティのACLのみを  用いたCovertChannel だけでは検出できないアクセス権の矛盾が存  在する場合でも ・検索エンジンによって得られた情報にオントロジーを  用いたセマンティックな解析手法を適用することで外的要因を考慮し  た場合のACL の矛盾や経路を効率よく見つけることが可能となり ・従来のCovert Channel 解析法での外的要因を考慮した場合検出で   きないアクセス権の矛盾が存在する, という問題点を解決することが  できるかもしれない.

今後の課題 ・Hadoop によるRDF導出効率化 ・RDFで検索された処理結果とオントロジーDBから外的要因  を考慮したACLを導き出す解析エンジンの構築 ・ACLの矛盾や経路を検出するのに最も適したオントロジー  の記述法の検討