早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕 XML班 早稲田大学大学院理工学研究科 情報科学専攻修士2年 後藤滋樹研究室 坂本義裕
XMLとは eXtensible Markup Language の略 構造を記述する言語 電子文書の記述に用いられたSGML(Standard Generalized Markup Language)を改良 HTMLとは同じSGMLを親とする兄弟言語
XMLの背景 SGML HTML HTML4.01 XHTML XML1.0 XSL 2000.1 HTMLをXMLで再定義 webでの 情報発信 1999.12 1980~ 電子出版向け 非常に複雑 XHTML XML1.0 XSL 1998.2 各言語の反省点を取り入れた 柔軟性のある言語 2001.10 レイアウト記述言語
XMLの特徴 独自のタグを定義できる HTMLのように構造記述とスタイル記述を混在させない 可読性を保ちつつ複雑なデータ構造を構築できる 構造記述,スタイル記述について少し突っ込んで。
XMLの利用(1) XMLで記述されたデータは、Parserと呼ばれる構文解析プログラムを通すことで様々なアプリケーションから利用できる Parser (構文解析) 各種 アプリケーション XML文書 XML parser: - Sun XML parser for Java - Microsoft MSXML(IEにも内装)
XMLの利用(2) 現在では様々な場所で利用されている webコンテンツのフォーマット変換 (XML→C-HTML,MML) Webサービス (SOAPでの規定データフォーマットはXML) フォーマット変換にはXSLT(XSL Transformations)
Webコンテンツの自動生成 データはXMLで保存↓ リクエスト インターネット Web サーバ コンテンツ サーバ DB XSLT XML C-HTML MML XHTML 機種情報を含めてリクエスト ↑閲覧環境に合わせてフォーマット変換
Webサービス インターネット 購買担当者 イントラネット内の 調達用システム →各サイトを一元的に操作可能になる A社の販売サイト サイト間のメッセージ交換プロトコルにSOAP C社の販売サイト 見積もり要求 見積もり結果 →各サイトを一元的に操作可能になる
研究テーマ(1) パケット解析ツール開発作業の軽減 そのために・・・ 共通部分のモジュール開発 パケットヘッダのパラメータをXMLで記述 Javaを用いてBinaryからXMLへ XMLフォーマットを用いて透過的にアクセス
→従来の方法だと抽出モジュールをいちいち作成しないといけない 研究テーマ(2) packet (Bin format) … TCPレイヤ 抽出モジュール 解析ツール 本体 TCP IPレイヤ 抽出モジュール IP 灰色の部分が開発しなければならない部分 … … →従来の方法だと抽出モジュールをいちいち作成しないといけない
→XMLフォーマットをはさむことによって一元的に扱うことが可能 研究テーマ(3) packet (Bin format) packet (XML format) <?xml version="1.0"?> <!DOCTYPE module SYSTEM "relaxCore.dtd"> <module relaxCoreVersion="1.0"> <interface> <export label="TCP_segment"/> </interface> <elementRule role="TCP_segment"> … 解析ツール 本体 TCP IP Bin2XML module Java class mapper … … →XMLフォーマットをはさむことによって一元的に扱うことが可能