MS-Word ⇒ XML 2001/10 マウスをクリックしてください。(カーソルはどこにあっても結構です。)次ページが表示されます。 有限会社中央商会 Tel 03-3661-1606/4081/0834 Fax 03-3662-9586 E-mail: info@chuou-shokai.co.jp
Officeで最も普及している文書作成ツール ■ MS-Word to XML MS-Word Officeで最も普及している文書作成ツール DTD XML 変 換 ツ ー ル XSL MS-Wordの持っているスタイル機能を利用してDTDで設定した「タグ」を挿入 MS-Wordのスタイルで設定されたレイアウト等の表示情報を元にしてXSLを作成
■ MS-Word スタイルの設定 ① MS-Wordの便利な機能の一つにスタイルの設定があります。下記メニューにより設定可能です。 設定されたスタイルを入力した文字列に適用することで、フォント・ポイント・センタリング等を簡単に設定できます。
■ MS-Word スタイルの設定 ② 【章見出し】 20ポイント・MSゴシック センタリング・黒色 【節見出し】 左寄せ・アンダーライン 青色 【標準】 10.5ポイント・MS明朝 左寄せ・黒色 【強調】 10.5ポイント・MSゴシック 左寄せ・赤色
Wordのレイアウト等の表示情報 ⇒⇒⇒ X S L ■ MS-Wordの変換 スタイル(Word)とタグ(XML)との対応(マッピング) 【章見出し】 ⇒ <文書全体><タイトル> </タイトル> </文書全体> 【節見出し】 ⇒ <セクション><タイトル> </タイトル> </セクション> 【標 準】 ⇒ <本文><段落> </段落> </本文> 【強 調】 ⇒ <段落><キーワード> </キーワード> </段落> XML <文書全体> <タイトル>文字コードの基礎</タイトル> <セクション> <タイトル> 1.コンピュータと文字</タイトル> <本文> <段落>コンピュータは古くから文字を扱ってきました。それは、コンピュータが扱っているデータはバイナリであり、人間が直接それを見ても理解し難いので、人間に分かり易くするために<キーワード>文字</キーワード>に変換する必要があるからです。 </段落> <段落>コンピュータは数値しか処理できないので、文字に番号を振って対応付けなくてはなりません。一般的には、それを"文字コード"と呼んでいます。 </段落> </本文> </セクション> <タイトル> 2.文字集合</タイトル> <段落>コンピュータが扱う文字を集めたものが"文字集合"です。ただし、単に集めるだけでなく、種類ごとに分類をしたり、並べる順番なども決めなければなりません。また、集めた文字に番号を振る(つまり、文字に背番号を付ける)ことも必要です。 </段落> <段落>文字集合の例としては、 <キーワード> ISO </キーワード>によって規格化されている"ISO 10646"があります。 </段落> </文書全体> Word Wordのレイアウト等の表示情報 ⇒⇒⇒ X S L
■ 文書の標準化とDTD作成 XML化対象文書(Word)の構造解析 DTDの作成 利用目的・利用形態の検討 Word文書の標準化・規格化 Word文書のスタイル指定をXMLのタグ(DTDで決定)に置き換えることで、Word文書をXML文書に変換するため、Word文書入力時における標準化は不可欠となります。 また、タグにタグで指定された文章の意味内容・相互関係情報をも盛り込み、タグを用いて検索・抽出・表示するXMLの仕組では文書作成の標準化・規格化が重要なポイントとなります。
■ XML化検討による副次的効果 XML化対象文書(Word)の構造解析 文書の利用目的・利用形態の検討 現状ワークフロー分析・問題点の洗い出し ワ ー ク フ ロ ー の 改 善
XML(タグ付けされた文書要素単位での管理)は不適 ■ XML化が効果的か???? XML化対象文書(Word)の構造解析 文書の利用目的・利用形態の検討 XML(タグ付けされた文書要素単位での管理)は不適 XML化が不適であったとしても Word文書の標準化・規格化 文書作成の効率化・省力化 文書単位での管理 PDFによる閲覧・利用