XML と Excel によるデータ化の違い (1) Excel ファイルのままでは検索はできない! (2) Excel ファイルでは、項目の追加や削除に対応できな い! (3) Excel ファイルでは、品質の機械的なチェックが困難 (4) Excel では、大きなデータ、大量のデータに対応できな い! (5) Excel では、様式を変更して表示することが困難
XML と Excel によるデータ化の違い(1) Excel ファイルのままでは検索はできない! 「管理者」が「信濃川下流事務所」であるものを検索する場合 Excel では、ファイルの中身を全文検索することは可能であるが、 1 つ 1 つのセルに意味を持たせ ることができないため、「管理者」という文字列や、「信濃川下流河川事務所」という文字列 の検索はできるが、 「信濃川下流河川事務所」 が「管理者」であるかどうかの検索はできな い XML では、 1 つの値に対して、その値の意味を「タグ」と呼ばれるものを使って記述するので、 「信濃川下流河川事務所」 が「管理者」であるかどうかの検索ができる EXCEL ファイル EXCEL ファイル EXCEL ファイル XML ファイル 検索 たとえば、管理者が「信濃川下流河川事務 所」である施設を検索したい “ 信濃川下流河川事務所 ” というセルが あっても、それが ” 管理者 “ かどうかは人 が見なければ分からない “ 管理者 ” というタグに、 “ 信濃川下流河川事 務所 ” という文字列が書いてある施設を検索 する 山田川樋管 信濃川下流河川事務所 1978 ・・・ <タグ>による値の 意味づけがおこなえ る 報告先信濃川下流河 川事務所 管理者新潟市 ・・・ セル一つ一つに意味 づけはおこなえない 人が見て判断する
Excel ファイルで検索をするためには・・・ 1) Excel ファイルとは別に、別途メタデータを作成する メタデータを作った項目でしか検索はできない 2) Excel ファイルの、どのセル( ○ 行△列)には何が入るかの様式を取 り決め 例えば、「 2 行 B 列」のセルには管理者が入ることを取り決め ABCD 1報告先信濃川下流河川事務所竣工年 管理者新潟市・・・ 3 ABCD 1報告先 1 信濃川下流河川事務所竣工年 報告先 2 新潟県 3 管理者新潟市・・・ 4 報告先が増えたため、 1 行追加すると、「管 理者」が入るはずの セルに別のデータが 入ってしまい、間 違った検索がおこな われてしまう
XML と Excel によるデータ化の違い(2) Excel ファイルでは、項目の追加や削除に対応できな い! 災害履歴データに、新たに「新潟県中越地震」を追加する Excel では、行の追加によりデータを追加することは可能であるが、様式が すでにいっぱいである場合には、行の追加により様式が崩れる XML では、データの意味を保持したまま、データの追加が容易 EXCEL ファイル XML ファイル 1964 新潟地震 ・・・ 2004 新潟福島豪雨災害 2004 新潟県中越地震 被災 年 被災内容 1964 新潟地震 1998 新潟県豪雨 8.4 水害 2004 新潟福島豪雨災害 被災 年 被災内容 1964 新潟地震 1998 新潟県豪雨 8.4 水害 2004 新潟福島豪雨災害 2004 新潟県中越地震 様式が決まっている 場合には、追加によ り様式が崩れる場合 がある データの意味を 保持したまま、 データの追加が 容易
XML と Excel によるデータ化の違い(3) Excel ファイルでは、品質の機械的なチェックが困難 入力したデータのデータ構造やデータタイプをチェックする場合 Excel では、各セルが、文字列であるか数値であるかのチェックは可能であるが、様 式が変更されていないかどうかの確認はできない 人が確認しなければならない XML では、タグの種類に応じてチェックが可能であり、また構造についても XML ス キーマという構造を定義したファイルを必ず持つためチェックが可能 「管理者」が文字列か、「竣工年」が数値であるか・・・ というタグが追加されたことは容易に確認可能 ABCD 1報告先信濃川下流河川事務所竣工年 管理者新潟市・・・ 3 ABCD 1報告先 1 信濃川下流河川事務所竣工年 報告先 2 新潟県 3 管理者新潟市・・・ 4 「 2 行 B 列」が文 字列かどうかの チェックは可能 1 行追加されたこ とは人が直接見 ない限りチェッ クできない XML ファイル 鳥屋野潟排水機場 信濃川下流河川事務所 ・・・ ・・・ XML スキーマ ファイル XML スキーマの記述イメージ には、 という情報があります は文字列です は数値です ※実際の記述方法は異なります は、 とい う情報を持つことは定義さ れていないので、 XML ス キーマを見ることで確認で きる 必ず対で存在 Excel の場合 XML の場合
XML と Excel によるデータ化の違い(4) Excel では、大きなデータ、大量のデータに対応できな い! エクセルは、レコード数 、カラム数 256 に制限されて いる。 レコード数に制限があることで、大量のデータを処理することはで きない。 (例)データ数が 以上ある場合は、データをエクセルファイ ルに格納できない。 カラム数が制限されていることで、大きなデータを処理できない。 (例)面データの XY 座標値を取り込む場合、頂点が 128 番目以降の 頂点の座標値をエクセルファイルに格納できない。 テキスト形式である XML ファイルはデータ量の制限はない。 ID 種類頂点 1 の X 頂点 1 の Y 頂点 2 の X 頂点 2 の Y … 頂点 127 の X 頂点 127 の Y 1 面 … 面 … : 面 … 頂点数が 128 以上 ある場合は不可 件 以上の データ は不可
XML と Excel によるデータ化の違い(5) Excel では、様式を変更して表示することが困難 Excel では、様式を変更して別の形で表現する場合には、ファイルをコ ピーして変更しなければならない。大幅な変更の場合はその配置に苦 労する XML では、同じ XML ファイルから、スタイルシートいうファイルを作 成することで、複数の様式を作成することができる。データの重複が 生じない。 Excel の場合 XML の場合 施設名管理者竣工年 1山田川樋管信濃川下流河川事務所 三条公共下水 道放流樋管 三条市下水道課 ・・・ 1998 山田川樋管 信濃川下流河川事務所 1978 ・・・ スタイルシート 施設名管理者竣工年 1山田川樋管信濃川下流河川事務所 三条公共下水 道放流樋管 三条市下水道課 ・・・ 1998 もとのデータは 1 つで、複 数の様式を表現可能 施設 1 施設 2 施設 3 施設名山田川樋管三条公共下水 道放流樋管 ・・・ 管理者信濃川下流河 川事務所 三条市下水道 課 ・・・ 竣工年 ・・・ コピー もとのデータを変更するか、コピー して別の様式を作成する必要あり。 コピーする場合には重複したデータ となる