空間メタデータ整備 における課題 園山 実 三菱総合研究所
内容 研究者のニーズ メタデータ内容や整備に求められる要件 研究者が直面する問題点 空間データ交換システムにおけるメタデータ管理上の課題 まとめ
空間データ交換研究会メタデータ分科会 前述の内容について検討していくことを目的に、空間データ交換研究会のサブワーキングとして設置された。 メンバー: 東京大学 (株)パスコ (株)NTTデータ (株)三菱総合研究所
研究者のニーズ(1) 【データ入手時】 研究のリソースとなる空間情報について詳細かつ正確な情報を知りたい →できるだけ容易に知りたい ある条件のもとに適切な空間データを検索したい →どのような空間データが現存しているのかを知りたい 空間データを容易に入手したい →できればネットワーク経由で入手したい
研究者のニーズ(2) 【データ処理時】 ・複数の空間データを比較したい ・個々の空間データを特性に応じて加工したい ・複数の空間データを組み合わせて利用したい 【データ提供・展開時】 ・自分の研究成果を整理したい ・自分の研究成果である空間データの意味を正確に伝えたい 【その他】 ・利用や加工についての制約について知りたい
メタデータ内容への要件 必要にして十分な情報量 空間データの内容に係わる情報だけではなく、その確からしさや利用に係わる情報も含む。 標準化 記述項目と表現方法の標準化 ↓ ほとんどの要件はISO/TC211で満たされている ISO/TC211は研究者ニーズをほぼ直接的に具現化したものといえる
メタデータ整備への要件 メタデータを作る 質の高いメタデータの作成促進 できるだけ多くの既存の空間データにメタデータを付与 新たな空間データにメタデータ付与が促進される仕組みの確立やインセンティブの確保が重要 質の高いメタデータの作成促進 -メタデータ標準に則って- 記述内容の標準化:シソーラスへの対応による検索性確保 メタデータ作成支援ツールの整備 各空間データの位置づけの明確化:全体像の明確化 →これらはクリアリングハウスの満たすべき要件にも通じる
メタデータ分科会での取り組み 空間データ交換システムで扱うメタデータの設定 クリアリングハウスとの連携の検討 ISO/TC211に基づくサンプルメタデータの作成 例) 国土地理院数値地図 国土庁国土数値情報 衛星画像データ(LANDSAT-TM) 環境庁自然環境情報 古水文学データベース
空間データ交換システムにおけるメタデータ整備 新たな空間データ 空間データ交換システム データ交換要求 交換済み空間データ 連携・メタデータの共有 クリアリングハウス 空間データ交換サーバ メタデータB 空間データ 検索要求 メタデータA 検索結果 メタデータAのサブセット ・必要となるメタデータ項目 ・各項目の記述内容 ・メタデータ作成支援方法 等について検討中。 ユーザー(研究者) メタデータ標準ISO/TC211に準拠
研究者が直面する問題点 【データ入手時】 メタデータを読むのが大変 【データ提供・展開時】 メタデータの作成が大変 ・データ項目が多すぎる メタデータを読むのが大変 【データ提供・展開時】 メタデータの作成が大変 ・データ項目が多すぎる ・各項目の意味が良くわからない ・項目間の対比関係がよくわからない
項目の解釈の難しさ 例) ただし、ISO/CD15046-15を対象に議論。 活動型の記述: どのような活動を示すのか? A-1,11/12 Initiative type/Initiative name →メタデータは出来上がったデータセットの説明であるので、CSISでいうと例えば「フォーマット変換」が活動。 データサイズの問題: 圧縮前?圧縮後? A-7,16 Distribution Transfer Size →基本的にメタデータ作成対象のデータセットの圧縮後のサイズを示すべきだが、必要に応じて繰り返し記述で圧縮前サイズや要素ファイルのサイズを示すことが可能。
項目の解釈の難しさ 空間データに係わる時間情報: 項目が多いが・・ ①A-3,5 Source date/time「元情報の日時」 ②A-7,19 Distribution format version Date「フォーマットバージョン日付」 ③A-9,5 Reference date「参照日」 ④A-12,11 Temporal extent Date/time「時間的範囲の日時」 →原則として、データを作成する上で使われた資料とその作成に関する記述は系譜(lineage)で行うべき。あくまでも、メタデータは出来上がったものについての説明と割り切る。 解釈としては、①:元情報の作成日時,②:当該フォーマットが発効した日付,③:データのリリース日,④:地表状態を表す日時。
空間データ交換システムにおける メタデータ管理上の課題 どのようなデータ単位にメタデータを準備しておくのか?(検索時に非常に重要) 交換した空間データ全てにメタデータを付与するのか? クリアリングハウスとのデータのやり取り When? What? How?
まとめ ISO/TC211の受け止め方 ①標準(枠)ができてもメタデータ(中身)はできない。 ②オールマイティーではあるが全ての研究者にとって必ずしも使い易いものではない。 ↓ いかに多くのメタデータの記述を促し、それを展開していけるかが重要。 そのためには、まず以下が必要。 最低限表現すべきこと、知っておくべきことを明確にする。 研究者の空間情報リテラシーや専門に応じ、入力支援やカタログ表示のカスタマイズ化を図る。