Download presentation
Presentation is loading. Please wait.
1
第1章 実世界のモデル化と形式化 8.モデルの信頼性
第1章 実世界のモデル化と形式化 8.モデルの信頼性 太田守重
2
ここで学ぶこと これまで示してきたように、実世界の諸現象は、概念として、もしくは個物としてモデル化される。従ってモデルの信頼性は,スキーマレベル及びインスタンスレベルで評価される.スキーマレベルの信頼性は,形式的には一般地物モデルに準拠しているか否かで評価できるが,型や型同士の相互関係の表現については,そのスキーマに関係する人々の合意が信頼性を保証する.一方インスタンスレベルの信頼性は,その正確さで評価でき、大きく5つに分類できる.それは完全性 (completeness),位置正確度 (positional accuracy) ,時間正確度 (temporal accuracy) ,論理一貫性 (logical consistency),及び主題正確度 (thematic accuracy)である. ここでは、スキーマレベル及びインスタンスレベスに分けて、信頼性評価の基本的な知識を学ぶ。最後に、空間データの要求仕様を記述する空間データ製品仕様書についても紹介する。
3
応用スキーマの信頼性 形式的な評価:一般地物モデル(GFM)に照らした妥当性の確認
地物型の定義、継承、及び関連が、UML及びGFMの規則に準拠しているか? 属性(空間、時間、場所)が、それぞれのスキーマに準拠して定義されているか? 関連役割や継承の定義にもれはないか? 操作の定義にもれはないか? 合意形成:関係者間の合意形成を通じた妥当性の確認 タスクフォース内部の合意 有識者の理解 公開による周知 改訂可能性の確保
4
応用スキーマの信頼性ーUML及びGFMへの準拠
GFMはUMLクラス図の記法を制限して使用している。 そこで、GFMが示す範囲内でUML表記法に従っていることを確認する。 応用スキーマの作成に、UMLによるモデリングを支援するソフト(*)を使用すれば、UMLへの形式的な準拠が保証される。 GFMへの準拠: 応用スキーマが、第2章2節に示したGFMによる応用スキーマのための規則に従っていることを、確認する。 (*) 例えば、ArgoUML, astah* communityなど
5
応用スキーマの信頼性ー属性が基本スキーマに準拠するか
属性の定義には、以下の要素が完備しなければいけない。 属性名(メンバー名) 定義:属性の意味 データ型:基本スキーマ(*)に含まれるデータ型 基数:多重度の下限と上限 (*)基本スキーマ: 以下のスキーマは応用スキーマを作成するための基本スキーマである。 空間スキーマ、時間スキーマ、場所スキーマ及び基本データ型のような、属性の型として使われるデータ型を定義するスキーマ 参照系のためのスキーマ 被覆スキーマ
6
応用スキーマの信頼性ー関連役割や継承の定義
関連役割の定義には以下の要素が完備しなければいけない。 関連種類(関連(association)、集成(aggregation)、又は合成( composition)) 役割名:相手の地物型の役割を示す名前 定義:地物型に与えられた役割の説明 基数:多重度(下限、上限) 継承の定義には以下の要素が完備しなければいけない。 最下位の地物型は具象型でなければいけない。 多重継承は避ける。 自分自身に対する継承はできない。
7
応用スキーマの信頼性ー操作の定義 操作の定義には以下の要素が完備しなければいけない。 操作名:(メンバー名) 定義:操作の説明
引数:操作に入力されるパラメータ(名前とデータ型の対) 戻り値:捜査の結果返されるデータの型
8
応用スキーマの信頼性ー合意形成 タスクフォース内部の合意:
利害関係者がタスクフォースを形成して、共用する応用スキーマを設計することが行われるが、その中で合意形成が行われる。 有識者の理解: 内部の合意がとれた段階で、その分野に知見をもつ有識者の意見を求め、改良した原案を作る。 公開による周知: さらに、必要に応じて原案を公開し、パブリックコメントを求める場合もある。 以上の段階を経て、応用スキーマは一定の信頼性を確保したことになる。 改訂可能性の確保: 利用中に気が付く問題点や、新たな需要への対応などが求められるので、応用スキーマは一定の期間をおいて、改訂を行うべきである。
9
インスタンスの信頼性 インスタンスは品質の評価を経て信頼性を確保することができる。評価要素は大きく5つに分かれる。
品質:明示的又は暗示的に示される要求を、インスタンス(データ)が満たす程度。 品質評価要素: 完全性 論理一貫性 位置正確度 時間正確度 主題正確度 地理データ(インスタンス)は実世界の現象を抽象化している。そこで、例えば位置の場合、現象の位置と一致すること(誤差0)が品質の要求になると考える向きがある。しかし、計測機器を使用して、人間が計測する以上、誤差0で位置をはかることはできない。そこで、利用者の要求を考え、関係者の合意を経て、正確度の程度が、要求として定められる。品質は、そのような要求に対する適合度のことをいう。
10
インスタンスの信頼性ー完全性 完全性:アイテム(地物,地物属性及び地物関係)の存在及び欠落 過剰:データ集合内の過剰なアイテムの存在の度合い
漏れ:データ集合からのアイテムの欠落の度合い 例: ある自治体の道路管理者が、管理している照明灯(地物)の本数を現場で数えたら5625本だった。これに対して自治体が保有している照明灯台帳(データ集合)上の本数は5635本であった。確認したところ、撤去した照明灯が一部、台帳に残っていたことが判明した。 この場合の完全性は「過剰」で、その度合いは、(5635 – 5625) / 5625 = 、つまり、0.18%になる。
11
インスタンスの信頼性ー論理一貫性 論理一貫性:データ集合,地物,属性及び関係に関する論理的規則の遵守の度合い。以下の種類がある。
書式一貫性:アイテムがデータ集合の物理構造を規定する規則に従って格納されている度合い。例)XML で記述されたデータ集合は,XML の文法に従わなければならない。 概念一貫性:概念スキーマ規則の遵守の度合い。例)データ集合は,対応する応用 スキーマを遵守しなければならない。 定義域一貫性:属性値が定義域に含まれる度合い。例)定義域が1 から10 までの整数であるときは,属性値は,その範囲になければならない。 位相一貫性:明示的に符号化した位相的特性の正しさの度合い。例)道路のネットワーク中のノードは全て,エッジの端点となる。したがって,孤立したノードがあればエラーとなる。 この中で、定義域とは、属性値がもちうる範囲のことを指す。例えば、建物の幾何属性としての曲面はその建物が存在する自治体の領域を出ることはないとする。すると自治体の領域を示す曲面を定義域とすることができる。論理一貫性の検証は、応用スキーマに応じた品質評価ソフトを作成し、それを使って行うことが多い。
12
インスタンスの信頼性ー位置正確度 位置正確度:地物の空間位置の正確度。以下の種類がある。
絶対正確度(外部正確度):測定された座標値と真又は真とみなす座標値との近さ。例)地図上で計測した照明灯の平面直角座標と、現場で測量用GPSで計測した値のずれ。GPSによる値はこの場合真と見なされる値と考えられる。 相対正確度(内部正確度):地物の相対位置と真又は真とみなす個々の相対位置との近さ。例)航空写真測量用の図化機で計測した道路縁から施設までの距離と、現場で巻き尺ではかった値のずれ。 位置正確度としては、これ以外にも、グリッドデータ位置正確度がある。これは、グリッドデータ位置と真又は真とみなすデータ位置との近さを示す。地図上で矩形を示すグリッドも、投影法の影響で、地球上では矩形にならないことがある。また、その逆もある。例えば日本でよく使われる標準地域メッシュの形状は台形に近い。これを矩形として処理すると、誤差が生ずることになる。
13
インスタンスの信頼性ー時間正確度 時間正確度:地物の時間属性及び時間関係の正確度。以下の種類がある。
時間測定正確度:測定された時間属性の示す時間と真又は真とみなす時間との近さ。例)事故を目撃した人が、昼の12時頃といった場合、真の時間との差は±30分程度と考えられる。 時間一貫性:事象系列の順序関係の正しさの度合い。例)竣工日は撤去日より遅くなることはない。 時間妥当性:報告されたトランザクション時間と真又は真とみなす値との近さ備考 トランザクション時間は,データベースに登録されたデータがもつ時間で,一般的には,アイテムの登録日時(タイムスタンプ)など。例)実世界に起きた現象を報告する電子メールのタイムスタンプと、実際に現象が起きた時点の差。 時間一貫性は、論理一貫性における位相一貫性と同種の品質評価要素である。時間の位相については、時間関係を示すネットワークが非巡回有向グラフになっているかが問われることになる。また前順序時間が対象になる場合は、グラフが線形になっているか、が問われる。 トランザクション時間に対して有効時間(Valid time)という概念がある。これは,実世界で計測される時間であり、時間属性の時間は全て有効時間である。
14
インスタンスの信頼性ー主題正確度 主題正確度:地物の主題属性の正しさ又は正確度。以下の種類がある。
分類の正しさ:地物,地物属性又は地物関連に割り当てられた分類値と真値と見なされる値(例えば,ground truth,基準になる参照データ集合)との比較 非定量的主題属性の正しさ:他と区別するための符号(非定量的属性)の正しさの度合い。例)土地利用分類の正確さ 定量的主題属性の正確度:大小又は順序を示す数(定量的属性)と真又は真とみなす数との近さ。例)地図上で測った道路の幅員と、現場で巻き尺で測った値の差 主題属性には様々な種類があるので、ここに示した要素以外の要素もあり得るので、それぞれについて、その正確さの評価方法を考えることになる。
15
空間データ製品仕様書 空間データ製品仕様書:空間データの使用目的,内容及び品質など作成されるべき空間データに対する要求事項を明確にするための仕様書。これによって、応用スキーマのUMLクラス図及び文書、品質要求などがひとまとめに示されることになる。以下の項目を含む。 概覧:対象とする製品の概要説明 適用範囲:空間データの地理的、時間的な範囲 データ製品識別:製品の名称 データ内容及び構造:応用スキーマのUMLクラス図及び文書 参照系:空間参照系及び時間参照系の指定 データ品質 :品質要求及び検証の方法 データ製品配布 :データ提供方法、メディアなど メタデータ:空間データの説明情報のためのルールの指定 その他:その他必要に応じて(例:描画のための規則など) 空間データ製品仕様書は、地理データ(インスタンス)を作成する際の要求をまとめたものであると同時に、出来上がった製品の説明情報としても使われる。ただし、本来の説明情報はメタデータ(データに関するデータ)であり、その中で、製品仕様書や品質評価結果が示されることになる。空間データの利用者は、メタデータの記載内容を見ることによって、自分の目的に合致したデータか否かを判断することができる。なお、空間データ製品仕様書の具体例は、国土地理院のサイトなどから入手することができる。例えば、 など。
16
まとめ 実世界の現象の抽象概念を地物とよぶが、地物は型(クラス)またはインスタンス(オブジェクト)として表現される。これは、実世界の現象のモデルである。地物型及び地物型同士の関係は応用スキーマで表現できるが、これがGFMに準拠していれば、関係者の理解が得やすくなる。また、GFMに準拠していることが応用スキーマの形式的な信頼性確保の条件になる。しかしその内容については、関係する人々の合意こそが、信頼性の証しとなる。 地物インスタンスについては、品質要求に対する適合性で、信頼性をはかることができる。品質要素は大きく5種類あり、データの作成目的に応じた評価基準が定められ、空間データ製品仕様書に示される。評価結果はデータのためのデータであるメタデータに記載することによって、関係者は自分の目的に合致したデータか否かを判断することができる。
17
参考文献 有川正俊、太田守重監修(2007)『GISのためのモデリング入門』ソフトバンククリエイティブ
国土地理院、地図情報レベル2500データ作成の製品仕様書(案)、国土地理院技術資料A・1-No.295-1、 (財)日本規格協会、JIS X 7113:2004 地理情報ー品質原理 (財)日本規格協会、JIS X 7114:2009 地理情報ー品質評価手順 ISO, ISO 19131:2007 Geographic Information – Data product specifications
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.