IV. GISデータの変換・統合
GISのデータには様々なものがあり,それぞれ データ形式や作成時点,投影法などばらばらで あることが少なくない. データを組み合わせて使うときには,データの変 換が必要になることがある.
IV-1 空間参照系(georeferencing system)の変換 オブジェクトの位置を示す方法 1) 緯経度座標系(Latitude/Longitude system) オブジェクトの位置を緯度と経度で示す GPS
2) UTM格子座標系(Universal Transverse Mercator Grid System) 横メルカトル図法に基づき,地表面を経度6度,緯度8度ごとの格子で区切ったもの 各地点の位置は,それが含まれる格子の記号と,格子の原点からのXY座標で表される.
3) 平面直角座標系(19座標系,日本) 日本全国に19の原点を設け,それぞれの原点を中心に平面直角座標系を構成したもの 狭い範囲の空間データでは標準的に用いられる.
第IX系 原点: 北緯36°0′0″, 東経139°50′0″ (千葉県野田市の北端) 適用範囲: 東京都(XIV系、XVIII系及び XIX系に規定する区域を除く),福島県,栃木県,茨城県,埼玉県,千葉県,群馬県,神奈川県
4) 階層式直角座標系(標準メッシュ,日本) 1次メッシュ:東西1度,南北40分 2次メッシュ: 1次メッシュを縦横それぞれ8分割 3次メッシュ: 2次メッシュを縦横それぞれ10分割(約1km*1km)
5) 住所 日本の場合,街区単位(例外:京都) 但し,住居表示未実施の場合, 街区に複数の住所が含まれることがある. アメリカの場合,通り単位
空間参照系の変換は,最近ではツールを使って ほぼ自動的に行うことができる 例: 緯経度座標系 平面直交座標系 住居表示 緯経度座標系 (アドレスマッチング)
IV-2 投影法の変換 投影法のいろいろ 方位図法 円錐図法 円筒図法
方位図法 円錐図法 円筒図法
gnomonic stereographic orthographic
投影法の変換も,最近ではツールを使ってほぼ自動的に行うことができる
IV-3 平行移動,拡大・縮小,回転 これらの変換はAffine変換の一部を構成する. GISでは数値を与えれば自動的に変換が行われる.
IV-4 ゴムシート処理 ゆがみを持つ地図の修正 投影法のわからない地図の変換 例: 古地図 手描きの地図
萬宝御江戸絵図 1861年 18×12cmの携帯用地図
Sketch map of an 8-year-old child
One resident's personal map of New York City
? IV-5 補間(spatial interpolation) いくつかの地点だけでわかっているデータから,全域の値を推定する 標本点 いくつかの地点だけでわかっているデータから,全域の値を推定する 127 119 ? 135 112 108 121 124 標本点
離散補間 連続補間 補間(狭義) 補外 補間(広義)
なぜ,補間が重要か? 空間や時間は連続であり,それらをデジタルな形で完全に表現することは不可能である.
IV-5.1 離散補間 発想:近いところにある点同士の値は近い 境界線で区切られた領域内の値を標本点の値で代表する
IV-5.2 連続補間1 - 1次元における補間 GISデータは通常2次元であるが,補間を理解するにはまず1次元の場合から始めた方が分かりやすいので先に1次元の場合について説明する.
標本点 節点
補間は基本的に,標本値に挟まれた各区間ごとに,何らかの関数を当てはめるという方法で行う. 連続補間では通常,区間の境界部分(節点と呼ばれる)で関数値を一致させる(離散補間との違い).
スプライン関数・・・ 各区間の補間に多項式を用いる場合,その関数をスプライン関数と呼ぶ.連続補間の場合,必ずスプライン関数を用いるというわけではないが,その扱い易さゆえ,利用されることは多い.
区間数:m 区間iにおけるスプライン関数 従って, m(n+1)個の未知パラメータ数を推定すれば,全体を補間することができる.
スプライン関数の拘束条件 関数は必ず各節点を通過する 節点において二つの関数は1, 2, …, n – 1次導関数まで連続する.
未知パラメータ数: m(n+1) 拘束条件1)により減少する自由度: 2m 拘束条件2)により減少する自由度: (m – 1)(n – 1) 従って,全体の自由度は m(n+1) – 2m –(m – 1)(n – 1)= n – 1 である.
自由度n – 1ということは,n=1(一次関数)であればスプライン関数は一意に定まることを意味している.他方, n≧2の場合には,前述の拘束条件だけではスプライン関数を定めることができない.この場合,さらにいくつかの条件を付加することで関数を定める.
1) 線形補間(linear spline) 1次関数による補間 自由度0:スプライン関数は一意に定まる 標本点を結ぶ折れ線
Linear spline
2) 2次補間(quadratic spline) 2次関数による補間 自由度1 スプライン関数の定め方: ある一点(例えば端点)における一次導関数の値を与える 全長を最小にするパラメータ推定
Quadratic spline
3) 3次補間(cubic spline) 3次関数による補間 自由度2 スプライン関数の定め方: 両端点における一次導関数値を与える(端点と,その隣接点を結ぶ直線の傾きなど).
Qubic spline
3次補間の特徴 滑らかさと振動の大きさのバランスが良い(4次以上の関数にすると,振動が大きくなり,補間が自然に行われなくなる. あらゆる関数の中で,曲率の総和を最小にする. 自在定規の持つ関数(物理的に無理のない曲線)
4) 応用:平面上の点を結ぶ補間 スプライン関数 ベジェ曲線
IV-5.3 連続補間2 - 矩形格子に基づいた,2次元における補間 67 71 72 69 64 65 59 66 75 74 70 60 77 78 79 61 82 84 81 76 73 88 86 83 80 区間数 my個 区間数 mx個
各格子内で,それぞれ異なるスプライン関数を考える.いま,スプライン関数の次数をnとすると,未知パラメータの数はmxmy (n+1)2である(平面における多項式では, n次関数のパラメータ数は(n+1)2 である). このうち,拘束条件を考えると,全体の自由度は (mx+my+2)(n – 1) + (n – 1)2 である.
1) 共線形補間(bilinear spline) 1次関数による補間(注:平面ではない!) 自由度0:スプライン関数は一意に定まる
A surface generated through the bilinear spline method
A surface generated through the bilinear spline method
2) 共2次補間(biquadratic spline) 2次関数による補間
自由度:mx+my+3 X軸上・Y軸上の端節点における1次導関数と,原点におけるxyによる1次導関数を与えると,関数を定めることができる.
実際の補間の手続きでは, 1次導関数を定めた境界線部分から順番にスプライン関数を求めていく.
A surface generated through the biquadratic spline method
A surface generated through the biquadratic spline method
3) 共3次補間(bicubic spline) 3次関数による補間
自由度: 2 mx+ 2 my+8 両X軸上・Y軸上の端節点における1次導関数と,4端点におけるxyによる1次導関数を与えると,関数を定めることができる.
A surface generated through the bicubic spline method
A surface generated through the bicubic spline method
IV-5.4 連続補間3 - 不規則三角格子網 67 72 64 71 74 69 65 69 66 60 72 76 59 67 75 60 79 70 61 71 64 78 69 76 76 81 74 73 82 74 83 70 77 88 77 86 84 80 78 75 66 74
各点を結ぶドローネ三角網(各点を三角形で結ぶ方法の一つ)を構築
A point distribution
Two triangulations
ドローネ三角網では,各三角形の形状が比較的正三角形に近い(極端な鋭角や鈍角がない)
各三角形の内部では,スプライン関数による補間を行う. なお,ドローネ三角網はGISで簡単に構築できる.
IV-6 kriging - 連続補間4 地形学や地質学などで良く用いられる方法 南アフリカの地質学者D. G. Krigeによって開発され,その名前が方法の名前になっている.
IV-6.1 バリオグラム(variogram) 連続分布関数f(x) R
バリオグラム関数g(h) この関数は,分析領域Rにおいて,距離がhだけ離れた2点間での,連続分布関数f(x)の値の差の二乗の平均値である.つまり,空間的にどのくらい距離が離れると,関数の値がどのくらい異なるのかを表現したと考えればよい.
nickel concentrations in north Vancouver Island 1.0 0.8 0.0 g(h) 0.4 0.2 0.0 0.0 1.0 2.0 nickel concentrations in north Vancouver Island
バリオグラム関数は,実際のデータから求められるものである.しかし,様々なデータについて関数を求めると,いくつか典型的なパターンが見られる.
linear spherical exponential quadratic wave power typical Variograms
バリオグラムは,距離hの関数として表されることが多い.しかし,方向による差異を考慮し,方向別のバリオグラムを作成することも少なくない.
バリオグラムと 似た関数として,コバリオグラム(covariogram),コレログラム(correlogram)がある.
ここで,mとs2はそれぞれ連続分布の平均と分散 である.
コバリオグラムは,確率分布における共分散と同じ形をしている.即ち,連続分布関数f(x)が確率的に決定されると考えた場合,距離hだけ離れた2点間のf(x)の共分散はコバリオグラムC(h)で与えられる.
バリオグラム,コバリオグラム,コレログラムの関係は, であり,これらは同等と考えて良い.
標本点iにおける連続分布の値:f(xi) IV-6.2 krigingの一般論 81 74 78 82 76 83 88 77 86 84 80 75 64 59 74 76 61 65 66 標本点:P1, P2, …, Pn 標本点iの位置ベクトル:xi 標本点iにおける連続分布の値:f(xi)
各地点におけるf(x)の値は,何らかの確率分布に従って決定される(確率現象である)と考える. また,任意の地点xにおけるf(x)の値は,周囲の標本点におけるf(x)の線形和を用いて推定する. 従って,ウェイトwi(x)を如何に決定するかがkrigingの中心課題である(ここで,ウェイトが地点xの関数であることに注意).
ここで,標本値f(xi)とウェイトwi(x)をまとめてベクトル表記しておく.
IV-6.3 simple kriging f(x)の従う確率分布について,以下の仮定を置く. 1) E[f(x)]=0(地点によらず期待値は0である) 2) 任意の2地点におけるf(x)の共分散は,地点間距離のみの関数として与えられる.
地点xにおける,f(x)の推定値の誤差の期待値は, となり,地点によらず0である.即ち,推定量は不偏推定量である.
一方,f(x)の推定値の平均二乗誤差は, である.但し,s2=C(0)かつ,
推定値の誤差はできるだけ小さいことが望ましい.そこでここでは,推定値の平均二乗誤差が最小になるようにウェイトw(x)を決定する. を得る.
従って推定値は, となる.
ここで問題は,f(x)の共分散を与えるコバリオグラムC(h)の決定である.simple krigingでは,この関数は理論的に考えられるいくつかのモデルの中から,既知の値に適合するものを選んで利用する.なお,コバリオグラムは通常,hの減少関数である. 例: C(h)=100e-h C(h)=1/(h+0.001)
例: 183.0 22.63 122.0 -38.37 148.0 -12.37 ? 160.0 -0.37 176.0 15.63
0.066 0.225 0.351 0.128 0.107 (数字はウェイトを表す)
simple krigingの問題点 1) 地点によらずf(x)の期待値が0であるという仮定は強く,現実には成立しないことが多い. 2) コバリオグラムC(h)の決定方法が恣意的である. 3) ウェイトw(x)の成分の和が1ではない.
このうち, 2) コバリオグラムC(h)の決定方法が恣意的である. の問題点は,コバリオグラムC(h)を未知パラメータを含む理論モデルの形で定め,実際のデータからモデルに含まれるパラメータ推定を行うことである程度解決することができる.
IV-6.4 ordinary kriging simple krigingの問題点のうち, 3) ウェイトw(x)の成分の和が1ではない. を解決し,ウェイトw(x)の成分の和=1とした方法
他の仮定や方法は全て同じである.即ち,f(x)の推定値の平均二乗誤差 を最小化する.但し,ウェイトに関する条件 が付される.条件付きの最小化問題であるので,Lagrangeの未定乗数法によりw(x)を算出する.
例: 0.094 0.251 0.363 0.151 0.141 (数字はウェイトを表す)
ordinary krigingの問題点 1) 地点によらずf(x)の期待値が0であるという仮定は強く,現実には成立しないことが多い.
IV-6.5 universal kriging ordinary krigingの問題点を解決し,f(x)の期待値が地点によって異なることを明示的に考慮した補間方法
f(x)の従う確率分布に関する仮定 1) E[f(x)]=m(x) 2) 任意の2地点におけるf(x)の共分散は,地点間距離のみの関数として与えられる.
ウェイトに関する条件
すると,f(x)の推定値の平均二乗誤差は以下の式で与えられる. 但し,
そして,最小化問題 を, subject to という制約条件の下で,Lagrangeの未定乗数法により解くことで,w(x)及びmが得られる.
なお,最近の統計パッケージの中には,krigingの計算を自動的に行うものが少なくない(代表的なものではS-PlusのSpatialStat).従って,実際にLagrangeの未定乗数法をプログラムで作成する必要はそれほどない.
IV-6.6 その他 block kriging いくつかの地点での値を推定するのではなく,ある領域における平均値を効率的に推定する方法 cokriging 二つの連続分布関数を,互いの情報を利用しながら同時に補間する方法
disjunctive kriging 標本値の線形和ではなく,非線形関数を用いて推定を行う方法 cross validation 補間して得られた値の精度を調べるために,標本点における値を他の値から推定し,その推定誤差を評価する方法
IV-6.7 スプラインとkrigingの比較(私見) 利用者 画像処理など 地形・地質学など 方法 自動的 半自動的 機構 (若干)不明確 明確 個別性 対象によらない 対象に依存
IV-6.8 今後の話題 補間精度の検討 補間法の比較 時空間補間 高次元補間