VII. 空間モデル
VII-1 空間モデルとは何か 空間操作,空間解析で得られる,空間パターンに関する知識に基づいて作られる,空間現象を記述するための数理的モデル
空間モデルの分類法 1) 理論的モデル 理論的に妥当であると思われる行動や現象の仮説を置き,それに依拠して演繹的に構築するモデル 2) 記述的モデル 現象から得られるデータを分析し,それを適切に記述する方法を帰納的に構築するモデル
1) 決定論的モデル 現象が行動原理や理論によって完全に記述されているモデル 2) 確率論的モデル 現象のうち,行動原理や理論によって記述され内部分が残されており,それを確率的変動として記述するモデル
ここでは,確率論的モデルのみを取り上げる.空間モデルにはこれ以外の範疇に含まれるものもあるが,我々が身近に接するモデルの多くは確率論的モデルである.理論的モデルと記述的モデルについては,ここではその両方を取り上げる.
モデル構築の一般論 1) 理論的に適切と思われる統計的モデルを考える. 2) 得られているデータから,モデルのパラメータを推定する. 3) 推定されたパラメータの有意性を検討する. 4) 複数のモデルを考えている場合には,その中から最も適切なものを選択する.
空間モデルの例 1) 空間回帰モデル 2) 空間選択モデル 3) 点パターン過程 4) 空間拡散過程 ・
空間モデルは,分野ごとにはそれぞれ開発が行われてきたが,その一般化はそれほど進んでいるとはいえない.空間モデルの研究は現在も途上である. そのため,空間モデルをきちんと体系的に説明することは極めて困難である.
VII-2 空間回帰モデル 点,線,面の各オブジェクトに付随する属性を記述するモデル.理論的モデルというよりも記述的モデルである. 例:各空間集計単位における作物の単位面積当たり収量を,各空間集計単位の気温や標高,雨量などで説明する.
領域:S1, S2, …, Sn 領域iに与えられている被説明変数:yi 領域iに与えられている説明変数:xi1, xi2, …, xip yiを,xi1, xi2, …, xipで説明したい!
VII-2.1 (通常の)重回帰モデル とおき, 定数項相当分 とする.
ここで,eは確率的に変動する誤差項であり,期待値0かつ各iについて独立に同一の確率分布に従うものとする.即ち, と仮定する.
この仮定の下では,XとYが与えられれば,通常最小自乗法(ordinary least squares)によってbを推定し,YをXによって説明するモデルが得られる.即ち, となる.
モデル推定の有意性を統計的に議論するには,eが正規分布に従うという仮定を追加する.すると,パラメータbの各成分についてt値が計算され,それらが検定に用いられる.
VII-2.2 (一般)重回帰モデル 通常の重回帰モデルでは,誤差の確率分布に独立性,同一性を仮定する.この仮定は非常に強く,特に,空間に分布するデータに対しては成立することは稀である.実際例えば,隣接する領域の値における誤差は強く相関していることが多い.
(一般)重回帰モデル 仮定
2番目の仮定は,回帰式の誤差項が互いに相関していることを表しており,行列Cは分散共分散行列と呼ばれる.相関が強ければ,共分散は大きくなる. これらの仮定の下では,パラメータベクトルbは一般最小二乗法(generalized least squares)によって推定される.即ち, である.
この推定は,一見簡単そうであるが,実はそうではない.推定には分散共分散行列Cが必要であり,この値は普通は分からない.そのため,パラメータベクトルbと分散共分散行列Cをどちらも推定しなければならない. 推定にはいくつかの方法があるが,最も良く用いられるのはバリオグラムを利用する方法である.
推定の手順 1) 通常の回帰モデルを適用し,Yの推定値を算出する.そして,その残差のバリオグラムを作成する. 2) 得られたバリオグラムに対して,適当な理論モデルを適用し,それに基づいて分散共分散行列Cを推定する.
2) のバリオグラムは,領域間の距離を説明変数,Yの推定値の残差の共分散を被説明変数とするものである.
3) 推定された分散共分散行列Cを用いて,一般最小二乗法によりパラメータベクトルbを推定し,その残差分布を求める. 4) 2)と3)の過程を,残差が十分小さくなるまで繰り返し,最終的な結果を採用する(収束計算).
VII-2.3 空間誤差モデル(Spatial Error Model: SEM) (一般)重回帰モデルでは,分散共分散の構造が通常の重回帰モデルと比べて大きな自由度を持つようになる.しかしそれでも,(一般)重回帰モデルでは以下の仮定が置かれていることになる. 誤差分布の分散共分散は,空間的な距離の連続関数として表すことができる(距離のみに依存する).
この仮定は必ずしも妥当であるとはいえない.そこで,この仮定を要求しないモデルが必要となり,それに応えるものの一つが空間誤差モデルである.
空間誤差モデル Y:被説明変数 X:説明変数 U:構造的に決定される誤差を表す項 W:領域間の距離を表す距離行列 e:ランダム誤差を表す項 r:定数項
距離行列
ランダム誤差に関する仮定
空間誤差モデルの意味 この項だけ見れば,通常の重回帰モデルと同じである.つまり,被説明変数Yを説明変数Xを用いて表し,そこに誤差Uが加わっている.但し,誤差Uが独立・同一の確率分布に従うのではなく,ある構造によって決定されるという点が異なる.
この式のうち,Uの一つを書き下してみよう.
ここから分かるとおり,上の式は,誤差uiがそれ以外の誤差u1,u2,…, ui-1, ui+1, …, un-1, unとランダム誤差によって決定されることを表している. つまり,各領域の構造誤差は互いに影響し合っており,その影響の仕方は領域間の距離(距離行列W)によって規定されている.
空間誤差モデルは,一種の同時自己回帰モデル(SAM:Simulnateous Autoregressive Model)である.これは,二つの式を合わせると理解しやすい.
被説明変数Yは,各領域の説明変数X((X-rW)Xb)と,各領域の周辺におけるY(rWY)によって決定される.この後者,つまり,周辺におけるYの値が含まれていることが,「自己」回帰の性質を表している.
この式より,Uの分散共分散行列は陽に表される.
空間誤差モデルにおいて,未知のパラメータはb,r,sである(UはWとr,sが与えられれば前式によって定まる).これらの推定には,通常,Uが分散共分散行列V[U]を持つ正規分布に従うという仮定を置く. この仮定は,空間誤差モデルの基本式 が(一般)重回帰モデルに従うと考えるのと同値である.
推定の手順 1) 通常の重回帰モデル(Y=Xb+e)を適用し,bの推定値を算出する. 2) 1)で得られたbを用い,尤度を最大化するrとsを計算する.
3) 空間誤差モデル(Y=Xb+U)を適用し(ここで,Uは分散共分散行列V[U]を持つ正規分布に従うと考える),それに基づいてbの新たな推定値を算出する. 4) 2)と3)の過程を,b,r,sの推定値が十分に安定するまで繰り返し,最終的な結果を採用する(収束計算).
空間誤差モデルと対比されるモデルとして,空間自己回帰モデル(Spatial Autoregressive Model: SAM)がある.これは,ある地点における被説明変数の値Yが他の領域の値から受ける影響を明示的に組み込んだモデルである.
そして,空間誤差モデルと空間自己回帰モデルを統合するモデルが空間回帰モデル(Spatial Regressive Model: SRM)である.このモデルでは,被説明変数を説明する構造において,被説明変数と誤差の両方に自己回帰的(この場合には空間的)構造が組み込まれている.
VII-2.4 一般線形モデル(Generalized Linear Model: GLIM) これまで扱った三つのモデルでは,被説明変数は連続的に無限の値域を取りうることが前提となっている.しかし,GISデータの中には人口や世帯数など,整数値しか取らない個数データや,正値しか取らない密度データなども多い.これらのデータにも対応するモデルが一般線形モデルである.
被説明変数が個数を表す場合 ・・・値域は正の整数値に限定されるため,被説明変数Yを対数変換 する.これは,値域を拡大するだけでなく,誤差項の等分散性を確保する意味でも極めて有効である(通常,Yが大きいほど誤差の分散も大きい).
被説明変数が比率を表す場合 ・・・値域は0~1に限定されるため,被説明変数Yをロジスティック変換 した上で,Y‘を被説明変数とする回帰分析を行う.
これらの変数変換を統一的に理解し,理論的枠組みを与えるモデルが一般線形モデルである.これは,被説明変数Yが指数型分布族(正規分布,Poisson分布,二項分布など)に従い,その期待値mの関数g(m)が説明変数Xの線形関数Xbと表されるモデルを指す.即ち, Y~指数型分布族 である.
なおここで,期待値mの関数g(m)は対数変換やロジスティック変換などの変数変換に相当し,関数g(m)は連結関数link functionと呼ばれる.
一般線形モデルの例 通常の重回帰モデル Y=Xb+e これは,Yが期待値Xbの正規分布に従っていると考えるモデルであり,連結関数g(m)=mである.
Poisson回帰モデル Y~Poisson(exp(Xb)) 個数データYを被説明変数とする場合,それを対数変換した上で回帰分析を行う.また,被説明変数はPoisson分布に従うと考えるのが通例である(正規分布では整数以外の値を取りうる).この場合,連結関数g(m)=log(m)であり,Yは期待値exp(Xb)のPoisson分布に従っていると考える.
Logistic回帰モデル Y~Bi(exp(Xb)/(1+exp(Xb))) 比率データYを被説明変数とする場合,それをロジスティック変換した上で回帰分析を行う.また,被説明変数は二項分布に従うと考える.この場合,連結関数g(m)=log(m/(1-m))であり,Yは期待値exp(Xb)/(1+exp(Xb))の二項分布に従っていると考える.
一般線形モデルの推定には最尤法が用いられる.具体的な計算は繰り返し計算による.即ち,通常の重回帰モデル(Y=Xb+e)を適用してbの推定値を算出し,その値を用いて誤差項の分散共分散行列を計算,さらにそれに基づいてbの推定値を再推定,という手続きを,推定値が収束するまで行う.
VII-2.5 その他の回帰モデル Geographically Weighted Regression Model (GER) 回帰式のパラメータbが空間上の位置によって異なることを明示的に組み込んだモデル.
Bidimensional Regression Model 説明変数,被説明変数がいずれも2次元ベクトルで表されており,それらの関係を線形式で記述するモデル.地図の歪みを扱うためにしばしば用いられる.