VII. 空間モデル.

Slides:



Advertisements
Similar presentations
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
データ分析入門(12) 第12章 単回帰分析 廣野元久.
【MedR】第7回 東京大学医学系研究科 特任助教 倉橋一成.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
第4章 回帰分析の諸問題(1) ー 計量経済学 ー.
パネル分析について 中村さやか.
重回帰分析入門 経済データ解析 2009年度.
回帰分析 重回帰(1).
実証分析の手順 経済データ解析 2011年度.
第4回 (10/16) 授業の学習目標 先輩の卒論の調査に協力する。 2つの定量的変数間の関係を調べる最も簡単な方法は?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
Bias2 - Variance - Noise 分解
回帰分析.
第6章 数量化I類.
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
第5章 回帰分析入門 統計学 2006年度.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
VI-7 連続分布(面データ)を分析する方法
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
VII-3 空間選択モデル  空間におけるオブジェクトの選択行動を記述するためのモデル. 例: 買物先選択,居住地選択,観光地選択,
需要の価格弾力性 価格の変化率と需要の変化率の比.
情報経済システム論:第11回 担当教員 黒田敏史 2018/9/20 情報経済システム論.
補章 時系列モデル入門 ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
データ解析 静岡大学工学部 安藤和敏
 統計学講義 第11回     相関係数、回帰直線    決定係数.
4章までのまとめ ー 計量経済学 ー.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
第14章 モデルの結合 修士2年 山川佳洋.
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
母分散の信頼区間 F分布 母分散の比の信頼区間
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
回帰分析(Regression Analysis)
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
データ解析 静岡大学工学部 安藤和敏
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
モデルの微分による非線形モデルの解釈 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
パターン認識特論 カーネル主成分分析 和田俊和.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
電磁気学C Electromagnetics C 7/10講義分 電気双極子による電磁波の放射 山田 博仁.
最終プレゼンテーション 「合併率と都道府県格差の 関係について」 2006年1月24日(火) 2002359 秦 数正
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

VII. 空間モデル

VII-1 空間モデルとは何か  空間操作,空間解析で得られる,空間パターンに関する知識に基づいて作られる,空間現象を記述するための数理的モデル

 空間モデルの分類法 1) 理論的モデル  理論的に妥当であると思われる行動や現象の仮説を置き,それに依拠して演繹的に構築するモデル 2) 記述的モデル  現象から得られるデータを分析し,それを適切に記述する方法を帰納的に構築するモデル

1) 決定論的モデル  現象が行動原理や理論によって完全に記述されているモデル 2) 確率論的モデル  現象のうち,行動原理や理論によって記述され内部分が残されており,それを確率的変動として記述するモデル

 ここでは,確率論的モデルのみを取り上げる.空間モデルにはこれ以外の範疇に含まれるものもあるが,我々が身近に接するモデルの多くは確率論的モデルである.理論的モデルと記述的モデルについては,ここではその両方を取り上げる.

モデル構築の一般論 1) 理論的に適切と思われる統計的モデルを考える. 2) 得られているデータから,モデルのパラメータを推定する. 3) 推定されたパラメータの有意性を検討する. 4) 複数のモデルを考えている場合には,その中から最も適切なものを選択する.

空間モデルの例  1) 空間回帰モデル  2) 空間選択モデル  3) 点パターン過程  4) 空間拡散過程 ・

 空間モデルは,分野ごとにはそれぞれ開発が行われてきたが,その一般化はそれほど進んでいるとはいえない.空間モデルの研究は現在も途上である.  そのため,空間モデルをきちんと体系的に説明することは極めて困難である.

VII-2 空間回帰モデル  点,線,面の各オブジェクトに付随する属性を記述するモデル.理論的モデルというよりも記述的モデルである. 例:各空間集計単位における作物の単位面積当たり収量を,各空間集計単位の気温や標高,雨量などで説明する.

 領域:S1, S2, …, Sn  領域iに与えられている被説明変数:yi  領域iに与えられている説明変数:xi1, xi2, …, xip  yiを,xi1, xi2, …, xipで説明したい!

VII-2.1 (通常の)重回帰モデル とおき, 定数項相当分 とする.

 ここで,eは確率的に変動する誤差項であり,期待値0かつ各iについて独立に同一の確率分布に従うものとする.即ち, と仮定する.

 この仮定の下では,XとYが与えられれば,通常最小自乗法(ordinary least squares)によってbを推定し,YをXによって説明するモデルが得られる.即ち, となる.

 モデル推定の有意性を統計的に議論するには,eが正規分布に従うという仮定を追加する.すると,パラメータbの各成分についてt値が計算され,それらが検定に用いられる.

VII-2.2 (一般)重回帰モデル  通常の重回帰モデルでは,誤差の確率分布に独立性,同一性を仮定する.この仮定は非常に強く,特に,空間に分布するデータに対しては成立することは稀である.実際例えば,隣接する領域の値における誤差は強く相関していることが多い.

(一般)重回帰モデル 仮定

 2番目の仮定は,回帰式の誤差項が互いに相関していることを表しており,行列Cは分散共分散行列と呼ばれる.相関が強ければ,共分散は大きくなる.  これらの仮定の下では,パラメータベクトルbは一般最小二乗法(generalized least squares)によって推定される.即ち, である.

 この推定は,一見簡単そうであるが,実はそうではない.推定には分散共分散行列Cが必要であり,この値は普通は分からない.そのため,パラメータベクトルbと分散共分散行列Cをどちらも推定しなければならない.  推定にはいくつかの方法があるが,最も良く用いられるのはバリオグラムを利用する方法である.

推定の手順 1) 通常の回帰モデルを適用し,Yの推定値を算出する.そして,その残差のバリオグラムを作成する. 2) 得られたバリオグラムに対して,適当な理論モデルを適用し,それに基づいて分散共分散行列Cを推定する.

 2) のバリオグラムは,領域間の距離を説明変数,Yの推定値の残差の共分散を被説明変数とするものである.

3) 推定された分散共分散行列Cを用いて,一般最小二乗法によりパラメータベクトルbを推定し,その残差分布を求める. 4) 2)と3)の過程を,残差が十分小さくなるまで繰り返し,最終的な結果を採用する(収束計算).

VII-2.3 空間誤差モデル(Spatial Error Model: SEM)  (一般)重回帰モデルでは,分散共分散の構造が通常の重回帰モデルと比べて大きな自由度を持つようになる.しかしそれでも,(一般)重回帰モデルでは以下の仮定が置かれていることになる.  誤差分布の分散共分散は,空間的な距離の連続関数として表すことができる(距離のみに依存する).

 この仮定は必ずしも妥当であるとはいえない.そこで,この仮定を要求しないモデルが必要となり,それに応えるものの一つが空間誤差モデルである.

空間誤差モデル Y:被説明変数 X:説明変数 U:構造的に決定される誤差を表す項 W:領域間の距離を表す距離行列 e:ランダム誤差を表す項 r:定数項

距離行列

ランダム誤差に関する仮定

空間誤差モデルの意味  この項だけ見れば,通常の重回帰モデルと同じである.つまり,被説明変数Yを説明変数Xを用いて表し,そこに誤差Uが加わっている.但し,誤差Uが独立・同一の確率分布に従うのではなく,ある構造によって決定されるという点が異なる.

 この式のうち,Uの一つを書き下してみよう.

 ここから分かるとおり,上の式は,誤差uiがそれ以外の誤差u1,u2,…, ui-1, ui+1, …, un-1, unとランダム誤差によって決定されることを表している.  つまり,各領域の構造誤差は互いに影響し合っており,その影響の仕方は領域間の距離(距離行列W)によって規定されている.

 空間誤差モデルは,一種の同時自己回帰モデル(SAM:Simulnateous Autoregressive Model)である.これは,二つの式を合わせると理解しやすい.

 被説明変数Yは,各領域の説明変数X((X-rW)Xb)と,各領域の周辺におけるY(rWY)によって決定される.この後者,つまり,周辺におけるYの値が含まれていることが,「自己」回帰の性質を表している.

 この式より,Uの分散共分散行列は陽に表される.

 空間誤差モデルにおいて,未知のパラメータはb,r,sである(UはWとr,sが与えられれば前式によって定まる).これらの推定には,通常,Uが分散共分散行列V[U]を持つ正規分布に従うという仮定を置く.  この仮定は,空間誤差モデルの基本式 が(一般)重回帰モデルに従うと考えるのと同値である.

推定の手順 1) 通常の重回帰モデル(Y=Xb+e)を適用し,bの推定値を算出する. 2) 1)で得られたbを用い,尤度を最大化するrとsを計算する.

3) 空間誤差モデル(Y=Xb+U)を適用し(ここで,Uは分散共分散行列V[U]を持つ正規分布に従うと考える),それに基づいてbの新たな推定値を算出する. 4) 2)と3)の過程を,b,r,sの推定値が十分に安定するまで繰り返し,最終的な結果を採用する(収束計算).

 空間誤差モデルと対比されるモデルとして,空間自己回帰モデル(Spatial Autoregressive Model: SAM)がある.これは,ある地点における被説明変数の値Yが他の領域の値から受ける影響を明示的に組み込んだモデルである.

 そして,空間誤差モデルと空間自己回帰モデルを統合するモデルが空間回帰モデル(Spatial Regressive Model: SRM)である.このモデルでは,被説明変数を説明する構造において,被説明変数と誤差の両方に自己回帰的(この場合には空間的)構造が組み込まれている.

VII-2.4 一般線形モデル(Generalized Linear Model: GLIM)  これまで扱った三つのモデルでは,被説明変数は連続的に無限の値域を取りうることが前提となっている.しかし,GISデータの中には人口や世帯数など,整数値しか取らない個数データや,正値しか取らない密度データなども多い.これらのデータにも対応するモデルが一般線形モデルである.

被説明変数が個数を表す場合  ・・・値域は正の整数値に限定されるため,被説明変数Yを対数変換 する.これは,値域を拡大するだけでなく,誤差項の等分散性を確保する意味でも極めて有効である(通常,Yが大きいほど誤差の分散も大きい).

被説明変数が比率を表す場合  ・・・値域は0~1に限定されるため,被説明変数Yをロジスティック変換 した上で,Y‘を被説明変数とする回帰分析を行う.

 これらの変数変換を統一的に理解し,理論的枠組みを与えるモデルが一般線形モデルである.これは,被説明変数Yが指数型分布族(正規分布,Poisson分布,二項分布など)に従い,その期待値mの関数g(m)が説明変数Xの線形関数Xbと表されるモデルを指す.即ち, Y~指数型分布族 である.

 なおここで,期待値mの関数g(m)は対数変換やロジスティック変換などの変数変換に相当し,関数g(m)は連結関数link functionと呼ばれる.

一般線形モデルの例 通常の重回帰モデル Y=Xb+e  これは,Yが期待値Xbの正規分布に従っていると考えるモデルであり,連結関数g(m)=mである.

Poisson回帰モデル Y~Poisson(exp(Xb))  個数データYを被説明変数とする場合,それを対数変換した上で回帰分析を行う.また,被説明変数はPoisson分布に従うと考えるのが通例である(正規分布では整数以外の値を取りうる).この場合,連結関数g(m)=log(m)であり,Yは期待値exp(Xb)のPoisson分布に従っていると考える.

Logistic回帰モデル Y~Bi(exp(Xb)/(1+exp(Xb)))  比率データYを被説明変数とする場合,それをロジスティック変換した上で回帰分析を行う.また,被説明変数は二項分布に従うと考える.この場合,連結関数g(m)=log(m/(1-m))であり,Yは期待値exp(Xb)/(1+exp(Xb))の二項分布に従っていると考える.

 一般線形モデルの推定には最尤法が用いられる.具体的な計算は繰り返し計算による.即ち,通常の重回帰モデル(Y=Xb+e)を適用してbの推定値を算出し,その値を用いて誤差項の分散共分散行列を計算,さらにそれに基づいてbの推定値を再推定,という手続きを,推定値が収束するまで行う.

VII-2.5 その他の回帰モデル Geographically Weighted Regression Model (GER)  回帰式のパラメータbが空間上の位置によって異なることを明示的に組み込んだモデル.

Bidimensional Regression Model  説明変数,被説明変数がいずれも2次元ベクトルで表されており,それらの関係を線形式で記述するモデル.地図の歪みを扱うためにしばしば用いられる.