Presentation is loading. Please wait.

Presentation is loading. Please wait.

浅見泰司 asami@csis.u-tokyo.ac.jp 2010年10月17日 第4章 空間解析 6. 傾向面分析 浅見泰司 asami@csis.u-tokyo.ac.jp.

Similar presentations


Presentation on theme: "浅見泰司 asami@csis.u-tokyo.ac.jp 2010年10月17日 第4章 空間解析 6. 傾向面分析 浅見泰司 asami@csis.u-tokyo.ac.jp."— Presentation transcript:

1 浅見泰司 asami@csis.u-tokyo.ac.jp
2010年10月17日 第4章 空間解析 6. 傾向面分析 浅見泰司

2 ここで学ぶこと 大まかな空間分布をとらえる手法として傾向面分析の内容を理解する。
1,2,4次関数の曲面で近似することで、どちらの方向で高いか、どちらの方向に広がっているのかなどをとらえることができる。

3 傾向面分析のニーズ 地表面上の連続的な分布は、サーフェス(surface)を形成する。 これを簡単な関数で近似できると便利。 例
人口密度 地価 気温 これを簡単な関数で近似できると便利。 概略の形がわかる 数値計算に便利なこともある 大まかな傾向把握が可能となる

4 都市の人口密度分布で考えてみる。 まずは都心からの距離で表す方法を紹介し、次に、2次関数などで空間分布を近似する傾向面分析に発展させていく。

5 都心からの距離と人口密度 都市内の人口分布を簡単な関数で近似する方法があると便利。
よく行われる方法は、都心部からの距離で人口密度を表すこと。 地形・地質上の制約がなければ、都市はほぼ同心円的に発展する。そのため、都心部からの距離が似ていれば地区の市街化状況も似ていると考えられる。そこで、人口密度もおおまかには都心部からの距離で決まっているだろうと仮定する。 この考え方をもとに、20世紀半ばから様々な式が開発されてきた。 都心部からの距離をx、その地点での人口密度をD(x)として、いくつかの式を紹介する。 下記の式は夜間人口を念頭に開発されたものだが、人口分布に適合するならば昼間人口やその他の人口分布に応用してもかまわない。

6 クラーク(Clark)の式 よく使われる表現式は、クラークの式(Clark (1951))と呼ばれる。 D(x)=a exp(bx)
ただし、aは(モデル上の)都心部の人口密度、bは定数。 都心部から離れるに従って人口密度が減少するため、b < 0。 Clark (1951)は、アメリカなどの都市の人口密度を調べ、比較的よく記述できることを示した。 その頃の都市は都心部ほど人口密度の高い単峰的な分布を示す都市が多かった。 その後都市が発展するに従って、都心部より離れた部分の人口密度の方が高い都市が増えた。これは、副都心が発達したり、都心部が空洞化するため。 negative exponential modelとも呼ばれる。この式は、次のような特徴を持つ。 (1)中心地点で最も密度が高い。 (2)人口密度のグラフは下に凸の形である。

7 パラメータa, bを推定するのには、各地点での人口密度の対数を都心部からの距離で単回帰分析すればよい。
すなわち、   log D(x)=log a + bx という式で回帰分析し、定数項を後で変換すれば良い。 クラークの式を用いた分析で、特にbの値が経年的にどのように変化するかを調べることにより、都市の外延化現象を分析することができる。bが減少するほど、外延化現象が進んでいる。

8 ニューリング(Newling)の式 クラークの式では空洞化現象の進んだ規模の大きい都市の人口分布を表現することは困難。そこで、この欠点を改めるために提案されたのが、ニューリングの式(Newling (1969))。  D(x) = a exp(bx+cx2) aは(モデル上の)都心部の人口密度、bとcは定数。 都心部から離れるにつれて人口密度は上昇しそれから減少するというのが一般的なので、b>0, c<0となる。 単峰的な都市ではb<0となることもある。 指数の部分が2次式であるため、quadratic exponential model ともいわれる。 この式には次のような特徴がある。 (1) b>0の時、中心からやや離れた地点において人口密度が最大になる。  (x = -b/(2c) において最大値a exp[-b2/(4c)]をとる。) (2) b>0の時、最大人口密度点ではグラフが上に凸である。 (3) 都心部から充分離れた地点では人口密度のグラフは下に凸で、人口密度は都心部から離れるに従って減少する。 (4) b<0ならば都心部を最大密度とする分布となり、グラフは下に凸となる。 (5) b<0かつc=0とすれば、Clark の式となる。従って、ニューリングの式はクラークの式を含む、より一般的な式である。 空洞化現象も表すことができる。

9 ニューリングの式のパラメータを実際の人口密度分布から推定するには、各地点での人口密度の対数を都心部からの距離とその二乗値で重回帰分析すればよい。
すなわち、   log D(x) = log a + bx+cx2 という式で回帰分析し、定数項を後で変換すれば良い。 ニューリングの式の応用として、モデル上の人口密度最大点の経年的変化を求めることにより、ドーナツ化現象を分析できる。すなわち、最大点( -b/(2c) )が都心部から離れるほど、ドーナツ化現象が進行していると考えられる。 ただ、xがあまりに小さな範囲に限定される場合は、この回帰分析による推定方法は不安定となる。

10 アインバーグ(Aynvarg)の式 都市の空洞化現象を表す別の改良された式として、アインバーグの式(Aynvarg (1969); Angel and Hyman (1972))がある。この式は次のように表せる。   D(x) = a exp(bx)xc a, b, cは定数。 通常、都心部からやや離れた地点で密度が最大に達し、その後減少していくという分布なので、a>0, b<0, c>0という符号をとる。 この式を現実の都市の人口分布にあてはめるには、通常の線形回帰分析ではできない。このことと、上記・の性質が多くの都市では成り立たないために、アインバーグの式はさほど用いられない。ただ、xの二乗の指数関数項がないため、ニューリングの式よりも、「ゆるやかに」密度が減少するような関数になり、都心部を除いて、現実の都市内人口密度分布に適合しやすい。 この式は関数形からlinear gamma function model とも呼ばれる。 この式には次のような特徴がある。 (1)中心からやや離れた地点において人口密度が最大になる。(x = -c/bにおいて、最大値a exp(-c)(-c/b)cをとる。) (2)中心地点での人口密度は0。 (3)最大人口密度点のすぐ外側では(ニューリングの式と異なり)下に凸で人口  密度が減少する。 (4)c=0とすれば、クラークの式となる。従って、クラークの式の別の拡張とも言える。

11 パール(Parr)らの式 パールら(Parr, et al. (1988))は、二つの新しい関数形を提案している。その中で、実用にもなりそうな式を紹介する。   D(x) = a exp[b(log x) + c(log x)2] ただし、a, b, cは定数で、対数は自然対数である。典型的にはa > 0, c<0という符号をとる。 この式もアインバーグの式と同様、中心部の人口密度は0に限定されるという欠点を持つ。 ただし、関数形から人口減少がより「ゆるやかな」関数形を推定でき、かなり外延化した人口分布に(都心部を除いて)適合しやすい。 関数形からlognormal function modelとも呼ばれる。 この式の特徴は、 (1)中心部の人口密度は0である。 (2)中心からやや離れた地点で人口密度は最大となる。(x = exp[-b/(2c)]において最大値a exp[-b2/(4c)]) をとる。) (3)最大密度点以遠では下に凸で減少する。 である。

12 参考: 人口密度分布式 Stewart (1947) Clark (1951) Tanner (1961) Smeed (1963)
参考: 人口密度分布式 Stewart (1947) D(x) = D0-bx Clark (1951) D(x) = D0 exp(-bx) Tanner (1961) D(x) = D0 exp(-cx2) Smeed (1963) D(x) = D0 x-a Aynvarg (1969) D(x) = D0 exp[(bx)x-f] Stewart (1947)の式は都心からの一次式

13 Newling (1969) Newling (1971) McDonald and Bowman (1976)
D(x) = D0 exp(bx+cx2) Newling (1971) D(x) = D0+bx-cx2 McDonald and Bowman (1976) D(x) = D0 (xR-x)b D(x) = D0 exp(-ax+b/x) Kau and Lee (1976) [D(x)l-1]/l = a+bx [D(x)l-1]/l = a+b(xl-1)/l Newling (1971)の式は都心からの距離の二次式

14 Frankena (1978) Zielinski (1979) D(x) = D0-bx+cx2-dx3
D(x) = D0 exp(-bx+cx2-dx3) Zielinski (1979) D(x) = D0 exp(bx-cx2)x-f D(x) = D0 exp[-cx2x-f] Frankena (1978)の式は、都心からの距離の三次式

15 中心からの(x,y)座標で表すとx,yで表現する式になる
この中のいくつかは距離に関するn次式 中心からの(x,y)座標で表すとx,yで表現する式になる D(x) = f(x,y) もう一つの欠点は、都心部からの距離だけで表現されているので、どの方向にも同じような分布をしていることが暗黙に仮定されている。この欠点を補う方法が、座標点の式で表現する方法。→傾向面分析

16 人口密度分布式関連文献 Angel, S. and G.M. Hyman (1972) "Urban Spatial Interaction" Environment and Planning, 4, Aynvarg, Y. (1969) “Zones of Influence of Middle-Sized Cities, Their Boundaries and Passenger Flows” Soviet Geography, 10, Clark, C. (1951) "Urban population densities” Journal of the Royal Statistical Society, 114, Frankena, M. (1978) "A bias in estimating urban population density functions” Journal of Urban Economics, 5, Kau, J.B. and Lee, C.F. (1976a) "Capital-land substitution and urban land use” Journal of Regional Science, 16, Kau, J.B. and Lee, C.F. (1976b) "The functional form in estimating the density gradient: An empirical investigation” Journal of the American Statistical Association, 71,

17 McDonald, J. y Bowman, H.W. (1976) "Some tests of alternative urban population density functions” Journal of Urban Economics, 6, Newling, B. (1969) "The spatial variation of urban population densities” Geographical Review, 59, Newling, B. (1971) "The spatial variation of urban population densities” in Internal Structure of the City, Oxford University Press, London. Smeed, R.J. (1963) "The effect of some kinds of routing systems on the amount of traffic in central areas of towns” Journal of the Institution of Highway Engineers, 10, 5-26. Stewart, J.Q. (1947) "Empirical mathematical rules concerning the distribution and equilibrium of population” Geographical Review, 24, Tanner, J.C. (1961) “Factors effecting the amount of travel” Road Research Technical Papers, 51, Zielinski, K. (1979) “Experimental analysis of eleven models of urban population density” Environment and Planning A, 11,

18 傾向面分析(trend surface analysis)
規則的あるいは不規則的に分布しているn個の観測点について、観測された値の分布をできる限り近似するサーフェスを回帰式によって数学的に求めるもの(張, 2001; 奥野, 1977; O’Sullivan and Unwin, 2002)。

19 傾向面分析とは 傾向面分析とは2次元に広がった人口密度の値をなめらかな曲線で近似して、その分布の特徴をとらえるものである。2次元の広がりをxy座標で表そう。例えば、x軸が東方向、y軸が北方向としても良い。 原点を例えば都心部など分析上便利な中心的な点に定める。人口密度がわかっている点を(xi, yi) (i=1,...,N)とし、その地点の人口密度をpiとする。人口密度をなめらかな曲線で近似した式を、z = f(x, y)とする。近似するのだから、人口密度がわかっている各地点iで、piとf(xi, yi)の違いをなるべく小さくする必要がある。そのため、その差の2乗の和を最小化する最小二乗法を用いて、近似曲線fを求めるのが一般的。 傾向面分析の説明

20 1次傾向面 最も簡単な(ただ、あまり近似は良くない)1次傾向面をとりあげる。これは、fの関数として1次の式を用いるもので、a, b, cを定数として、   f(x, y) = ax+by+c と表すことができる。定数は最小二乗法で推定する。 山形に分布する人口密度を平面で近似しようというのだから、さほど近似にならない。ただ、どちらの方向に人口密度が多いかを知ることはできる。具体的には、(a, b)の方向に人口密度が多い地域が卓越していることになる。

21 2次傾向面 現実的な分析は、2次以上の傾向面分析によって行うことができる。2次傾向面は、fの関数として2次式を用いるもので、a~gを定数として、   f(x, y) = ax2 + bxy + cy2 + dx +ey + g と表すことができる。 都市全域を含めて分析すれば、通常、aとcは負の値となって、上に凸の2次曲面となる。 2次傾向面で重要な点は、2次傾向面の最大値で、これが、分析対象都市の人口分布での中心地に相当する。 もうひとつ重要なのは、どちらの方向に長く人口密度が高い地域が広がっているかを示すもので、これは、得られた2次曲面が楕円曲面となっている場合に、その長軸方向が求めるべき方向となる。

22 4次傾向面 都市の人口密度分布は都市全域で考えれば周辺部が小さくなる山形なので、3次傾向面はあまり用いられず、4次傾向面が使われる。4次傾向面も上と同様に、fが4次式で表されるものである。 4次式を用いると、都心部の空洞化現象なども表すことができ、例えば、どちらの方向に空洞化が卓越しているかなどを分析することができる。

23 傾向面分析の例 まずは、計算例を見てみよう! 例 東京都23区の2010年における人口密度分布 人口・世帯数:2010年1月の住民基本台帳
緯度経度は各区役所の位置 (x,y)は経度と緯度がそれぞれ、最小値0、最大値1になるように変換したもの

24 2010年の23区の人口密度と位置 住民基本台帳による1月1日人口
TITLE 2010年人口 2010年世帯数 人口密度 緯度 経度 UNIT 世帯 人/k㎡ 千代田区 47 138 25 914 4 050 中央区 65 786 11 186 港区 9 909 新宿区 15 477 文京区 16 736 台東区 92 656 16 566 墨田区 17 335 江東区 11 177 品川区 15 343 目黒区 17 212 大田区 11 344 世田谷区 14 319 渋谷区 12 966 中野区 19 215 杉並区 15 496 豊島区 18 804 北区 15 479 荒川区 94 378 18 324 板橋区 16 106 練馬区 14 378 足立区 12 066 1 葛飾区 12 394 江戸川区 13 074 住民基本台帳による2010年1月1日における東京23区の人口密度の表

25 コロプレスマップ おおまかに言うと・・・ 北西の方が密度が高い。 中心部は少なく、周辺で多く、外延部で少ない(ドーナツ化現象)。 ように見える。

26 おおまかに言うと・・・ Q1:北西の方が密度が高い? Q2:中心部は少なく、周辺で多く、外延部で少ない(ドーナツ化現象)?

27 本来はコロプレス・マップで表現すべきだが、あえて、それぞれの区役所の位置で代表させて、その地点における人口密度であると考えると・・・

28 23区の区役所の位置を基準化してプロットした物

29 一次回帰式 PopDensity = ax+by+c という回帰分析をしてみると・・・

30 概要 回帰統計 重相関 R 0.4131157 重決定 R2 0.1706645 補正 R2 0.087731 標準誤差 3298.5859
観測数 23 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 2 残差 20 合計 22 係数 t P-値 下限 95% 上限 95% 切片 4.194E-06 x y 回帰分析結果

31 つまり、 PopDensity = x y 北(yが正)西(xが負)側に人口密度がやや多いが、xの係数もyの係数も統計的に有意ではない。 →Q1は×

32 さらに、二次回帰式 PopDensity = ax2 + bxy + cy2 + dx +ey + g という回帰分析をしてみると・・・

33 回帰統計 重相関 R 0.417101 重決定 R2 0.173973 補正 R2 -0.06898 標準誤差 3570.674 観測数
23 分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 5 残差 17 2.17E+08 合計 22 2.62E+08 係数 t P-値 下限 95% 上限 95% 切片 x y x^2 xy -39005 y^2 -25839 回帰分析結果

34 つまり、 PopDensity = -950x xy-1201y2-7302x +3875y+14341 ・・・x2とy2の係数はマイナスだけど、xyの係数はプラス

35 実際、y=x(北東-南西方向)とすると、 PopDensity = 3315x2-3427x+14341
x,yで2階微分すると、 これは負値行列ではない! つまり上に凸ではない 実際、y=x(北東-南西方向)とすると、 PopDensity = 3315x2-3427x+14341 となり、原点から十分遠いところでは大きくなる! 北東-南西方向では下に凸! →Q2も× 負値の議論は、線形代数を習っていないとやや難しいので、そのときは上半分の記述は無視しても良い。

36 このように、コロプレスマップではごまかされてしまうようなことを傾向面分析により正確に分析できる!

37 多項式関数の適合 先の例のように、サーフェスモデルを求める際、回帰式に多項式を用いる場合がある。 これが傾向面分析の基礎的な応用。
通常は、平面の当てはめ(一次関数により傾向面分析)、もしくは二次関数による当てはめくらいしか行わない。それ以上だと、解釈が難しくなってくる。

38 多項式関数の適合 より正確に記述すると: zi=f(xi,yi)+ei
ただし、ziはi番目の観測値、(xi,yi)はi番目の観測値の(x,y)座標、f()は傾向面関数、eiはi番目の観測値の誤差。 傾向面関数が線形であれば、通常の線形の回帰分析で関数を推計できる。

39 残差解析 サーフェス全体の分散を傾向(多項回帰式)と傾向からの残差に分け、そのうちの残差に注目し、その統計的性質をもとに多項回帰式の妥当性や外れ値の抽出などがおこなわれる。

40 応用として、回帰分析の残差分析にも使われる。
まずは、説明変数で回帰して、その残差について傾向面分析を行う。 一度にやってしまうには、 zi=g(ti)+f(xi,yi)+ei という関数を推計すればよい。ただし、g()は属性に関する回帰分析の関数、tiはi番目の観測値の属性値ベクトルである。

41 例えば、人口密度は道路密度(1㎢あたりのkm単位の道路長さ)で決まると考えたとする。そうすると、
PopDensity = a+bRoadDensity+e e = cxx+cyy+e   というモデルを考えることができる。最初の式は、人口密度が道路密度の一次関数で表現できるというモデルであり、二番目の式は、その誤差に関する傾向面分析である。

42 これを一つの式に表わすと PopDensity = a+bRoadDensity+cxx+cyy+e   となる。これは、上記の残差傾向面分析の式の形となっている。 実際にやってみると・・・ (道路密度は2008年のデータ)

43 人/k㎡ km/k㎡ 人口密度 道路密度 x y 千代田区 4050 15.10593 0.504551 0.620816 中央区
11186 港区 9909 新宿区 15477 文京区 16736 台東区 16566 墨田区 17335 江東区 11177 品川区 15343 目黒区 17212 24.13 大田区 11344 世田谷区 14319 渋谷区 12966 中野区 19215 杉並区 15496 豊島区 18804 北区 15479 荒川区 18324 板橋区 16106 練馬区 14378 足立区 12066 1 葛飾区 12394 江戸川区 13074 東京23区の人口密度と道路密度のデータ

44 回帰統計 重相関 R 0.675193 重決定 R2 0.455886 補正 R2 0.369973 標準誤差 2741.232 観測数
分散分析表 自由度 変動 分散 観測された分散比 有意 F 回帰 3 1.2E+08 残差 19 1.43E+08 合計 22 2.62E+08 係数 t P-値 下限 95% 上限 95% 切片 3515.1 道路密度 人口密度を被説明変数、人口密度と区役所の位置を示すx,yで回帰分析した結果

45 PopDensity = 3515+589RoadDensity-1409x-251y+e
つまり、道路密度で人口密度はほぼ説明され、かつ誤差にも一定方向に大きな誤差があるというような有意な傾向がないことがわかる。

46 残差に対する傾向面分析は、時として回帰式には含まれない隠れた変数を見出すヒントになることもある。ただし、あまり強力な方法とはならないことが多い。

47 参考文献 O’Sullivan, David and David J. Unwin (2002) Geographic Information Analysis, John Wiley & Sons, Inc. 奥野隆史(1977)『計量地理学の基礎』大明堂. 張長平(2001)『地理情報システムを用いた空間データ分析』古今書院.


Download ppt "浅見泰司 asami@csis.u-tokyo.ac.jp 2010年10月17日 第4章 空間解析 6. 傾向面分析 浅見泰司 asami@csis.u-tokyo.ac.jp."

Similar presentations


Ads by Google