VI-5 線分布(ネットワークデータ)を分析する方法 道路や鉄道など,線オブジェクトの集合はGISではネットワークデータと呼ばれることが多い.
ネットワークデータの分析に良く用いられる手法は,ネットワークを「グラフ」と見なし,その接続状態を分析する方法である.このような手法はグラフ論的手法(graph-theoretic approach)と呼ばれることもある.
ネットワークをグラフと見なすとは? ネットワークにおける,個々の線の接続状態だけに着目し,線の長さや向き,線に付随する属性などの情報を全て捨て去ること.
Three equivalent graphs representing a metro network
VI-5.1 グラフ論において用いられる用語 1) 連結グラフ: グラフ中の全てのノードがリンクによって結合されているグラフ 2) 非連結グラフ: グラフ中の全てのノードがリンクによって結合されていないグラフ
connected graph disconnected graph
3) 結合成分: 非連結グラフにおいて,結合していない個々の部分
4) 平面グラフ: 平面上でノード以外の交点を持たないグラフ 5) 非平面グラフ: 平面上でノード以外の交点を持たないグラフc
planar graph non-planar graph
6) 完全グラフ: 全てのノード対を結ぶリンクから成るグラフ 7) ツリーグラフ: 巡回路(サイクル)を持たないグラフ
complete graph tree graph
8) 位相距離: グラフにおいて,各リンクの長さを1と考えた場合における,2つのノードを結ぶ最短距離
なお,一般的にグラフ論では,ループ(起終点が同一のリンク)や重複リンク(起点と終点がそれぞれ同一のリンク群)を許す.しかし,以下では説明を簡単にするため,これらはいずれも存在しないものと仮定しておく.
いま,ノード数n,リンク数l,結合成分数pというグラフがあるものとする. このグラフの様子を簡潔に表すための指標を考える.
VI-5.2 結合度(connectivity)指標 ネットワークをグラフとしてみるとき,全体の結合の強さ(密度)はしばしば興味の一つとなる.道路で言えば,十分な道路網があるのか,という問題である.
結合度指標とは,基本的に,ノードとリンクの比を見る指標,すなわち,ノードと比べてリンクが十分に多いかどうかを示す.
1) m指標 m = l - n + p 結合度が高い(リンクが多い)ほど,値が大きい. 平面グラフでは,リンクの数は最大で3n-6である.従って, 0≦m ≦2n - 5
2) a指標 l - n + p a = 2n - 5 a指標は,m指標を最大値2n - 5で割って基準化し,変域を0~1となるように基準化したもの.平面グラフにおいては, 0≦a ≦1
3) b指標 l b = n 結合度が高い(リンクが多い)ほど,値が大きい. 平面グラフでは, 6 0≦b ≦3 - n
4) g指標 b l g = = 6 3n - 6 3 - n g指標は,b指標を基準化したもの.平面グラフにおいては, 0≦g ≦1
m 0.00 0.00 3.00 5.00 a 0.00 0.00 0.60 1.00 b 0.80 0.80 1.40 1.80 g 0.44 0.44 0.78 1.00
以上,4つの結合度指標は,いずれもノードとリンク,結合成分の数だけに注目し,ネットワーク全体の結合の強さを表したものである. この方法ではしかし,グラフの詳細な連結状態が考えられていないため,相互に区別できないグラフが生ずることになる.例えば,ツリーグラフは全て同一の指標を持つ.
VI-5.3 近接度(accessibility)指標 結合度指標・・・ネットワーク全体の様子を表す 近接度指標・・・各ノードの様子を表す 近接度指標は,各ノードのネットワーク中における「便利さ」を示すと考えて良い.
1) ケーニッヒ指数 各ノードから最遠点までの距離 ケーニッヒ指数の小さなノードは,他のノードに対して近接性が高く,ネットワークの中心にあると考えて良い.
4 4 4 3 4 3 4 2 3 ケーニッヒ指数
(参考) 直径 単一グラフにおける全ケーニッヒ指数の最大値 グラフの歪み(扁平度)を表す
2) シンベル指数(近接指数) 各ノードから全てのノードまでの距離の和 ケーニッヒ指数と同様,ノードの近接性や中心性を表す.
18 18 17 12 25 18 20 13 13 シンベル指数
以上挙げた2種類の指標群は,いずれもネットワークの接続状態だけに注目し,ノードやリンクの属性を全く考慮していない.しかし例えば,道路網の評価を行う際には,道路の容量や混雑度なども考慮に入れる必要がある.このような,ノードやリンクの属性を考慮する指標も多数提案されているが,ここでは時間の都合上,割愛する.
VI-5.4 ネットワーク分析の応用 - 都市の発展過程
VI-6 連続分布(サーフェス)を分析する方法 連続分布とは... 2次元平面上の一点を与えたときに,そこにおける数値が一つ定まるデータ スカラー場 例:標高や地価,CO2分布
但し,連続分布をGISで表現する場合には,サンプル点のデータに基づく補間を用いるか,あるいは,空間集計単位による集計を用いることになり,表現形式上,データは2種類に分類される.
サーフェス(surface): サンプル点におけるデータに基づいた補間によって構成される連続分布 例:標高値や地価,気温など
面データ(areal data, area data): 空間集計単位ごとにデータを集計して構成される連続分布 例:町丁目ごとの人口密度,街区ごとの建蔽率など
サーフェスと面データの違い サーフェス: 滑らかな関数 自然地理発祥 面データ: 階段状の関数 人文地理発祥
「密度」という,空間のある領域を定めない限り得られない値は面データにしか現れない. 但し,これらはそれほど本質的な差異ではない.従って,ほとんどの分析手法はいずれにも適用可能である.
VI-6.1 傾向面分析 サーフェスを簡単な多項式で近似し,その特性を見る方法. 例:z=a+bx+cxy+dy+ex2+fx2y+gx2y2+hxy2+iy2 式の当てはめは,通常は最小二乗法を用いる.
傾向面分析の問題点 サーフェスが,簡単な多項式で表されるほどに単純であれば有効であるが,そうでなければ結果の解釈が難しい
VI-6.2 バリオグラム(variogram) サーフェス関数f(x)
バリオグラム関数g(x) この関数は,分析領域Rにおいて,距離がhだけ離れた2点間での,サーフェス関数f(x)の値の差の二乗の平均値である.つまり,空間的にどのくらい距離が離れると,関数の値がどのくらい異なるのかを表現したと考えればよい.
nickel concentrations in north Vancouver Island 1.0 0.8 0.0 g(x) 0.4 0.2 0.0 0.0 1.0 2.0 nickel concentrations in north Vancouver Island
VI-6.3 位相法 サーフェスデータの全体的な構造を表す,全く別の方法として位相法がある.これは,頂点や底,尾根,谷など,サーフェスの局所的な位相特性に着目し,それらの相互関係を記述するものである.
peak(頂点) bottom(底) col(鞍点) slope(斜面)
これら4つの特性点と,それらを繋ぐ尾根線を全てサーフェス上に描く.そして,それらの接続状態を前述のネットワーク分析法によって分析する.