VI-5 線分布(ネットワークデータ)を分析する方法

Slides:



Advertisements
Similar presentations
中学校段階での 相関関係の指導 宮崎大学教育文化学部 藤井良宜. 概要 現在の学習指導要領における統計の扱い これまでの相関関係の指導 相関関係の指導のポイント 相関関係.
Advertisements

放射線の計算や測定における統計誤 差 「平均の誤差」とその応用( 1H) 2 項分布、ポアソン分布、ガウス分布 ( 1H ) 最小二乗法( 1H )
到着時刻と燃料消費量を同時に最適化する船速・航路計画
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
2009/12/4 グラフ (2) 第10講: 平成21年12月4日 (金) 4限 E252教室 コンピュータアルゴリズム.
ひでき 平成17年4月12日 「日本教」モデルを ネットワーク分析する ひでき 平成17年4月12日.
地理情報システム論 第14回 GISによる処理技法と応用(3) ラスタ形式による空間的演算 ~土地利用の予測
11章 ボリュームレンダリングを学ぶ 本来は目に見えない内部情報をレンダリングし可視化する技術
ラベル付き区間グラフを列挙するBDDとその応用
重回帰分析入門 経済データ解析 2009年度.
初級ミクロ経済学 -生産者行動理論- 2014年10月20日 古川徹也 2014年10月20日 初級ミクロ経済学.
重回帰分析入門 経済データ解析 2011年度.
Effect sizeの計算方法 標準偏差が正確に求められるほど症例数が十分ないときは、測定しえた症例の中で、最大値と最小値の値の差を4で割り算した値を代用することが出来る。この場合には正規分布に従うことを仮定することになる。
神奈川大学大学院工学研究科 電気電子情報工学専攻
地理情報システム論 第3回 コンピュータシステムおける データ表現(1)
放射線の計算や測定における統計誤差 「平均の誤差」とその応用(1H) 2項分布、ポアソン分布、ガウス分布(1H) 最小二乗法(1H)
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
主成分分析                     結城  隆   .
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
VI-7 連続分布(面データ)を分析する方法
第11講: 平成18年12月 8日 (金) 4限 E352教室 グラフ (1).
第4章 空間解析 2.ネットワーク分析 (3) ネットワーク構造分析
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
V. 空間操作.
Yuri Y. Boykov Marie-Pierre Jolly
原子核物理学 第4講 原子核の液滴模型.
地理情報システム論 第14回 ラスタ形式による空間的演算 GISの応用(2)~土地利用の予測
第9回 GISで空間分布を捉える デジタル地理情報の構造 GISでみる地理分布 地理分布の計測 地理分布の理解.
顔部品の検出システムの構築 指導教員 廉田浩 教授 1DS04188W  田中 甲太郎.
情報学研究科 通信情報システム専攻 小野寺研究室 M1 奥村 佳弘
Data Clustering: A Review
第1章  開水路の等流(Uniform flow of open channel)
決定木とランダムフォレスト 和田 俊和.
グラフアルゴリズムの可視化 数理科学コース 福永研究室 高橋 優子 2018/12/29.
T2統計量・Q統計量 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
第14章 モデルの結合 修士2年 山川佳洋.
第3回 アルゴリズムと計算量 2019/2/24.
生物統計学・第3回 全体を眺める(1) R、クラスタリング、ヒートマップ、各種手法
主成分分析 Principal Component Analysis PCA
計算量理論輪講 chap5-3 M1 高井唯史.
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
Data Clustering: A Review
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
部分的最小二乗回帰 Partial Least Squares Regression PLS
V. 空間操作.
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
わかりやすいパターン認識 第7章:部分空間法  7.1 部分空間法の基本  7.2 CLAFIC法                  6月13日(金)                  大城 亜里沙.
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
データ解析 静岡大学工学部 安藤和敏
地理情報システム論(総)/ 国民経済計算論(商)
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
地理情報システム論(総)/ 国民経済計算論(商)
地理情報システム論 第4回 コンピュータシステムおける データ表現(2)
ポッツスピン型隠れ変数による画像領域分割
原子核物理学 第7講 殻模型.
重回帰分析入門 経済データ解析 2008年度.
重回帰分析入門 (第5章補足) 統計学 2007年度.
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
パターン認識特論 カーネル主成分分析 和田俊和.
時間情報に基づく多様な中心性に着目した 動的ネットワーク分析の提案
離散数学 11. その他のアルゴリズム 五島.
電磁気学C Electromagnetics C 7/10講義分 電気双極子による電磁波の放射 山田 博仁.
Presentation transcript:

VI-5 線分布(ネットワークデータ)を分析する方法  道路や鉄道など,線オブジェクトの集合はGISではネットワークデータと呼ばれることが多い.

 ネットワークデータの分析に良く用いられる手法は,ネットワークを「グラフ」と見なし,その接続状態を分析する方法である.このような手法はグラフ論的手法(graph-theoretic approach)と呼ばれることもある.

ネットワークをグラフと見なすとは?  ネットワークにおける,個々の線の接続状態だけに着目し,線の長さや向き,線に付随する属性などの情報を全て捨て去ること.

Three equivalent graphs representing a metro network

VI-5.1 グラフ論において用いられる用語 1) 連結グラフ:  グラフ中の全てのノードがリンクによって結合されているグラフ 2) 非連結グラフ:  グラフ中の全てのノードがリンクによって結合されていないグラフ

connected graph disconnected graph

3) 結合成分:  非連結グラフにおいて,結合していない個々の部分

4) 平面グラフ:  平面上でノード以外の交点を持たないグラフ 5) 非平面グラフ:  平面上でノード以外の交点を持たないグラフc

planar graph non-planar graph

6) 完全グラフ:  全てのノード対を結ぶリンクから成るグラフ 7) ツリーグラフ:  巡回路(サイクル)を持たないグラフ

complete graph tree graph

8) 位相距離:  グラフにおいて,各リンクの長さを1と考えた場合における,2つのノードを結ぶ最短距離

 なお,一般的にグラフ論では,ループ(起終点が同一のリンク)や重複リンク(起点と終点がそれぞれ同一のリンク群)を許す.しかし,以下では説明を簡単にするため,これらはいずれも存在しないものと仮定しておく.

 いま,ノード数n,リンク数l,結合成分数pというグラフがあるものとする.  このグラフの様子を簡潔に表すための指標を考える.

VI-5.2 結合度(connectivity)指標  ネットワークをグラフとしてみるとき,全体の結合の強さ(密度)はしばしば興味の一つとなる.道路で言えば,十分な道路網があるのか,という問題である.

 結合度指標とは,基本的に,ノードとリンクの比を見る指標,すなわち,ノードと比べてリンクが十分に多いかどうかを示す.

1) m指標 m = l - n + p  結合度が高い(リンクが多い)ほど,値が大きい.  平面グラフでは,リンクの数は最大で3n-6である.従って, 0≦m ≦2n - 5

2) a指標 l - n + p a = 2n - 5  a指標は,m指標を最大値2n - 5で割って基準化し,変域を0~1となるように基準化したもの.平面グラフにおいては, 0≦a ≦1

3) b指標 l b = n  結合度が高い(リンクが多い)ほど,値が大きい.  平面グラフでは, 6 0≦b ≦3 - n

4) g指標 b l g = = 6 3n - 6 3 - n  g指標は,b指標を基準化したもの.平面グラフにおいては, 0≦g ≦1

m 0.00 0.00 3.00 5.00 a 0.00 0.00 0.60 1.00 b 0.80 0.80 1.40 1.80 g 0.44 0.44 0.78 1.00

 以上,4つの結合度指標は,いずれもノードとリンク,結合成分の数だけに注目し,ネットワーク全体の結合の強さを表したものである.  この方法ではしかし,グラフの詳細な連結状態が考えられていないため,相互に区別できないグラフが生ずることになる.例えば,ツリーグラフは全て同一の指標を持つ.

VI-5.3 近接度(accessibility)指標  結合度指標・・・ネットワーク全体の様子を表す  近接度指標・・・各ノードの様子を表す  近接度指標は,各ノードのネットワーク中における「便利さ」を示すと考えて良い.

1) ケーニッヒ指数  各ノードから最遠点までの距離  ケーニッヒ指数の小さなノードは,他のノードに対して近接性が高く,ネットワークの中心にあると考えて良い.

4 4 4 3 4 3 4 2 3 ケーニッヒ指数

(参考) 直径  単一グラフにおける全ケーニッヒ指数の最大値  グラフの歪み(扁平度)を表す

2) シンベル指数(近接指数)  各ノードから全てのノードまでの距離の和  ケーニッヒ指数と同様,ノードの近接性や中心性を表す.

18 18 17 12 25 18 20 13 13 シンベル指数

 以上挙げた2種類の指標群は,いずれもネットワークの接続状態だけに注目し,ノードやリンクの属性を全く考慮していない.しかし例えば,道路網の評価を行う際には,道路の容量や混雑度なども考慮に入れる必要がある.このような,ノードやリンクの属性を考慮する指標も多数提案されているが,ここでは時間の都合上,割愛する.

VI-5.4 ネットワーク分析の応用 - 都市の発展過程

VI-6 連続分布(サーフェス)を分析する方法  連続分布とは...   2次元平面上の一点を与えたときに,そこにおける数値が一つ定まるデータ   スカラー場   例:標高や地価,CO2分布

 但し,連続分布をGISで表現する場合には,サンプル点のデータに基づく補間を用いるか,あるいは,空間集計単位による集計を用いることになり,表現形式上,データは2種類に分類される.

サーフェス(surface):  サンプル点におけるデータに基づいた補間によって構成される連続分布  例:標高値や地価,気温など

面データ(areal data, area data):  空間集計単位ごとにデータを集計して構成される連続分布  例:町丁目ごとの人口密度,街区ごとの建蔽率など

サーフェスと面データの違い  サーフェス: 滑らかな関数 自然地理発祥  面データ: 階段状の関数 人文地理発祥

 「密度」という,空間のある領域を定めない限り得られない値は面データにしか現れない.  但し,これらはそれほど本質的な差異ではない.従って,ほとんどの分析手法はいずれにも適用可能である.

VI-6.1 傾向面分析  サーフェスを簡単な多項式で近似し,その特性を見る方法.  例:z=a+bx+cxy+dy+ex2+fx2y+gx2y2+hxy2+iy2  式の当てはめは,通常は最小二乗法を用いる.

傾向面分析の問題点  サーフェスが,簡単な多項式で表されるほどに単純であれば有効であるが,そうでなければ結果の解釈が難しい

VI-6.2 バリオグラム(variogram)  サーフェス関数f(x)

バリオグラム関数g(x)  この関数は,分析領域Rにおいて,距離がhだけ離れた2点間での,サーフェス関数f(x)の値の差の二乗の平均値である.つまり,空間的にどのくらい距離が離れると,関数の値がどのくらい異なるのかを表現したと考えればよい.

nickel concentrations in north Vancouver Island 1.0 0.8 0.0 g(x) 0.4 0.2 0.0 0.0 1.0 2.0 nickel concentrations in north Vancouver Island

VI-6.3 位相法  サーフェスデータの全体的な構造を表す,全く別の方法として位相法がある.これは,頂点や底,尾根,谷など,サーフェスの局所的な位相特性に着目し,それらの相互関係を記述するものである.

peak(頂点) bottom(底) col(鞍点)  slope(斜面)

 これら4つの特性点と,それらを繋ぐ尾根線を全てサーフェス上に描く.そして,それらの接続状態を前述のネットワーク分析法によって分析する.