VI-3 異なる2つの点分布の関係を分析する方法

Slides:



Advertisements
Similar presentations
1標本のt検定 3 年 地理生態学研究室 脇海道 卓. t検定とは ・帰無仮説が正しいと仮定した場合に、統 計量が t 分布に従うことを利用する統計学的 検定法の総称である。
Advertisements

『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
第6回 適合度の検定 問題例1 サイコロを 60 回振って、各目の出た度数は次の通りであった。 目の出方は一様と考えてよいか。 サイコロの目 (i) 観測度数 : 実験値 (O i ) 帰無仮説:サイコロの目は一様に出る =>それぞれの目の出る確率 p.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
地理情報システム論 第11回 GIS による処理技法 アドレスマッチングの利用 空間的分布の特徴の把握.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
Ruth Onn, Alfred Bruckstein (Int J Comp Vision 1990)
看護学部 中澤 港 統計学第5回 看護学部 中澤 港
疫学概論 二項分布 Lesson 9.頻度と分布 §B. 二項分布 S.Harano,MD,PhD,MPH.
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
自己重力多体系の 1次元シミュレーション 物理学科4年 宇宙物理学研究室  丸山典宏.
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
重回帰分析入門 経済データ解析 2009年度.
実証分析の手順 経済データ解析 2011年度.
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
重回帰分析入門 経済データ解析 2011年度.
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
確率・統計Ⅱ 第7回.
第2章補足Ⅱ 2項分布と正規分布についての補足
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
VI-7 連続分布(面データ)を分析する方法
透視投影(中心射影)とは  ○ 3次元空間上の点を2次元平面へ投影する方法の一つ  ○ 投影方法   1.投影中心を定義する   2.投影平面を定義する
VII-3 空間選択モデル  空間におけるオブジェクトの選択行動を記述するためのモデル. 例: 買物先選択,居住地選択,観光地選択,
5.5 The Linear Arboricity of Graphs (グラフの線形樹化数)
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
VI-5 線分布(ネットワークデータ)を分析する方法
ガウス過程による回帰 Gaussian Process Regression GPR
原子核物理学 第4講 原子核の液滴模型.
第2日目第4時限の学習目標 平均値の差の検定について学ぶ。 (1)平均値の差の検定の具体例を知る。
Fuzzy c-Means法による クラスター分析に関する研究
確率・統計Ⅰ 第3回 確率変数の独立性 / 確率変数の平均 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
Basic Tools B4  八田 直樹.
電磁気学C Electromagnetics C 7/17講義分 点電荷による電磁波の放射 山田 博仁.
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
超幾何分布とポアソン分布 超幾何分布 ポアソン分布.
VIII. 空間情報表現.
VI. 空間解析.
確率と統計 年1月12日(木)講義資料B Version 4.
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
第1日目第3時限の学習目標 2変量データを手にした時の分布の特徴の記述方法(前回からの続き)について学ぶ。 基本的な2変量統計量ー1
V. 空間操作.
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
速度ポテンシャルと 流線関数を ベクトルで理解する方法
確率と統計2009 第12日目(A).
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
経営学研究科 M1年 学籍番号 speedster
疫学概論 ポアソン分布 Lesson 9.頻度と分布 §C. ポアソン分布 S.Harano,MD,PhD,MPH.
第3日目第4時限の学習目標 第1日目第3時限のスライドによる、名義尺度2変数間の連関のカイ2乗統計量についての復習
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
小標本に関する平均の推定と検定 標本が小さい場合,標本分散から母分散を推定するときの不確実さを加味したt分布を用いて,推定や検定を行う
藤田保健衛生大学医学部 公衆衛生学 柿崎 真沙子
確率と統計2007(最終回) 平成20年1月17日(木) 東京工科大学 亀田弘之.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
重回帰分析入門 (第5章補足) 統計学 2007年度.
パターン認識特論 カーネル主成分分析 和田俊和.
議論の前提 ある人獣共通感染症は、野生動物が感染源となって直接又は媒介動物を通じて人に感染を起こす。
回帰分析入門 経済データ解析 2011年度.
確率と統計 年12月16日(木) Version 3.
確率と統計 年1月7日(木) Version 3.
ペンシルパズル「一本線」のヒント数の扱いに関する解析
Presentation transcript:

VI-3 異なる2つの点分布の関係を分析する方法  異なる2種類の点オブジェクトが,同一地域内に分布している場合,それらの関係が問題になることがある.

Deaths from cholera in London, 1854

Lung and larynx cancer cases in the Chorley-Ribble area Lung cancer Larynx cancer Lung and larynx cancer cases in the Chorley-Ribble area

 二つの分布間の関係といっても様々なものがあり得るが,ここでは,二つの分布が互いに接近しているのか,互いに避けあっているのか,そのどちらでもないのか,ということに焦点を当てる.

相互回避 相互集塊 相互独立

二つの分布の類似性は, 1) 相互の因果関係(一方が他方を引き起こす)    例:コレラ患者と井戸の分布 2) 同一の原因を持つ(どちらも同じ原因による)    例:肺ガンと咽頭ガンの患者の分布 を暗に物語る.

他にも,   産業廃棄物焼却施設と咽頭ガン患者の分布   犯罪発生地点と交番の分布   プランクトンとその捕食者の分布   鉄道駅と商業施設の分布 ・・・

いま,分析領域内にA,Bという2種類の点分布が存在する.ここで,分析領域を合同なM個の区画に分割し,区画を以下のように分類して数える. VI-3.1 区画法  いま,分析領域内にA,Bという2種類の点分布が存在する.ここで,分析領域を合同なM個の区画に分割し,区画を以下のように分類して数える. A種を含む A種を含まない 合計 B種を含む kAB k0B KB B種を含まない kA0 k00 K-KB 合計 KA K-KA K

 ここで,もし二つの分布間に関係がないとすると,表の左列と中列,上段と中段はそれぞれ相似形になるはずである.このことを検定するには,以下の統計量を計算すればよい.

 この統計量は,二つの分布が独立である場合,自由度1のc2分布に従う.

問題点  a) 区画の大きさによって結果が異なる  b) 空間的な位置に関する情報を生かしていない

VI-3.2 相互最近隣距離法  単一点分布における最近隣距離法に対応  いま,分析領域内にA,Bという2種類の点分布が存在し,それぞれの点の個数をna, nb,密度をla, lbとする.

 それぞれの種類の全ての点について,他種の最近隣点までの距離の平均値(平均相互最近隣距離)を計算する.  但し,daiはAに属する点iからBに属する最寄りの点までの距離, dbiはBに属する点iからAに属する最寄りの点までの距離をそれぞれ表す.

 二種類の点が,いずれも無限平面上でランダムに分布する場合,平均相互最近隣距離Dの期待値は簡単な式で表される.  従って, DとE[D]を比較することにより,二種類の点が互いに接近しているのか,互いに避け合っているのかを判断することができる.

 検定の方法は大きく2つに分かれる.点の数が十分多い場合には,それぞれの点分布から点をma, mb個,それぞれna, nbに比例するようにランダムに抽出し,それらについて平均相互最近隣距離Dを計算する.

すると,点分布がランダムな場合のDの確率分布は, となり,正規分布に基づく検定ができる.

 点の数が少ない場合には,通常の最近隣距離法と異なり,平均相互最近隣距離Dの確率分布が明らかではない.そのため,検定はモンテカルロシミュレーションによらざるを得ない.

VI-3.3 相互K-関数法(2つの分布が対等な場合)  最近隣距離法の拡張が相互最近隣距離法であるが,同様に,K-関数法の拡張が相互K-関数法である.  いま,分析領域内にA,Bという2種類の点分布が存在し,それぞれの点の個数をna, nbとする.

このとき,Bから見たAの相互K-関数は次のように定義される. Bの点から距離h以内に存在するAの点の個数  KAB’(h)= nb la  Aから見たBの相互K-関数KBA’(h)も同様に定義される.

そして,AB間の関係はこれらの加重平均 で表される.但し,通常はこの値を基準化した相互L-関数 が用いられることが多い.

 なお,相互K-関数,相互L-関数の統計的検定は,いずれもモンテカルロ・シミュレーションによる.

Oklahoma City offences by whites and blacks and the cross L-function -10 -5 5 10 20 40 60 80 300 offence by whites offence by blacks Oklahoma City offences by whites and blacks and the cross L-function

VI-3.4 相互K-関数法(2つの分布が対等ではない場合)   例: 肺ガン患者と咽頭ガン患者の分布      白人と黒人による犯罪発生地点の分布

 しかし現実には,空間的近接性が議論される空間分布の場合,二つの分布間には因果関係が暗に想定されていることが少なくない.   例: コレラ患者と井戸の分布      産業廃棄物焼却施設と白血病患者の分布 原子力発電所と急性リンパ球小児白血病患者の分布

Leukaemia cases in upstate New York, 1978-82 Hazardous waste sites Leukaemia cases Leukaemia cases in upstate New York, 1978-82

Childhood acute lymphocytic leukaemia cases, N Nuclear power plants Leukaemia cases Childhood acute lymphocytic leukaemia cases, ages 0-15 years for 1980-1990 in Sweden

 このように,二つの分布の間に因果関係などが想定されており,必ずしも対等な扱いができない場合には,相互K-関数法は適当ではない.  なぜならば,この方法における統計的検定は,二つの点分布がそれぞれ自由に(ランダムに)分布できると仮定しているからである.この仮定では,「二つの分布が無関係である」か,「二つの分布は互いに影響し合っている」ということしかわからない.

 そこでこの場合,相互K-関数の定義において用いられる関数の一方KAB’(h)あるいはKBA’(h)を利用する. KAB’(h)を用いれば, Bから見たAの様子がわかる.従って,例えば産業廃棄物焼却施設と白血病患者の分布を比較する場合,前者をB,後者をAとしてKAB’(h)を計算すればよい.なおこの場合にも,統計的検定はモンテカルロシミュレーションによる.

VI-3.5 その他の方法  非一様場における点パターン分析   例: 人口分布による点分布の歪みの修整      カルトグラムによる視覚化

Census tracts of San Francisco City/County (1980)

本来の地図

人口に応じて歪めた地図(カルトグラム)

Hypothetical cases of a disease

Hypothetical cases of a disease

時空間における点パターン分析  ・病気の伝染・発症パターン  ・犯罪の発生パターン

VI-4 点分布と線分布の関係を分析する方法  例: 幹線道路とファミリーレストランの分布 幹線道路と呼吸器系疾患の発生率 高圧線と小児ガンの発生率  この場合,専ら興味は「線分布が点分布に与える影響」にあり,その反対,つまり,「点分布が線分布に与える影響」が考えられることはほとんどないと言って良い.

横浜市におけるファミリーレストランの分布

VI-4.1 最近隣距離方法  いま,分析領域内に何らかの線分布と,n個の点が存在しているものとする.このとき,各点から最近隣の線までの距離の平均値を計算する.

Spatial relationship between a point distribution and a line distribution

di:点iから最近隣点までの距離 n:点の個数  そして,点が分析領域においてランダムに分布しているときの平均最近隣距離の確率分布をモンテカルロシミュレーションによって導出し,統計的検定を行う.

最近隣距離法と同様,K-関数を用いる方法もある.すなわち, VI-4.2 K-関数法  最近隣距離法と同様,K-関数を用いる方法もある.すなわち, 線から距離h以内に存在する点の個数 n l K (h)=  但し,nは点の個数,lは点の密度をそれぞれ表す.K-関数を計算した後は,モンテカルロシミュレーションに基づく統計的検定を行う.