初期マイクロデータの推定手法に関する エージェントベースとセルベースの比較

Slides:



Advertisements
Similar presentations
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
Advertisements

土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
土地利用マイクロシミュレーションのための 年代の違いを考慮した世帯別転居行動分析 関西大学大学院理工学研究科 社会資本計画研究室 金崎 智也.
世帯マイクロデータの適合度評価における 重みの決定手法
地理情報システム論 第14回 GISによる処理技法と応用(3) ラスタ形式による空間的演算 ~土地利用の予測
電力配線図(A系統:長さmm) 消費電力:1100W TH-LC 2階 220 ⑥タップ (電力源タップ)
【セッション予約日時、価格等の新規登録】
入門 計量経済学 第02回 ―本日の講義― ・マクロ経済理論(消費関数を中心として) ・経済データの取得(分析準備) ・消費関数の推定
都市マイクロシミュレーションに基づく 課題の抽出と政策立案
社会調査とは何か(3) 調査対象者の選定方法
CGS カーネルベース 変化するオブジェクトに    進化するデータベースを。.
画面設計④:製品詳細ページ 別 紙 Daishinsha Inc. マスタ タイトルの書式設定 ■ヘッダー・グローバルメニュー ×
行動モデル夏の学校 買い物地選択行動 モデルのパラメータ推定
ISDASインターネット分散観測: ワームの平均寿命はいくらか?
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
プログラム演習 ‐行動モデル夏の学校2007‐ 2007/09/20 愛媛大学大学院M1 牛尾龍太郎.
Bassモデルにおける 最尤法を用いたパラメータ推定
疫学概論 母集団と標本集団 Lesson 10. 標本抽出 §A. 母集団と標本集団 S.Harano,MD,PhD,MPH.
『大阪府人口ビジョン(案)』の概要 ■はじめに ■人口の将来見通し(シミュレーション) ■大阪府の人口の潮流 c ■基本的な視点
胃ろうまたは腸ろうによる経管栄養.
状況の制約を用いることにより認識誤りを改善 同時に野球実況中継の構造化
マイクロシミュレーションにおける 可変属性セル問題と解法
マーケティング戦略.
未定稿 資料2-4 主な「政策課題」の整理(全体像) 世界をリードする大阪産業 水とみどり豊かな新エネルギー都市大阪 ミュージアム都市大阪
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
マッチング理論を用いた 土地利用マイクロシミュレーション モデルの開発
経鼻経管栄養.
地理情報システム論演習 地理情報システム論演習
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
小標本検査データを元にした 疲労破損率のベイズ推定
・ Twinpact100のDV入力(プレゼン画面キャプチャ) ・ WEBカメラ(発表者) の両方を1画面にして配信・録画する。
地理情報システム論 第14回 ラスタ形式による空間的演算 GISの応用(2)~土地利用の予測
愛媛大学C班 M2 前川朝尚 M1 谷本善行 B4 薬師神司
市区町村別標準化該当比マップ (2013年度版) 岡山県保険者協議会 岡山県国民健康保険団体連合会.
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
音高による音色変化に着目した音源同定に関する研究
カテゴリ設定の影響を考慮した 初期マイクロデータ推定手法の比較
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
MSET使用方法  一時中断したい場合には、マウスの右クリックをしてください(小ウインドウが開き一時停止します)。続行する場合には、開いた小ウインドウ以外の適当な場所を右クリックしてください。
【e-Rad】担当者用 平成24年度公募(三次) 新規公募(三次)設定 操作説明 (3月29日修正版)
長崎市① 長崎市における平和学習スポット (社)長崎県観光連盟.
疫学概論 直接法と間接法の相違 Lesson 5. 率の調整 §D. 直接法と間接法の相違 S.Harano,MD,PhD,MPH.
ブレッド・ボードを用いた回路の作成 気温データ・ロガー編.
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
都市・港湾経済学(総) 国民経済計算論(商)
ベイズ最適化 Bayesian Optimization BO
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
東京海洋大学 地域計画研究室 三島佑介 高下寛之
クロス表とχ2検定.
今から2200年ほど前に,古代ギリシアのアルキメデスは,円周率が3と71分の10より大きく,3と7分の1より小さいことを発見しました。・・・
第17回福岡県ねんりんスポーツ・文化祭 ふれあい市場レイアウト
回帰分析(Regression Analysis)
HMM音声合成における 変分ベイズ法に基づく線形回帰
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
富士見町の新規就農者支援 パッケージ制度のご紹介
持続可能な開発目標(SDGs:Sustainable Development Goals)について
サンプリングと確率理論.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
ブレッド・ボードを用いた回路の作成 気温データ・ロガー編.
Q状態イジング模型を用いた多値画像修復における 周辺尤度最大化によるハイパパラメータ推定
実都市を対象とした初期マイクロデータの 推定手法の適用と検証
Presentation transcript:

初期マイクロデータの推定手法に関する エージェントベースとセルベースの比較        ドーコン 正員   ○杉木 直      東京都市大学 フェロー  宮本 和明      東京都市大学 正員    大谷 紀子  Kasetsart University 正員    Varameth VICHIENSAN 1

背景 ・土地利用-交通モデル分野におけるマイクロ シミュレーションへの関心の高まりと研究事例 および実際の都市への適用事例の蓄積の進展  シミュレーションへの関心の高まりと研究事例  および実際の都市への適用事例の蓄積の進展 ・土地利用マイクロシミュレーションにおける  シミュレーション初期年次の「マイクロデータ」  の必要性 ・個人、個別世帯に関するデータの入手は困難  →入手可能データによる「人口データ推計」を実施   :集計データ(国勢調査等)+サンプル調査

目的 ◆初期年次のマイクロデータ作成に関する セルベースとエージェントベースによる手法の比較  セルベースとエージェントベースによる手法の比較 →モデル適用の場面や目的を踏まえた推定手法選択のため     のガイドライン作成にむけて 質的な視点における比較   ・データ特性、推定手法の規範、複雑性、データ入手可能性等に関する     両手法の特性、メリット・デメリットの整理 量的な視点における比較   ・実データを観測データとして用いた両手法による初期データの作成   ・セルベースデータの比較による推定の頑健性の評価   ・エージェントベースデータの適合度評価によるマイクロ世帯推計への有効性    の検証   

人口・世帯データ推計に関する既存研究 ①セルベースの推計手法 ・・・IPF法およびその拡張 ②エージェントベースの推計手法 - Deming and Stephan (1940) ・人口データ推計問題への適用 - Beckman et al. (1996) - 宮本ら (1986) ・IPF法の改良 - Guo and Bhat (2007) - Pritchard and Miller (2009) ②エージェントベースの推計手法 ・・・モンテカルロサンプリング ・モンテカルロサンプリングによる  各エージェントに対する多属性の設定 - Moeckel, et al. (2003) Moeckel らによる 人口・世帯データ生成手法

人口・世帯データ推計に関する既存研究 ・エージェントベースの 人口・世帯推定システム - 宮本ら (2009, 2010, 2011)  人口・世帯推定システム - 宮本ら (2009, 2010, 2011) 人数別世帯の構成員に対する属性(年齢、性別、続柄)の推定    →総合的な属性からなる初期マイクロ世帯データの推定     (住宅タイプ、居住地、自動車保有台数、所得)

マイクロデータ推定手法の質的比較 セルベース エージェントベース の推計手法 の推計手法 ・属性の組み合わせで定義さ  れる多次元表のセル値 ・直接的には推定されない ・個々のエージェントを直接推定 ・各々が固有の属性を持ち多様な   属性の組み合わせが考慮可能 マイクロデータ の特性 属性及び カテゴリ の制約 ・離散的なカテゴリ設定 ・属性やカテゴリの増加に  伴うゼロセル問題の発生 ・属性やカテゴリの設定に対する  制約なし ・エントロピー最大化という  明確な規範あり ・固定的な解法アルゴリズム ・明確な規範なし ・サンプルの確率分布による推定  のため尤度最大化にベースを置  くと解釈される 推定手法 の規範

マイクロデータ推定手法の質的比較 セルベース エージェントベース の推計手法 の推計手法 ・一意な推定結果 ・試行毎に異なる推計結果 ・複数の推定結果より利用する  ものを選択する必要あり 推定結果 の頑健性 推定 アルゴリズム の複雑性 ・改良手法を含むいくつかの  パターンはあるが、一般的  には単純なアルゴリズム ・複雑な推定アルゴリズム ・恣意性が介在する可能性あり データ 入手可能性 ・属性/カテゴリ別総量:集計データ、既存統計等により入手 ・サンプルデータ:アンケート調査等により入手 手法間の 互換性 ・エージェントベースデータ  への変換には限界あり ・取り扱える属性の数が限定  的 ・集計によるセルベースデータへ  の変換が容易

マイクロデータ推定手法の量的比較 ◆検討対象:人口データ ◆属性:個人年齢+所属する世帯の人数 ◆カテゴリ   年齢:18カテゴリ (0-4歳,5-9歳,10-14歳,15-19歳,・・・,75-79歳,80-84歳,85歳以上)   世帯人数:7カテゴリ ◆推定手法   セルベース : IPF法   エージェントベース : モンテカルロシミュレーション(宮本ら2009) ◆比較検討手法  セルベースおよびエージェントベースの適合度評価

マイクロデータ推定手法の量的比較

マイクロデータ推定手法の量的比較 ◆利用データ :第4回道央都市圏パーソントリップ調査データ 世帯構成員の詳細情報を含む 19,394世帯のマイクロデータ 10,000世帯データを母集団として ランダム抽出(人口:24,115人) 1,000世帯データを サンプルデータ として抽出 年齢別人口、 世帯人数別人口 を集計 IPF法、モンテカルロシミュレーションのサンプルデータとして 人口に関する周辺制約データとして

マイクロデータ推定手法の量的比較 ◆セルベースの適合度評価 観測データ 推定データ

マイクロデータ推定手法の量的比較 ◆セルベースの適合度評価 ・平均的にはエージェントベースの方がやや良好な結果 ケース 個人 データ数 適合度(セルベース) セルベース (IPF) エージェントベース (モンテカルロシミュレーション) Sample 1 2,346 0.184 0.170 Sample 2 2,357 0.183 0.192 Sample 3 2,434 0.208 0.171 Sample 4 2,415 0.175 Sample 5 2,446 0.213 0.219 平均 0.194 0.185 ・平均的にはエージェントベースの方がやや良好な結果 ・同一のサンプルにおいてエージェントベースでは大きく改善される可能性

マイクロデータ推定手法の量的比較 ◆エージェントベースの適合度評価 観測データ 適合度 適合度 推定データ 推定データ 適合度=乖離量距離の最小和 観測データ 推定データ

マイクロデータ推定手法の量的比較 ◆エージェントベースの適合度評価 ・エージェントベースの方が良好な適合度を示す結果 ケース 個人 データ数 適合度(エージェントベース) セルベース (IPF) エージェントベース (モンテカルロシミュレーション) 平均 標準偏差 Sample1 2,346 3,981 49.6 2,548 20.8 Sample2 2,357 4,176 25.2 2,925 11.7 Sample3 2,434 2,958 23.1 2,376 14.0 Sample4 2,415 3,539 55.6 3,041 12.2 Sample5 2,446 2,971 12.5 3,340 ・エージェントベースの方が良好な適合度を示す結果 ・セルベースに比べエージェントベースの適合度は安定的

まとめ ・セルベースとエージェントベースによるマイクロデータ 推定手法に関して、質的な比較を行い整理  推定手法に関して、質的な比較を行い整理 ・セルベースと:IPF法とエージェントベース:モンテ  カルロシミュレーションによる初期分布を、セルベース  とエージェントベースの適合度で評価 ◆課題  ・量的比較の更なる追加検証    ・サンプリング率による変化    ・セル統合パターンによる変化                  など

初期マイクロ世帯データ推定手法の構築(1) ◆マイクロデータの定義 マイクロ世帯データ 自動車保有台数 世帯収入 住居タイプ 世帯構成 居住ゾーン 年齢構成 マイクロ世帯データの   一般的表現 世帯s 世帯人数m 35 29 7 ={①本人・男,②子・男1,③子・男2,④子・男3,⑤孫・男    ,⑥兄弟,⑦父,⑧その他・男1,⑨その他・男2    ,⑩本人・女,⑪妻,⑫子・女1,⑬子・女2,⑭子・女3,⑮孫・女1    ,⑯姉妹,⑰母1,⑱子の妻1,⑲その他・女1,⑳その他・女2} ={35,7,999,999,999    ,999,999,999,999    ,999,29,999,999,999,999    ,999,999,999,999,999}

推定フロー(1) : 世帯構成員の年齢・性別・続柄の決定 START ①世帯人数別の世帯数へ  世帯サンプルより性別、  続柄を付加 ③周辺分布(5歳年齢階層別人口)  に一致するように調整 性別年齢階層別人口 Y Y N 年齢階層別人口 のチェック Y 世帯sの年齢構成 乱数発生 N ※1 N 世帯sのマイクロデータ Y 累積関数 ランダムサンプリング N 乱数発生 線形関数 Y        が  性別年齢階層 N ②各世帯構成員  の年齢の付加 に所属するか?   人世帯サンプル =[世帯サンプル        の世帯構成] =[世帯主性別, 世帯構成員1の続柄・年齢 ,世帯構成員2の続柄・年齢, ・・・   ,世帯構成員    の続柄・年齢] N によって  と  の誤差が 改善されるか? 再生成された   Y 世帯sの年齢構成 世帯sのマイクロデータ (初期データセット計算時) (収束計算時)