実都市を対象とした初期マイクロデータの 推定手法の適用と検証 ドーコン 正員 ○杉木 直 東京都市大学 学生員 村中 智哉 東京都市大学 フェロー 宮本 和明 1
背景 ・土地利用-交通モデル分野におけるマイクロ シミュレーションへの関心の高まりと精力的な 取り組みの進展 シミュレーションへの関心の高まりと精力的な 取り組みの進展 ・土地利用マイクロシミュレーションにおける シミュレーション初期年次の「マイクロデータ」 の必要性 ・個人、個別世帯に関するデータの入手は困難 →入手可能データによる「人口データ推計」を実施 :集計データ(国勢調査等)+サンプル調査
目的 ◆初期マイクロデータ推定システムの 実都市を対象とした適用・検証 ◆シミュレーション初期年次のマイクロデータを推定・作成 するための「体系的な手法」の構築 〈先行研究〉 ・周辺制約の有無、離散変量と連続変量の組み合わせごとに、エージェント ベースの手法により総合的な属性からなる初期マイクロ世帯データの推定 システムを構築 ・道央都市圏パーソントリップ調査データを母集団として、適合度評価により 推定手法の有効性を検証 ◆初期マイクロデータ推定システムの 実都市を対象とした適用・検証 ・アンケートサンプルによるパラメータ設定 ・既存統計による周辺分布データの作成 ・人口規模の異なる複数ゾーンを対象とした世帯構成員属性の推定実施 →実都市レベルの適用における有効性検証、今後の改良の方向性の検討
初期マイクロ世帯データの推定システム ◆世帯構成員属性(性別/年齢/世帯主との続柄)に 関する世帯属性のみを対象として初期マイクロ 関する世帯属性のみを対象として初期マイクロ 世帯データを推計 総合的属性を対象とする初期マイクロ世帯データ推計システムのうち、世帯構成員の属性を推定を行う機能を抽出して利用
初期マイクロ世帯データ推定手法 ◆前提条件 ・対象エージェント:世帯およびその構成員 ・対象属性 世帯:世帯人数、世帯構成(続柄の組み合わせで定義) 世帯構成員:年齢、性別、世帯主との続柄 ・国勢調査による以下の周辺制約データが入手可能 - 性別5歳年齢階層別人口 - 世帯主人数別世帯数 ・すべての世帯の世帯構成、各世帯構成員の年齢・性別・ 続柄情報を含む限定的な数の世帯サンプルが入手可能
初期マイクロ世帯データ推定手法 ◆推定手法の基本的な考え方 ①世帯人数別の世帯数に対して、世帯サンプルより 各世帯構成員の性別、続柄を付加 各世帯構成員の性別、続柄を付加 ②各世帯構成員の年齢の付加 ・出現頻度が高い世帯タイプ ‐属性間の相関性を考慮して決定 ・出現頻度が低い世帯タイプ ‐世帯サンプルと同様の年齢を与える ③周辺分布(5歳年齢階層別人口)に一致するように調整 ・推定、データ生成、調整はモンテカルロ法により すべて確率的に行う
初期マイクロ世帯データ推定手法 ◆属性間の相関性を考慮した年齢の決定 : m人世帯データの属性変数 : 主成分分析による無相関変数 1 の累積曲線 ranis 乱数発生 pismin pis
初期マイクロ世帯データ推定システムのフロー START 初期データの作成 性別年齢階層別人口 Y Y N 年齢階層別人口 のチェック Y 乱数発生 N END 世帯 の年齢構成 N Y 累積関数 ランダムサンプリング N 乱数発生 線形関数 Y が 性別年齢階層 N N に所属するか? 人世帯サンプル =[世帯サンプル の世帯構成] =[世帯主性別, 世帯構成員1の続柄・年齢 ,世帯構成員2の続柄・年齢, ・・・ ,世帯構成員 の続柄・年齢] N によって と の誤差が 改善されるか? 再生成された Y 世帯 における 世帯構成員の年齢構成 (初期データセット計算時) (収束計算時)
初期マイクロ世帯データ推定システムのフロー START 性別年齢階層別人口に対する調整計算 性別年齢階層別人口 Y Y N 年齢階層別人口 のチェック Y 乱数発生 N END 世帯 の年齢構成 N Y 累積関数 ランダムサンプリング N 乱数発生 線形関数 Y が 性別年齢階層 N に所属するか? 人世帯サンプル =[世帯サンプル の世帯構成] =[世帯主性別, 世帯構成員1の続柄・年齢 ,世帯構成員2の続柄・年齢, ・・・ ,世帯構成員 の続柄・年齢] N によって と の誤差が 改善されるか? 再生成された Y 世帯 における 世帯構成員の年齢構成 (初期データセット計算時) (収束計算時)
対象地域の概要 ◆富山市を対象として推定システムを適用 ・人口規模、高齢者比率の異なる7ゾーンを設定 ・性別人口構成はほぼ同一
利用データ ◆サンプルデータ ・富山市を対象としたアンケート調査(H23年12月実施)より - 3,864世帯、9,747人分のマイクロ世帯データサンプル (世帯人数、世帯構成員の性別/年齢/続柄) →主成分パラメータ、推定システムで利用 ◆周辺分布データ ・H22年国勢調査データ - 性別5歳年齢階層別人口 - 世帯主人数別世帯数
属性・カテゴリ設定 ◆世帯構成員タイプ ◆世帯タイプ :アンケートサンプル 自由度10以上の 世帯タイプ
主成分パラメータの推定 ◆自由度10以上の世帯タイプについて主成分パラメータBを推定 【4人世帯】
推定結果:計算時間 ◆各ゾーンの初期マイクロ世帯の推定を30ケース実行 ◆計算時間 :Intel Xeon 2.4GHz CPU, 16.0GB RAM (10ケース平均) ・人口規模:大 → 調整対象世帯探索のため計算時間が指数的に増加 ・大規模データにおいても実用時間内で推定が可能であることを確認
推定結果:タイプ別世帯数 ◆タイプ別世帯数構成比 (30ケース平均) ・サンプルの特性を反映、特定タイプへの偏りなし
推定結果:タイプ別世帯数 ◆タイプ別世帯数標準偏差 (世帯) (30ケース) ・世帯数規模に応じた標準偏差、特定タイプへの偏りなし
推定結果:世帯主年齢構成 ◆世帯主年齢構成比 (30ケース平均) ・概ね再現良好に再現しているが、出現頻度が低い世帯タイプで偏りあり
まとめ ◆初期マイクロデータ推定システムの実都市を対象とした 適用・検証として、以下を実施 ◆初期マイクロデータ推定システムの実都市を対象とした 適用・検証として、以下を実施 ・アンケートよりパラメータ・サンプル設定、既存統計 より周辺分布データ作成 ・人口規模の異なる複数ゾーンを対象とした世帯構成員 属性の推定 →計算時間、世帯タイプ構成等より推定システムの 実都市レベルの適用における有効性を確認 ◆今後の課題 ・小地域単位でのマイクロ世帯データの推定 ・居住住宅タイプ、所得、自動車保有等の属性を含めた 実都市でのマイクロ世帯データの推定