プログラム演習 ‐行動モデル夏の学校2007‐ 2007/09/20 愛媛大学大学院M1 牛尾龍太郎
説明の流れ Ⅰ.演習データ1(買い物施設選択)の説明 Ⅱ.離散選択分析のプロセス Ⅲ.サンプルプログラムの説明 Ⅲ.サンプルプログラムの説明 Ⅲ‐1 Rによる買い物地選択のMNL Ⅲ‐2 GAUSSによる買い物地選択のMNL 付録.サンプルプログラムの説明 付録-1 演習データ2(経路選択)の説明 付録-2 Rによる経路選択のMNL 付録-3 GAUSSによる経路選択のMNL
Ⅰ.演習データ1の説明 -買い物施設選択-
Ⅰ.買い物地選択データセットについて 松山街中PP調査のデータを使用 サンプル数は287トリップ 買い物目的地は8施設 買い物目的地までの距離は道を考えず,単純な直線距離 買い物目的選択トリップデータを,プログラム用に加工したものがkaimono.csvとなっています
Ⅱ.離散選択分析のプロセス
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
1.分析対象を決める 1)外的条件の変化 例えば,郊外にショッピングモールの建設が予定されている.これができたとき,人の買い物行動はどう変わるのか? 2)分析範囲の決定 想定される行動変化 買い物場所の変化 買い物頻度の変化 買い物場所への利用交通手段の変化 など
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
2.(モデル分析の方針を決める) どのようなモデルを用いて分析するかを検討 集計モデルvs非集計モデル 効用関数の誤差構造は? 異質性(嗜好,選択肢集合など)は? 新規郊外店舗の建設(政策変数)をモデルでどのように表すか?
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
3.調査の実施 1.および2.を踏まえて調査設計 対象母集団の決定 サンプルの抽出方法の決定(ランダムor層別) サンプル数の決定 調査手法の決定 紙面,PP,インタビュー調査 配布・回収方法 謝礼 など 質問項目の決定
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
4.データの集計(と作成) 1)基礎集計 単純集計,クロス集計を行うことによりデータの特徴を読みとる 2)選択肢集合の決定 単純集計,クロス集計を行うことによりデータの特徴を読みとる 2)選択肢集合の決定 買い物場所選択実績やデータ量を見て選択肢集合を決定する 3)データの作成 不足しているLOSデータ等の作成
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
5-1.モデルの推定-モデルの選定- モデルの選定 2.の方針および4.の集計結果を踏まえてモデルを選定(例:多項ロジットモデル)
(後に紹介するサンプルプログラムは5施設について) 5-2.モデルの推定-モデルの特定化①- ここでは簡単のため高島屋(高島),三越,ジョープラザ(ジョ)の3つの買い物地選択について考える (後に紹介するサンプルプログラムは5施設について) 各選択肢の効用関数の特定化 :確定項 :確率項
5-2.モデルの推定-モデルの特定化②- :定数項 :サービスレベル変数(LOS変数) :社会経済変数(SE変数) 確定項の特定化 買い物地選択を決める主な要因として,距離( ),女性ダミー( ),年齢ダミー(60歳以上)( )を考える :定数項 :サービスレベル変数(LOS変数) :社会経済変数(SE変数) 定数項は最大で(選択数-1)
5-2.モデルの推定-モデルの特定化③- 共通係数(generic coefficients)と選択肢固有係数(intrinsic coefficients) 距離に対する重み(パラメータ)は各選択肢で同じ 各施設までの1kmの移動に伴う不効用は全て等しい 距離に対する重み(パラメータ)は各選択肢で異なる 1kmの移動に伴う不効用は目的施設にごとに異なる
5-2.モデルの推定-モデルの特定化④- 多重共線性(multicollinearity) 仮に三越に無職ダミー( )を入れてみる でも,60歳以上と無職って相関がかなり高そうだ 説明変数間に高い相関がある状態をいう。この場合、パラメータの分散が大きくなり、その信頼性が小さくなる
5-3.モデルの推定-モデルの推定- モデルの推定 以降,モデルの選定,モデルの特定化,モデルの推定の作業を繰り返す 省略 以降,モデルの選定,モデルの特定化,モデルの推定の作業を繰り返す 例えば,当初はネスティッドロジットモデルを採用しモデル推定を行なった結果,多項ロジットモデルと有意な差がないと判断されれば,多項ロジットモデルに変更してモデル推定を行なう
Ⅱ.離散選択分析のプロセス 分析対象を決める (モデル分析の方針を決める) 調査の実施 調査データの集計(と作成) モデルの推定 5-1 モデルの選定 5-2 モデルの特定化 5-3 モデルの推定 推定結果の解釈
6.推定結果の解釈① t検定 モデルの適合度 検定値は,パラメータ推定値をその推定値をその推定値の標準偏差の推定値で除した値. 検定値は,パラメータ推定値をその推定値をその推定値の標準偏差の推定値で除した値. この値が絶対値で1.96以上であれば十分(有意水準5%) 初期尤度 最終尤度 モデルの適合度 決定係数 自由度決定済み決定係数 モデルに含まれる未知パラメータ数
6.推定結果の解釈② 分析・政策 新しい郊外ショッピングモールはどのような人(年齢別,性別,職業)が利用するのだろうか? 買い物目的地へ向かう移動手段はどう変わったのか? 施設による違い(駐車場の有無,敷地面積,中心市街地か郊外にあるか)は影響を与えているか?
Ⅲ‐1.サンプルプログラムの説明 -Rによる買い物地選択のMNL-
Ⅲ-1.Rの初期場面 文字化けしているならメニューバーの編集からGUIプリファレンスを選びFontをFixedSysに変更
Ⅲ-1.モデルの作成① ① ② ③ ④
Ⅲ-1.モデルの作成② ⑤ ⑥ ⑦ ⑧ ⑨
Ⅲ-1.モデルの作成③ ⑩ ⑪ ⑫ ⑬
Ⅲ-1.結果の出力 ⑭ ⑮ ⑯ ⑰ ⑱ ⑲
Ⅲ‐2.サンプルプログラムの説明 -GAUSSによる買い物地選択のMNL-
Ⅲ‐2. GAUSSの初期場面 FontからSelectに行き,フォント名をSystemからFixedSysに変更 File→Editから書き込み用のファイルを指定
Ⅲ‐2.モデルの作成① ① ② ③ ④ ⑤ ⑥ ⑦
Ⅲ‐2.モデルの作成② ⑧ ⑨ ⑩ ⑪ ⑫
Ⅲ‐2.モデルの推定結果 ⑬ ⑭ ⑮ ⑯ ⑰ ⑱ ⑲
付録.サンプルプログラム -経路選択-
付録1.経路選択データセットについて 松山PP調査(03年~05年)のデータ 各年のトリップ数は03年419,04年5110,05年3124となる 経路選択の選択肢数は,トリップによって違う 実際の経路選択はalt1 経路選択サンプルプログラム用に加工したデータがPathSet2.csv となっています(GAUSSサンプルデータ→sample→route→PathSet2.csv)
付録2.サンプルプログラムの説明 -Rによる経路選択のMNL-
付録2.モデルの作成① ①・apply(Path,1,sum)はPathの行に関して 関数sumを適用.2なら列 ・Path[,1]/utでPathデータの1行目(実際 の選択結果)を抜き出す ・定数項が定義できないのも特徴 ①
付録2.モデルの作成② ②経路のトリップ毎に選択肢数が違うので,買い物選択のときみたいな書き方ではダメ ② 推定結果は省略
付録3.サンプルプログラムの説明 -GAUSSによる経路選択のMNL-
付録3.モデルの作成① ①sumc(path’)でpathデータを転置し,転置したデータを足し合わせる ①
付録3.モデルの作成② 買い物選択と同じである 推定結果は省略