事例研究(ミクロ経済政策・問題分析 I) - 規制産業と料金・価格制度 - (#403 - 複合選択分析(入子型Logit)) 2017年 12月 戒能一成
0. 本講の目的 (手法面) - 応用データ解析の手法のうち、離散型選択に 関連する複合選択モデル分析(多段階・多選択 肢)の概要を理解する (内容面) - 計量経済学・統計学を実戦で応用する際の 留意点を理解する
1. 複合選択モデルの概念 1-1. 複合選択モデルとは - 複合選択モデルとは、二項選択型など離散型選 択モデルが複数(多段階・多選択肢)で組合わさ れたモデルをいう ・ 経路選択 (ex. 東京・成田 → Geneva) ・ 耐久消費財購入 (ex. 住宅, 自動車) - 解法などは離散型選択モデルと共通しており 最大尤度法(Maximum Likelihood)が用いられる - 多くの場合目的に応じて構造が決定されるため 個別手法毎の事例はあまり多くない 3
- 条件付Logitモデル (Conditional Logit Model) 1. 複合選択モデルの概念 1-2. 複合選択モデルの種類 (基本形) - 条件付Logitモデル (Conditional Logit Model) - 多項式Logitモデル (Multi-nominal Logit Model) - 混在Logitモデル (Mixed Logit Model) (= ランダム変数Logitモデル (Random Var. L. M.)) (応用形) - 加法効用モデル (Additive Random Utility M.) - 多段階Logitモデル (Nested Logit Model) → 何れのモデルでも、Logit を Probit に代えたものが 使われることがある 4
1. 複合選択モデルの概念 1-3. 複合選択モデルの要件 - 何れのモデルでも、選択に影響を与える因子が 説明変数として観察可能であることが必要 (選択肢毎に共通する因子, 異なる因子の識別要) - 多くのモデルにおいては、選択の対象である 選択肢が「排反」の関係にある(= 選択確率の和 が 1を超えない)ことが必要 ・ 結果が重複する場合でも「独立な選択が複数 回行われた」と仮定すれば解ける場合あり (ex. 別荘、自動車複数保有、携帯+スマホ) 5
2-1. 条件付Logitモデル Conditional Logit Model - 対象毎・選択肢毎に異なる説明変数のみで選択 2. 複合選択モデル(1) 基本形 2-1. 条件付Logitモデル Conditional Logit Model - 対象毎・選択肢毎に異なる説明変数のみで選択 結果が決定されていると仮定したLogitモデル Pr(yi=j) = exp(-zij・βij)/Σk(exp(-zik・βik)) i, j 対象i, 選択肢j (Σk; 選択肢j 全部の和) (i=戒能, 経路選択肢(j ∈ 直行,北京経由,・・・) Pr(yi=j) 対象i の選択結果 yi が j である確率 [0, 1] zij 対象i の j に関する説明変数(ベクトル) (zij ∈ 運賃, 事故頻度,・・(←選択肢j毎に異なる)) βij 係数 6
2-2. 多項式Logitモデル Multi-nominal Logit Model - 対象毎に異なる(選択肢に共通した)説明変数の 2. 複合選択モデル(1) 基本形 2-2. 多項式Logitモデル Multi-nominal Logit Model - 対象毎に異なる(選択肢に共通した)説明変数の みで選択結果が決定されていると仮定したLogit モデル Pr(yi=j) = exp(-zi・βij)/Σk(exp(-zi・βik)) i, j 対象i, 選択肢j (Σk; 選択肢j 全部の和) (i=戒能, 経路選択肢(j ∈ 直行,北京経由,・・・) Pr(yi=j) 対象i の選択結果 yi が j である確率 [0, 1] zi 対象i の説明変数(ベクトル) (zi ∈ 所得, 荷物個数 ・・・(← 選択肢jに共通)) β 係数 7
2. 複合選択モデル(1) 基本形 2-3. 混在Logitモデル Mixed Logit Model - 対象毎・選択肢毎に異なる説明変数と選択肢に 共通した説明変数が混在する形で選択結果が 決定されていると仮定したLogitモデル - 基本形の中で最も実用的であるため多用される (cf. 家計消費支出の価格効果・所得効果) Pr(yi=j) = exp(-zi・βij -z’ij・β’ij)/Σk(exp(-zi・ βik –z’ij・β’ik)) - モデルの選択には通常のAIC/BIC 最小化判定 による方法が適用可能 8
3. 複合選択モデル(2) 応用形 3-1. 加法効用モデル ARUM Additive Random U. M 3. 複合選択モデル(2) 応用形 3-1. 加法効用モデル ARUM Additive Random U. M. - 多段階での選択が単調増加(・減少)する効用関 数の大小関係で決定されていると仮定したモ デル (← 混在Logitモデルの一般化形) - 効用関数として線形・対数線形など様々な関数 形を用い、Logit関数の説明変数部分に当てはめ て分析を行う - 主に消費者選好の分析に用いられる Pr(yi=j) = exp(Uij)/Σk(exp(Uik)) Uij ; 単調増加(・減少)する効用関数 9
3. 複合選択モデル(2) 応用形 3-2. 加法効用モデル ARUM (2) - 加法効用モデルで用いる関数には、「加法性が 成立する効用関数」としての独特の制約条件あり ← 分析に入る前に、観察指標の選択確率を 用いて制約条件の成立を確認する必要有 a. ∀ Pr(U); 1 ≧ Pr(U) ≧ 0, Pr(U) = Pr(U+α) b. ∂ Prj(U)/∂Uk = ∂ Prk(U)/ ∂Uj c. ∂n-1 Prj(U) /Σn-1(∂ Un) ≧ 0 (n≠j) =∂n-1 Prj(U) /(∂ U1,・・・Uj-1,Uj+1,・・・Un) ≧ 0 10
3. 複合選択モデル(2) 応用形 3-3. 多段階Logitモデル Nested Logit Model (1) - 多段階での選択が階層構造(Nest)となっている 場合を仮定したモデル (McFadden(1978)) - 各段階の階層構造の対応関係や順序が予め 解っていることが分析の前提 (例) 東京→Geneva経路選択 (自 宅) [第1段: 出発空港] 成田 羽田 [第2段: 経由空港] 香港 Istanbul 香港 Istanbul 11
3. 複合選択モデル(2) 応用形 3-4. 多段階Logitモデル Nested Logit Model (2) - 当然ながら、同じ選択肢の組合わせであっても 階層構造が異なるモデルを分析すると異なる 結果が出る - 階層構造が異なる場合、各階層でのLogitモデル の結果からはAIC/BIC 最小化による判定は適用 できない - 従って、分析に用いる階層構造についてはミクロ 経済理論や補助情報などを用いて確定させる必 要あり 12
- 戒能教官の国連欧州本部出張(過去58回)の選 択確率(被説明変数)の実績は下記のとおりであ るが、教官の選択行動原理を推計せよ 4. 複合選択モデルの実践的応用例 4-1. 経路選択問題 (“駅馬車問題”)(1) - 戒能教官の国連欧州本部出張(過去58回)の選 択確率(被説明変数)の実績は下記のとおりであ るが、教官の選択行動原理を推計せよ (搭乗する時期が異なっている可能性に注意) 成田-香港 成田-Istbl. 羽田-香港 羽田-Istbl. 平均運賃 $ 7,700 6,600 7,000 5,800 平均時間 h 26.0 29.0 22.0 25.0 変動係数 hs 0.022 0.064 0.022 0.055 選択頻度 n 16 8 23 11 選択確率 p 0.276 0.138 0.397 0.190 13
- 経由地として「香港」が選択される条件付確率p は0.7程度であり、運賃より時間・遅延を優先して 4. 複合選択モデルの実践的応用例 4-2. 経路選択問題 (“駅馬車問題”)(2) - 経由地として「香港」が選択される条件付確率p は0.7程度であり、運賃より時間・遅延を優先して 選択していると推定可 (出発地「羽田」 p~0.6) → 第1段が経由地、第2段が出発地と「仮定」 成田-香港 成田-Istbl. 羽田-香港 羽田-Istbl. 平均運賃 $ 7,700 6,600 7,000 5,800 平均時間 h 26.0 29.0 22.0 25.0 変動係数 hs 0.022 0.064 0.022 0.055 選択確率 p 0.276 0.138 0.397 0.190 ← 成田発 → ← 羽田発 → ← 0.667 → ← 0.677 → 14
4. 複合選択モデルの実践的応用例 4-3. 経路選択問題 (“駅馬車問題”)(3) - 第1段「経由地」の選択に関するLogit分析(試行) (「香港」が選択される確率) ← 「多重共線性」により運賃・時間の併用不可 係数 p値 AIC . 運賃 PRS 0.003 0.000 39.01 時間 TME -0.612 0.001 58.83 - 運賃を主説明変数とすると論理的矛盾(係数が 正→高い方を選択!?)、説明変数を加えても同様 ← 運賃は「結果」であり「原因」でない可能性大 15
4. 複合選択モデルの実践的応用例 4-4. 経路選択問題 (“駅馬車問題”)(4) - 第1段「経由地」の選択に関するLogit分析結果 (「香港」が選択される確率) AIC = 54.45 平均時間, 平均遅延時間, 割引額 . logit honk tme dtme dprs Logistic regression Number of obs = 58 LR chi2(3) = 26.91 Prob > chi2 = 0.0000 Log likelihood = -23.22612 Pseudo R2 = 0.3668 ---------------------------------------------------------------------------------------------------------- honk | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+------------------------------------------------------------------------------------------- 時間 tme | -.5321302 .2066167 -2.58 0.010 -.9370915 -.1271688 遅延 dtme | -2.752288 1.53903 -1.79 0.074 -5.768731 .2641547 割引 dprs | -.0022341 .001131 -1.98 0.048 -.0044508 -.0000173 _cons | 11.84631 4.053961 2.92 0.003 3.90069 19.79193 --------------------------------------------------------------------------------------------------------- 16
4. 複合選択モデルの実践的応用例 4-5. 経路選択問題 (“駅馬車問題”)(5) - 第2段「出発地」の選択に関するLogit分析(試行) (「香港」選択の際に「羽田」が選択される確率) ← 「多重共線性」により運賃・時間の併用不可 係数 p値 AIC . 運賃 PRS -0.002 0.003 41.62 時間 TME --- --- --- - 時間を主説明変数とすると「羽田」出発の方が例 外なく時間が短いので条件付確率が定義できな いため利用不可 (“perfect prediction”) 17
4. 複合選択モデルの実践的応用例 4-6. 経路選択問題 (“駅馬車問題”)(6) - 第2段「出発地」の選択に関するLogit分析結果 (「香港」∧「羽田」の選択確率) AIC = 23.96 . logit hahk prs dprs Logistic regression Number of obs = 39 LR chi2(2) = 34.84 Prob > chi2 = 0.0000 Log likelihood = -8.9805136 Pseudo R2 = 0.6598 ----------------------------------------------------------------------------------------------------- hahk | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+-------------------------------------------------------------------------------------- 運賃 prs | -.0105346 .003836 -2.75 0.006 -.018053 -.0030162 割引 dprs | -.018106 .0071239 -2.54 0.011 -.0320687 -.0041434 _cons | 81.65799 29.68843 2.75 0.006 23.46973 139.8463 ---------------------------------------------------------------------------------------------------- 18
5. 多段階Logitモデルの自己診断 5-1. 自己診断 Diagnosis (1) 1- 「選択構造の妥当性」の検証 1- 「選択構造の妥当性」の検証 最初に仮定した選択順序の妥当性は要検証 特に消去法的逐次選択の可能性に注意 (例: 最初にIstanbulを経由するか否かのみ決 定し、他の肢が次段で決定されている) (自 宅) (自 宅) ・・・・・ (自 宅) 成田 羽田 香港 Istanbul (それ以外) Istanbul 香港 Istanbul 成田 羽田 羽田・香港 成田・香港 19
5. 多段階Logitモデルの自己診断 5-2. 自己診断 Diagnosis (2) 2- 「多重共線性」の検証 - Logit・Probitによる離散型選択モデルでは分布 形状が決まっており多重共線性が出やすい 1 選択確率関数 Pr (Di=1, zi’β) = 確率密度関数の積分値 措置群 (Di =1) 対照群 (Di =0) -∞ z0 (zi の平均) (zi – zo)’β/σ 説明変数 (zi-z0)’β Zi 20
5. 多段階Logitモデルの自己診断 5-3. 自己診断 Diagnosis (3) 3- 「単純選択仮定」の適用 (= データの性質が 解らないうちから”nlogit “を使わない) - 多段階Logitモデルでは、上位段に問題がある と下位段で正常な結果は導出できない - 「選択構造仮定の妥当性」の検証過程で、 上位段から順番に単純選択で解いてみるか、 問題が疑われる段の条件付確率を計算し 局所的に解いてみることが有効な場合有 - 最初から「多段選択」を試行し成功する例稀少 21