異質性と動学化へのアプローチ 名古屋大学 山本俊行 2007/09/20-21 第6回 行動モデル夏の学校.

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
スタートアップゼミ 社会基盤交通研 B4 佐津川功季. 多項プロビットモデル  ロジットモデルの弱点である 、 誤差項の独立性という仮定に 対して 、 多変量正規分布を用いて選択肢間の相関を表現した モデル 。 効用関数 において確率項ベクトル において、平均値をそれぞれ 0 、共分散行列を Ω(J×J.
潜在クラス分析入門 山口和範. 内容 条件付独立 シンプソンのパラドックス 対数線形モデルにおける表現 局所独立 潜在変数モデル Lem 入門.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
世帯マイクロデータの適合度評価における 重みの決定手法
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
コンピュータビジョン特論 第8回対象追跡 2006年11月22日 加藤丈和.
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
パネル分析について 中村さやか.
行動モデル夏の学校 買い物地選択行動 モデルのパラメータ推定
情報経済システム論:第12回 担当教員 黒田敏史 2017/3/8 情報経済システム論.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
Bassモデルにおける 最尤法を用いたパラメータ推定
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
シミュレーション論Ⅰ 第4回 基礎的なシミュレーション手法.
仕事帰りと拘束時間に着目した行動目的選択
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
統計学 11/08(木) 鈴木智也.
計測工学 -測定の誤差と精度2- 計測工学 2009年5月17日 Ⅰ限目.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
ベイジアンネットワーク概説 第3章 ベイジアンネットワークモデルの      数学的基礎 3.5 情報量基準を用いた構造学習 岩崎唯史.
(ラプラス変換の復習) 教科書には相当する章はない
【小暮研究会2】 「ベイズのアルゴリズム」:序章 【1,2:計量経済分析と統計分析】 【 3:ベイズ定理】
脳活動に関するデータ データの種類 データの特徴 脳波・脳磁図・fMRI画像 脳活動とパフォーマンスの関係はきわめて冗長。
小標本検査データを元にした 疲労破損率のベイズ推定
相関分析.
第6章 連立方程式モデル ー 計量経済学 ー.
動学的一般均衡モデルについて 2012年11月9日 蓮見 亮.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
決定木とランダムフォレスト 和田 俊和.
第9章 混合モデルとEM 修士2年 北川直樹.
応用統計学の内容 推測統計学(inferential statistics)   連続型の確率分布   標本分布   統計推定   統計的検定.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
確率論の基礎 「ロジスティクス工学」 第3章 鞭効果 第4章 確率的在庫モデル 補助資料
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
音響伝達特性を用いた単一マイクロホンによる話者の頭部方向の推定
6. ラプラス変換.
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
予測に用いる数学 2004/05/07 ide.
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
(昨年度のオープンコースウェア) 10/17 組み合わせと確率 10/24 確率変数と確率分布 10/31 代表的な確率分布
ベイズ・アプローチによる グラフィカル・テスト理論
不完全な定点観測から 真の不正ホストの分布が分かるか?
ウィルスって どの位感染しているのかな? 菊池研究室  小堀智弘.
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
ベイズ基準による 隠れセミマルコフモデルに基づく音声合成
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
自転車の利用促進に着目した研究 名古屋大学  E班 M1  酒井大輔             徐剛           高橋和大 平野泰博    安江勇弥.
個人の関心を考慮した交通手段選択モデルの推定
共同利用自転車の利用促進に着目した交通手段選択モデル
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
統計現象 高嶋 隆一 6/26/2019.
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
実都市を対象とした初期マイクロデータの 推定手法の適用と検証
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

異質性と動学化へのアプローチ 名古屋大学 山本俊行 2007/09/20-21 第6回 行動モデル夏の学校

内容 異質性の表現方法 選好の異質性 嗜好の異質性 意思決定方略の異質性 動学化の方法 変動について 複数時点での状態の記述 複数時点での変化の記述 連続時間軸上での変化の記述 2007/09/20-21 第6回 行動モデル夏の学校

四段階推計における分担率曲線 所要時間だけでは不十分!! 所要時間比(自動車所要時間/鉄道所要時間) 1 鉄道分担率 0.5 1 5 0.5 1 5 所要時間比(自動車所要時間/鉄道所要時間) 2007/09/20-21 第6回 行動モデル夏の学校

影響要因を追加する 費用を追加する 運行頻度やアクセス距離などその他多くのサービス水準を追加する 所要時間の価値を算出する:労働に費やした場合に得られる収入を用いる 所要時間と費用を合わせた一般化費用を分担率のX軸に用いる 運行頻度やアクセス距離などその他多くのサービス水準を追加する 全ての要因を貨幣換算する? 2007/09/20-21 第6回 行動モデル夏の学校

最も基本的な離散選択モデル U = a + b1x1 + b2x2 + e 地域によって定数項は異なる・・・異質性 様々なサービス水準の組み合わせからなる交通手段の効用を推定する(各サービス水準の重みを推定する) 線形効用関数を仮定する(補償型の効用) 誤差項に確率分布を仮定する(分担率曲線と同様の曲線を生成) 平均的な偏りは定数項で表す U = a + b1x1 + b2x2 + e 地域によって定数項は異なる・・・異質性 2007/09/20-21 第6回 行動モデル夏の学校

時間価値は収入によって異なったりするはず 定数項の構造化 地域・意思決定者による選択結果の違いを表現する 「定数項が属性によって異なる」と解釈できる サービス水準の影響は属性によらず一定 U = a + b1x1 + b2x2 + c1z1 + c2z2 + e 時間価値は収入によって異なったりするはず → さらなる異質性の導入 2007/09/20-21 第6回 行動モデル夏の学校

重みの構造化 サービス水準の重みを属性毎に異なるものとして推定する セグメント毎にサービス水準の重みを個別に推定する 全てのサービス水準について異なる重みを仮定する場合は,セグメント毎に全く個別のモデルを推定することになる U = a + f1(z1, z2)x1 + f2(z1, z2)x2 + c1z1 + c2z2 + e はっきり属性は特定できないが,まだ重みの個別化が十分でない場合は?→→非観測異質性の導入 2007/09/20-21 第6回 行動モデル夏の学校

非観測異質性の導入1: 潜在セグメントモデル 意思決定者が各セグメントに確率的に帰属することをモデル化 Pr(i) = SjQ(j)P(i|j) Q(j):セグメントjに帰属する確率(属性で構造化する場合と全員同じ確率を与える場合がある) P(i|j):セグメントjに固有の効用関数によって選択肢 i を選択する確率 2007/09/20-21 第6回 行動モデル夏の学校

非観測異質性の導入2: ランダム係数モデル サービス水準の重みを確率的に分布させる g(z):仮定する確率分布(正規分布等) U = a + f1(z1, z2, z1)x1 + f2(z1, z2, z2)x2 + c1z1 + c2z2 + e Pr(i) = ∫P(i| z )g(z)∂z 最近では,確率分布の分散を属性で構造化するモデルも提案されている 2007/09/20-21 第6回 行動モデル夏の学校

2つの非観測異質性導入方法の相違 潜在セグメントモデル:重みが離散分布 ランダム係数モデル:重みが連続分布 どちらも優劣はない どうせなら,両方やってみますか? やってみた論文もあります.まぁモデルの適合度は上がってますけど・・・ 2007/09/20-21 第6回 行動モデル夏の学校

ランダム係数モデルの若干の注意 正規分布を使うと,係数の正負は限定されない(定義域が無限なので必ず正負両方の値を取る)→時間とか費用とか普通は負であるはず 問題の生じない分布形が提案されている 切断正規分布,対数正規分布,一様分布,三角分布,Johnson’s SB分布 2007/09/20-21 第6回 行動モデル夏の学校

Mixed Multinomial Logit Modelの乱用 ランダム係数モデルを含む Mixed multinomial logit model (MMNL) に対して,シミュレーションによる積分を活用した推定手法が急速に発展した そのため,近年多くの論文でMMNLモデルの適用が見られた 2006年IATBR会議では,非観測異質性で処理するのではなく,説明変数で構造化し,構造を理解しようという反省が出てきている 2007/09/20-21 第6回 行動モデル夏の学校

意思決定方略の異質性 線形効用関数は真の意思決定方略の近似 真の意思決定方略をモデル化する価値があるかも 例え真の意思決定方略が異なっていても,重み付き平均は最も選択の近似能力が高い ただし,サービス水準間に負の相関がある場合には,再現力が低くなることが分かっている 真の意思決定方略をモデル化する価値があるかも 2007/09/20-21 第6回 行動モデル夏の学校

様々な意思決定方略 選択の状況や意思決定者によって 用いられる意思決定方略は異なる 方略 荷重加算型 等加算型 勝率最大化 連結型 分離型 概要 荷重加算型 各サービス水準の重み付き平均 等加算型 各サービス水準の単純平均 勝率最大化 各サービス水準毎に望ましい選択肢を選び,選ばれた回数が最も多い選択肢 連結型 全てのサービス水準が許容基準を満たす選択肢 分離型 サービス水準のうち一つでも希望水準を満たす選択肢 辞書編纂型 最も重要なサービス水準について最も望ましい選択肢 EBA 重要度によって確率的に選んだサービス水準が最低水準を満たす選択肢 選択の状況や意思決定者によって 用いられる意思決定方略は異なる 2007/09/20-21 第6回 行動モデル夏の学校

複数の意思決定方略を含む 潜在セグメントモデル Pr(i) = SjQ(j)P(i|j) P(i|j):セグメントjに固有の意思決定方略によって選択肢 i を選択する確率 ただし,多くの意思決定方略は推定しづらい 可能性としてしては, 選択結果以外の情報を取得し推定に用いる ベイズ推定,データマイニング,等の推定手法の適用 2007/09/20-21 第6回 行動モデル夏の学校

選択結果以外の使える情報 使っている意思決定方略を直接アンケート調査等で聞く 意思決定の際に考慮した要因を聞く(非補償型の意思決定の多くは用いる情報を限定する) 選択結果とあわせてデータが得られる同時確率(尤度)を最大化する 2007/09/20-21 第6回 行動モデル夏の学校

ベイズ推定 概要 パラメータの事前分布(通常は無知の分布)とデータが得られる尤度からパラメータの事後分布をベイズの定理によって求める 通常は解析的に解けないため,MMNLで用いられるのと同様のシミュレーションによって数値積分を行う 利点 一部のパラメータが推定不能の場合でも,他のパラメータを推定することが可能 パラメータ空間が大局的に凸になっていない場合でも局所解に陥らない可能性が高い 2007/09/20-21 第6回 行動モデル夏の学校

データマイニング 概要 情報量基準等の指標と計算速度に優れたアルゴリズムを用いて,非線形関数やif-then ルールを効率的に探索する 様々なアルゴリズムによるツールがある 意思決定方略の探索に使えそうなツール CHAID, CART, C4.5等の決定木:確立されており利用が容易 Bayesian Belief Network:より統計解析的 2007/09/20-21 第6回 行動モデル夏の学校

動学化へのアプローチ1: 変動について(北村,2003) 交通は移ろいやすく,交通現象に変動はつきもの 差異:一断面における個体間の変動 変化:特定の個体の系時的変動 変動:確率過程的変動 2007/09/20-21 第6回 行動モデル夏の学校

交通行動分析データの進展 断面データ パネルデータ 長期観測データ 環境の異なる個人間差異 時点間の個人の行動変化 個人内変動の考慮 2007/09/20-21 第6回 行動モデル夏の学校

長期観測の利点 断面データ(1時点) パネルデータ y = f(x) + e(差異, 変化, 変動) yt = f(xt) + e(差異) + et(変化, 変動) yt’ = f(xt’) + e(差異) + et’(変化, 変動) yt’ - yt = f(xt’) - f(xt) + et’(変化, 変動) - et(変化, 変動) 2007/09/20-21 第6回 行動モデル夏の学校

長期観測の利点 長期観測 yt1 = f(xt1) + e(差異) + et(変化) + et1(変動) E(yt’N) - E(ytN) = E(f(xt’)) – E(f(xt)) + et’(変化) - et(変化) 2007/09/20-21 第6回 行動モデル夏の学校

長期観測データの活用 変動のモデル化 変動の除去 変動を明示的に導入して日々の行動をモデル化 行動の基にある,より安定的な意思決定原理のモデル化 変動の除去 一定期間に集計した行動のモデル化 一週間の時間配分モデル等への multiple discrete-continuous choice model や多変量頻度モデル等の適用 2007/09/20-21 第6回 行動モデル夏の学校

動学化へのアプローチ2 通常のモデルはある時点のサービス水準が同じ時点の交通手段選択を決定すると仮定している サービス水準が変化したら直ぐに行動も変化するのか? 動的モデル構築の必要性 2007/09/20-21 第6回 行動モデル夏の学校

複数時点での状態のモデル化 慣性 遅れ効果 先取り効果 Xt-1 Xt Xt+1 時点間効果 Yt-1 Yt Yt+1 時点 T-1 T 2007/09/20-21 第6回 行動モデル夏の学校

Yt = aYt-1 + bXt + cXt-1 + dXt+1 + et 複数時点の状態モデルの問題点 Yt = aYt-1 + bXt + cXt-1 + dXt+1 + et 誤差項は時点間で相関を持つ(非観測異質性は時点間で同一となる) 上記のようなモデル構造だと,Xtの値が増加した場合も減少した場合もYtに与える影響の大きさは同じで正負対象(変化の対象性) 自動車保有台数等では,変化の対象性が成り立たないケースが多く見られる 2007/09/20-21 第6回 行動モデル夏の学校

複数時点での変化のモデル化 時点 T-1 T T+1 ∆Xt-1 ∆Xt ∆Xt+1 ∆Yt-1 ∆Yt ∆Yt+1 2007/09/20-21 第6回 行動モデル夏の学校

∆Yt = a∆Yt-1 + b ∆Xt + c ∆Xt-1 + d ∆Xt+1 + et 複数時点の変化モデルの問題点 ∆Yt = a∆Yt-1 + b ∆Xt + c ∆Xt-1 + d ∆Xt+1 + et 説明変数は ∆Xt の他に, Xt も含まれる 変化の非対称性も考慮可能 時間は連続なのに,離散的に扱っている 意思決定の時点とモデル化が整合していないケースも生じる 2007/09/20-21 第6回 行動モデル夏の学校

連続時間軸上での変化のモデル化 生存時間モデルの適用 連続時間を扱える 時点間の誤差項の相関等で苦労する必要がない 意思決定(選択)行動について,明示的には効用理論の枠組みで表現していない 効用理論との整合性について示した論文もあり関連付けることは可能(小林ら, 1997; 佐々木ら, 1997) 2007/09/20-21 第6回 行動モデル夏の学校

生存時間モデル ハザード関数: t 以前に事象が発生していないという条件下で t に事象が発生する条件付き確率密度 f(t): 確率密度関数 2007/09/20-21 第6回 行動モデル夏の学校

観測打ち切り 事象が最後まで発生しないケースも解析可能 データから削除すると推定パラメータのバイアスにつながる 被験者2 被験者1 Time 観測開始時点 観測終了時点 2007/09/20-21 第6回 行動モデル夏の学校

尤度関数 di: 事象が観測できなかったことを表すダミー変数 以下のように,S(t) が h(t)で表せることから上記は h(t)の関数 2007/09/20-21 第6回 行動モデル夏の学校

ハザード関数の構造化 比例ハザードモデル:基準ハザード関数に異質性が影響を与える.時点間で一定 加速故障モデル:時間の進み方に異質性が影響を与える 2007/09/20-21 第6回 行動モデル夏の学校

構造化の方法によるモデルの分類 モデル 基準ハザード 異質性 ノンパラメトリックモデル ノンパラメトリック セミパラメトリックモデル 2007/09/20-21 第6回 行動モデル夏の学校

観測精度との整合性 通常の調査では,変化の時点を連続的に観測することは稀であり,通常は1年に1度等のパネル調査が用いられる 生存時間モデルでは「変化」がある時間内に生起したことを表現することも生起確率を t について積分することで表現可能(積分区間は任意に設定可能) 2007/09/20-21 第6回 行動モデル夏の学校

おわりに 時間をかければモデルの適合度は向上する モデルを分かりやすくするために,本質的なこと以外は削除することも大事 このプレゼンファイルも火曜日より枚数が増えることは増えた モデルを分かりやすくするために,本質的なこと以外は削除することも大事 このプレゼンファイルの内容は枚数を増やしたことで分かりにくくなったかも知れない ある程度の時間であきらめる勇気も必要:あきらめないと2008年度モデルの新車は出ない もちろん言い訳にしてはいけませんが・・・ 2007/09/20-21 第6回 行動モデル夏の学校