スタートアップゼミ 社会基盤交通研 B4 佐津川功季. 多項プロビットモデル  ロジットモデルの弱点である 、 誤差項の独立性という仮定に 対して 、 多変量正規分布を用いて選択肢間の相関を表現した モデル 。 効用関数 において確率項ベクトル において、平均値をそれぞれ 0 、共分散行列を Ω(J×J.

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

1 小暮研究会2 第1章ベイジアンアルゴリズ ム 2値選択 ベルヌーイ試行 尤度原理 同一性 交換可能性 尤度についてのまとめ 環境情報学部3年 渡邊洋一.
Division of Process Control & Process Systems Engineering Department of Chemical Engineering, Kyoto University
『わかりやすいパターン認 識』 第 5 章 特徴の評価とベイズ誤り確率 5.4 ベイズ誤り確率と最近傍決定則 発表日: 5 月 23 日(金) 発表者:時田 陽一.
Lesson 9. 頻度と分布 §D. 正規分布. 正規分布 Normal Distribution 最もよく使われる連続確率分布 釣り鐘形の曲線 -∽から+ ∽までの値を取る 平均 mean =中央値 median =最頻値 mode 曲線より下の面積は1に等しい.
計量的手法入門 人材開発コース・ワークショップ (IV) 2000 年 6 月 29 日、 7 月 6 ・ 13 日 奥西 好夫
土木計画学 第3回:10月19日 調査データの統計処理と分析2 担当:榊原 弘之. 標本調査において,母集団の平均や分散などを直接知ることは できない. 母集団の平均値(母平均) 母集団の分散(母分散) 母集団中のある値の比率(母比率) p Sample 標本平均 標本分散(不偏分散) 標本中の比率.
マルチレベル共分散構造分析 清水裕士 大阪大学大学院人間科学研究科日本学術振興会. 本発表の概要・目的 個人 - 集団データの階層性 個人 - 集団データの階層性 階層的データは従来の方法では十分な分析が できない 階層的データは従来の方法では十分な分析が できない 従来の方法は何が不十分なのか?
2016 年度 計量経済学 講義内容 担当者: 河田 正樹
統計学入門2 関係を探る方法 講義のまとめ. 今日の話 変数間の関係を探る クロス集計表の検定:独立性の検定 散布図、相関係数 講義のまとめ と キーワード 「統計学入門」後の関連講義・実習 社会調査士.
エクセルと SPSS による データ分析の方法 社会調査法・実習 資料. 仮説の分析に使う代表的なモデ ル 1 クロス表 2 t検定(平均値の差の検定) 3 相関係数.
●母集団と標本 母集団 標本 母数 母平均、母分散 無作為抽出 標本データの分析(記述統計学) 母集団における状態の推測(推測統計学)
グラフィカル多変量解析 ----目で見る共分散構造分析----
第1回 確率変数、確率分布 確率・統計Ⅰ ここです! 確率変数と確率分布 確率変数の同時分布、独立性 確率変数の平均 確率変数の分散
確率・統計Ⅰ 第12回 統計学の基礎1 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
時系列の予測 時系列:観測値を時刻の順に並べたものの集合
多変量解析 -重回帰分析- 発表者:時田 陽一 発表日:11月20日.
補章 時系列モデル入門 ー 計量経済学 ー.
行動モデル夏の学校 買い物地選択行動 モデルのパラメータ推定
情報経済システム論:第12回 担当教員 黒田敏史 2017/3/8 情報経済システム論.
確率・統計Ⅰ 第11回 i.i.d.の和と大数の法則 ここです! 確率論とは 確率変数、確率分布 確率変数の独立性 / 確率変数の平均
統計的仮説検定 基本的な考え方 母集団における母数(母平均、母比率)に関する仮説の真偽を、得られた標本統計量を用いて判定すること。
Pattern Recognition and Machine Learning 1.5 決定理論
土木計画学 第5回(11月2日) 調査データの統計処理と分析3 担当:榊原 弘之.
統計解析 第9回 第9章 正規分布、第11章 理論分布.
プログラム演習 ‐行動モデル夏の学校2007‐ 2007/09/20 愛媛大学大学院M1 牛尾龍太郎.
Generating Functions (前半) B4 堺谷光.
Bassモデルにおける 最尤法を用いたパラメータ推定
統計的仮説検定の考え方 (1)母集団におけるパラメータに仮説を設定する → 帰無仮説 (2)仮説を前提とした時の、標本統計量の分布を考える
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
時空間データからのオブジェクトベース知識発見
プロモーションのモデル.
質的データの分析手法 ---プロビットモデル・ロジットモデルの概要---
第3章 重回帰分析 ー 計量経済学 ー.
第3章 重回帰分析 ー 計量経済学 ー.
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
確率・統計輪講資料 6-5 適合度と独立性の検定 6-6 最小2乗法と相関係数の推定・検定 M1 西澤.
最尤推定によるロジスティック回帰 対数尤度関数の最大化.
ベイズ基準によるHSMM音声合成の評価 ◎橋本佳,南角吉彦,徳田恵一 (名工大).
需要の価格弾力性 価格の変化率と需要の変化率の比.
土木計画学 第6回(11月9日) 調査データの統計処理と分析4 担当:榊原 弘之.
情報経済システム論:第11回 担当教員 黒田敏史 2018/9/20 情報経済システム論.
補章 時系列モデル入門 ー 計量経済学 ー.
ガウス過程による回帰 Gaussian Process Regression GPR
第6章 カーネル法 修士2年 藤井 敬士.
相関分析.
VII. 空間モデル.
第6章 連立方程式モデル ー 計量経済学 ー.
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
第5章 特徴の評価とベイズ誤り確率 5.5 ベイズ誤り確率の推定法 [1] 誤識別率の偏りと分散 [2] ベイズ誤り確率の上限および下限
独立成分分析 (ICA:Independent Component Analysis )
標本分散の標本分布 標本分散の統計量   の定義    の性質 分布表の使い方    分布の信頼区間 
多変量解析 ~主成分分析~ 1.主成分解析とは 2.適用例と解析の目的 3.解析の流れ 4.変数が2個の場合の主成分分析
市場調査の手順 問題の設定 調査方法の決定 データ収集方法の決定 データ収集の実行 データ分析と解釈 報告書の作成 標本デザイン、データ収集
Black Litterman Modelによる最適化
パターン認識特論 担当:和田 俊和 部屋 A513 主成分分析
部分的最小二乗回帰 Partial Least Squares Regression PLS
I班 東京大学 伊藤・柿元・瀧口・戸叶・福士
早稲田大学大学院商学研究科 2014年12月10日 大塚忠義
データの型 量的データ 質的データ 数字で表現されるデータ 身長、年収、得点 カテゴリで表現されるデータ 性別、職種、学歴
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
第3章 線形回帰モデル 修士1年 山田 孝太郎.
「アルゴリズムとプログラム」 結果を統計的に正しく判断 三学期 第7回 袖高の生徒ってどうよ調査(3)
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
最尤推定・最尤法 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
個人の関心を考慮した交通手段選択モデルの推定
パターン認識特論 カーネル主成分分析 和田俊和.
わかりやすいパターン認識 第6章 特徴空間の変換 6.5 KL展開の適用法 〔1〕 KL展開と線形判別法 〔2〕 KL展開と学習パターン数
統計現象 高嶋 隆一 6/26/2019.
混合ガウスモデル Gaussian Mixture Model GMM
Presentation transcript:

スタートアップゼミ 社会基盤交通研 B4 佐津川功季

多項プロビットモデル  ロジットモデルの弱点である 、 誤差項の独立性という仮定に 対して 、 多変量正規分布を用いて選択肢間の相関を表現した モデル 。 効用関数 において確率項ベクトル において、平均値をそれぞれ 0 、共分散行列を Ω(J×J の行列)と仮 定する。このとき Ωij が選択肢 i と j 間の共分散にあたり、もし全て 共分散が 0 ならばロジットモデルと相違無い。  この場合選択肢間の相関などを自由に表現できる。  ただし計算には、 J 回の多重積分を必要とし、選択肢の数が多 い場合計算が極めて困難になるのが問題。

計算について このような計算をしなければなら ないので非常に難しい 。

Mixed logit モデル  計算を簡易にするために用いられる 。  確率項を 、 共分散を持つ項と選択肢に固有の独立誤差項 ( ガン ベル分布に従う ) に分解する 。  を共分散行列 Ω に従う誤差項 、 を選択肢に固有の誤差項 とすると 、 選択確率は となる 。 f は多変量正規分布の密度関数とする 。 多重積分が残る のは変わりないが 、 モンテカルロシミュレーションによる近似を 行うことにより近似の値を算出することが可能である 。

複数データに基づくモデル推定 複数のデータをモデル推定に用いる場合・・・データの特徴に注意 ・集計データと非集計データの違い ・カウントデータとアンケートデータの違い ・ RP データと SP データの違い ・異なる地域におけるデータでは、地域の特徴がどのように反映されているか ・異なる時点ではどのように反映されているか、また時点間の繋がりの捉え方 モデル化の枠組みとしては・・・ ① あるデータソースから推定されたモデルを 、 別のデータによって更新 ② 複数のデータソースの特徴を考慮して 、 モデル推定時に同時に使用 重要なのはデータもパラメータも確率変数であり 、 バイアスに左右されるとい うこと

RP/SP モデル  RP 、 SP 両データを同時に利用して離散選択モデルを推定する 方法 。  特徴としては ①: RP データを使用することで SP バイアスの影響を需要予測か ら除去できる 。 ②: 属性間のトレードオフを示すパラメータを両データから同時 に推定することにより統計的な有効性を上げることができる 。 ③: 新しいサービスについての変数等 RP からは同定できないパラ メータを推定することができる 。

RP/SP モデル  各データごとにモデルを定式化  ここで : 個人 n の選択肢 i に対する説明変数 ベクトル 、 : 未知係数ベクトル  はランダム項の分散の違いを示すスケールパラメータ

 はそれぞれ RP モデル 、 SP モデルで異なる係数を持つ説 明変数ベクトルであり が SP バイアスを表している 。  これのパラメータ推定をする場合にはロジットと同様に最尤 法を用いる 。 このときそれぞれは  となる 。 これを最大化することでパラメータの推定ができる 。

RP/SP モデル  パラメータの推定はロジットモデルの推定と同様尤度の最大 化によりそれぞれ求めることができ 、 RP と SP の確率項が独立 であるのならば線形結合した尤度の最大化によりパラメータ を求めることができる 。 独立でなくても一致推定量を得る 。  ただし 、 μ を導入したことによりパラメータについて非線形で あるために 、 専用のプログラミングが必要となるところは注 意する点である 。

RP/SP モデル  各尤度を段階的に求めていくことにより 、 パラメータの非線 形性を避けたものが段階推定法である 。 ① SP データの尤度関数を最大化しパラメータの推定値 と を 得 、 次の値を計算する 。 ② RP モデルについて確定項を としこれから最大尤度を算出 、 以下のパラメータを推定する 。

RP/SP モデル  これまでは通常の段階推定法だが 、 次の手順を行うことによ りパラメータの制度を向上できる 。 ③ と を 倍してスケール変換された SP データを作成 する 。 この条件下で同時推定を行い新たにパラメータを算出する 。 この同時推定はパラメータについて線形であり比較的簡易に求め られる 。

離散選択モデルの応用  効用関数中の係数パラメータは 、 母集団中で同一であるとし ていた 。 → 個人ごとに嗜好の差があると考える方が自然 。 運 賃を重視する人や移動時間を重視する人など 。  対処法の 1 つとして性別 、 所得 、 職業等の個人属性を変数に 導入する方法がある 。  ここで は性別 、 所得をあらわす変数とパラメータ 。  他にもサービスレベル変数のパラメータを個人属性に従って 変化させることもできる 。 例えば運賃が性別によって効用に 与える影響が違うとするなら とすることにより説明可 能 。

離散選択モデルの応用  データを嗜好がおおよそ均一と見られるサブグループに分け てからグループごとにパラメータを推定することも多い 。  このサブグループをマーケットセグメントと呼ぶ 。 先の個人 属性変数の導入の代わりにあらかじめセグメンテーションに よって個人属性を説明したものと言える 。  モデルに必ずつきまとう問題は 「 どの変数によって行動を説 明するか 」 ということであり 、 先のモデルもそうだしこのモ デルにも言えることだが 、 どのような個人属性によって嗜好 の異質性を表すことができるかは先験的に 、 または試行錯誤 的に決めなくてはいけない 。

選択肢集合の考え方  通常 、 離散選択モデルは個人個人の選択肢集合にどのような 選択肢が含まれているかが明確に分かっている場合のみ適用 可能 。  このとき 、 例えば運転免許を保有していない人は自動車とい う選択肢を除去するべきである 。  またかなり遠い距離に対し 、 徒歩という手段でアプローチす る人は特別な理由 ( 健康上の理由とか ) がない限り選択され ないと考えられ 、 選択肢集合から除去するべきである 。  誤った選択肢集合のもとでモデルを推定した場合 、 パラメー タに誤差が生じる可能性がある 。

選択肢集合の考え方  選択肢の範囲は明確に分かっており 、 IIA 特性が成り立っている が 、 選択肢の数が膨大なでありすべてを書き下すことが困難な 場合 、 選択肢の集計化が方法の 1 つとしてある 。  ここで μ はスケールパラメータであり 、 M は集計化された選択肢 i の中の要素選択肢数である 。  第二項は 、 確定効用値に集計された規模の補正項が入っている ことを示している 。

選択肢集合の考え方  選択肢集合が分析者にとって不確定である場合には 、 確率的な選 択肢集合を考えた分析が有効  G は選択肢の全ての部分集合の集合 、 C は選択肢集合であり 、 個人 n の選択肢集合が C である確率を で表している 。  このモデルは選択肢集合の形成と 、 選択肢集合という所与のもと での選択行動という二段階での構成になっており 、 この二つの段 階が行動論的に異なる規範に基づいている場合でも 、 この式を用 いて選択肢集合の不確実性を考慮したものとして表現できる 。

便益指標としてのログサム変数  ログサム変数において となるように設定すると 、 ログ サム変数は全選択肢の最大効用の期待値となる 。  これには選択肢集合の合成関数として望ましい二つの性質が あり 、 新しい選択肢が加わるとログサム変数の値は必ず大き くことと 、 選択肢の確定効用があがるとログサム変数の値は 大きくなることである 。 を の部分集合とし 、

便益指標としてのログサム変数  これらから 、 政策施行前後におけるログサム変数の変化が消 費者余剰に等しいことがわかり、便益計算に利用することが 可能となる。施行前後の効用値を示す数字をそれぞれ1、2 とし、  この式は効用レベルでの無次元数なので金額単位に直すには 費用の係数値で割り戻せば良い。