あるルーティングゲームの 最適戦略について

Slides:



Advertisements
Similar presentations
List decoding for Reed-Muller codes and its application to polar codes 安永 憲司 東京工業大学 大学院情報理工学研究科 数理・計算科学専攻 1.
Advertisements

新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
コンピュータビジョン特論B - Graph Cuts - 永橋知行.
オンライン学習 Prediction Learning and Games Ch2
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
秘密のリンク構造を持つグラフのリンク解析
一次関数と方程式 本時の流れ ねらい「二元一次方程式をグラフに表すことができる。」 ↓ 課題の提示 yについて解き、グラフをかく
数理科学コース・ 倉田 和浩 2007/11/3 大学祭オープンラボ
一次関数のグラフ(式を求めること) 本時の流れ ねらい「グラフや座標など与えられた条件をもとに一次 関数の式を求める。」 ↓
一次関数のグラフ(式を求めること) 本時の流れ ねらい「グラフや座標など与えられた条件をもとに一次 関数の式を求める。」 ↓
Generating Functions (前半) B4 堺谷光.
An Algorithm for Enumerating Maximal Matchings of a Graph
JAG Regional Practice Contest 2012 問題C: Median Tree
時空間データからのオブジェクトベース知識発見
データ構造と アルゴリズム 第二回 知能情報学部 新田直也.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
線形代数学 4.行列式 吉村 裕一.
A path to combinatorics 第6章前半(最初-Ex6.5)
Selfish routing 川原 純.
動力学(Dynamics) 運動方程式のまとめ 2008.6.17
Googleのページランク 基本的な仕組は数学的 グラフの行列による表現 隣接行列(推移行列、遷移行列) 固有値と固有ベクトル W大学
シャノンのスイッチングゲームにおけるペアリング戦略について
シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて
3. 可制御性・可観測性.
独立成分分析 1.問題は何か:例:解法:全体の見通し 2007/10/17 名雪 勲.
7. 音声の認識:高度な音響モデル 7.1 実際の音響モデル 7.2 識別的学習 7.3 深層学習.
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
決定木とランダムフォレスト 和田 俊和.
「三角形の面積の変化の様子を一次関数としてとらえることができる。」
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
7.4 Two General Settings D3 杉原堅也.
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
デザイン情報学科 メディア情報設計 河原英紀
ランダムグラフ エルデシュとレーニイによって研究された.→ER-model p:辺連結確率 N:ノード総数 分布:
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
主成分分析 Principal Component Analysis PCA
A Simple Algorithm for Generating Unordered Rooted Trees
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
様々な情報源(4章).
母分散の信頼区間 F分布 母分散の比の信頼区間
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
進化ゲームと微分方程式 第15章 n種の群集の安定性
2016年度 有限幾何学 中間試験 問1 次のグラフを描け.(描けない場合は理由を述べよ) 各20点
4. システムの安定性.
サポートベクターマシン Support Vector Machine SVM
重み付き投票ゲームにおける 投票力指数の計算の高速化
Max Cut and the Smallest Eigenvalue 論文紹介
Selfish Routing and the Price of Anarchy
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
A02 計算理論的設計による知識抽出モデルに関する研究
プロジェクト演習III,V <インタラクティブ・ゲーム制作> プログラミングコース
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
7.8 Kim-Vu Polynomial Concentration
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
奈良女子大集中講義 バイオインフォマティクス (7) 進化系統樹
d b c e a f 年度 有限幾何学 中間試験 問1 次の用語の定義をそれぞれ述べよ.
生命情報学特論 (6) 固定パラメータアルゴリズムと 部分k木
弱電離気体プラズマの解析(LXXVI) スプラインとHigher Order Samplingを用いた 電子エネルギー分布のサンプリング
逆運動学(Inverse Kinematics) 2007.5.15
グラフの帯域幅連続多重彩色 を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室 西川和秀.
混合ガウスモデル Gaussian Mixture Model GMM
京都大学 情報学研究科 通信情報システム専攻 高田智史 joint work with 伊藤大雄 中村義作
Time Reversal E-Text: pp.80-83(PDF: pp.49-50) FM08002 太神 諭
Presentation transcript:

あるルーティングゲームの 最適戦略について 瀧本 英二  内沢 啓 東北大学大学院情報科学研究科

情報処理学会東北支部 設立30周年記念 プログラミングコンテスト みちのく 達人 秋の陣

りんごキャッチ競争 A B

ルール りんごデータ:(x1,y1,t1), ..., (xn,yn,tn) (xi,yi) = i番目のりんごの座標 ti = i番目のりんごの落下開始時刻 プレイヤーB プレイヤーA 7,s,s,s,r,r,r,s,s,s,l,l,l,s,s,・・・ 34,s,s,s,s,s,r,r,r,r,l,l,l,s,・・・ 初期x座標 s: その場にとどまる r: 右へ移動 l: 左へ移動

DAGによる表現 GA=(V,EA):プレイヤーAからみたりんごグラフ (i,j) 2 EA , りんご i を取った後りんご jを 取る可能性がある Aの地面に落下する時刻 プレイヤーAの戦略 = GAにおけるパス X (実際にはこれの推移的閉包)

りんごグラフの例 GA=(V,EA) A B ※ すべてのりんごの落下開始時刻を同じと仮定

Bのりんごグラフ GB=(V,EB) A B ※ すべてのりんごの落下開始時刻を同じと仮定

陣地について Aのパス Bのパス A B ※ すべてのりんごの落下開始時刻を同じと仮定

陣地について Aのパス Aの陣地 Bの陣地 Bのパス A B ※ すべてのりんごの落下開始時刻を同じと仮定

零和行列ゲームによる定式化 プレイヤーA GA上のパスP <GA,GB> プレイヤーB GB上のパスQ Aからみた損失行列 M(P,Q) = Bの取ったりんごの数 – Aの取ったりんごの数 P1 Q1 P2 P3 Q2 Q3 …… +1 +2 +4 -2 -1 -3

ミニマックス戦略 Aの混合戦略 = GAのパス上の分布 W Q1 Q2 Q3 …… W1 P1 W2 P2 …… W3 P3 …… …… +1 +2 +4 W2 P2 +1 -2 -1 …… W3 P3 +2 +1 -3 …… …… …… Aの最適戦略 W*

Hedge Algorithm による解法[Freund,Schapire] t = 1, 2, ..., T 仮想プレイヤーA 仮想プレイヤーB 混合戦略 Wt Qt = argmaxQ P Wt(P) M(P,Q) 戦略の更新 t 2 [0,1] 定理

問題点 重み Wt の更新に O(パスの個数) 時間必要 一般にパスの個数は指数的に大きい そもそも最適戦略 W* の表現の長さが指数的?

問題解決のアイデア P 辺上に遷移確率 vt を保持し,次の関係式によって パス上の分布 Wt を間接的に表現 0.5 1.0 0.3 P 0.5 sink 0.8 source 0.2 0.7 1.0 1.0 Wt(P) = ランダムウォークが         パスP をたどる確率

Wt の重み更新の模倣 条件: (更新前) (更新後) を満たすような辺上の重み更新 が求められる

定理[Takimoto, Warmuth] 損失行列 M が のように表せるとき,Wt の重み更新を vt を用いて 模倣できる.さらに,vt ! vt+1の更新は多項式時間 計算可能

りんごキャッチ競争の場合 Bの陣地 BのパスQが選んだりんご sink Aの陣地 m(Q) = の数 = 4 Aの陣地 m(Q) = の数 = 4 l(e,Q) = 0 Bの陣地の      -2 Aの陣地の      -1 -1 -1 -2 -1 -1 -2 source

Wt の重み更新の模倣 条件 より とおくと, = 任意のPに対しこれが成立するような vt+1 を求める

Path Kernels O(|P|) 時間? Path Kernel 辺の重みベクトル: v = (v(e1), ..., v(em)) パスの重みベクトル: W = (W(P1), ..., W(PN)), ただし, この関係を,w = (v) と表す. 係数ベクトル : b = (b(e1), ..., b(em)) Path Kernel O(|P|) 時間? normalization factor

Path Kernel の計算 sink u source

Path Kernel の計算 O(|E|) 時間! u sink source

Weight Pushing Algorithm 目標 u sink source

目標を達成しているか確認 P = { (u0=source, u1) , (u1, u2) …, (uk-1, uk=sink) } に対し, OK!

今後の課題 何か応用は? Adaptive な場合?