緩和+分解+調整による 分散協調問題解決 神戸大学大学院海事科学研究科 平山 勝敏.

Slides:



Advertisements
Similar presentations
<最適化の概念> 最適化すべき問 題 数学モデル 変数,数式 数理計画法 定められた計算手 順を用いて解くた めの方法論.
Advertisements

三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
木探索によるCSPの解法 (Tree search algorithms for solving CSPs) 認知システム論 制約充足( 2 ) 制約をみたす組合せを探すエージェント バックトラック法 フォワードチェック 動的変数順序.
到着時刻と燃料消費量を同時に最適化する船速・航路計画
制約付き最短路問題に対する実験的解析 上智大学 宮本裕一郎 o 1 d (7, 15) (9,4) (12,4)
ネットワーク理論講義補助資料 Text. 組合せ最適化とアルゴリズム 4.5 節 主・双対法 pp
ラベル付き区間グラフを列挙するBDDとその応用
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
秘密のリンク構造を持つグラフのリンク解析
最適間接税.
組合せ最適化問題と厳密解法 最小木、ナップサック問題、ビンパッキング、巡回セールスマン問題 LPによる上界・下界 分枝限定法
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
Approximation of k-Set Cover by Semi-Local Optimization
土木計画学 第11回(12月21日) 土木計画と説明責任 計画における代替案の作成1 担当:榊原 弘之.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
先端論文紹介ゼミ Role-based Context-specific Multiagent Q-learning
「基礎OR」/「OR演習」 第3回 10/13/2009 森戸 晋.
整数計画法を用いた ペグソリティアの解法 ver. 2.1
エージェントアプローチ 人工知能 21章 B4 片渕 聡.
PCクラスタ上での 連立一次方程式の解の精度保証
第 七 回 双対問題とその解法 山梨大学.
1章前半.
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
第7章 データベース管理システム 7.1 データベース管理システムの概要 7.2 データベースの格納方式 7.3 問合せ処理.
計算量理論輪講 岩間研究室 照山順一.
ネットワーク理論講義補助資料 Text. 組合せ最適化とアルゴリズム 4.3 節 Lagrange緩和 pp
早わかりアントコロニー最適化 (ACO: Ant Colony Optimization)
情報工学総合演習 D-I 近似アルゴリズム 埼玉大学 理工学研究科 山田 敏規、 橋口 博樹、 堀山 貴史
Linear Relaxation for Hub Network Design Problems
サポートベクターマシン によるパターン認識
大阪大学 大学院情報科学研究科 博士前期課程2年 宮原研究室 土居 聡
大阪市立大学 学術情報総合センター 大西克実
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
ネットワーク上での社会的効用と個人的効用の対立問題に対するアルゴリズム的研究
ネットワーク理論 Text. Part 3 pp 最短路問題 pp 最大流問題 pp.85-94
第9章 混合モデルとEM 修士2年 北川直樹.
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
第14章 モデルの結合 修士2年 山川佳洋.
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
Introduction to Soft Computing (第11回目)
運搬スケジューリング問題と その周辺 東京商船大学 流通情報工学 久保 幹雄.
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
ファジィ制約充足問題への 連続領域の導入 Introducing continuous domains to
部分的最小二乗回帰 Partial Least Squares Regression PLS
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
Data Clustering: A Review
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
B03 量子論理回路の 最適化に関する研究 西野哲朗,垂井淳,太田和夫,國廣昇 電気通信大学 情報通信工学科.
最長片道きっぷの厳密解を求める 東京大学大学院 宮代隆平,葛西隆也.
サポートベクターマシン Support Vector Machine SVM
秘匿リストマッチングプロトコルとその応用
ロジスティクスにおける 最適化の応用 東京商船大学   流通システム 久保 幹雄.
サプライ・チェイン最適化について 研究者・実務家が知っておくべきこと
第16章 動的計画法 アルゴリズムイントロダクション.
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
土木計画学 第12回(1月14日) 計画における代替案の作成2 担当:榊原 弘之.
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
ポッツスピン型隠れ変数による画像領域分割
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
半正定値計画問題(SDP)の 工学的応用について
11.動的計画法と擬多項式時間アルゴリズム.
分枝カット法に基づいた線形符号の復号法に関する一考察
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年8月1日 3.2 競合学習
13.近似アルゴリズム.
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
東京工業大学情報理工学研究科 小島政和 第1回横幹連合コンファレンス 2005年11月25,26日 JA 長野県ビル
グラフの帯域幅連続多重彩色 を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室 西川和秀.
Presentation transcript:

緩和+分解+調整による 分散協調問題解決 神戸大学大学院海事科学研究科 平山 勝敏

目次 分散協調問題解決 分散最適化 分散制約最適化問題 一般化相互割当問題 アルゴリズムの分類 緩和・分解・調整法 緩和・分解・調整法の適用例 まとめ

分散協調問題解決 分散協調問題解決 基本的な動機 複数の問題解決器(処理ノード/エージェント)が協力してある一つの問題を解こうとする問題解決のモデル ~ 【人工知能学事典】より 基本的な動機 効率追求論: 問題が大きすぎるため1エージェントで解くのは効率が悪い。 分散ありき論: 何らかの理由(プライバシーやセキュリティ、サーバー管理の手間など)で、問題を1箇所に集めて解くことができない。

分散協調問題解決 分散協調問題解決のための基本的な枠組み 黒板モデル 分散探索 分散プランニング 交渉プロトコル 分散制約充足 分散最適化

分散最適化 分散最適化問題 分散された変数集合(値域は有限で離散的とする) 分散された制約集合 大域的な目的関数 大域的な目的関数 Agent1 Agent2 Agent3 分散協調

分散制約最適化問題(COP) 構成要素 目的 変数集合、値域集合、効用関数集合 効用の総和を最大にするような変数集合への値の割当てを求める。 x1 x2 x3 Total Utility r 3 y 5 4 効用関数fij x1 j red yellow 1 2 f12 f13 i x2 x3 f23

分散制約最適化問題(COP) 構成要素 目的 変数集合、値域集合、効用関数集合 効用の総和を最大にするような変数集合への値の割当てを求める。 x1 x2 x3 Total Utility r 3 y 5 4 効用関数fij x1 j red yellow 1 2 f12 f13 i x2 x3 f23

分散制約最適化問題(DCOP) 初出文献: [Modi, et.al., 03][Modi, et.al., 05] 変数と効用関数が複数のエージェントに分散された制約最適化問題 可能な応用例 センサーネットワーク 会議スケジューリング Agent 1 Max. f12 + f23 + f13 x1 f12 f13 x2 x3 x1 x2 x3 f23 Agent 2 Agent 3 Agent 1 Agent 2 Agent 3

一般化相互割当問題 組合せ最適化問題 NP困難,実行可能性の判定もNP完全 等式制約,不等式制約を含む整数計画問題 財1 財2 財3 目的:  効用和が最大となる財の割当てを求める. 割当制約:  各財は1エージェントにのみ割り当てられる. ナップサック制約:  各エージェントの資源消費量の総和は  利用可能な資源容量を超えない. (5,1) (6,2) (5,2) (2,2) (2,2) (4,2) 4 3 (効用, 資源消費量) Agent1 Agent2

一般化相互割当問題 組合せ最適化問題 NP困難,実行可能性の判定もNP完全 等式制約,不等式制約を含む整数計画問題 財1 財2 財3 目的:  効用和が最大となる財の割当てを求める. 割当制約:  各財は1エージェントにのみ割り当てられる. ナップサック制約:  各エージェントの資源消費量の総和は  利用可能な資源容量を超えない. (5,1) (6,2) (5,2) (2,2) (2,2) (4,2) 4 3 (効用, 資源消費量) Agent1 Agent2

一般化相互割当問題 組合せ最適化問題 NP困難,実行可能性の判定もNP完全 等式制約,不等式制約を含む整数計画問題 財1 財2 財3 目的:  効用和が最大となる財の割当てを求める. 割当制約:  各財は1エージェントにのみ割り当てられる. ナップサック制約:  各エージェントの資源消費量の総和は  利用可能な資源容量を超えない. (5,1) (6,2) (5,2) (2,2) (2,2) (4,2) 4 3 (効用, 資源消費量) Agent1 Agent2

一般化相互割当問題(GMAP) 初出文献: [Hirayama, 06] 資源制約のある分散集合分割問題 可能な応用例: 配送問題(vehicle routing problem) 資源スケジューリング(resource scheduling problem) 目的:  効用和が最大となる財の  割当てを求める. 割当制約(エージェント間制約):  各財は1エージェントにのみ  割り当てられる. ナップサック制約(エージェント 内制約):  各エージェントの資源消費  量の総和は利用可能な資  源容量を超えない. Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

一般化相互割当問題(GMAP) 初出文献: [Hirayama, 06] 資源制約のある分散集合分割問題 可能な応用例: 配送問題(vehicle routing problem) 資源スケジューリング(resource scheduling problem) Max. 5x11+6x12+5x13+4x21+2x22+2x23 目的:  効用和が最大となる財の  割当てを求める. 割当制約(エージェント間制約):  各財は1エージェントに割  り当てられる. ナップサック制約(エージェント 内制約):  各エージェントの資源消費  量の総和は利用可能な資  源容量を超えない. Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

一般化相互割当問題(GMAP) [Hirayama, 06] 資源制約のある分散集合分割問題 可能な応用例: 配送問題(vehicle routing problem) 資源スケジューリング(resource scheduling problem) Max. 5x11+6x12+5x13+4x21+2x22+2x23 目的:  効用和が最大となる財の  割当てを求める. 割当制約(エージェント間制約):  各財は1エージェントにのみ  割り当てられる. ナップサック制約(エージェント 内制約):  各エージェントの資源消費  量の総和は利用可能な資  源容量を超えない. Agent1 Agent2 1 2 3 1 2 3 XOR XOR XOR 4 3

目次 分散協調問題解決 分散最適化 分散制約最適化問題 一般化相互割当問題 アルゴリズムの分類 緩和・分解・調整法 緩和・分解・調整法の適用例 まとめ

アルゴリズムの分類 DCOP GMAP 分枝限定法 ADOPT [Modi, 03] BnB-ADOPT [Yeoh, 10] 動的計画法 DPOP [Petcu, 05] Max-Sum [Rogers, 11] 局所探索法 DSA [Fitzpatrick, 01] DALO [Kiekintveld, 10] 緩和・分解・調整法 DaCSA [Vinyals, 10] EU-DaC [Vinyals, 10] DeQED [Hatano, 13] DisLRP [Hirayama, 06; Hirayama, 07; Hirayama, 09; Hanada, 11]

緩和・分解・調整法 直感的なイメージ 大域的な目的関数 Agent1 Agent2 Agent3 最適解 実行可能領域 エージェント 間制約 エージェント 間制約 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. global objective Max. … Max. … Max. … Agent1 エージェント 間制約 Max. … Max. … Max. … 最適解 Agent1 Agent2 Agent3 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Agent1 Agent2 Agent3 上界値を与える 実行不可能解 最適解 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Agent1 Agent2 Agent3 上界値を与える 最適解に 実行不可能解 近づけたい! Max. … 最適解 Agent1 Agent2 Agent3 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Agent1 Agent2 Agent3 上界値を与える 最適解に 実行不可能解 近づけたい! Max. … 最適解 Agent1 Agent2 Agent3 実行可能領域 緩和された エージェント間制約 緩和された エージェント間制約 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … Agent1 Agent2 Agent3 緩和されたエージェント間制約に対応した 重み(ラグランジュ乗数)付きのペナルティ項 上界値を与える 実行不可能解 最適解に 近づけたい! Max. … Max. … Max. … 最適解 Agent1 Agent2 Agent3 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … Agent1 Agent2 Agent3 最適解 実行可能領域 重み(ラグランジュ乗数)を更新して情報交換 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … Agent1 Agent2 Agent3 最適解 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … Agent1 Agent2 Agent3 最適解 実行可能領域 重み(ラグランジュ乗数)を更新して情報交換 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … Agent1 Agent2 Agent3 最適解 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … ペナルティ項の重み(ラグランジュ乗数)の値を変化 させて最小の上界値を求める. (ラグランジュ双対問題) Max. … Max. … Max. … 最適解 Agent1 Agent2 Agent3 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法 ラグランジュ双対問題の代表的解法 劣勾配最適化法 切除平面法 バンドル法 単純な降下法であり計算コストは小さい 分散環境との親和性が高い 最適解(最小の上界値を与える解)に収束する保証はない 切除平面法 線形計画問題を解く必要がある 最適解に収束する バンドル法 2次計画問題を解く必要がある 最適解 実行可能領域

緩和・分解・調整法 直感的なイメージ Max. … Max. … Max. … 問題によっては、各上界値に対応して実行可能解(下界値) が得られる場合がある(ラグランジュヒューリスティックス) 1 2 3 Max. … Max. … Max. … 最適解 3 2 1 Agent1 Agent2 Agent3 実行可能領域 注) 目的関数は加法的かつエージェントごとに分解可能と仮定する

緩和・分解・調整法の適用例 DCOP GMAP 分枝限定法 ADOPT [Modi, 03] BnB-ADOPT [Yeoh, 10] 動的計画法 DPOP [Petcu, 05] Max-Sum [Rogers, 11] 局所探索法 DSA [Fitzpatrick, 01] DALO [Kiekintveld, 10] 緩和・分解・調整法 DaCSA [Vinyals, 10] EU-DaC [Vinyals, 10] DeQED [Hatano, 13] DisLRP [Hirayama, 06; Hirayama, 07; Hirayama, 09; Hanada, 11]

緩和・分解・調整法の適用例 DisLRP for GMAP Max. 5x11+6x12+5x13+4x21+2x22+2x23 Agent1 Agent2 1 2 3 1 2 3 XOR (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) XOR XOR 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. 5x11+6x12+5x13+4x21+2x22+2x23 Agent1 Agent2 1 2 3 1 2 3 XOR (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) XOR XOR 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. 5x11+6x12+5x13+4x21+2x22+2x23 +m1(1-x11-x21) +m2(1-x12-x22) +m3(1-x13-x23) Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. 5x11+6x12+5x13+4x21+2x22+2x23 +m1(1-x11-x21) +m2(1-x12-x22) +m3(1-x13-x23) Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. 5x11+6x12+5x13 -m1x11-m2x12-m3x13+m1+m2+m3 Max. 4x21+2x22+2x23 -m1x21-m2x22-m3x23 Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. (5-m1)x11+(6-m2)x12+(5-m3)x13+m1+m2+m3 Max. (4-m1)x21+(2-m2)x22+(2-m3)x23 Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Max. (5-m1)x11+(6-m2)x12+(5-m3)x13+m1+m2+m3 Max. (4-m1)x21+(2-m2)x22+(2-m3)x23 Agent1 Agent2 1 2 3 1 2 3 (5-m1,2) (6-m2,2) (5-m3,1) (4-m1,2) (2-m2,2) (2-m3,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Round 1: Agent1 Agent2 1 2 3 1 2 3 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Round 1: Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Round 1: Agent1 Agent2 1 2 3 1 2 3 (5,2) (6,2) (5,1) (4,2) (2,2) (2,2) m1: up m2: --- 4 3 m3: down Select {1, 2} Select {1} 上界値 = 15

緩和・分解・調整法の適用例 DisLRP for GMAP Round 2: Agent1 Agent2 1 2 3 1 2 3 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Round 2: Agent1 Agent2 1 2 3 1 2 3 (4,2) (6,2) (6,1) (3,2) (2,2) (3,2) 4 3

緩和・分解・調整法の適用例 DisLRP for GMAP Round 2: Agent1 Agent2 1 2 3 1 2 3 【定理】 ラグランジュ乗数のある値のもとで, DisLRPによる財の割当てが緩和された エージェント間制約をすべて満たすとき, その割当ては最適解である. Round 2: Agent1 Agent2 1 2 3 1 2 3 (4,2) (6,2) (6,1) (3,2) (2,2) (3,2) m1: --- m2: --- 4 3 m3: --- Select {2, 3} Select {1} 最適解 上界値 = 15

緩和・分解・調整法の適用例 DCOP GMAP 分枝限定法 ADOPT [Modi, 03] BnB-ADOPT [Yeoh, 10] 動的計画法 DPOP [Petcu, 05] Max-Sum [Rogers, 11] 局所探索法 DSA [Fitzpatrick, 01] DALO [Kiekintveld, 10] 緩和・分解・調整法 DaCSA [Vinyals, 10] EU-DaC [Vinyals, 10] DeQED [Hatano, 13] DisLRP [Hirayama, 06; Hirayama, 07; Hirayama, 09; Hanada, 11]

緩和・分解・調整法の適用例 DeQED for DCOP Max. f12 + f23 + f13 効用関数fij j i x2 x3 x1 red yellow 1 2 i x2 x3 x1 Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Min. f12 + f23 + f13 コスト関数fij red yellow 1 2 i x2 x3 x1 Agent 1 Agent 2 Agent 3 目的: 大域的なコスト関数の値を最小化する

緩和・分解・調整法の適用例 DeQED for DCOP Min. f12 + f23 + f13 コスト関数の2次符号化 {red,yellow} x2 x3 x1 値を単位ベクトルに変換 Agent 1 Agent 2 Agent 3 コスト関数fij コスト関数fij 行列に変換 j red yellow 1 2 i

緩和・分解・調整法の適用例 DeQED for DCOP 各変数とそれに関するコスト関数のペア に対して補助変数aを導入する

緩和・分解・調整法の適用例 DeQED for DCOP 各変数とそれに関するコスト関数のペア に対して補助変数aを導入する

緩和・分解・調整法の適用例 DeQED for DCOP 各変数とそれに関するコスト関数のペア に対して補助変数aを導入する

緩和・分解・調整法の適用例 DeQED for DCOP

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23 x1 x2 x3 f12 f23 f13

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23 x1 x2 x3 f12 f23 f13

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23 x2 x3 x1 f13 Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23 x2 x3 x1 f13 Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23 x2 x3 x1 f13 Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 コスト関数f12 コスト関数f23

緩和・分解・調整法の適用例 DeQED for DCOP 総和を保存するために,aに関する各項 を1/2倍する Agent 1

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP 一般に,ラグランジュ乗数の値のみを交換するだけで問題を解くことができ,変数xの値そのものを交換する必要がない. Agent 1 Agent 2 Agent 3 decide decide decide

緩和・分解・調整法の適用例 DCOP 分枝限定法 ADOPT [Modi, 03] BnB-ADOPT [Yeoh, 10] 動的計画法 DPOP [Petcu, 05] Max-Sum [Rogers, 11] 局所探索法 DSA [Fitzpatrick, 01] DALO [Kiekintveld, 10] 緩和・分解・調整法 DaCSA [Vinyals, 10] EU-DaC [Vinyals, 10] DeQED [Hatano, 13] 変数xの値そのものを 交換する 変数xの値そのものを 交換しなくてもよい

緩和・分解・調整法の適用例 DeQED for DCOP 補助変数aを導入しても,それに伴って追加される制約は単項コスト関数のみであり,部分問題の複雑さは本質的に増加しない. Agent 1 Agent 2 Agent 3 decide decide decide

緩和・分解・調整法の適用例 DCOP 分枝限定法 ADOPT [Modi, 03] BnB-ADOPT [Yeoh, 10] 動的計画法 DPOP [Petcu, 05] Max-Sum [Rogers, 11] 局所探索法 DSA [Fitzpatrick, 01] DALO [Kiekintveld, 10] 緩和・分解・調整法 DaCSA [Vinyals, 10] EU-DaC [Vinyals, 10] DeQED [Hatano, 13] 補助変数を使わない 補助変数を使う一方で, 部分問題の複雑度は増加 補助変数を使うが,部分 問題の複雑度はほとんど 増加しない

緩和・分解・調整法の適用例 DeQED for DCOP 最適値の上界値(実行可能解)と下界値の情報が得られる. Agent 1 decide decide decide

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP 総和が最適値の下界値となる

緩和・分解・調整法の適用例 DeQED for DCOP Agent 1 Agent 2 Agent 3 decide decide

緩和・分解・調整法の適用例 DeQED for DCOP 変数xの値から,もとのコスト関数の値の総和 を計算でき,それが最適値の上界値となる. Agent 1 Agent 2 Agent 3 decide decide decide

ランダムネットワーク(100変数)の実験結果 全体の問題 変数の数:100 値域サイズ:3 制約の数:247 制約にかかるコスト {1,2,…,106}から ランダムに選択 サイクル数:{50, 100, 150, 200, 250, 300, 350, 400, 450, 500}

スケールフリーネットワーク(100変数)の実験結果 全体の問題 変数の数:100 値域サイズ:3 制約の数:180 制約にかかるコスト {1,2,…,106}から ランダムに選択 サイクル数:{50, 100, 150, 200, 250, 300, 350, 400, 450, 500}

ランダムネットワーク(1000変数)の実験結果 全体の問題 変数の数:1000 値域サイズ:3 制約の数:2497 制約にかかるコスト {1,2,…,106}から ランダムに選択 サイクル数:{50, 100, 150, 200, 250, 300, 350, 400, 450, 500}

スケールフリーネットワーク(1000変数)の実験結果 全体の問題 変数の数:1000 値域サイズ:3 制約の数:1997 制約にかかるコスト {1,2,…,106}から ランダムに選択 サイクル数:{50, 100, 150, 200, 250, 300, 350, 400, 450, 500}

まとめ 緩和・分解・調整法の概要と分散問題解決への適用例を示した. 一般的な特徴: 実行不可能解から最適解へ接近する. 非厳密解法だが,一般に最適値の上界と下界が得られる. 非同期的ではなく局所同期的に動作する.

関連文献 [1] Daisuke Hatano, Katsutoshi Hirayama: DeQED: an Efficient Divide-and-Coordinate Algorithm for DCOP, IJCAI-2013, to appear [2] Kenta Hanada, Katsutoshi Hirayama: Distributed Lagrangian Relaxation Protocol for the Over-constrained Generalized Mutual Assignment Problem, PRIMA-2011, pp.174-186. [3] Katsutoshi Hirayama, Toshihiro Matsui, Makoto Yokoo: Adaptive Price Update in Distributed Lagrangian Relaxation Protocol, AAMAS-2009, pp.1033-1040. [4] Katsutoshi Hirayama: An α-approximation Protocol for the Generalized Mutual Assignment Problem, AAAI-2007, pp.744-749. [5] Katsutoshi Hirayama: A New Approach to Distributed Task Assignment using Lagrangian Decomposition and Distributed Constraint Satisfaction, AAAI-2006, pp.660-665.