算法数理工学 第12回 定兼 邦彦.

Slides:



Advertisements
Similar presentations
組合せ最適化輪講 2.3 連結性 川原 純. 2.3 連結性 内容 – グラフ上の節点をすべてたどるアルゴリズム 計算機上でのグラフの表現 – 強連結成分を求めるアルゴリズム トポロジカル順序を求める方法も – k- 連結、 k- 辺連結について – 2- 連結グラフの耳分解について.
Advertisements

授業展開#12 コンピュータの扱いにくい問 題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣 を比較するためには、標準的なコン ピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモ デルとして、チューリングマシンを考え、
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
©2008 Ikuo Tahara探索 状態空間と探索木 基本的な探索アルゴリズム 横形探索と縦形探索 評価関数を利用した探索アルゴリズム 分岐限定法 山登り法 最良優先探索 A ( A* )アルゴリズム.
情報基盤アルゴリズムとして のメタヒューリスティクスの 研究 茨木俊秀、巳波弘佳、藤原洋志、 千葉英史、関口良行(関西学院大 学)、 藤重悟(京都大学)、 柳浦睦憲(名古屋大学)、 野々部宏司(法政大学)、 梅谷俊治(電気通信大学)
到着時刻と燃料消費量を同時に最適化する船速・航路計画
最適化アルゴリズムの動向 ーメタヒューリスティックスを中心としてー (基礎編)
2009/12/4 グラフ (2) 第10講: 平成21年12月4日 (金) 4限 E252教室 コンピュータアルゴリズム.
極小集合被覆を列挙する 実用的高速アルゴリズム
離散システム特論 整列(sorting)アルゴリズム 2.
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
第11回 整列 ~ シェルソート,クイックソート ~
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
整数計画法を用いた スリザーリンクの解法 杉村 由花 (東京大学)
An Algorithm for Enumerating Maximal Matchings of a Graph
Approximation of k-Set Cover by Semi-Local Optimization
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
データ構造と アルゴリズム 第二回 知能情報学部 新田直也.
香川大学工学部 富永浩之 情報数学1 第2-2章 合同式の逆元と応用 香川大学工学部 富永浩之
データ構造とアルゴリズム 分割統治 ~ マージソート~.
マイクロシミュレーションにおける 可変属性セル問題と解法
岩井 儀雄 コンピュータ基礎演習  ー探索、整列ー 岩井 儀雄
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
第11講: 平成18年12月 8日 (金) 4限 E352教室 グラフ (1).
非線形方程式の近似解 (2分法,はさみうち法,Newton-Raphson法)
第11回 整列 ~ シェルソート,クイックソート ~
二分探索木によるサーチ.
7-3.高度な木 (平衡木) AVL木 平衡2分木。回転操作に基づくバランス回復機構により平衡を保つ。 B木
サポートベクターマシン によるパターン認識
MPIを用いた並列処理 ~GAによるTSPの解法~
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
決定木とランダムフォレスト 和田 俊和.
定兼邦彦 今井浩 東京大学理学系研究科 情報科学専攻
巡回セールスマン問題への招待 東京商船大学 久保 幹雄.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
独立成分分析 5 アルゴリズムの安定性と効率 2007/10/24   名雪 勲.
第7章 疎な解を持つカーネルマシン 修士2年 山川佳洋.
第3回 アルゴリズムと計算量 2019/2/24.
Introduction to Soft Computing (第11回目)
早わかりアントコロニー最適化 (Ant Colony Optimization)
25. Randomized Algorithms
計算量理論輪講 chap5-3 M1 高井唯史.
First Course in Combinatorial Optimization
アルゴリズムとプログラミング (Algorithms and Programming)
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
ファジィ制約充足問題への 連続領域の導入 Introducing continuous domains to
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
算法数理工学 第10回 定兼 邦彦.
プログラミング 4 整列アルゴリズム.
不確実データベースからの 負の相関ルールの抽出
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
適応的近傍を持つ シミュレーテッドアニーリングの性能
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
データ構造とアルゴリズム (第5回) 静岡大学工学部 安藤和敏
Max Cut and the Smallest Eigenvalue 論文紹介
人工知能特論II 第8回 二宮 崇.
情報工学概論 (アルゴリズムとデータ構造)
2009/11/27 グラフ (1) 第9講: 平成21年11月27日 (金) 4限 E252教室 コンピュータアルゴリズム.
分枝カット法に基づいた線形符号の復号法に関する一考察
2008年6月5日 非線形方程式の近似解 2分法,はさみうち法,Newton-Raphson法)
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
13.近似アルゴリズム.
Q q 情報セキュリティ 第7回:2005年5月27日(金) q q.
グラフの帯域幅連続多重彩色 を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室 西川和秀.
Presentation transcript:

算法数理工学 第12回 定兼 邦彦

動的計画法 (Dynamic Programming) 分割統治法と同様,部分問題の解を統合する ことによって問題を解く. 分割統治法では問題を独立な部分問題に分割し, 部分問題を再帰的に解き,それらの解を組み合わせて元の問題の解を得る. 動的計画法では部分問題が独立でないときに用い, 計算量を削減する.

動的計画アルゴリズムの開発 最適解の構造を特徴付ける 最適解の値を再帰的に定義する ボトムアップ方式で最適解の値を計算する 計算された情報からある最適解を構成する

循環セールスマン問題 (Traveling Salesman Problem, TSP) n 個の節点を持つネットワーク G = (V,E) において, 各枝 (i,j)  E の長さ aij が与えられたとき,全ての節点をちょうど1度ずつ訪問して元に戻る巡回路の中で最短のものを見つける問題 枝 (i,j) と枝 (j,i) の長さは常に等しいとする (対称な巡回セールスマン問題)

循環セールスマン問題は n 個の節点 1, 2,..., n の最適な並び替え (順列) を求める問題 順列の数は n! 全ての順列を列挙すれば解は求まるが,遅い 動的計画法により,効率的に解く ただし多項式時間ではない (TSPはNP完全) 4 2 3 1 8 5 7

f({2,3,4},3) は節点1を出発して, 節点2,4を適当な順番で経由し, 節点3に到達する路のうち 最短のものの長さ 節点1を出発点とする 節点の集合 S  {2,3,...,n} と, S に含まれる節点 i に対して,節点1を出発して,S に属する全ての節点をちょうど1度ずつ通ったあと,節点 i に到達する路の中で最短のものの長さを f(S,i) と書くとする S = {2,3,4} とする. f({2,3,4},3) は節点1を出発して, 節点2,4を適当な順番で経由し, 節点3に到達する路のうち 最短のものの長さ 4 2 3 1 8 5 7

節点1を出発し,節点集合 {2,3,4} の全ての節点を通って節点1に戻る最短巡回路の長さ f* は 同様に サイズの小さい部分集合から順に計算しておけばいい p(S,i) は節点 i の直前に訪問する節点を表す

[反復1] [反復2]

[反復3] [反復4] 最短巡回路は 1  3  2  4  1 長さは 21

ナップザック問題 目的関数 (最大化) 制約条件 0  k  n を満たす整数 k と,0  d  b を満たす 整数 d に対して定義される部分問題 目的関数 の目的関数の最大値を f(k,d) と表す

元の問題は f(n,b) を求めることに対応する 次の式に基づく動的計画法で解ける 1,...,k の品物で重さが d 以下の組合せで価値が 最大のものの価値は, 1,...,k1 の品物で重さが d 以下の組合せで価値が 最大のものの価値,または 1,...,k1 の品物で重さが dak 以下の組合せで価値が 最大のものに品物 k を追加したときの価値  のいずれかのうち価値の大きい方 計算量:O(nb)  注:b に比例するので多項式時間ではない

目的関数: 制約条件: k 1 2 3 4 0,  1,{3} 2,{4} 7,{1} 5 8,{2} 6 9,{2,3} d

データマイニング 大量のデータの中から有益な情報を抽出 有益な情報とは POSデータ,アクセスログ 統計情報 (平均,分散) 要素間の相関関係 (A⇒B) 外れ値 (異常検出)

応用 市場分析 リスク回避 テキストマイニング Webマイニング 販売促進 優良顧客 企業の倒産予測 トピック抽出 グループ分け,アクセス解析

相関ルール トランザクションに含まれた属性間の相関関係 ( x → y ) : x ならば y である. 関係データベース  トランザクションに含まれた属性間の相関関係  ( x → y ) : x ならば y である. 関係データベース (x:条件属性、 y:目的属性) 年齢 性別 血液型 身長 体重 血糖値 精密検査 52 男 A 172 78 140 yes 28 女 AB 158 45 120 no B 65 135 カテゴリ属性結合ルール ( pizza = yes ) → ( cola = yes ) ( pizza = yes ) ∧ ( young girl = yes ) → ( diet cola = yes) 数値属性結合ルール ( 血糖値 ∈ [140, 160 ]) → ( 精密検査 = yes) ( (血糖値, 体重) ∈ R )  → (精密検査 = yes )

抽出したいルールの基準(support,confidence) 体重 血糖値 精密検査 78 140 yes 45 120 no 61 165 82 152 71 125 65 135 条件属性:体重,血糖値 目的属性:精密検査 support:条件属性を満たすデータの数 hit   :条件属性と目的属性を同時に       満たすデータの数 confidence: hit / support 抽出されたルールをsupport (支持度) と confidence (確信度) で表す

カテゴリ属性間の相関ルール 相関ルール 支持度,確信度の高いルールを求める A & B & D ⇒ F A, B, C,...: アイテム 例: パン & バター ⇒ 牛乳 支持度,確信度の高いルールを求める 両者がある閾値以上のルール全てを列挙

数値属性結合ルールの発見 確信度がminconf以上で,支持度が最大となる領域を求める 領域は矩形和楕円型領域とする

データの離散化と可視化 各ピクセルの濃さはconfidenceを表す confidenceが大きいピクセルほど黒くなる 血糖値 (mg/dl) 体重 体重 血糖値 精密検査 78 140 yes 45 120 no 65 135 82 85 88 91 血糖値 160 23 62 34 45 12 51 92 98 32 36 47 42 79 61 84 56 81 87 90 31 58 52 78 37 74 85 150 152 150 154 体重:3 kg 刻み 血糖値:2 mg/dl 刻み 140 156 hit 130 (88≦体重<91) ∧ (156≦血糖値<158)  ∧ (精密検査=yes) 61 70 79 88 97 106 support 体重(kg) (88≦体重<91) ∧ (156≦血糖値<158) 各ピクセルの濃さはconfidenceを表す confidenceが大きいピクセルほど黒くなる confidence: hit / support

矩形和楕円型領域 p 2次元ピクセル平面 の1点 p に対して,p を含む 長方形の和集合としてとられる領域を矩形和楕円型領域と呼ぶ. Lemma 与えられた点 p を中心とする短形和楕円型領域で 与えられた確信度 t に対して支持度を最大にする領域は O(n)で計算できる

最大ゲイン矩形和楕円型領域を求めるアルゴリズム 分割 ダイナミックプログラミングにより O(n) 時間で計算できる

支持度(i,j) 確信度ρ(i,j) (t=4) 8 8 7 5 3 1 1 1 1 1 8 7 7 4 3 1 1 1 1 1 5 6 (minconf) 5 6 3 1 1 1 1 1 1 7 6 6 4 2 1 1 1 1 1 5 3 2 2 1 1 1 1 1 確信度ρ(i,j) 支持度(i,j) - 8 4 2 1 5 6 3 9 10 7 11 12 (t=4)

α(i,j) : i行以上の部分で点( i, j )を含む矩形和楕円形領域の 中の最大支持度 4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11

を求める 4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11 16 19 22 20

を求める 12 11 16 19 22 20 12 11 22 20

を求める 4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11 22 20 25 26 28 27

を求める 12 11 22 20 25 26 28 27 12 11 22 20 28 27

を求める 4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11 22 20 28 27 30 32 29

を求める 12 11 22 20 28 27 30 32 29 12 11 22 20 28 27 32 29

を求める 4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11 22 20 28 27 32 29 33 30 25

を求める 12 11 22 20 28 27 32 29 33 30 25 12 11 22 20 28 27 32 29 33 30 25

4 8 11 12 7 10 9 3 6 5 2 -2 1 -4 -8 12 11 22 20 28 27 32 29 33 30 25

ダイナミックプログラミングによりすべでのα( i , j )をO(n)時間で計算 最適領域のゲインは 領域はダイナミックプログラミングのバックトラッキングにより計算

近似解法 NP完全,NP困難な問題を多項式時間で解くことは今のところできていない そこで,厳密な最適解を求めることはあきらめ, 近似解を求めることを考える 解の精度に保証がない場合をヒューリスティック (heuristic) 解法または発見的解法という TSPに対する1つの発見的解法:最近近傍法 ある節点から出発して,まだ訪問していない隣接節点の中で現在の節点に最も近い節点へ次々と移動する 欲張り法 最適解と比べてかなり悪くなる場合もある

最近挿入法 これまでに得られている部分巡回路 (いくつかの 節点のみを経由する巡回路) R に1つの節点 i を 付け加え,新しい巡回路 R  {i} を構成する 部分巡回路 R  {1,2,...,n} と節点 i  R に対し, R と i の距離を と定義する (0) 節点 i0 を任意に選び,R = {i0} とする (1) 巡回路 R との距離 d(R,i) が最小となる  節点 i  R を選ぶ (2) i に最も近い点 j  R に対し,巡回路で j の次に i を入れる (3) 巡回路に含まれていない点があれば (1) に戻る

i i j j k k R  {i} R 各枝の長さが三角不等式 aij + ajk  aik を満たすとき, 最近挿入法で得られる巡回路の長さは最適解の2倍 以下であることが保障される

局所探索法とメタヒューリスティックス 発見的解法で得られた近似解に対して,さらに 部分的な修正を繰り返し加えることにより,より 良い近似解が得られる場合が多い そのための基本的な戦略を一般にメタヒューリスティックスと呼ぶ 局所探索法:様々なメタヒューリスティックスの基礎 任意の実行可能解 x に対して,その一部分を修正して得られる解の集合を N(x) で表し,x の近傍と呼ぶ 最小化する目的関数を f とする

局所探索法の一般的な計算手順 (0) 初期解 x を選ぶ (1) 現在の解 x の近傍 N(x) から f(y) < f(x) を満たす解 y を選ぶ.そのような解 y が N(x) 内に存在しなければ計算終了 (2) x を y で置き換えてステップ(1)へ戻る 局所探索法が終了した時点で得られている解 x は, その近傍 N(x) 内で目的関数が最小である.つまり 局所的最適解になっている. 初期解 局所的最適解

局所探索法を用いて実際に問題を解くには,近傍の定義と近傍の探索法が重要 一般に,大きい近傍を用いれば現在の解よりも 良い解が見つかる可能性が大きいが,遅くなる 近傍の探索法 即時移動:近傍内の解を1つずつ順番に調べていき,x より良い解 y が見つかれば直ちに x を y で置き換える 最良移動:近傍内の全ての解を調べて最良の解 y を 見つけ,それを x と置き換える 即時移動の方が早いが,最良移動の方が良い解が出る場合が多い (常に良いとは限らない) 探索時間と解精度のトレードオフ

TSPでの局所探索法 2-opt近傍: 隣り合わない2本の枝を巡回路 x から 取り去り,別の2本の枝を付け加えて得られる 巡回路全体を N(x) と定義する. 節点数が n のとき,N(x) に含まれる解の数は n(n3)/2 = O(n2) ユークリッド平面の場合,交差している2つの枝をつけかえると解は必ず良くなる

3-opt近傍: 隣り合わない3本の枝を巡回路 x から 取り去り,別の3本の枝を付け加えて得られる 巡回路全体の集合 1つの解 x に対して3本の枝を選ぶ組合せの数は O(n3) 3本の枝の付け替え方は4通り

3-opt近傍の方が2-opt近傍よりも近傍が大きいため,得られる局所的最適解の質は良くなるが, 局所探索の速度は遅くなる. k-opt近傍 (k  4) も定義できるが,近傍のサイズが O(nk) になり計算が遅いので用いられない.

メタヒューリスティックス 発見的解法によって得られた近似解を改良する ための枠組み 局所的最適解から抜け出すことができる 焼きなまし法 (simulated annealing) タブー探索法 (tabu search) 遺伝的アルゴリズム (genetic algorithm) ニューラルネットワーク (neural networks)

焼きなまし法 現在の解の近傍からランダムに解を選ぶ それが改良になっていれば新しい解とする 改悪になる場合でも,目的関数値の差の大きさに応じてある確率で新しい解として採用する

f(x) を最小化する場合 (0) 凍結温度 Tfreeze > 0 を定める. 初期温度 T > Tfreeze と初期解 x を選ぶ. (1) 現在の解の近傍 N(x) からランダムに解 y を選び,  := f(y) – f(x) とおく. (2)  < 0 ならば x を y で置き換える. (3)   0 ならば,区間 [0,1] から実数  をランダムに選び,  < e/T ならば x を y で置き換える. (4) T  Tfreeze ならば終了. そうでなければ,温度 T を更新して (1) へ戻る.

ステップ(3)では,近傍 N(x) から選ばれた解 y が 改悪となる場合でも,確率 e/T で解を入れ替える  > 0 のとき なので,目的関数の改悪量  が同じでも,温度が高いときの方が改悪となる解を採用する確率が 大きい 計算の最初の段階では温度を高く設定して局所最適解に捕捉されることを避ける 温度を次第に低下していき,改悪が起こる確率を下げ,安定した探索が行えるようにする

よく用いられる方法:2つのパラメタを用いる 0 <  < 1: 温度の減少率 1 <  < 2: 反復回数 ある温度 T で r 回の探索を行った後, 温度を T に下げる 新しい温度での反復回数を r にする 時間はかかるが良い解を得ることが期待できる

タブー探索法 局所探索法では,現在の解 x の近傍 N(x) 内で f(y) < f(x) を満たす解 y へ移動する さらに連続して探索を行えるようにするため,N(x) において x を除いた中での最良の解 y を見つけ, f(y)  f(x) であっても y に移動する しかし,y に移動したあとで局所探索を続けると また x に戻ってしまう 同じ解の再探索を避けるようにしたい

タブー探索法では,過去の反復で現れた解や移動のパタン (2-optで入れ替えた枝など) をタブーリストと呼ばれる集合として記憶しておく 新しい解に移動するときは,タブーリストに含まれない解の中で最良のものに移動する タブーリストが長くなるとメモリを多く消費し,探索も遅くなるので,リストの長さは上限を決めておく リストの古い情報は捨てる

タブー探索法 (0) 初期解 x を選ぶ.タブーリストの最大長 l を定め, 初期タブーリストを L :=  とする 現在の解 x の近傍 N(x) において,x 自身と タブーリスト L に含まれる解を除く最良の解 y を 見つけ,x を y で置き換える タブーリスト L に新しい解 x を追加する.もし L の大きさが l を越えれば,最も古い要素を L から 取り除く 停止条件が満たされれば計算終了. そうでなければステップ(1)へ戻る.

メタヒューリスティックスは,複雑な組合せ最適化問題に対する実際的なアルゴリズムを構築する ための柔軟な枠組み 計算を効率的に行うにはアルゴリズムに含まれるパラメタや近傍を適切に設定する必要がある 計算実験などによって得られる知識を利用することが重要