列挙問題列挙問題の定義アルゴリズムの速度バックトラッキング分割法逆探索.

Slides:

Advertisements

Similar presentations

組合せ最適化輪講 2.3 連結性川原純. 2.3 連結性内容 – グラフ上の節点をすべてたどるアルゴリズム計算機上でのグラフの表現 – 強連結成分を求めるアルゴリズムトポロジカル順序を求める方法も – k- 連結、 k- 辺連結について – 2- 連結グラフの耳分解について.

Advertisements

平面三角分割グラフを列挙するアルゴリズムの改良中野眞一（群馬大学）宇野毅明（情報学研究所） 2002 年 6 月 24 日コンピューテーション研究会.

A Simple Constant Time Enumeration Algorithm for Free Trees 中野眞一宇野毅明群馬大学情報学研究所 2003 年 9 月 19 日アルゴリズム研究会.

到着時刻と燃料消費量を同時に最適化する船速・航路計画

極小集合被覆を列挙する実用的高速アルゴリズム

データ構造とアルゴリズム第十二回知能情報学部知能情報学科新田直也.

動的計画法表の作成制約の追加練習問題.

動的計画法表の作成制約の追加練習問題.

ラベル付き区間グラフを列挙するBDDとその応用

近似アルゴリズム第１０章終了時刻最小化スケジューリング

データ構造とアルゴリズム論第６章探索のアルゴリズム

　　　　有限幾何学　　　　　　第8回.

On the Enumeration of Colored Trees

頻出集合列挙アルゴリズムに対する実用的高速化技術について

An Algorithm for Enumerating Maximal Matchings of a Graph

Permutationグラフと Distance-Hereditaryグラフの再構築アルゴリズム

2009/10/9 良いアルゴリズムとは第2講: 平成21年10月9日 (金) 4限 E252教室コンピュータアルゴリズム.

Approximation of k-Set Cover by Semi-Local Optimization

データ構造とアルゴリズム第二回知能情報学部新田直也.

宇野毅明（国立情報学研究所＆総合研究大学院大学）

岩井儀雄コンピュータ基礎演習　ー探索、整列ー岩井　儀雄

宇野毅明国立情報学研究所 2002年3月東北大大学院情報科学研究科ワークショップ

疑似頻出アイテム集合の多項式遅延列挙アルゴリズム

第11講: 平成18年12月 8日 (金) 4限 E352教室グラフ (1).

データ構造とアルゴリズム論第２章配列（構造）を使った処理

クリークマイニングとその応用～大規模データの活用～

データ構造とアルゴリズム論第７章探索のアルゴリズム

大規模データに対する効率的な列挙アルゴリズム

二分探索木によるサーチ.

第25章単一始点最短路 3節 Bellman-Fordのアルゴリズム

ネットワーク理論 Text. Part 3 pp 最短路問題 pp 最大流問題 pp.85-94

定兼邦彦今井浩東京大学理学系研究科情報科学専攻

近年の列挙技術の進展ー計画立案と解法ー宇野毅明（情報学研究所）有村博紀（北海道大学）中野眞一（群馬大学）

離散数学 08. グラフの探索五島.

7.4 Two General Settings D3 杉原堅也.

情報とコンピュータ静岡大学工学部安藤和敏

25. Randomized Algorithms

第5回放送授業.

A Simple Algorithm for Generating Unordered Rooted Trees

Cプログラミング演習第１０回　二分探索木.

アルゴリズムとプログラミング (Algorithms and Programming)

先進的計算基盤システムシンポジウム SACSIS2007併設企画マルチコアプログラミングコンテスト「Cellスピードチャレンジ2007」

連続領域におけるファジィ制約充足問題の反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.

数独の解生成と解に対する番号付け理学部　情報科学科　渡辺研究室戸神星也.

プログラミング 4 整列アルゴリズム.

2009/10/23 整列アルゴリズム (1) 第4講: 平成21年10月23日 (金) 4限 E252教室コンピュータアルゴリズム.

頻出・飽和・極大頻出集合の効率的な列挙アルゴリズムとその実装

プログラミング 4 探索と計算量.

第５章　計算とプログラム本章で説明すること・計算の概観と記述法・代表的な計算モデル・プログラムとプログラム言語.

ナップサック問題クマさん人形をめぐる熱いドラマの結末.

情報知能学科「アルゴリズムとデータ構造」

アルゴリズムとプログラミング (Algorithms and Programming)

列挙問題列挙問題の定義アルゴリズムの速度バックトラッキング分割法逆探索.

宇野毅明（国立情報学研究所＆総合研究大学院大学）

データ構造とアルゴリズム (第5回) 静岡大学工学部安藤和敏

短い部分文字列のミスマッチトレランスを高速計算するアルゴリズム

大規模ネットワークに対する実用的クラスタ発見アルゴリズムの開発

データ構造とアルゴリズム論第６章探索のアルゴリズム

大規模データ処理に対する列挙アルゴリズムの活用

擬似クリークを列挙する多項式時間遅延アルゴリズム

2009/11/27 グラフ (1) 第9講: 平成21年11月27日 (金) 4限 E252教室コンピュータアルゴリズム.

ソートのプログラムの流れ配列の中身を小さい順に並び替える a[1],a[2],…a[n]の値を順に出力する

分枝カット法に基づいた線形符号の復号法に関する一考察

コストのついたグラフの探索分枝限定法 A*アルゴリズム.

Cプログラミング演習ニュートン法による方程式の求解.

参考：大きい要素の処理.

グラフの列挙中野　眞一　　　（群馬大学） 2019/9/14 列挙学校.

オブジェクト指向言語論第六回知能情報学部新田直也.

アルゴリズム～すべてのプログラムの基礎～.

プログラミング論バイナリーサーチ 1.

Presentation transcript:

列挙問題列挙問題の定義アルゴリズムの速度バックトラッキング分割法逆探索

列挙問題の定義列挙問題与えられた集合の要素（あるいは問題の解）を全て、ちょうど１度ずつ出力せよ例）　与えられた集合の要素（あるいは問題の解）を全て、ちょうど１度ずつ出力せよ例）　・与えられたグラフの、頂点 s から頂点 t までのパスを列挙せよ　・ナップサック問題の実行可能解を列挙せよ列挙問題を解くアルゴリズム  列挙アルゴリズム

なぜ列挙したいかというと・最適化問題  最適な解をひとつだけ見つける問題（システム）のある種の極みの状態がわかるしかし、・最適化問題　  最適な解をひとつだけ見つける　問題（システム）のある種の極みの状態がわかるしかし、・データの不備、目的関数のあいまいさがあると、最適解が必ずしも良いとは限らない・サンプリング、データ検索などでは、ひとつだけでは困る、見つけそこないがあると困ることがある・それはそれとして、同じものが何回も出てきては困る・解を全部見つけると言うことは、問題全体の構造を捉えること条件を満たす全ての解を列挙したい

・近年、IT技術の発達で、大規模なデータが半自動的に収集できるようになった（POS、web、文書、顧客データ、財務、利用者、人事…）データ中心の科学・近年、IT技術の発達で、大規模なデータが半自動的に収集できるようになった　　（POS、web、文書、顧客データ、財務、利用者、人事…）データがそろっているところでモデルを作って研究しようデータの選別モデル化データ処理いわば、データを出発点とした問題解決の科学（人工知能、データマイニング、自然言語処理、セマンティックweb…）

典型的なOR的なアプローチは、データ収集でつまづくことが多い問題発見定式化解法（最適化）典型的な OR（＋数理計画）的アプローチデータ収集（システム構築）求解運用できたモデルを実際に使うここがボトルネックであることが多いデータ中心のアプローチなら、この問題が解決できる

Enumerations from databases solve many problems and give new knowledge データの不備、目的のあいまいさ・データ中心科学では、処理の目的があいまいなことが多い・データに、不備・不正確・丁寧さ乱雑さなどのゆらぎがある例） web ページの検索　目的は、「見つけたいページを見つける」であるが、見つけたいページとは何であろうか？  答えがあることは明白だが、各解の評価尺度を作るのが困難  データの情報を正確に信じることも難しい小さいデータではできることが、大きなデータではぜんぜんできない例1：データを眺めて、特徴を得ること例2： web検索、最近の話題を知りたい Enumerations from databases solve many problems and give new knowledge Web ページデータベース？見つけたいページ

・候補の提示と絞込みによる解決 ① キーワードを指定 ② キーワードを含むページを列挙 ③ 見つかったページを実際に検証２段階の問題解決・候補の提示と絞込みによる解決　① キーワードを指定　② キーワードを含むページを列挙　③ 見つかったページを実際に検証見つけたいページ Enumerations from databases solve many problems and give new knowledge キーワード検索候補 Enumerations from databases solve many problems and give new knowledge 実際にページを見て検証 Web ページデータベース小さいデータではできることが、大きなデータではぜんぜんできない例1：データを眺めて、特徴を得ること例2： web検索、最近の話題を知りたい・数理的にはっきりとした部分をコンピュータで解く　（候補列挙）・残りはユーザに任せる　（候補の絞込み）

列挙の難しさ：適当に見つけると  実行可能解は、最高 2n 個  最悪で、メモリを O(2n ) 使う・適当に実行可能解を見つける、という作業を繰り返す・見つけそこないがあるか、確認できない・同じ解を出力しないようにするためには、メモリに今まで出力した解を蓄えておく必要がある・変数が n 個ある組合せ最適化問題　  実行可能解は、最高 2n 個　  最悪で、メモリを O(2n ) 使う 1つの解が1バイトしか使わないとして・ n ＝ 30 程度で1GB くらい・ n ＝ 40 程度で1000GB くらい・こんなにたくさんのメモリは用意できない

しらみつぶしに探しましょう・しらみつぶしに組合せを調べればいいんじゃない？・変数が n 個ある組合せ最適化問題・しらみつぶしに組合せを調べればいいんじゃない？・変数が n 個ある組合せ最適化問題　  組合せは 2n 個　  全て調べると、 O(2n ) 時間かかる・ n ＝ 30 程度で1時間くらいかかる・ n ＝ 50 程度で100年くらい・例えば、実行可能解が数千個しかないのに、こんなに時間がかかっていては困る

出力の数で時間を計る・列挙問題は解がたくさんあるので、解が多ければそれだけ時間がかかるのはしょうがない・でも、解が少なければ、早く終わってほしい・問題が与えられれば、その解の数Nは決まるので、N に対して短時間なアルゴリズムがほしいあるアルゴリズムの計算時間が、入力の大きさ n と出力する解の数 N のみに依存する多項式であるとき、出力多項式時間である、という任意の解の次の解を出力するまでの時間が入力の大きさ nの多項式であるとき、多項式時間遅延である、という

列挙アルゴリズムの作成手法・比較的、基礎的な問題であるので、アルゴリズム作成手法も単純・しかし、逆に言うと、バリエーションが少ない　－バックトラック法　　　　　深さ優先的＋辞書順の優先度で隣接関係を探索　－分割法　　　　　分枝限定法のように、問題を再帰的に分割する　－逆探索　　　　　親子関係という隣接性から得られる探索路を進む

バックトラック法・あるいはバックトラッキングと呼ばれる・主に、単調な集合族の要素の列挙、あるいはその極大要素の列挙に使われる・単調な集合族 F：　X∈F 　  任意の X'⊆X に対して X'∈F 　　　　　（ X∈F 　 Xの任意の部分集合は F に含まれる）・単調な集合族の例）　－グラフのクリーク　－ナップサック問題の実行可能解　－マッチングの集合　－ある頂点を始点とするパスの集合 111…1 000…0

バックトラック法 (2) ・空集合から出発し、各反復で要素を１つずつ付け加えていき、再帰的に解を作る・ただし、加える要素は、　集合中の最大添え字より　大きいもののみ・付け加えたものが解にならないなら、引き返す（バックトラック）・すべての要素を付け　加え終えたら、反復終了 φ 1,3 1,2 1,2,3 1,2,4 1,3,4 2,3,4 1 2 3 4 3,4 2,4 1,4 2,3 1,2,3,4

バックトラック法 (3) ・空集合から出発し、各反復で集合中の最大添え字より大きい添え字の要素を加える Backtrack (S) 　大きい添え字の要素を加える Backtrack　(S) 1 Output S 2 For each e > S の末尾　　　（S の最大添え字の要素） If S ∪{e}が解 then call Backtrack (S ∪{e}) 1,2,3,4 1,2,3 1,2,4 1,3,4 2,3,4 1,2 1,3 1,4 2,3 2,4 3,4 1 2 3 4 φ ・仕組みが単純、多項式空間・多項式時間遅延　（出力多項式時間）

バックトラックでナップサック問題の解列挙問題： a1,…,an の組合せで、合計が b 以下のものを全て見つけよ Backtrack　(S) 1 Output S 2 For each i > S の末尾（S の最大添え字の要素） If ∑S ＋ ai ≦b then call Backtrack (S ∪{ai}) 計算時間：　1反復 O(n) 　  　解1つあたり　 O(n) a1,…,an をあらかじめ大きい順にソートしておくと、　1反復 O(子どもの数) 　  　解1つあたり　 O(1)

ナップサック解列挙のコード・ a[0],…,a[n] の組合せで、合計が b 以下になるものを表示 int a[n], flag[n]; sub (int i, int s){ int j; for (j=0 ; j<n ; j++ ) if (flag[j] = = 1) printf (“%d\n”, a[j]); // 数の表示 for (j=i+1 ; j<n ; j++ ){ if ( s+a[j] <= b ){ // 解のチェック flag[j] = 1; sub(i, s+a[j]); }

極大解に注目・単調な集合族は、台集合or要素の平均の大きさが大きくなると、爆発的に要素数が大きくなる・解数が大きいと、求解後の処理も大変  極大解のみを列挙することで冗長性をなくす　X∈F が F の極大解  任意の X⊆X’ に対して X’∈Fでない・極大解は、一般に隣接していないので、探索が難しい 111…1 000…0

ナップサック問題の極大解列挙問題： a1,…,an の組合せで合計が b 以下のものの中で、極大なものを全て見つけよ Backtrack　(S) 1 Output S 2 For each i > S の末尾（S の最大添え字の要素） and ∑S ＋ ai ＋…+ an > b – ai-1 If ∑S ＋ ai ≦b then call Backtrack (S ∪{ai}) 計算時間：　1反復 O(子どもの数) 　  　解1つあたり　 O(n)

分枝限定法的バックトラック・任意の組合せ最適化問題の実行可能解を全探索的に探索各反復で・現在解が実行可能なら出力各反復で　・現在解が実行可能なら出力　　　　　　　・末尾より大きな各要素について、それを加えた解　　　　　　　　が存在する可能性があるなら、再帰呼び出し Backtrack (S) 1 If S が実行可能 Output S 2 For each e > S の末尾　If S に e 以降の要素を加えた解が存在する可能性がある then call Backtrack (S ∪{e}) ・仕組みが単純、多項式空間・出力多項式時間になるとは限らない

分割法 F1 X1 ・実行可能解集合X : F の要素で性質 P を満たすもの・ X の要素が1つだけならば、それを出力して反復終了　　　反復終了・ F を分割して、 X を空でない２つの集合に分割・再帰的に列挙例）　－グラフの頂点 s から頂点 t へのパス　－２部グラフのマッチング F X F2　　　X2

分割法アルゴリズムの例問題：グラフ G=(V,E) の頂点 s から頂点 t へのパスを列挙問題の分割： s に接する辺 e をひとつ選び、　e を含むパスを列挙する問題と、　e を含まないパスを列挙する問題に分割するただし、 e を含むパス、含まないパスが存在すること子問題：　e を含むパスを列挙：　G から、e 以外の e に接する枝を除去　e を含むパスを列挙：　G から e を除去計算時間：　1反復 O(|E|) 　  　パス1つあたり　 O(|E|)

コード・ flag は最初全て 0、path に構築中のパスが入る・ deg[v] は vの次数、edge[v] はv に隣接する頂点の配列 int flag[n], path[n]; enum_path (int s, int t, int i){ int j; if ( s = = t ){ path[0] から path[i] を出力 } else { flag[s] =1; path[i] = s; ・t から flag[]= = 0 である頂点のみを通って到達可能な頂点の flag を2 にする・s に隣接して、flagが0 である頂点のflagを -1-s にする・t から flag[]= = 2 である頂点のみを通って到達可能な頂点の flag を0 にする for ( j=0 ; j<deg[s] ; j++){ if (flag[edge[i][j]] = = 0 ) enum_path( edge[i][j], t, i+1); // t に到達可能な頂点のみに対して再帰呼び出し } ・s に隣接して、flagが-1-s である頂点のflagを 0 にする

分割法の計算時間・実行可能解の集合を X 、その個数を N とする・分割法の各反復は、 X を細かい集合に分けていく　　（1反復で、ある集合が2つに分かれる）　か、解を1つ出力する・反復の個数は、高々 2N-1 ・反復の計算時間は、通常入力の多項式・多項式時間遅延　（出力多項式時間）　・入力多項式空間

逆探索・いくつかの解を除く全ての解に親を定義。ただし、 ★ 任意の解は自分自身の先祖にならないこと・親子関係から木（林）を導出　　　 ★ 任意の解は自分自身の先祖にならないこと・親子関係から木（林）を導出・導出した木を深さ優先探索する反復数は出力数と等しくなる計算時間は、解1つあたり1反復の計算時間

逆探索 (2) ・導出した木を深さ優先探索する  木の全体をメモリに格納する必要はない　　 木の全体をメモリに格納する必要はない・与えられた解の子供を列挙するアルゴリズムがあれば十分・欲を言えば、i 番目の子供を与えると、 i+1 番目の子供を返す関数があればよい（木の深さが指数でも多項式時間遅延）メモリは、子供を見つけるのにかかるメモリ分必要通常、入力の多項式

逆探索アルゴリズムの例問題： n変数m等式の線形計画問題の、実行可能辞書を列挙親の定義：単体法 S と目的関数 c を適当に選び、　各辞書 x に対して、 S によるピボットで移動する辞書を　　x の親とする子供の見つけ方：　辞書 x に対して、ピボットにより移動可能な辞書を、　添え字順で発生。得られた各辞書について、　その親を作り、x の子供であるか、チェックする計算時間：　全て可能なピボット： nm 個 × ピボット n2+m　＝　O(n3m+nm2)

まとめ・列挙問題の定義・アルゴリズムの速度：出力多項式時間・バックトラック：ナップサックの実行可能解・アルゴリズムの速度：　出力多項式時間・バックトラック：　ナップサックの実行可能解・分割法：　　グラフのパス・逆探索：　　線形計画の実行可能辞書