M1 Kenji KANEDA (SIG-PDS)

M1 Kenji KANEDA (SIG-PDS)
Heuristics for Scheduling Parameter Sweep Application in Grid environments M1 Kenji KANEDA (SIG-PDS) 2019年4月12日全体ミーティング発表

Outline of Presentation
Background & Overview of AppLeS (Task, Network) Model Scheduling Simulation Experiments Related Work Summary 2019年4月12日全体ミーティング発表

Background (自分の研究) 複数のクラスタ、スーパーコンピュータが高速ネットワークによって結合多数の計算資源を利用する機会の増大
しかし、FirewallやPrivate Networkなどの管理者が利用に制限を課している場合が多い管理者の課す制限を自動的に迂回して、遠隔計算機の効率的かつ簡便な利用を目指す 2019年4月12日全体ミーティング発表

Background 多数の異種環境上の計算機に分散計算を行いたい Software DSM MPI
parameter sweep application embarrassing parallel 多数の独立したタスクを多数の計算機にばら撒く有名なツール実際に使用されている？ UCSD IPDPS SC 2019年4月12日全体ミーティング発表

AppLeS (Application Level Scheduling)
parameter sweep applicationのスケジューリング対象多大なparameter spaces 各々タスクは独立いくつかのファイルを共有するのみ資源は動的に利用率が変化 2019年4月12日全体ミーティング発表

AppLeSの想定するシナリオ計算 Server Information Service output check input input
User 2019年4月12日全体ミーティング発表

Background & Overview of AppLeS (Task, Network) Model Scheduling Simulation Experiments Related Work Summary & Future Work 2019年4月12日全体ミーティング発表

Network Model (1/2) network topology クラスタ k個のクラスタと利用者のいるホストで構成
いくつかのホストと一つのストレージで構成ストレージはクラスタ内で共有クラスタと利用者のいるホストとを直接結ぶリンクは一つクラスタ内のホスト間の通信は無視できる(比較的高速と仮定) 2019年4月12日全体ミーティング発表

Network Model (2/2) 2019年4月12日全体ミーティング発表

Task Model 各々独立なn個のタスク想定するアプリケーションいくつかの入力ファイル一つの出力ファイル
そのうちいくつかは複数のタスクで共有一旦ストレージに蓄えられた入力ファイルは、全計算中常に蓄えられ続ける一つの出力ファイル一度ホストに割り当てられたタスクの移動は考えない想定するアプリケーション MCell (micro-physiology application) 3-D Monte-Calro simulationを使用入力ファイルは数百MBytes e.g. ) MCell, a micro-physiology application that uses 3-D Monte-Carlo simulation techniques to study molecular bi-chemical interaction within living cells hundres of MBytes of input 2019年4月12日全体ミーティング発表

Scheduling 目的概要 makespanが最も短くなるようなタスクの割り当て adaptiveなスケジューリング
動的な資源の変化に対応する概要定期的にschedule()という関数を呼ぶ 2019年4月12日全体ミーティング発表

Gantt Chartというネットワークリンクとホストの状態を表す図を利用
schedule() 次にschedule()を呼ぶタイミングを計算現在実行中の計算、ファイル転送の終了時間を予測未実行のタスク中からサブセットTを選択 T中のタスクをHeuristicに割り当てる入力 Network Topology いままでに送信したinputファイルの位置現在実行中のタスクやファイルのリスト Gantt Chartというネットワークリンクとホストの状態を表す図を利用 2019年4月12日全体ミーティング発表

次にschedule()を呼ぶタイミング
頻繁なスケジューリングの計算を避けるため資源の変化、予測の変化に適応するため実行間隔の決定方法定期的偏向を考慮予測実行時間と実際の実行時間の差を考慮し、ずれが多いときほど、頻繁に計算 2019年4月12日全体ミーティング発表

実行終了時間の予測 (1/2) 概要現在実行中のタスクの終了時間の予測 Gantt Chartにその状態を書き込む
Networks Links Link 1 Link 2 Cluster 1 Cluster 2 Host 1.1 Host 1.2 Host 2.1 Host 2.2 Host 2.3 送受信中のファイル実行中のタスク 2019年4月12日全体ミーティング発表

実行終了時間の予測 (2/2) 終了時間の予測方法 NWSなどのシステムから得られる情報をもとにHeuristicに予測
例）実行中のジョブの終了時間の予測各々のジョブの計算時間は等しいと仮定過去に実行した際にかかった実行時間とその時のCPU load 実行中のジョブのいままでの実行時間とそのCPU load 現在何%実行が終了したかを予測 2019年4月12日全体ミーティング発表

未実行タスクのサブセットの選択 schedule()の計算時間の削減のため選択方法
複数回呼び出すため一度に全てのタスクを割り当てる必要はない選択方法 random maximizing data re-use 巨大な入力ファイルを共有するタスクの数が最大となる集合 2019年4月12日全体ミーティング発表

未実行のタスクの割り当て未実行のタスクをHeuristicにホストに割り当てる Gantt Chartを重複しないように埋めていく
Networks Links Cluster 1 Cluster 2 Host 1.1 Host 1.2 Host 2.1 Host 2.2 Host 2.3 Link 1 Link 1 Link 2 input ここでの予測も先ほどと同じように行っている output 2019年4月12日全体ミーティング発表

Heuristics Algorithm (1/5) 用語、定義
Hjk=j thクラスタ中のk thホスト C（Ti,Hjk）=タスクTiのホストHjkでの実行時間関数f(x)が最小となるときのxの値 argmaxも同様 2019年4月12日全体ミーティング発表

Heuristics Algorithm (2/5) Min-min
Tiを最短時間で計算するホストHjkの選択 Hj,k jthクラスタ中のkthホスト C（Ti,Hjk）タスクTiのホストHj,kでの終了時間 argmin(C(Ti, Hjk)) は min argmaxも同様 T中で最短時間で終了するタスクTsの選択 2019年4月12日全体ミーティング発表

Heuristics Algorithm (3/5) Max-min
Tiを最短時間で計算するホストHjkの選択 T中で計算に最も時間のかかるタスクTsの選択 2019年4月12日全体ミーティング発表

Heuristics Algorithm (4/5) Sufferage
最適でないホストに割り当てたときの影響のでかいタスク 2019年4月12日全体ミーティング発表

Heuristics Algorithm (5/5) XSufferage
ほとんどどのホストで計算するか、しないかという選択は、そのクラスタ内のストレージに共有する入力ファイルがあるかないかということが問題となる異なるクラスタに属する2つホストでの計算時間の差がもっとも大きなタスクTiの選択 2019年4月12日全体ミーティング発表同一クラスタ内でのホスト間の性能差は小さいと考えたため

Simulation Environments
task 1600 tasks (各々は均一) input = unshared 10K file + shared file output = 10K file network topology 5 clusters = (6, 6, 8, 20, 20) network bandwidth = 6 ~ 600Kbytes/sec interval of scheduling event = 500sec 2019年4月12日全体ミーティング発表

Simulation Result (1/2) 2019年4月12日全体ミーティング発表
Workqueue = なにもHeuristicsを使わずにタスクを割り当てる。Performance estimationなども行わない 2019年4月12日全体ミーティング発表

QoI = performance estimation accuracy
Simulation Result (2/2) shared file 40Mbytes QoI = performance estimation accuracy 2019年4月12日全体ミーティング発表

Related Work : Condor(1/2)
概要 @University of Wisconsin-Madison High Throughput Computingを目指す分散計算ツール特徴 ClassAd ジョブの要件と計算機のステータスを利用者が記述 OS, Memory, etc. それを利用してパターンマッチングを行い、タスクの割り当てを行う 2019年4月12日全体ミーティング発表

Related Work : Condor (2/2)
特徴 Remote System Call remote hostからlocal host上のファイルの参照を可能にする open()などを仲介するプロキシを生成 checkpoint ジョブの停止、再実行、実行ホストの移動が可能 fault tolerant preemption stack, processのアドレス空間などの情報を全て複製する Fork(), kernel thread等を禁止 preemption = 各々のタスクに優先度を利用者がつける。より優先度の高いものが、そのホストで実行されるもし優先度の低いものの実行中に、より高い優先度のものが投入された場合は低い優先度のものを 2019年4月12日全体ミーティング発表

Related Work : Nimrod 概要特徴 @Monash University
Parameter sweep application用のツール特徴 Deadline scheduling 多数のタスクからなるアプリケーション全体の実行時間が利用者の求めるデッドラインを超えないようする GUI interface の提供 Grid Economy Model 利用者がレンタル料と計算終了時間の間でトレードオフのできる環境を提供性能や計算資源の需要の高さから計算資源に優先度をつけ、はじめは優先度の低い資源にタスクを割り当てて、各タスクの実行時間と計算資源との関係から計算資源に対する評価を改めて、多数のタスクからなるアプリケーション全体の実行時間がユーザの求めるデッドラインを超えないように次のタスクを割り当てていく 2019年4月12日全体ミーティング発表

Related Work : Bricks 概要特徴 @Tokyo titech University
スケジューリング及びそのフレームワークの評価基盤特徴 Deadline Scheduleに関する評価、研究 Load Correctionアルゴリズム Fallbackアルゴリズム 2019年4月12日全体ミーティング発表

Related Work : Scheduling on Heterogeneous Environments
対象とするネットワーク regular graph irregular graph 対象とする計算 (タスク) タスクが各々独立タスク間で通信が存在パイプライン、DAG Task migration スケジューリングの目的 Throughput round trip time 異種環境上でスケジューリングを行おうという研究は多数ある実際に実装するかどうかは別にしてパイプライン Data Intensive 2019年4月12日全体ミーティング発表

Summary AppLeS parameter sweep application用のスケジューリング
いくつかのHeuristics Algorithmを提案シミュレーションで各々を比較 XSufferageがもっとも良い性能をしめした特に多大なファイルを共有する際に良い性能 QoIが悪い時にも良い性能 Related Work take into account data storage issues no assumption constant perfectly predictable performance characteristics シミュレーションで使ったモデルがそうだという気もする 2019年4月12日全体ミーティング発表

References Heuristics for Scheduling Parameter Sweep applications in Grid environments Henri Casanova, Arnaud Legrand, Dmitrii Zagorodnov and Francine Berman (HCW'2000) Using Simulation to Evaluate Scheduling Heuristics for a Class of Applications in Grid Environments Francine Berman, Henri Casanova, Dmitrii Zagorodnov and Arnaud legrand Research Report 2019年4月12日全体ミーティング発表

M1 Kenji KANEDA (SIG-PDS)

Similar presentations

Presentation on theme: "M1 Kenji KANEDA (SIG-PDS)"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

M1 Kenji KANEDA (SIG-PDS)

Similar presentations

Presentation on theme: "M1 Kenji KANEDA (SIG-PDS)"— Presentation transcript:

Similar presentations

About project

フィードバック