仮想マシンへの CPU 割り当ての変化に応じた最適な並列アプリケーション実行

Slides:

Advertisements

Similar presentations

第2回　プロセス管理ジョブ、プロセスとは？プロセスの状態遷移プロセス制御ブロックスケジューリング.

Advertisements

ファイルキャッシュを考慮したディスク監視のオフロード

セキュリティ機構のオフロードを考慮した仮想マシンへの動的メモリ割当

クラウドにおけるネストした仮想化を用いた安全な帯域外リモート管理

Xenを用いたクラウドコンピューティングにおける情報漏洩の防止

IaaS 仮想マシン(VM)をネットワーク経由で提供負荷に応じてVM数や性能を変更できるハードウェアの導入・管理・維持コストの削減

全体ミーティング (4/25) 村田雅之.

中村孝介（九州工業大学）光来健一（九州工業大学/JST CREST）

KVMにおけるIDSオフロードのための仮想マシン監視機構

仮想マシンの並列処理性能に対するCPU割り当ての影響の評価

クラウドにおけるライブラリOSを用いたインスタンス構成の動的最適化

ファイルシステムキャッシュを考慮した仮想マシン監視機構

クラウドにおけるアプリケーション単位での VM構成の動的最適化

帯域外リモート管理を継続可能なマイグレーション手法

大きな仮想マシンの複数ホストへのマイグレーション

Ibaraki Univ. Dept of Electrical & Electronic Eng.

ネストした仮想化を用いた VMの安全な帯域外リモート管理

VMマイグレーションを可能にするIDSオフロード機構

IaaS型クラウドにおけるキーボード入力情報漏洩の防止

演算/メモリ性能バランスを考慮したマルチコア向けオンチップメモリ貸与法

アスペクト指向プログラミングを用いたIDSオフロード

サスペンドした仮想マシンのオフラインアップデート

型付きアセンブリ言語を用いた安全なカーネル拡張

過負荷時の分散ソフトウェアの性能劣化を改善するスケジューリングの提案

仮想マシン間にまたがるプロセススケジューリング

XenによるゲストOSの監視に基づくパケットフィルタリング

VMのメモリ暗号化によるクラウド管理者への情報漏洩の防止

VMのメモリ暗号化によるクラウド管理者への情報漏洩の防止

VM専用仮想メモリとの連携による VMマイグレーションの高速化

IaaS型クラウドにおけるインスタンス構成の動的最適化手法

リモートホストの異常を検知するための GPUとの直接通信機構

シャドウデバイスを用いた帯域外リモート管理を継続可能なVMマイグレーション

実行時情報に基づく OSカーネルのコンフィグ最小化

仮想メモリを用いた VMマイグレーションの高速化

複数ホストに分割されたメモリを用いる仮想マシンの監視機構

ネストしたVMを用いた仮想化システムの高速なソフトウェア若化

仮想計算機を用いたサーバ統合における高速なリブートリカバリ

クラウドにおけるIntel SGXを用いた VMの安全な監視機構

通信機構合わせた最適化をおこなう並列化ンパイラ

クラウドにおけるVMリダイレクト攻撃を防ぐためのリモート管理機構

クラウドにおけるVM内コンテナを用いた自動障害復旧システムの開発

未使用メモリに着目した複数ホストにまたがる仮想マシンの高速化

クラウドにおけるVM内コンテナを用いた低コストで迅速な自動障害復旧

Intel SGXを用いた仮想マシンの安全な監視機構

軽量な仮想マシンを用いたIoT機器の安全な監視

複数ホストにまたがって動作する仮想マシンの障害対策

VMMのソフトウェア若化を考慮したクラスタ性能の比較

信頼できないクラウドにおける仮想化システムの監視機構

ウェブアプリケーションサーバの Degradation Schemeの制御に向けて

VMが利用可能なCPU数の変化に対応した並列アプリケーション実行の最適化

Virtualizing a Multiprocessor Machine on a Network of Computers

仮想環境を用いた侵入検知システムの安全な構成法

仮想マシンの監視を継続可能なマイグレーション機構

オペレーティングシステム (プロセススケジューリング)

マイグレーションを支援する分散集合オブジェクト

第４回　メモリ管理主記憶（メインメモリ）の管理固定区画方式と可変区画方式空き領域の管理スワッピング.

仮想マシンと物理マシンを一元管理するための仮想AMT

仮想化システムのソフトウェア若化のための軽量なVMマイグレーション

全体ミーティング (5/23) 村田雅之.

仮想マシンに対する高いサービス可用性を実現するパケットフィルタリング

Cell/B.E. のSPE上で動作する安全なOS監視システム

VMリダイレクト攻撃を防ぐための安全なリモート管理機構

ゼロコピー・マイグレーションを用いた軽量なソフトウェア若化手法

仮想化システムの軽量なソフトウェア若化のためのゼロコピー・マイグレーション

オペレーティングシステム (プロセススケジューリング)

強制パススルー機構を用いた VMの安全な帯域外リモート管理

IPmigrate：複数ホストに分割されたVMのマイグレーション手法

複数ホストにまたがるVMの高速かつ柔軟な部分マイグレーション

複数ホストにまたがるVMのメモリ使用状況に着目した高速化

強制パススルー機構を用いた VMの安全な帯域外リモート管理

Presentation transcript:

仮想マシンへの CPU 割り当ての変化に応じた最適な並列アプリケーション実行九州工業大学情報工学部機械情報工学科光来研究室 12237044 髙山都旬子グラフについてしっかり話す　BTのとことか共有の場合タイムスライス←こっちを省略共有の場合を追加物理cpuと似ているからさらっといける

VM 内で実行される並列アプリケーション仮想マシン（VM）内で並列アプリケーションを動かすことも増えてきた物理CPU（CPUコア）をVMの仮想CPUに割り当てる仮想CPUをアプリケーションのスレッドに割り当てる VM アプリケーションマルチコアCPUの普及で並列アプリケーション増クラウドコンピューティングの利用でVM増 VM内で動く並列アプリケーションは図と連動して説明物理CPU：物理プロセッサのCPUコア仮想CPU：VMが持つ仮想的なCPU スレッド：並列処理に対応したプログラムの最小の実行単位物理CPUと仮想CPUの説明で割り当ての説明スレッドの説明で割り当ての説明スレッドが物理CPUに対応付けされる　で　並列に動く VMが持つ仮想的なCPU 実行単位スレッドごとに別々の処理をする基本的な単語の説明を図の説明前に入れるスレッド vCPU vCPU vCPU vCPU 仮想CPU 物理CPU pCPU pCPU pCPU pCPU

VM マイグレーション動作中のVMが別のサーバに移動されることがあるマイグレーション先のサーバの物理CPUが足りない場合があるサーバのメンテナンス時や負荷分散時マイグレーション先のサーバの物理CPUが足りない場合がある仮想CPUに１対１に割り当てられない移動させることがある　から　説明前スライドからの流れ：サーバ上でVMは動いているができる→×可能○そういうことがある、避けられないこと動作中のVMが別のサーバに移動させることがある VM VM マイグレーション仮想CPU 仮想CPU 物理CPU 物理CPU サーバ1 サーバ2

物理 CPU の不足時の対処 (1/3) VM に割り当てる物理CPU を減らす例：4 個→ 2 個一つの物理CPUが複数の仮想CPUに割り当てられる VMの仮想CPU数は変わらないため物理CPU が減った分だけ性能が低下減らす方法があります説明の時左の図（見てる人から） ----- 会議メモ (16/02/22 15:39) ----- 仮想CPUの場所中？外？本来なら中 VM VM 仮想CPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU 物理CPU pCPU pCPU pCPU pCPU pCPU pCPU

物理 CPU の不足時の対処 (2/3) VM が利用できる物理CPUの使用率を制限する例：400% → 200% 上限を低く設定するほど性能が低下図の例で説明既に半分は他のVMに使われているという状況（マイグレーションの時とは違うCPUの不足の仕方）何個の物理CPUを何％ずつ使うかはスケジューラが決定する残り半分に色をつけて使われていることがわかるように VM VM 仮想CPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU 物理CPU 100% 100% 100% 100% 50% 50% 50% 50%

物理 CPU の不足時の対処 (3/3) 複数の VM 間で物理CPU を共有する例： 1 VM で占有 → 2 VM で共有 vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU pCPU pCPU pCPU pCPU 物理CPU pCPU pCPU pCPU pCPU

予備実験目的並列アプリケーション実験環境物理 CPU の不足時の対処による性能低下を調査 Tascell で並列化したフィボナッチ数計算 (fib) NAS Parallel Benchmarks (BT) 実験環境 CPU: AMD Operation 6367 (16コア) × 2，メモリ: 320GB 仮想化ソフトウェア: Xen 4.4.0 VM: 仮想CPU 16個，メモリ 4GB，OS: Linux 3.13.0 実験環境のコア数と仮想CPU数は言う

物理CPU を減らした場合割り当てる物理CPUを16個からn個に減らしたどの場合も理論値より遅くなっている理論値からの増加率 fib: 4 ～ 25%，BT: 16 ～ 78% 横軸縦軸の説明（最初のここだけ）特に横軸物理CPU の減少分だけ低下した時の性能を理論値とした．

物理CPU の使用率を制限した場合 CPU使用率の上限を1600%から減らしたどの場合も理論値よりも遅くなっている理論値からの増加率上限値が小さいほど差が大きくなる理論値からの増加率 fib: 23 ～ 328%，BT: 157 ～ 5243% 横軸にひとこと前スライドとの対比さっきよりも差が大きい

物理CPU を共有した場合アプリケーションを同時に実行するVMを１台からn台に増やした台数を増やすほど理論値より遅くなった理論値からの増加率 fib: 12% ～ 20%，BT: 104% ～ 191% ----- 会議メモ (16/02/22 15:39) ----- ページ番号を上とか右とかに移動させる

理論値より性能が低下する原因仮想CPUのスケジューリングのオーバヘッドが原因と考えられるシステム全体の仮想CPU の数が物理CPU より多い場合、スケジューリングが必要になる仮想CPUを切り替えるオーバヘッドがあるクリックで切り替えながらオーバヘッドが生じることを説明 VM vCPU vCPU vCPU vCPU pCPU pCPU

提案：pCPU-Est 物理CPUの不足時に並列アプリケーションの実行を最適化するフレームワーク VMが利用可能な物理CPU の数を見積もる仮想CPUの切り替えを減らすように最適化を行う VM の仮想CPU 数の最適化アプリケーションのスレッド数の最適化仮想CPUスケジューラのタイムスライスの最適化（省略）タイムスライスの最適化の説明は省略するって言う

利用可能な物理CPU 数の見積もり以下の数の中の最小の値とするハイパーコールを作成してVM内から取得できるようにした VMに割り当てられた物理 CPU 数 CPU 使用率の上限 ÷ 100を四捨五入した値 VMの仮想CPU 数ハイパーコールを作成してVM内から取得できるようにした三つの値をそれぞれの例でもいう読まなくていい　いきなり例題で２００％って書く pCPUのところに５０％ ----- 会議メモ (16/02/22 15:39) ----- ２個利用可能がどの条件を使ったのか書くハイパーコールとは？ハイパバイザを呼び出すシステムコールそれとも消す普通VM内では見られないのを取得できるようにした強調物理CPU数：2個→2個利用可能 CPU使用率上限÷100=2→2個利用可能 vCPU vCPU vCPU vCPU vCPU vCPU vCPU vCPU pCPU pCPU 50% 50% 50% 50%

VMの仮想 CPU 数の最適化利用可能な物理 CPU 数を基に仮想CPU数を調整仮想 CPU 数を減らすことでスケジューリングを回避 OSはホットスワップ機能を用いてCPU数を動的に変更 VM アプリケーションホットスワップとは、コンピュータやサーバなどのシステムの電源を入れたまま、パーツやケーブル、あるいは外部機器などを交換する操作図を動かしながら説明 vCPU vCPU vCPU vCPU pCPU pCPU pCPU pCPU

アプリケーションのスレッド数の最適化利用可能な物理 CPU 数を基にスレッド数を調整使われる仮想 CPU 数を間接的に減らすスレッド数はユーザが調整可能アプリケーション実行中にスレッド数を変更するのは難しい VM アプリケーションスレッド使われる仮想CPUと１対１になる２つは使われないと言う ----- 会議メモ (16/02/19 13:27) ----- アプリケーションが複数動いたら単純な話ではない OSによる最適化 OS側でCPUやスレッドを最適化 ----- 会議メモ (16/02/22 15:39) ----- スレッドの表現の仕方４つのスレッドという vCPU vCPU vCPU vCPU pCPU pCPU pCPU pCPU

物理 CPU を減らした場合の最適化スレッド数の最適化が最も性能低下を抑えられた仮想CPU数の最適化も効果があった高速化：1.1〜1.3倍高速化：1.3〜2.0倍実験の説明物理CPU不足時の対処に対しpCPU-Estが提供する最適化手法を行うことでどの程度性能低下を抑えることができるか調査実験環境予備実験と同じ何色が何かを言う説明にあわせてどの辺りが違ったのか（仮想CPUの最適化のところ）

CPU 使用率を制限した場合の最適化仮想CPU数の最適化，スレッド数の最適化ともに効果があった利用可能な物理CPU数と同数が最適高速化：1.3〜4.9倍高速化：1.2〜55倍三枚目追加いろいろな数でやってみて最適なものを撮ったのがこのグラフですって説明指し棒で指しながら説明　とくに大幅に改善のところとか同じ傾向とは？何％高速化したか何倍の計算最適化前に比べて何倍速くなったか書く（性能向上のところ） ----- 会議メモ (16/02/19 13:27) ----- 利用可能な物理CPUと同数が必ずしも最適ではない同数ではない最適なやつをプロットしてみる最適のものを選ぶとこうなるほとんどは同数が最適だが一部は違うみたいなグラフグラフ差し替え本当に最適な値をプロット

物理CPU を共有した場合の最適化他の対処を行った場合と同様の効果があった利用可能な物理CPUと同数が最適高速化：1.2〜1.3倍高速化：1.3〜3.2倍（1-最適化後/最適化前)*100

関連研究 VCPU-Bal [Song et al. ‘13] ロックホルダ・プリエンプション [Uhlig et al. ‘04] VM間で物理CPUを共有する場合に最適な仮想CPU数に変更本研究では3つの対処と3つの最適化の関係を調べたロックホルダ・プリエンプション [Uhlig et al. ‘04] ロックを保持しているスレッドに割り当てられたCPUが他のスレッドに奪われることで処理が進まなくなる現象提案手法はこの問題を解消もしくは緩和できる (備忘録) 仮想環境では二重スケジューリング現象がある．一つは仮想CPUのOSのスケジューリング，もう一つはハイパーバイザによる仮想CPU のスケジューリング．二重スケジューリングのギャップを解消するために，各VM の仮想CPU の数を最小化し可能な限りvCPU スケジューリングからハイパーバイザを除外する方法が考えられており，最適な仮想CPU数を見積もるのがVCPU-Bal ロック・ホルダーは、現時点でロック(データへのアクセスや更新の制御)を保有している、または特定のロック・オブジェクトでロックを待機しているスレッドとかジョブとかプリエンプションは一時的に実行中のタスクを中断する

まとめ物理 CPU の不足時の対処による並列アプリケーションの性能への影響を調査並列アプリケーションを最適に実行する pCPU-Est を提案利用可能な物理CPU数を見積もるスレッド数、仮想CPU数、タイムスライスを最適化スレッド数の最適化が効果的であることが多かった今後の課題状況に応じて最も効果的な最適化を自動選択提案しました