VM専用仮想メモリとの連携による VMマイグレーションの高速化

VM専用仮想メモリとの連携による VMマイグレーションの高速化
九州工業大学村岡裕二　柏木崇広　光来健一

大容量メモリを持つVM クラウドでは大容量メモリを持つVMも提供 VMはホスト間でマイグレーションされる
Amazon EC2では4TBのVM（16TBのVMも計画）ビッグデータの解析などに利用 VMはホスト間でマイグレーションされるホストのメンテナンス、負荷分散などに利用移送元ホスト移送先ホスト VM本体メモリマイグレーション 1 2 3 3 4 5 更新メモリ

移送先ホストの要件 VMのマイグレーション時には移送先ホストに十分な空きメモリが必要
移送元ホスト移送先ホスト VM本体メモリマイグレーション 1 1 2 2 3 3 4 4 5 5 空きメモリ更新メモリ

仮想メモリを用いたマイグレーション仮想メモリを用いて必要なメモリ容量を確保必要に応じてページングを行う
物理メモリに入り切らないデータはディスクに格納物理メモリ容量以上のVMをマイグレーション可能必要に応じてページングを行うページイン：ディスクのデータを物理メモリへページアウト：物理メモリのデータをディスクへ移送元ホスト VM本体移送先ホスト物理メモリページインマイグレーションディスクメモリ 1 2 3 4 5 ページアウト

マイグレーションの性能低下仮想メモリはマイグレーションと相性が悪い VMのメモリ転送中に大量のページアウトが発生
物理メモリに格納されたデータが後で追い出される VMのメモリ再送時にページインが発生更新は物理メモリ上でしか行えない VM再開時にページインが発生（KVMの場合）仮想化ソフトウェア（QEMU-KVM）もページアウト移送元ホスト VM本体移送先ホストマイグレーション物理メモリメモリディスク 3 4 4 5 1 1 2 2 3 4 4 5 更新メモリ仮想化ソフトウェアのメモリ更新されるメモリ

分割マイグレーション [Suetake et al.’16]
VMを分割して複数ホストにマイグレーション VM本体と使われそうなメモリをメインホストにメインホストに入りきらないメモリをサブホストにマイグレーション中にページングを発生させないマイグレーション後はリモートページング必要なメモリをサブホストからページイン使われていないメモリをサブホストにページアウト移送元ホスト VM メモリ移送先メインホスト移送先サブホスト VM マイグレーションページングメモリメモリ主要なメモリそれ以外

分割マイグレーションの問題点リモートページングの影響が大きいネットワーク転送のオーバヘッドが大きい
ネットワーク帯域を消費してサービス性能に影響性能向上には高価な高速ネットワークが必要ハードウェア障害の影響を受けやすいネットワーク障害、サブホストの障害移送先サブホスト1 移送先メインホストメモリ VM メモリ移送先サブホスト2 メモリページング

提案：VMemDirect VM専用の仮想メモリと連携させることにより VMマイグレーションを高速化 VMごとに独立した仮想メモリを利用
移送元ホストのメモリアクセス履歴を移送先ホストでも活用移送元ホスト VM本体メモリ移送先ホストマイグレーション物理メモリディスク

VM専用の仮想メモリ VMごとにNVMe上にスワップ領域を作成仮想化ソフトウェアのページングを防止
仮想化ソフトウェアがページングを制御 KVMの場合はQEMU-KVM 仮想化ソフトウェアのページングを防止 VMのメモリだけがページングの対象 VM本体ディスクページング 1 2 3 4 5 6 仮想化ソフトウェアのメモリ VMのメモリスワップ領域

VMのメモリの直接転送 VMのメモリを移送先ホストの物理メモリまたはスワップ領域に直接格納ページングのオーバヘッドを削減
移送元ホストでメモリの格納先を決定再送時には格納済みのデータを直接上書きページングのオーバヘッドを削減物理メモリとNVMe間でデータの移動を行わない移送元ホスト VM本体移送先ホストマイグレーション物理メモリ NVMe メモリ 1 2 3 4 5

履歴に基づく格納先の決定メモリアクセス履歴に基づいて格納先を決定メモリより低速なNVMeへのアクセスを削減
使われそうなメモリデータから順に物理メモリへ残りのデータはスワップ領域へメモリより低速なNVMeへのアクセスを削減再送時に上書きされるデータは物理メモリにある可能性が高い移送元ホスト移送先ホストアクセス履歴 VM本体マイグレーション物理メモリ NVMe 1 2 3 4 4 5 アクセスされそうなメモリデータ残りのメモリデータ 11

実装 VMemDirectをQEMU-KVM 2.4.1とLinuxカーネル 4.11に実装
マイグレーション時にメモリの格納先とアクセス履歴を付加的に転送 VM専用スワップ領域を用いてページング移送元ホスト VM QEMU-KVM Linuxカーネル移送先ホスト NVMe QEMU-KVM Linuxカーネル

VM専用スワップ領域 VMのメモリと同じサイズのスパースファイルとして作成オフセットとVMの物理アドレスを対応づけ
実データを持たないブロック(ホール)からなるデータを書き込んだブロックだけ実データを持つデータを削除したブロックは再びホールにする VMのメモリスパースファイル物理メモリメモリデータホール

スワップ領域のアクセスダイレクトI/Oを用いて読み書きチャンク単位で読み書きページキャッシュなしでNVMeに直接アクセス
従来の仮想メモリによるVMのメモリやQEMU-KVM のページアウトを防止チャンク単位で読み書き 4KBのページ単位ではNVMeの性能を活かせない連続する256ページ単位でアクセスチャンク NVMe

チャンク単位でのメモリ転送マイグレーション時にチャンク単位でVMのメモリを分割メモリアクセス履歴に基づいてメモリを転送
スワップ領域のアクセスをチャンク単位で行うためメモリアクセス履歴に基づいてメモリを転送使われそうなチャンクは物理メモリに転送それ以外のチャンクはスワップ領域に転送チャンク物理メモリ VMのメモリ NVMe

スワップ領域への書き込み QEMU-KVMはVMのメモリをページ単位で転送再送が発生し始めるまではチャンク単位でスワップ領域に書き込み
送信をチャンク単位にするには大幅な変更が必要再送が発生し始めるまではチャンク単位でスワップ領域に書き込み受信したメモリがアドレス順かどうかで判断チャンクサイズ分のデータ受信後に一括書き込み移送元ホスト VM本体移送先ホスト物理メモリ NVMe メモリ 1 2 3 4

QEMU-KVMによるページング VMのメモリをuserfaultfd機構に登録 VM内の使われそうにないチャンクを選択
存在しないページへのアクセスを検出スワップ領域からチャンク単位で読み込み、削除 VMに物理メモリを割り当て、データを書き込み VM内の使われそうにないチャンクを選択スワップ領域にそのチャンクを書き込み VMのメモリから物理メモリを解放 VM本体ページインディスク 1 2 4 3 5 VMのメモリスワップファイルページアウト

メモリアクセス履歴の管理 VMの拡張ページテーブルから各ページのアクセスビットの値を取得エージングアルゴリズム
ページがアクセスされるとアクセスビットは１に取得後、アクセスビットを0にクリアエージングアルゴリズム各ページに８ビットを割り当てて履歴を管理最上位ビットにアクセスビットの値を記録定期的に右に１ビットシフト 1

実験 VMのマイグレーション性能とマイグレーション後の性能を測定従来の仮想メモリを用いた場合と比較 VMのサイズは12GBと2GBを使用
移送元・移送先ホスト CPU: Intel Xeon E v3 メモリ：16GB ディスク: Samsung NVMe SSD 960 EVO ネットワーク：10ギガビットイーサネット OS: Linux 4.11 仮想化ソフトウェア：QEMU-KVM 2.4.1

マイグレーション時間 VMのマイグレーションにかかる時間を測定十分なメモリがある場合と比べて従来の仮想メモリは2.1倍増加
VMemDirectは同程度チャンク単位で直接転送した効果ページ単位では従来の仮想メモリより増加 VMのメモリ 12GB

ダウンタイムマイグレーションの最終段階でVMが停止する時間を測定十分なメモリがある場合と比べて従来の仮想メモリは6.8倍の増加
VMemDirectは同程度仮想化ソフトウェアのページアウトを防いだ効果 VMのメモリ 12GB

スワップ領域の性能の影響スワップ領域として様々なディスクを用いた場合のマイグレーション性能を測定
SATA 3 HDD, Crucial MX300 SSDと比較マイグレーション時間は20〜79%短縮ダウンタイムは86〜95%短縮 VMのメモリ 2GB 52 16 95% 79% 87% 86% 20% 56%

マイグレーション後のVMの性能マイグレーション後のmemcachedの性能を測定マイグレーション前後で同じベンチマークを実行
従来の仮想メモリと比べて32倍の性能向上従来の仮想メモリを用いた場合には大量のページインが発生メモリアクセス履歴の有効性を確認 VMのメモリ 12GB

チャンクサイズの影響ページングの単位であるチャンクのサイズを変えてソート時間を測定
VMのメモリ 2GB ページングの単位であるチャンクのサイズを変えてソート時間を測定チャンクサイズを大きくすることで実行時間が92% 短縮チャンクサイズの増加とともにページング回数が減少

関連研究 Agileライブマイグレーション [Deshpande et al.'16] FlashVM [Saxena et al.'10]
ページングのオーバヘッドが大きい FlashVM [Saxena et al.'10] SSDの特性を考慮した仮想メモリマイグレーション中のページングは減らせない Infiniswap [Gu et al.’17] RDMAを利用したリモートページングの高速化高価なInfinibandが必要

まとめ大容量メモリを持つVMのマイグレーションを高速化するVMemDirectを提案今後の課題 VM専用の仮想メモリと連携
マイグレーション性能の向上を確認今後の課題分割マイグレーションとの比較様々なアプリケーションでの性能評価 VM専用の仮想メモリのオーバヘッド削減

VM専用仮想メモリとの連携による VMマイグレーションの高速化

Similar presentations

Presentation on theme: "VM専用仮想メモリとの連携による VMマイグレーションの高速化"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

VM専用仮想メモリとの連携による VMマイグレーションの高速化

Similar presentations

Presentation on theme: "VM専用仮想メモリとの連携による VMマイグレーションの高速化"— Presentation transcript:

Similar presentations

About project

フィードバック