カラム指向型データベース向けハードウェアキャッシュ機構の検討

Slides:



Advertisements
Similar presentations
FPGA 株式会社アプライド・マーケティング 大越 章司
Advertisements

Linuxを組み込んだマイコンによる 遠隔監視システムの開発
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
はじめに 課題論文 “Power Consumption and Energy Efficiency in the Internet “
Webプロキシサーバにおける 動的資源管理方式の提案と実装
情報検索概説II 第8回 パソコン組み立てと記憶装置 1999/11/25.
The Perl Conference Japan ’98 朝日奈アンテナによる コンテンツ情報の取得と利用
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
状況に応じたサービスを 提供するための人や物に 共通の情報管理
Chapter11-4(前半) 加藤健.
ノーマリ「オフ」と「オン」 九州大学 井上こうじ (ただのお友達).
最新ファイルの提供を保証する代理FTPサーバの開発
NFCを利用した登山者間DTNの構築 Building DTN for Climbers by using NFC
IaaS 仮想マシン(VM)をネットワーク経由で提供 負荷に応じてVM数や性能を変更できる ハードウェアの導入・管理・維持コストの削減
Rearrangeable NoC: 配線遅延を考慮した分散ルータ アーキテクチャ
神奈川大学大学院工学研究科 電気電子情報工学専攻
最新技術でネットワーク設備を省エネ化!! Green IT をリードするルータ/スイッチ「AXシリーズ」
垂直統合システム / Converged System
データベースとストレージ の最新動向 12.MAR.2015.
FPGAを用いたMG3用 インターフェース回路の解説
発表の流れ 研究背景 マルチテナント型データセンタ 関連研究 IPマルチキャスト ユニキャスト変換手法 提案手法 性能評価.
最新情報技術を活用した超大規模 天文データ解析機構の研究開発
研究背景 クラウドコンピューティングサービスの普及 ユーザ数の増加に伴う問題 マルチテナント方式の採用 データセンタの需要が増加
ユーザの機器利用状況に基づく 家庭内電力管理機構
ユビキタス環境における コミュニケーション・ツール選択支援機構の提案
Ibaraki Univ. Dept of Electrical & Electronic Eng.
プロキシ協調型動画像配信システムの検討 大阪大学 若宮 直紀.
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
組み込み向けCPU 小型デバイスに搭載されるCPU 特徴 携帯電話,デジタルカメラ,PDA,センサデバイスなど 小型 低消費電力 多機能
サーバ負荷分散におけるOpenFlowを用いた省電力法
A Brain-Friendly Guide
オペレーティングシステムJ/K (実時間処理システム)
高速剰余算アルゴリズムとそのハードウェア実装についての研究
読み出し回路のアップグレードに向けた研究
作りながら学ぶコンピュータアーキテクチャ(改訂版)授業資料 テキスト ページ対応 天野英晴
1.コンピュータと情報処理 p.18 第1章第1節 2.コンピュータの動作のしくみ CPUと論理回路
生産ライン情報管理システム.
ストレージの最新動向 ITソリューション塾・第20期 2015年11月10日.
オブジェクト指向プログラムにおける エイリアス解析手法の提案と実現
リモートホストの異常を検知するための GPUとの直接通信機構
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
各種ルータに対応する P2P通信環境に関する研究
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Internet広域分散協調サーチロボット の研究開発
オープンソース開発支援のための ソースコード及びメールの履歴対応表示システム
FPGA 株式会社アプライド・マーケティング 大越 章司
端末およびサービス透過的な 情報閲覧支援システムの構築
1億円 45%OFF HP Enterprise Data Warehouse Appliance 2012年6月まで
最新 IT トレンド ARM.
非対称リンクにおける ジャンボフレームの性能評価
SN比を考慮した 無線スケジューリング方式
Improvement of bootup time using Power Management - Project Update -
VMMのソフトウェア若化を考慮した クラスタ性能の比較
サービス指向ルータ向け 問合せ処理用ハードウェアの検討
ネットワークをシンプルにする エンタープライズ NFV
Ibaraki Univ. Dept of Electrical & Electronic Eng.
トラフィックプロファイラAGURIの設計と実装
Cソースコード解析による ハード/ソフト最適分割システムの構築
アドホックルーティングにおける 省電力フラッディング手法の提案
FPGA 株式会社アプライド・マーケティング 大越 章司
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
第4回 CPUの役割と仕組み2 命令の解析と実行、クロック、レジスタ
CO-Client Opeartion 1.1 利用履歴データベースの設計 (スキーマ バージョン 対応)
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
レポート課題1 基本問題:  課題1. あるマシンまでのRTT (Round Trip Time)を測定したところ 128msec(ミリ秒)であった。このマシンに対してウィンドウサイズ64KByteでTCPの通信を行う場合のスループットの予想値を計算せよ。 ヒント1: 授業中に説明したように、スループットの値は、ウィンドウサイズを往復遅延時間で割れば良い。Byteとbitの換算に注意する。計算を簡単にするために1024≒1000として計算して良い(もちろん、この概算を使わなくても良い)。スループットは、ど
7シリーズFPGA 評価キット販売開始 Kintex-7 FPGA KC705 評価キット
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
複数ホストにまたがるVMの 高速かつ柔軟な 部分マイグレーション
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Presentation transcript:

カラム指向型データベース向けハードウェアキャッシュ機構の検討 濱田 耀彦(1)  松谷 宏紀(1)(2)(3)     (1) 慶應義塾大学     (2) JST さきがけ     (3) 国立情報学研究所

ICT におけるトレンド: ビッグデータとグリーン化 Big data: the next oil Green datacenters データの蓄積・利活用によってさまざまなイノベーションが期待 地球温暖化防止の観点、経済面(データセンター運用コスト)から消費電力の削減は必須 9000 [EB] 6000 3000 2005 2010 2015 Sensor Social media Voice Enterprise Information explosion Amortized CAPEX OPEX Power cooling Power use Servers  IT 機器の増強へ作用(電力増)  IT 機器の省電力化への要求 IT 機器の省電力化をこれまで以上に推し進めなければ、電力がビッグデータ利活用の大きな足かせになる 制限: IT 機器の省電力化はすでにやり尽くされている データセンターでは、コモディティ機(コスト効率重視)が多用 そもそも回路の電源電圧はもう下げられない

ICT におけるトレンド: ビッグデータとグリーン化 Big data: the next oil Green datacenters データの蓄積・利活用によってさまざまなイノベーションが期待 地球温暖化防止の観点、経済面(データセンター運用コスト)から消費電力の削減は必須 9000 [EB] 6000 3000 2005 2010 2015 Sensor Social media Voice Enterprise Information explosion Amortized CAPEX OPEX 本研究では、ビッグデータ利活用の要であるデータベース(構造型ストレージ)をハードウェア化することによって、スループット性能を維持しつつ、多数のサーバを専用ハードウェアに置き換え、コストと電力効率の向上を狙う Power cooling Power use Servers  IT 機器の増強へ作用(電力増)  IT 機器の省電力化への要求 IT 機器の省電力化をこれまで以上に推し進めなければ、電力がビッグデータ利活用の大きな足かせになる 制限: IT 機器の省電力化はすでにやり尽くされている データセンターでは、コモディティ機(コスト効率重視)が多用 そもそも回路の電源電圧はもう下げられない

構造型ストレージ: データ構造の点から分類 構造型ストレージは、水平スケーラビリティに優れるが得手不得手がある(特定用途特化型) … Row Key Column Family 1 Column Family 2 MongoDB { _id : ObjectId(0), name : Risa, tel : 1234 } { _id : ObjectID(1), name : Shinpei, mail : kato@x.jp} ドキュメント 指向型 HBase, BigTable Schema-less DB カラム指向型 Neo4j Memcached Shinpei グラフ型 キーバリュー ストア型 Jiro Aya Key Value Ken Risa Shopping cart, User profile, Session, etc Customer social graph Hiro Yuko Taro

構造型ストレージ: データ構造の点から分類 構造型ストレージは、水平スケーラビリティに優れるが得手不得手がある(特定用途特化型) … Row Key Column Family 1 Column Family 2 MongoDB { _id : ObjectId(0), name : Risa, tel : 1234 } { _id : ObjectID(1), name : Shinpei, mail : kato@x.jp} ドキュメント 指向型 本研究では、 構造型ストレージのうち、 キーバリューストア型と カラム指向型を ハードウェアで高速化する HBase, BigTable Schema-less DB カラム指向型 Neo4j Memcached Shinpei グラフ型 キーバリュー ストア型 Jiro Aya Key Value Ken Risa Shopping cart, User profile, Session, etc Customer social graph Hiro Yuko Taro

本発表の概要: カラム指向型 DB アクセラレータ RDBMSに比べると処理はシンプル(例: KVS) I/O ネックなので、通信と計算の「密結合」が有利 10GbE FPGA Graph processing using Parallel algorithm Many cores or GPUs Hardware-based table management Binary JSON

目標: FPGA+40GbEを用いたカラム指向DBキャッシュ 各種NOSQLのCRUD操作をFPGA上にハード化 40GbEネットワークとDB HWを直結(I/Oネック) NOSQLサーバ NOSQLサーバのキャッシュ層 10GbE 10GbE FPGA 10GbE Request & Reply 10GbE Scan table startRow stopRow Graph processing using Parallel algorithm Many cores or GPUs Hardware-based table management Binary JSON

目標: FPGA+40GbEを用いたカラム指向DBキャッシュ 各種NOSQLのCRUD操作をFPGA上にハード化 40GbEネットワークとDB HWを直結(I/Oネック) HBase サーバ群 カメラ画像の リアルタイム解析 Put table 0101+age 28 Put table 0101+gender M … 通行人年齢 性別、時間 沖電気RESCAT

目標: FPGA+40GbEを用いたカラム指向DBキャッシュ 各種NOSQLのCRUD操作をFPGA上にハード化 40GbEネットワークとDB HWを直結(I/Oネック) HBase サーバ群 HBase キャッシュ Scan table startRow stopRow Cached Results Binary JSON Hardware-based table management Graph processing using Parallel algorithm Many cores or GPUs

カラム指向型 DB の構造: Flat-Wide 型 松谷  住所 Email 所属 役職 濱田  住所 Email 所属 役職 田村  住所 Email 所属 役職

カラム指向 DB: Flat-Wide 型 vs. Tall-Narrow 型 Flat-Wide 型と Tall-Narrow 型は相互に変形可能 松谷  住所 Email 所属 役職 濱田  住所 Email 所属 役職 Flat-Wide 型 Tall-Narrow 型

カラム指向 DB: Flat-Wide 型 vs. Tall-Narrow 型 Flat-Wide 型と Tall-Narrow 型は相互に変形可能 松谷  住所 Email 所属 役職 本研究では、カラム指向型データベースの Flat-Wide 型と Tall-Narrow 型の両方に対応するが、 内部的にはハードウェア処理に向く Tall-Narrow 型に変形して処理する 濱田  住所 Email 所属 役職 Flat-Wide 型 Tall-Narrow 型

カラム指向型 DB キャッシュ: 動作概要 HBase Cache (HBC) 本物(HBase サーバ)は全 Row を保持

カラム指向型 DB キャッシュ: 動作概要 Cached HBase Cache(HBC)は一部の Row のみ、ホストメモリにキャッシュ 本物(HBase サーバ)は全 Row を保持

カラム指向型 DB キャッシュ: アプリの例 短文投稿サービスの例 各 Row ID 各 Row データ よく参照されるのは、 「User ID」+「投稿日時」 ID、投稿日時でソート済み 各 Row データ 短文(256Byte) よく参照されるのは、 あるユーザの最新○○件 キャッシュポリシー 人気ユーザの投稿をキャッシュ そのユーザの最新64Row分

カラム指向型 DB キャッシュ: キャッシュ構造 キャッシュポリシー 人気ユーザの投稿をキャッシュ(ダイレクトマップ方式) その投稿者の最新64 Row 分(=1ブロック) FIFO buffer (64 entry) User #104 User #108 User #101 User #102

HBase の処理時間(scan 要求) 行サイズ 256Byte スキャン範囲(Row 数)は 1 ~ 1,000,000 Rows 382 sec マシン環境: Intel Xeon E5-1620 @3.7GHz, 128G RAM 40 sec 8 sec 2 sec

HBC の処理時間(scan 要求) キャッシュに 100% ヒットすると仮定 行サイズ 256Byte スキャン範囲(Row 数)は 1 ~ 1,000,000 Rows 2720 msec キャッシュに 100% ヒットすると仮定 272 msec ※見積根拠は 次スライドで説明 27 msec 3 msec

HBC の処理時間(scan 要求)見積根拠 実装環境 NetFPGA 10G(Virtex-5 TX240T) Xilinx ISE 13.4 DMA 転送回路 ホストメモリ  NetFPGA10G スループット: 105MByte / sec 転送遅延: 約 2 cycle / Byte HBC タグ比較回路 キャッシュヒット or ミス判定 動作周波数 221MHz HBC バス幅 64-bit(= Row当たり 32-cycle) HBase Cache (HBC) 10GbE x4 Virtex-5

キャッシュヒット率を考慮した性能見積もり ヒット率 0%、25%、50%、75%、90%、100% ミス時はソフトウェア処理(通信時間は含まない) 0% 25% 50% 75% 90% 100%

まとめ: カラム指向型 DB アクセラレータ カラム指向型データベース 40GbE 搭載 FPGA ボードを用いた HW キャッシュ I/O ネックなので、通信と計算の「密結合」が有利 40GbE 搭載 FPGA ボードを用いた HW キャッシュ ブロック単位で特定範囲をキャッシュ 短文投稿サイトの例: 人気ユーザの最新64件を保持 今回は性能見積のみ  現在、設計実装中 HBase サーバ HBase Cache(HBC) 10GbE x4 Virtex-5