データベースによる並列処理 情報論理工学研究室  04147175 三宅健太.

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

データベースの基礎知識 ACEESS の基本操作. データベースの基礎知識 データベース  特定のテーマや目的に毎のデータの集合体 データベースソフトウェア  データベースを作成、管理するソフトウェアの総 称 Oracle(Oracle) IBM(DB2) Microsoft(SQL Server)
中小企業診断士 野田 幸紀 2010 年 2 月 10 日(水) データ分析をする前に知っておきたいノウハウ (ACCESS初級編)
目次(電子納品 操作手順) ※ページはスライド番号
企画書作成ソフトウェアの開発 佐々木研究室 05k1134 吉村祥平.
blanco Framework ご紹介 DB版
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
Windows HPC Server を使ってみる
DB(データベース)のおはなし 作成者:小野正広 DBと言っても、  ドラゴンボール ではないですぞ! 3/1/2017.
情報理工学部 情報システム工学科 ラシキアゼミ 3年 H 井奈波 和也
LZ圧縮回路の設計とハード・ソフト 最適分割の検討 電子情報デザイン学科 高性能計算研究室 4回生 中山 和也 2009/2/27.
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
WEBから確認できる 駐車場管理システムについて
アルゴリズムイントロダクション第2章 主にソートに関して
3-1 MySQLについて 発表者:藤村元彦 自然言語処理研究室.
全体ミーティング (4/25) 村田雅之.
Microsoft Office 2010 クイックガイド ~Access編~
ACCESSによる データベースアプリケーション開発実習 日本工業大学 情報工学科 “データベースの実際” 教材
SQL J2EE I 第3回 /
アルゴリズムとデータ構造 --- 理論編 --- 山本 真基
全体ミーティング (6/13) 村田雅之.
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
文献管理ソフトRefWorksの利用.
3-2.データを取り出す 2004年 5月20日(木) 01T6074X 茂木啓悟.
医療支援診断のためのコンピュータ分散システムの検討
09 06/23 PHP と SQL (MySQL) の連携 その2
(B2) 親: minami, kazuki 多様な認証機器に対応する 認証システム (B2) 親: minami, kazuki.
パフォーマンスチューニング on Rails
マイクロソフト Access を使ってみよう 第1回
マイクロソフト Access での SQL 演習 第1回 SQL問い合わせ(クエリ)
マイクロソフト Access を使ってみよう 第4回
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
Occam言語による マルチプリエンプティブシステムの 実装と検証
ホスティングサーバの作成と、 ラズベリーパイの利用
11.Webサイトとデータベース, Webサイト+ブログシステムの開設手順例
SQL パフォーマンス チューニング ~ カバーリングインデックス/クエリヒントの利用~
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
ソフトを用いた動画の並列変換処理 情報論理工学研究室 中村勇介.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
第2回.リレーショナルデータベース入門 SQL を用いたテーブルへの行の挿入 SQL 問い合わせの発行と評価結果の確認.
第1回.リレーショナルデータベースを使ってみよう
第1回.リレーショナルデータベースを使ってみよう
第2回.リレーショナルデータベース入門 SQL を用いたテーブルへの行の挿入 SQL 問い合わせの発行と評価結果の確認.
SQL パフォーマンス チューニング ~ プランガイドの利用~
第3回.テーブルの結合 結合条件 SQL を用いた結合問い合わせ.
第3回.テーブルの結合 結合条件 SQL を用いた結合問い合わせ.
実行時情報に基づく OSカーネルのコンフィグ最小化
09 06/23 PHP と SQL (MySQL) の連携 その1
通信機構合わせた最適化をおこなう並列化ンパイラ
オープンソース開発支援のための リビジョン情報と電子メールの検索システム
1億円 45%OFF HP Enterprise Data Warehouse Appliance 2012年6月まで
WinSCPのインストール方法
7-3. 移行データ登録簡易マニュアル Version 1.0
先進的計算基盤システムシンポジウム SACSIS2007併設企画 マルチコアプログラミングコンテスト 「Cellスピードチャレンジ2007」
データベース設計 第8回 クライアント=サーバーモデル(2)
データベース設計 第4回 DBMSの機能と操作方法(1) Access入門
アルゴリズム論 (第12回) 佐々木研(情報システム構築学講座) 講師 山田敬三
3.リレーショナルデータベース,主キー, SQL
JDBC ソフトウェア特論 第3回.
コーディングパターンの あいまい検索の提案と実装
Webアプリケーションと JSPの基本 ソフトウェア特論 第4回.
理工学部情報学科 情報論理工学研究室 延山 周平
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
第2回.リレーショナルデータベース入門 SQL を用いたテーブルへの行の挿入 SQL 問い合わせの発行と評価結果の確認.
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
SQL J2EE I (データベース論) 第3回 /
岩村雅一 知能情報工学演習I 第7回(後半第1回) 岩村雅一
SQL データベース論 第11回.
Presentation transcript:

 データベースによる並列処理 情報論理工学研究室  04147175 三宅健太

本研究の背景 × × 原因 3. データのサイズが大きすぎる。 1. SQL文の文法 2. インデックスの張り方 膨大な量からなるデータ データベース 検索 応答 ユーザ 1つの応答時間が、 非常に大きなもの となってしまうこと がある。 原因 2. インデックスの張り方 1. SQL文の文法 × × 3. データのサイズが大きすぎる。 最大の原因!!

データベースとの連携に優れたプログラムの表記法 解決策 パラレルクエリ あらかじめデータを細分化し、手分けして処理する。 テーブル パラレルクエリ 逐次クエリ データを順番に処理していく データを分割し、結果をまとめる。 クエリ 結果 目的 分割されたテーブルにデータを挿入し、処理速度の向上の目指す。 データベースとの連携に優れたプログラムの表記法 PHP データベース 計算機 挿入 取り出す 出力

データベース環境の構築 準備 Windowsの標準環境には、DBは付属していない。 必要なソフトウェアをインストールしなければならない。 XAMPP MySQL TeraPad Apache データベース テキストエディタ

MySQLによる逐次クエリ & パラレルコードによるパラレルクエリ 研究内容 MySQLによる逐次クエリ & パラレルコードによるパラレルクエリ 双方のクエリを実行し、それぞれ処理時間を測定する。 それぞれの結果を検証し、双方の結果を比較する。 検証手順 [1]データの分割・挿入 [2]MySQLによる各テーブルへのクエリ処理 [3]パラレルコードによる各テーブルへのクエリ [4]結果をまとめる

[1]データの分割・挿入 例 文字列 文字列 例 文字列 各クエリごとにレコード数が均等になるように2~10個のデータに分割・挿入する。入力データは、文字列(a~z)をシャッフルしたもの。 例 分割なし 2分割 150万レコード T1 挿入 挿入 文字列 T0 文字列 T2 300万レコード 150万レコード 各テーブルを(T1-----Ti(2<=i<=10)) とし、テーブル全体をマージして比較用のテーブルT0を作成する。 例 2分割 MySQL MySQL T1 挿入 マージ結合 T0 文字列 T2

[2]MySQLによる各テーブルへのクエリ処理 各テーブルに入力された文字列(a~z)から、”sql”と配列された文字列を含む行を出力すると命令し、その処理速度を測定する。 例 分割なし 2分割 MySQL MySQL 逐次テーブル マージテーブル T0 T0 クエリ 結果表示 クエリ 結果表示 [3]パラレルコードによる各テーブルへのクエリ 各テーブルにパラレルコードを使用して、”sql”と配列された文字列を含む行を出力すると命令し、その処理速度を測定する。 例 分割なし 2分割 MySQL MySQL T1 T0 クエリ 結果 クエリ 結果 T2

出力された結果を作成した一時ファイルに追記し、処理速度の測定の結果を表示する。 例 分割なし 2分割 T0 T1.T2 追記 追記 出力 追記 集計 一時テーブル 一時テーブル 結果 結果表示 結果 結果表示 [4]結果をまとめる 各テーブルの処理がすべて完了しているかをチェックし、 MySQLによる逐次クエリの結果を、各分割ごとに比較 パラレルコードによるパラレルクエリの結果を、各分割ごとに比較 双方のクエリの結果を検証し、比較

MySQLによる逐次クエリ & パラレルコードによるパラレルクエリ 結果  MySQLによる逐次クエリ & パラレルコードによるパラレルクエリ

まとめ 今後の課題 1台の計算機を用いての処理であるため、並列処理可能な処理数に限界が見られた。 マルチプルINSERTによる方法 双方のクエリは、共に各テーブルを分割化することにより、処理速度が向上することが示された。 逐次クエリよりもパラレルクエリのほうが、より高いパフォーマンスが得られる。 1台の計算機を用いての処理であるため、並列処理可能な処理数に限界が見られた。 今後の課題 マルチプルINSERTによる方法 データ挿入部分を自動化し、ユーザがデータベースを使用する手間を省く