Raspberry Pi を用いた 並列分散処理

Slides:



Advertisements
Similar presentations
ゲームプログラミング講習 第2章 関数の使い方
Advertisements

サービス管理責任者等研修テキスト 分野別講義    「アセスメントと        支援提供の基本姿勢」 <児童発達支援管理責任者> 平成27年10月1日.
ヒトの思考プロセスの解明を目的とするワーキングメモリの研究
第27講 オームの法則 電気抵抗の役割について知る オームの法則を使えるようにする 抵抗の温度変化を理解する 教科書P.223~226
コラッツ予想の変形について 東邦大学 理学部 情報科 白柳研究室 山中 陽子.
コンパイラ 第3回 字句解析 ― 決定性有限オートマトンの導出 ―
第5章 家計に関する統計 ー 経済統計 ー.
公共財 公共経済論 II no.3 麻生良文.
VTX alignment D2 浅野秀光 2011年12月15日  放射線研ミーティング.
冷却フランシウム原子を用いた 電子の永久電気双極子能率探索のための ルビジウム磁力計の研究
生命情報学 (8) スケールフリーネットワーク
前半戦 「史上最強」風 札上げクイズ.

認知症を理解し 環境の重要性について考える
フッ化ナトリウムによる洗口 2010・9・13 宮崎市郡東諸県郡薬剤師会 学校薬剤師  日高 華代子.
食品の安全性に関わる社会システム:総括 健康弱者 ハイリスク集団 HACCP (食肉処理場・食品工場) 農場でのQAP 一般的衛生管理
規制改革とは? ○規制改革の目的は、経済の活性化と雇用の創出によって、   活力ある経済社会の実現を図ることにあります。
地域保健対策検討会 に関する私見(保健所のあり方)
公共政策大学院 鈴木一人 第8回 専門化する政治 公共政策大学院 鈴木一人
医薬品ネット販売規制について 2012年5月31日 ケンコーコム株式会社.
平成26年8月27日(水) 大阪府 健康医療部 薬務課 医療機器グループ
平成26年度 呼吸器学会からの提案結果 (オレンジ色の部分が承認された提案) 新規提案 既収載の変更 免疫組織化学染色、免疫細胞化学染色
エナジードリンクの危険性 2015年6月23日 経営学部市場戦略学科MR3195稲沢珠依.
自動吸引は 在宅を変えるか 大分協和病院 院長         山本 真.
毎月レポート ビジネスの情報 (2016年7月号).
医療の歴史と将来 医療と医薬品産業 個人的経験 3. 「これからの医療を考える」 (1)医薬品の研究開発 -タクロリムスの歴史-
社会福祉調査論 第4講 2.社会調査の概要 11月2日.
2015年12月28日-2016年3月28日 掲載分.
2010度 民事訴訟法講義 補論 関西大学法学部教授 栗田 隆.
腫瘍学概論 埼玉医科大学国際医療センター 包括的がんセンター 緩和医療科/緩和ケアチーム 奈良林 至
“企業リスクへの考え方に変化を求められています。 トータルなリスクマネジメント・サービスをプロデュースします。“
情報漏えい 経済情報学科 E  西村 諭 E  釣 洋平.
金融班(ミクロ).
第11回 2009年12月16日 今日の資料=A4・4枚+解答用紙 期末試験:2月3日(水)N2教室
【ABL用語集】(あいうえお順) No 用語 解説 12 公正市場価格 13 債権 14 指名債権 15 事業収益資産 16 集合動産 17
基礎理論(3) 情報の非対称性と逆選択 公共政策論II No.3 麻生良文.
浜中 健児 昭和42年3月27日生まれ 東京都在住 株式会社ピー・アール・エフ 代表取締役 (学歴) 高 校:千葉県立東葛飾高校 卒業
COPYRIGHT(C) 2011 KYUSHU UNIVERSITY. ALL RIGHTS RESERVED
Blosxom による CMS 構築と SEO テクニック
記入例 JAWS DAYS 2015 – JOB BOARD 会社名 採用職種 営業職/技術職/その他( ) 仕事内容 待遇 募集数
ネットビジネスの 企業と特性 MR1127 まさ.
Future Technology活用による業務改革
ネットビジネス論(杉浦) 第8回 ネットビジネスと情報技術.
g741001 長谷川 嵩 g740796 迫村 光秋 g741000 西田 健太郎 g741147 小井出 真聡
自然独占 公共経済論 II no.5 麻生良文.
Autonomic Resource Provisioning for Cloud-Based Software
Webショップにおける webデザイン 12/6 08A1022 甲斐 広大.
物理的な位置情報を活用した仮想クラウドの構築
ハイブリッドクラウドを実現させるポイントと SCSKのOSSへの取組み
寺尾 敦 青山学院大学社会情報学部 第12回 情報デザイン(4) 情報の構造化と表現 寺尾 敦 青山学院大学社会情報学部
【1−1.開発計画 – 設計・開発計画】 システム開発計画にはシステム開発を効率的、効果的に実行する根拠(人員と経験、開発手順、開発・導入するシステム・アプリケーション・サービス等)を記述すること。 システム開発の開始から終了までの全体スケジュールを記載すること。 アプリケーション機能配置、ソフトウェア、インフラ構成、ネットワーク構成について概要を示すこと。
6 日本のコーポレート・ガバナンス 2008年度「企業論」 川端 望.
急成長する中国ソフトウェア産業 中国ソフトウェアと情報サービス産業の規模 総売上高は5年間で約5.3倍の成長
米国ユタ州LDS病院胸部心臓外科フェローの経験
公益社団法人日本青年会議所 関東地区埼玉ブロック協議会 JCの情熱(おもい)育成委員会 2011年度第1回全体委員会
次世代大学教育研究会のこれまでの活動 2005年度次世代大学教育研究大会 明治大学駿河台校舎リバティタワー9階1096教室
子どもの本の情報 大阪府内の協力書店の情報 こちらをクリック 大阪府内の公立図書館・図書室の情報
第2回産業調査 小島浩道.
〈起点〉を示す格助詞「を」と「から」の選択について
広東省民弁本科高校日語専業骨幹教師研修会 ①日本語の格助詞の使い分け ②動詞の自他受身の選択について   -日本語教育と中日カルチャーショックの観点から- 名古屋大学 杉村 泰.
■5Ahバッテリー使用報告 事例紹介/東【その1】 ■iphon4S(晴れの昼間/AM8-PM3) ◆約1時間で68%⇒100%
『ワタシが!!』『地域の仲間で!!』 市民が始める自然エネルギー!!
ポイントカードの未来形を形にした「MUJI Passport」
SAP NetWeaver を支える Microsoft テクノロジーの全貌 (Appendix)
ガイダンス(内業) 測量学実習 第1回.
Python超入門 久保 幹雄 東京海洋大学.
熱力学の基礎 丸山 茂夫 東京大学大学院 工学系研究科 機械工学専攻
京都民医連中央病院 CHDF学習推進委員会
資料2-④ ④下水道.
Accessによる SQLの操作 ~実際にテーブルを操作してみよう!~.
Presentation transcript:

Raspberry Pi を用いた 並列分散処理 13162100 田中 基之

目次 概要 Raspberry Pi について 分散処理フレームワーク について 評価方法について 測定結果 考察

概要 複数台の小型コンピュータ 「Raspberry Pi」 を接続して,並列処理による計算速度の 変化などを測定,研究する. 分散処理フレームワーク 「Hadoop」,「Spark」 を用いてテストを行う. 今回は Master 1台 と Slave 8 台 とした.

Raspberry Pi とは 英国の「ラズベリー・パイ財団」が提供. 手のひらサイズのコンピュータで,OSが起動する. 今回使用する OS は 専用に用意された Linux である raspbian である. もともとは教育向けの低価格コンピュータとして開発. 簡単な電子工作やプログラミングを行うことができる. Python, Java, C言語, Scratch, PHP などがすぐに使える. 今回は Raspberry Pi 2 Model B を 9 台接続した.

Raspberry Pi とは スペック 価格は 35 米ドル / 4,725 円 ARM Cortex-A7 (900MHz) CPU グラフィック メモリー ネットワーク ARM Cortex-A7 (900MHz) クアッドコア Broadcom BCM2836 1 G byte 10/100 Mbps Ethernet 電源出力端子 電源電圧 電力定格 サイズ 重さ 3.3V, 5V 5V 10W 85.6 mm × 56.5 mm 45 g

分散処理フレームワーク 大規模なデータの分析などを分散処理(並列処理)によって実現するソフトウェア. Hadoop Spark メモリに入りきらない大規模なデータは安定して処理できる. 処理が複雑化すると処理時間が悪化. 繰り返し計算処理(機械学習やグラフなど)には適していない. 基本は Java で制御. Spark メモリに入りきる量のデータに対しては高速に処理できる. Scala で制御するが,Scala は Java, Python, R 言語 などで制御可能.

分散処理フレームワーク Map Reduce Map処理 Reduce処理 Slave 数 を変えても分散処理ができるようにするプログラミングモデル. Map処理 それぞれの Slave に対して,互いに独立になるように処理を分散させ,計算させる. Reduce処理 それぞれの Slave に分散させた処理を何らかの形で集約し,結果を返す.

Monte Carlo 法 [0,1]×[0,1] の領域に対してランダムに 𝑁 個の点 (𝑥,𝑦) を与えるとき,その点が 𝑦≤ 1− 𝑥 2  を満たす割合を調べることで, 円周率を推定する方法. 右図のように半径 1 の円の 1 4 の領域に点が含まれるかどうかを判定して  いるため, 求めた割合を 4 倍すると円周率 𝜋 の近似値が得られる. 右図の例では 𝑁=11, そのうち円の内部の点が 8 個であるから, 𝜋≃4× 8 11 =2.90909091⋯  である.

Monte Carlo 法 実装例 1セット(100,000個)×slice 数(32 ~ 512) の 要素を持つ配列 L をつくる. <MAP> 各要素に対してランダムに点を生成し,四分円内にあれば1,なければ0を返す. L = [0,1,2,3, … , 3200000 - 1] → [0, 1, 1, 0, … , 1] <REDUCE> 配列 L の要素を1つ1つ足し合わせたものを count とする. count を 配列 L の大きさで割ったものを4倍して 円周率 𝜋 を得る.

測定結果(1) Hadoop における処理時間 slice 数 10 での測定,5回の計測の中央値を使用. 縦軸は時間[s],横軸は Slave 数. Slave 数の増加にともない処理時間は減少している.

測定結果(2) Hadoop と Spark の比較 slice 数 32 での測定,5回の計測の中央値を使用. Slave 数 は 8 台. 約15倍の処理時間となった.

測定結果(3) Spark における処理時間(P) slice 数 32 での測定,5回の計測の中央値を使用.制御は Python. 縦軸は時間[s],横軸は Slave 数. Slave 数の増加にともない処理時間は減少している.

測定結果(4) Spark における処理時間(J) slice 数 32 での測定,5回の計測の中央値を使用.制御は Java. 縦軸は時間[s],横軸は Slave 数. Slave 数 4 までは処理時間が減少しているが, Slave 数 8 台では処理時間が増加した.

測定結果(5) Spark における処理時間 slice 数 32 での測定,5回の計測の中央値を使用.(2)と(3)の比較. 縦軸は時間[s],横軸は Slave 数. Python による制御より Java による制御のほうが処理がはやい.

測定結果(6) Spark における処理時間(J) slice 数 512 での測定,5回の計測の中央値を使用.制御は Java. 縦軸は時間[s],横軸は Slave 数. Slice 数 32 のときと異なり,Slave 数 8 でも処理時間は減少した.

測定結果(7) Spark における処理時間(J) slice 数 32 ~ 512 での測定,5回の計測の中央値を使用.制御は Java. 縦軸は時間[s],横軸は Slave 数. Slice 数 64 以上では分散の効果がみられる.

考察 Hadoop ,Spark の双方において,Slave 数に応じて処理時間が短くなる結果を得た. 今回のテストプログラムにおいては,Spark は Hadoop の 倍の処理速度となった. Spark では インタプリタ型 である Python による制御より,コンパイル型である Java 制御の方が処理速 度がよかった. Java 制御では slice 数 32 程度の計算量において,処理時間短縮の限界があった. 4 つの Slave に 8 Slice ずつ 処理させるより,8 つの Slave に 4 ずつ 処理させる方が時間がかかる. 8 Slice 相当の計算のための時間より,8 Slave に計算を分散させるための時間が上回った. Slice 数 の増加にともなって,分散による効果が顕著になった.

課題 すべての Slice が同じ処理になるようなプログラムによるテストを用いた. 1回の処理が早く終わってしまう Slave がいなかった(待ち時間がなかった). Slave によって処理時間に差があるテストプログラムによる測定と考察ができなかった. Spark より Hadoop の方がよい結果を出すようなテストが出来なかった. メモリに入りきらないような大規模なデータなどを扱った測定,考察ができなかった. プログラミングの技術の問題 上の課題を解決するために Mandelbrot Set のようなテストプログラムを作成したが,並列処理の結果 が得られなかった.おそらくコードに問題があると思われる.

Mandelbrot 集合 Mandelbrot 集合とは,複素数平面上において,次の漸化式 𝑧 𝑛+1 = 𝑧 𝑛 2 +𝑐 𝑧 0 =0 𝑧 𝑛+1 = 𝑧 𝑛 2 +𝑐 𝑧 0 =0  によって定まる数列 {𝑧 𝑛 } が,𝑛→∞ のときに発散しないような複素数 𝑐 全体がつくる集合である. 今回は漸化式にしたがって 𝑧 255 までを求めるなかで,絶対値が 2 を   超えた時点で発散,1度も超えなければ収束と判定した. 発散の速さ(今回は発散したときの 𝑛 の値)に応じて 256 階調の色を   つけて描写した. 範囲は −1.5≤Re 𝑧 ≤0.5, −1.0≤Im 𝑧 ≤1.0  とした.

Mandelbrot 集合 実装例 Size(128) × Size(128) の 要素を持つ配列 L をつくる. <MAP> 各要素の番号を Size で割った商を x ,余りを y とする.これを複素数の実部,虚部と考えて漸 化式に代入し,はじめて絶対値が 2 を超えるときの添字 n を求める.超えなければ n = 255 とする.こ の n に対し,255 – n を返す. L = [0, 1,2,3, … , 16384 - 1] → x = [0, 0, 0, 0, … , 127], y = [0, 1, 2, 3, … , 127] → [255, 250, 238, 241, … , 0] <REDUCE> 配列の各要素を 128 × 128 の正方形に対応させ,0 ~ 255 で色を決める. 正方形を描画する.

Mandelbrot 集合

参考文献 「ラズベリー・パイ 超入門 改訂第3版」 ソーテック社 「Hadoop 第3版」 オライリー・ジャパン 「ラズベリー・パイ 超入門 改訂第3版」 ソーテック社 著 福田和宏 「Hadoop 第3版」 オライリー・ジャパン 著 Tom White, 訳 玉川竜司,兼田聖士 「はじめてのSpark」 オライリー・ジャパン 著 Holden Karau, Andy Konwinski, Patrick Wendell, Matei Zaharia,  訳 玉川竜司 Hadoop 及び Spark サポートページ http://Hadoop.apache.org/ , http://spark.apache.org/ Raspberry Pi 上でHadoopクラスタを構成する / Raspberry Pi 2でApache Spark環境構築 http://make-muda.weblike.jp/2015/10/3197/ , http://make-muda.weblike.jp/2015/05/2767/ INTRODUCTION TO PROGRAMMING IN JAVA : Mandelbrot.java from §3.2 http://Introcs.cs.Princeton.edu/java/32class/Mandelbrot.java.html/