情報論理工学 研究室 第1回:並列とは.

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

授業展開#12 コンピュータの扱いにくい問 題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣 を比較するためには、標準的なコン ピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモ デルとして、チューリングマシンを考え、
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
ユーザーイメージ収集 インターフェイスの開発
早稲田大学大学院 理工学研究科情報科学専攻 後藤研究室 修士 焦 江霞
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム
第3回 並列計算機のアーキテクチャと 並列処理の実際
第2回 プロセス管理 ジョブ、プロセスとは? プロセスの状態遷移 プロセス制御ブロック スケジューリング.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
キャッシュ付PRAM上の 並列クィックソートと 並列マージソート
Chapter11-4(前半) 加藤健.
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
極小集合被覆を列挙する 実用的高速アルゴリズム
離散システム特論 整列(sorting)アルゴリズム 2.
ラベル付き区間グラフを列挙するBDDとその応用
遺伝的アルゴリズム  新川 大貴.
算法数理工学 第1回 定兼 邦彦.
AllReduce アルゴリズムによる QR 分解の精度について
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
コンピュータの主役はCPU(Central Processing Unit)
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
クロストーク成分の相互相関に 着目した音場再生システム
Ibaraki Univ. Dept of Electrical & Electronic Eng.
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
情報科学科 ネットワークシステムコース 西関研究室.
医療支援診断のためのコンピュータ分散システムの検討
大阪教育大学大学院教育学研究科 総合基礎科学専攻 中窪 仁
「システム構成要素」 (C)Copyright,Toshiomi KOBAYASHI,
最短路問題のための LMS(Levelwise Mesh Sparsification)
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
画像情報を用いた交通流計測 情報工学科 藤吉研究室 EP02076 都築勇司
 データベースによる並列処理 情報論理工学研究室  三宅健太.
スパコンとJLDG HEPの計算環境 HEPnet-J
Yutaka Yasuda, 2004 spring term
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
シミュレーション論 Ⅱ 第15回 まとめ.
大阪市立大学 学術情報総合センター 大西克実
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
高速剰余算アルゴリズムとそのハードウェア実装についての研究
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
Bottom-UpとTop-Down アプローチの統合による 単眼画像からの人体3次元姿勢推定
#6 性能向上、ブレイクスルー、集中と分散 Yutaka Yasuda.
コンピュータの歴史 〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀
リモートホストの異常を検知するための GPUとの直接通信機構
ソートアルゴリズムの種類 選択ソート (selection sort) バブルソート (bubble sort)
情報工学概論 (アルゴリズムとデータ構造)
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化
GPSと相対論 金野 幸吉.
スーパーコンピュータ「京」 理化学研究所 計算科学研究センター
ディジタル信号処理 Digital Signal Processing
情報とコンピュータ 静岡大学工学部 安藤和敏
情報論理工学 研究室 研究テーマ 並列アルゴリズム.
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
シミュレーション論Ⅰ 第14回 シミュレーションの分析と検討.
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
BSPモデルを用いた 並列計算の有用性の検証
理工学部情報学科 情報論理工学研究室 延山 周平
ソートのプログラムの流れ 配列の中身を小さい順に並び替える a[1],a[2],…a[n]の値を順に出力する
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
分散メモリ型並列計算機上での行列演算の並列化
外れ値検出 Outlier Detection 外れサンプル検出 Outlier Sample Detection
Presentation transcript:

情報論理工学 研究室 第1回:並列とは

並列計算機(Parallel Computer) 複数のプロセッサを持つ計算機 Cray T3E-1200E[2] QCDOC[1] [1]   Brookhaven National Laboratory, https://www.bnl.gov/world/ [2] 超並列計算機 (Cray T3E-1200E), 北陸先端科学技術大学院大学,    http://www.jaist.ac.jp/iscenter-new/mpc/old-machines/t3e/

スーパーコンピュータ「京」 汎用京速計算機 (2012年7月完成) 理化学研究所と富士通が共同開発 2011年6月Top500 1位, CPU数: 68,544, 8.162 PFlops 2011年11月Top5001位, CPU数: 88,128, 10.51 PFlops スーパーコンピュータ「京」[1] [1] スーパーコンピュータ「京」, 富士通, http://www.fujitsu.com/jp/about/businesspolicy/tech/k/

並列アルゴリズムとは 並列アルゴリズム(Parallel Algorithm) 並列化の利点 並列計算機で問題を解くためのアルゴリズム 多数の計算機を使って高速に解く 並列化の利点 計算時間の短縮 解ける問題のサイズが大きくなる 計算機価格の低下で現実に並列化可能に

並列計算の例 例: 2+3+5+7+1+8+5+4 プロセッサ4台 時間 35 時刻3 18 17 時刻2 プロセッサ2 プロセッサ1 プロセッサ3 プロセッサ4 5 12 9 時刻1 4 3 5 7 1 8 2 時刻0

並列計算の例 足し算と同様の処理が可能なのは? 平均値 (4.375) 最大値 (8) 中央値 (4) 入力: 2, 3, 5, 7, 1, 8, 5, 4 平均値 (4.375) 最大値 (8) 中央値 (4) 時間 ? 時刻3 ? 時刻2 ? 時刻1 4 3 5 7 1 8 2 時刻0

処理の高速化 様々な分野で複雑な問題を解く必要がある ⇒処理の高速化が必要 高速化のための手法 計算機高速化 アルゴリズム改良 並列化

計算機高速化の壁 原子の大きさ: 数Å~数十Å = 10-8~10-7m 光速: 30万km/s = 3.0×107m 原子1個を光が通過する時間: 10-15 秒 仮定: 原子100個で素子が作れた ⇒1秒にできる計算の上限: 1014個 = 100THz (現在の計算機: 1GHz~10GHz) あと1万倍くらいしか速くならない

アルゴリズム改良 劇的な高速化が可能 10 100 1000 1万 10万 n log n 1秒 32秒 12分 3時間 3日 n2 例:ソーティング 挿入法: n2 クィックソート: n log n 10 100 1000 1万 10万 n log n 1秒 32秒 12分 3時間 3日 n2 100秒 10日 3年 2n 1019年 10290年

アルゴリズム改良の壁 計算量には下界が存在 並列アルゴリズムならばより低い計算量に 計算量 例: ソーティングの下界 : n log n クィックソートの計算量: n log n ⇒ソーティングはこれ以上の改良は不可能 例: ナップサック問題の下界: おそらく 2n (未解決) 並列アルゴリズムならばより低い計算量に 計算量 insertion s., bubble s., selection s. n2 n1.25 Shell’s s. n log n quick s., merge s., heap s. 下界 不可能 n

並列化の対象 何を並列化するか? どんな処理でも速くできた方がいい 対象は何でもOK! …とは言え費用対効果は考慮する必要あり

並列化の欠点 並列化の欠点 並列計算機が必要 並列アルゴリズムが必要 並列化できるとは限らない 高速化できるとは限らない 並列計算機は高価 並列性を考えてアルゴリズムデザインする必要あり 並列化できるとは限らない 並列化しにくい問題もある 高速化できるとは限らない 並列化しても速度の上限はある

並列化の対象 並列化するべき対象 処理速度が必要 複雑な計算 費用をかけてもする意義のある処理 リアルタイム処理が必要な場合 期限が設けられている場合 複雑な計算 膨大なデータに対する正確な計算が必要な場合 費用をかけてもする意義のある処理 科学的意義や技術的意義のある重要な処理

宿題:スーパーコンピュータ「京」 スーパーコンピュータ「京」について調査 計算速度は? プロセッサは何台? いつ世界一になった? 現在世界何位? どこが開発した? どこにある? etc.