#6 性能向上、ブレイクスルー、集中と分散 Yutaka Yasuda.

Slides:



Advertisements
Similar presentations
授業展開#12 コンピュータの扱いにくい問 題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣 を比較するためには、標準的なコン ピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモ デルとして、チューリングマシンを考え、
Advertisements

情報技術基礎 論理素子による進歩. 計算機の歴史 計算機の歴史 1649 パスカル 歯車式加減算機 1839 バベッジ 階差機関 1890 ホレリス パンチカードシス テム ※歯車式の計算機は 1960 年(昭和30年)代ま で 便利な計算機として実際に使われてい た.
FPGA 株式会社アプライド・マーケティング 大越 章司
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
2014年4月11日 電子制御設計製図Ⅰ 第二回 担当教員: 北川輝彦.
第3回 並列計算機のアーキテクチャと 並列処理の実際
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
CPUについて HN:セシル.
2000年 3月 10日 日本電信電話株式会社 三菱電機株式会社
北海道大学 理学院 宇宙理学専攻 惑星物理学研究室 M 2 齊藤 大晶
SOIピクセル検出器用 Digital Libraryの開発
計算機システムⅡ 主記憶装置とALU,レジスタの制御
ネットワーク技術の普及による 費用配分の変化
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
テープ(メモリ)と状態で何をするか決める
IBMの歴史 発明 System 360 (1964) Hard Disk (1956) DRAM
コンピュータの主役はCPU(Central Processing Unit)
  第1章 コンピュータの歴史と構成  コンピュータ(computer)は人間の命令(プログラム)に従って,複雑な計算やいろいろなデータ処理ができる機械(道具)である.主な特徴は次の3点である. ●高速計算:計算は極めて速い.1秒間に数百億以上の計算ができる.   ●正確計算:人間の命令に従って,間違えることなく正しく計算できる. 
#12 Grid Computing Yutaka Yasuda.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
ARM 株式会社アプライド・マーケティング 大越 章司
首都大学東京 都市教養学部数理科学コース 関谷博之
情報処理の概念 #14 次代へ向けて / 2002 (秋) 一般教育研究センター 安田豊.
コンピュータ概論B ー ソフトウェアを中心に ー #03 プログラムの実行形態
コンピュータ概論B ー ソフトウェアを中心に ー #03 プログラムの実行形態
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
パソコンの歴史 ~1970年 1970年代 1980年代 1990年~ ▲1946 ENIAC(世界最初の計算機、1,900加算/秒, 18,000素子) ▲1947 UNIVACⅠ(最初の商用計算機) ▲1964 IBM System/360(5.1MHz, 1MB, 2億円) ▲1974 インテル8080(8.
ポストムーア時代とは 予想される課題 CMOSにおけるプロセス微細化 => 計算性能向上のサ イクルが止まる
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
専門演習Ⅰ 国際経済学部 国際産業情報学科 2年 石川 愛
Yutaka Yasuda, 2004 spring term
組み込み向けCPU 小型デバイスに搭載されるCPU 特徴 携帯電話,デジタルカメラ,PDA,センサデバイスなど 小型 低消費電力 多機能
イーサネットについて 飯塚務.
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
第6回 よく使われる組合せ回路 瀬戸 重要な組合せ回路を理解し、設計できるようにする 7セグディスプレイ用デコーダ 加算回路・減算回路
OpenMPハードウェア動作合成システムの検証(Ⅰ)
大阪市立大学 学術情報総合センター 大西克実
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
高速剰余算アルゴリズムとそのハードウェア実装についての研究
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
1.コンピュータと情報処理 p.18 第1章第1節 2.コンピュータの動作のしくみ CPUと論理回路
コンピュータの歴史 〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀
リモートホストの異常を検知するための GPUとの直接通信機構
コンピュータの歴史 ~1945年からの実用過程~ メンバー:秋田梨紗 (1E16M001-1) 梅山桃香 (1E16M010-2)
コンピュータ概論B ー ソフトウェアを中心に ー #02 システムソフトウェアと アプリケーションソフトウェア
FPGA 株式会社アプライド・マーケティング 大越 章司
ARM 株式会社アプライド・マーケティング 大越 章司
最新 IT トレンド ARM.
ARM.
コンピュータの歴史 1E16M009-1 梅津拓巳 1E16M045-4 田中新汰 1E16M035-0 柴田海斗
MIRS システム解説 (超音波センサボードとシリアル通信)
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
総合講義B:インターネット社会の安全性 第7回 情報システムの信頼性
計算機アーキテクチャ1 (計算機構成論(再)) 第一回 計算機の歴史、基本構成、動作原理
パイプラインとは何か? マイクロプロセッサ(MPU)の高速化手法の一つのこと。
CPU冷却用素子の開発 理工学研究科環境制御工学専攻 長谷川 靖洋
FPGA 株式会社アプライド・マーケティング 大越 章司
情報コミュニケーション入門e 第9回 Part2 ハードウェアとソフトウェア
情報コミュニケーション入門b 第2回 Part1 ハードウェアとソフトウェア
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
コンピュータの五大要素 入力装置 データ(プログラム)を取り込む 出力装置 処理結果のデータを外部に取り出す
ARM 株式会社アプライド・マーケティング 大越 章司
情報コミュニケーション入門b 第2回 Part1 ハードウェアとソフトウェア
情報論理工学 研究室 第1回:並列とは.
ARM 株式会社アプライド・マーケティング 大越 章司
情報コミュニケーション入門e 第9回 Part2 ハードウェアとソフトウェア
並列処理プロセッサへの 実数演算機構の開発
Presentation transcript:

#6 性能向上、ブレイクスルー、集中と分散 Yutaka Yasuda

超並列アプローチ IBM BlueGene/L SGI Altix PowerPC 440 / 0.7GHz を 32768 個搭載 Rochester, US SGI Altix Itanium 2 / 1.5GHz を 10240 個搭載 512 CPU のシステムを 20 セット接続 Linux OS NASA AMES, US NEC Earth Simulator (2002/6~2004/6 winner) NEC 製プロセッサ / 500MHz を 5120 個搭載 8 CPU のシステムを 640 セット接続 横浜

地球シミュレータ http://www.es.jamstec.go.jp/esc/jp/outline.html 超並列アプローチ 8台のスパコンからなる計算ノードを高速ネットで640台接続 5120のスーパーコンピュータで並列計算 何故今このようなスタイルの計算機が? (極端に大きな処理能力を実現する手法としてこのスタイルを採った理由は?)

繰り返し処理 (一般的) コンピュータの特長 役割分担の存在 繰り返し処理の例 単純な装置で複雑な処理を可能にする ハードウェアは単純なもので実現 複雑さはソフトウェアによって実現 複雑な処理は単純な処理の組み合わせや繰り返しに分解 これがコンピュータのハードウェアに高速性が求められる理由 繰り返し処理の例 二進での多数桁の足し算 (一般的) コンピュータの特長 単純な処理しかできない装置を組み合わせ、繰り返して処理することで複雑な処理をこなす 前提:「複雑な処理」は単純な処理に分解可能である 役割分担の存在 ハードウェアは単純なもので実現 複雑さはソフトウェアによって実現 複雑な処理は単純な処理の組み合わせや繰り返しに分解 これがコンピュータのハードウェアに高速性が求められる理由 繰り返し処理の例 二進での多数桁の足し算

二進での筆算 筆算は「一桁演算の繰り返し」へ単純化する例 10進で3桁の足し算を分解 2進では9桁、足し算も9回 10進1桁の足し算を三回(繰り上がり込み) 2進では9桁、足し算も9回

二進での計算 このような方法(筆算)で処理を行なう場合、 1. 一つの素子を9回使い回して処理する 2. 素子を9つ並べて一回で処理するか のいずれかとなる。 実際のコンピュータ 4bit CPU では (世界で初めての CPU Intel 4004, 1971) 4桁単位で処理 回路を 4 並列で用意して実現 4桁以上の演算は繰り返しで処理 その後 8bit, 16bit, 32bit, 64bit が処理能力のために開発 現在市場での高性能CPUは 64bit CPU が主流 64bit で足りない演算は複数回繰り返す このような方法(筆算)で処理を行なう場合、 1. 一つの素子を9回使い回して処理する 2. 素子を9つ並べて一回で処理するか のいずれかとなる。

CPU回路の拡大 64bit CPUなので、同一回路が64 並列で並ぶ。 目に映る回路は 16 並列なので、恐らくこの見えている構造の中に 4 つずつ何かの回路ができていると思われる。

性能 (処理速度) は何で決まるか ビット並列度を高める 繰り返し周期をより短く ともに技術的困難さと価格の問題に直結 性能=回路の複雑さに直結 繰り返し周期をより短く 性能=短い繰り返し周期=高速な回路に直結 Intel 4004 (1971)の108KHzから 3.8GHz 程度に より細く短い配線:電気の伝わる速度 より小さな回路:素子が機能する最短時間 ともに技術的困難さと価格の問題に直結 ビット並列度を高める 性能=回路の複雑さに直結 繰り返し周期をより短く 性能=短い繰り返し周期=高速な回路に直結 Intel 4004 (1971)の108KHzから Pentium 4 で 3.8GHz 程度に 3GHz では光は 10cm しか進まない(光速は約 30 万キロ) より細く短い配線:電気の伝わる速度 より小さな回路:素子が機能する最短時間 ともに技術的困難さと価格の問題に直結

マイクロプロセッサ いわゆるCPU 参考 半導体の微細化、集積化による高速化技術を追及 他の高速化手法を大きく抜いて成功 チップ価格=開発費用 / 生産数 共通品、量販品としての PC の成功 最高速製品が最廉価品であるという矛盾 参考 「マイクロプロセッサのテクノロジ」Intel http://www.intel.co.jp/jp/home/technology/processor/index.htm いわゆるCPU 半導体の微細化、集積化による高速化技術を追及 他の高速化手法を大きく抜いて成功  1971 の 4004 と 2002.11 の Pentium4 では  動作周波数は約2万8000倍、トランジスタ数は約2万4000倍 チップ価格=開発費用 / 生産数 共通品、量販品としての PC の成功 最高速製品が最廉価品であるという矛盾

Yutaka Yasuda, 1999, RIEB of Kobe University

さらなる高速化と限界 半導体技術における微細化と高速化 熱問題 Moore,1965 : 半導体回路の集積度は18-24ヶ月ごとに倍になる 現行は 90nm 〜 0.13μm 程度の配線幅 静電気ですら簡単に配線を壊してしまう 熱問題 過去において、微細化と高速化は同義だった 熱の集中:あの面積に 100W 程度集めると? リーク電流による熱問題の増大

既存技術の限界を別の視点から 打ち破る動きが必要な時がある ブレイクスルー 既存技術の限界を別の視点から 打ち破る動きが必要な時がある

並列分散・グリッド・P2P 並列処理 グリッド P2P 単体プロセッサの速度に依存するモデルからのシフト 複数のプロセッサを同時に利用するモデル デュアルコア、SMP(ex. Cell) 超並列(ネットワーク接続) グリッド 大量のコンピュータを集めて大きな計算資源を 「汎用計算資源」を構築できる可能性 P2P 互いに対等なコンピュータを接続して協調動作 サーバ・クライアントとは異なる新しいモデル 並列処理 単体プロセッサ依存というモデルからのシフト 複数のプロセッサを同時に利用するモデル グリッド 大量のコンピュータを集めて大きな計算資源を 「汎用計算資源」を構築できる可能性 P2P 互いに対等なコンピュータを接続して協調動作 サーバ・クライアントとは異なる新しいモデル 例: 並列=地球シミュレータ グリッド=SETI@Home など 世界中に分散した各家庭の PC の計算力をインターネットで集める Napstar, Winny などで評判が良くないが、本来は非常に希望のあるモデル

集中と分散、技術のバランス 集積回路への技術集中 それを補う処理能力向上の手法 素子・デバイス技術のブレイクスルー 歴史 従来手法での高速化の限界 それを補う処理能力向上の手法 並列処理・分散処理 (実は両者は同じもの) 素子・デバイス技術のブレイクスルー 光スイッチ、Millipede、etc.. 歴史 計算機が実用化されて50年 そのダイナミズムを感じる 次の判断をその波の上で行う感覚が求められている