並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分

並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分
１時間　＝1/10⇒　６分８時間　＝1/10⇒　４８分「ちょっと計算して試す」が可能になる

背景マルチコアのCPUが入手可能になったＰＣ教室に並んだＰＣを使える
Intel Xeon 　４コア⇒近々８コアに AMD　８コアにＰＣ教室に並んだＰＣを使える夜や休暇期間などは空いている個々のＰＣは「並み」でも、９０台×４教室ソフト環境（プラットフォーム・コンパイラ）も　徐々に整備されてきている

先行研究～山のようにある２つのモデル～メモリ共有vsメッセージプログラムもデータも共有できる別CPUへのデータ受け渡し早い
プログラムもデータも共有しない別CPUへのデータ受け渡し遅い多CPUも可（数百～数千）

先行研究～山のようにあるＣＰＵ×Ｎ台でも、Ｎ倍早くはならない自明な問題もある～それを対象にしたい
（本質的に）どうしても直列部分がある並列化の腕が悪いと、直列部分が増えるＮ倍に近づける努力は大変自動並列化は未だ課題が多い今までは並列化するよりCPU高速化が安かった自明な問題もある　～　それを対象にしたい

オープンな並列インタフェース？メモリ共有型 ⇒ OpenMP メッセージパシング型 ⇒ MPICH2
ライブラリが提供される、カーネルはLinux組み込み済み自動コンパイラもいくつか存在（Intelなど）メッセージパシング型　⇒　MPICH2 TCP/IPを使う　⇒　どうしてもオーバーヘッド大ライブラリが提供される自動は見かけない（無理？）

最初の実験環境ＨＰのサーバー：Xeon 4コア×２ＣＰＵで　８並列が可能なはずＬｉｎｕｘをインストールし利用可能単純な並列度テスト

最初の実験環境（続） for (i=0; i<255; i++) bufin[i]='\0'; x = 0.0;
for (i=0; i<maxi; i++) { x = x + sin( (double) i/maxi ); } read(0, bufin, 256); printf("%s", strcat(bufin, "a")); fprintf(stderr, "%s", strcat(bufin, "a"));

最初の実験環境（結果） user system elapsed PCPU
プロセス１つ：　　 9.720u 0.028s 0: % 0+0k 0+0io 0pf+0w プロセス４つ：　　38.814u 0.036s 0: % 0+0k 0+0io 0pf+0w プロセス８つ：　　77.476u 0.020s 0: % 0+0k 0+0io 0pf+0w プロセス９つ：　　87.301u 0.040s 0: % 0+0k 0+0io 0pf+0w プロセス１２：　　 u 0.028s 0: % 0+0k 0+0io 0pf+0w プロセス１６：　　 u 0.044s 0: % 0+0k 0+0io 0pf+0w

並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分

Similar presentations

Presentation on theme: "並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

並列処理実用？ 並列処理により、 現在時間がかかって実用しづらい処理を、 早くして実用にする １時間 ＝1/10⇒ ６分

Similar presentations

Presentation on theme: "並列処理実用？ 並列処理により、 現在時間がかかって実用しづらい処理を、 早くして実用にする １時間 ＝1/10⇒ ６分"— Presentation transcript:

Similar presentations

About project

フィードバック

並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分

Presentation on theme: "並列処理実用？並列処理により、現在時間がかかって実用しづらい処理を、早くして実用にする１時間＝1/10⇒ ６分"— Presentation transcript: