スーパーコンの概要 日本物理学会(首都大学) 2007年3月25日 大阪大学核物理研究センター 計算機室  外川浩章.

Slides:



Advertisements
Similar presentations
InTriggerの概要・利用ルール 東京大学 近山・田浦研究室 高橋 慧 kay_at_logos.ic.i.u-tokyo.ac.jp.
Advertisements

Confluence インストールに必 要な 知識と手順 リックソフト株式会社 2010 年 12 月.
Windows HPC Server を使ってみる
The Enterprise-class Monitoring Solution for Everyone
理学院 宇宙理学専攻 惑星物理学研究室 修士 2 年 徳永 義哉
UNIX利用法.
安全なログオン手順 2004/08/26 Port139 伊原 秀明.
UNIX利用法 情報ネットワーク特論資料.
第2回 プロセス管理 ジョブ、プロセスとは? プロセスの状態遷移 プロセス制御ブロック スケジューリング.
ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送
揮発性情報 2003/05/25 伊原 秀明(Port139).
計算機工学III オペレーティングシステム #14 ファイル: より進んだファイルシステム 2006/07/21 津邑 公暁
仮想テープライブラリ クラウド環境で利用できるテープバックアップの代替サービス 簡単な図 (網羅性より象徴性)
Linux インストール      のための基礎知識 物理実験 I 情報実験第9回 2003/12/12 中神 雄一.
物理実験 I 情報実験第9回 2004/12/10 小西 丈予 2003/12/12 中神 雄一
Windows Azure 仮想マシン 入門.
COPPER/FINESSE System構築
複数のコンピュータ(ノード)を一群にまとめて、信頼性や処理性能の向上を実現するシステム
報告 (2006/9/6) 高橋 慧.
斎藤卓也 中村純 広島大学・情報メディア教育研究センター
学校のデジタル仕事術 教務主任の校務IT化とその体制づくり
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
OSが乗っ取られた場合にも機能するファイルアクセス制御システム
Windows Server 2008 フェールオーバー クラスタ におけるディスク障害の対処方法
ネストした仮想化を用いた VMの安全な帯域外リモート管理
スパコンとJLDG HEPの計算環境 HEPnet-J
CMCスーパーコンピューティング環境 現状と将来
オペレーティングシステムとは オペレーティングシステム 第3回.
2016年度秋期 成果発表会 2016年11月25日 大阪開発センター 技術一部 畑中 龍樹.
BGALOG関係のリソースモニターの見方 P1 (概要)
マイクロソフト株式会社 SAP/Microsoft コンピテンスセンター
過負荷時のWebアプリケーションの 性能劣化を改善する Page-level Queue Scheduling
計算物理学基礎 第1回 UNIXの基礎 C言語の基本.
建設・建築現場のデータもクラウドへ自動バックアップ!
アトラス実験における データ解析用グリッド環境の構築
九州大学キャンパスクラウド 利用法 情報ネットワーク特論 講義資料.
情報の科学的 な理解(2) 情報科教育法 8回目 2005/6/4 太田 剛.
共生第二 解析&ファイルサーバー taro , pochi , hanako ,tama のご紹介
杉山耕一朗(北大理) 2009/02/06 epnetfan
3-10. MySQLシステムの管理  2004年6月10日  大北高広                01T6010F.
製品情報 Windows Server 2003のサポート終了をむかえ、ファイルサーバーの入れ替えを検討されていらっしゃる方も多いのではないでしょうか?既存のファイルサーバーをいきなりクラウド化するとインターネット回線の影響で、エクセルやワードのようなサイズの小さなファイルでさえ、開くまでに時間がかかってしまうことがあります。
学校におけるネットワークの運用と技術 テクニック編.
「計算科学による素粒子・原子核・宇宙の融合」
他のプロセスに あたえる影響が少ない 実行時ミラーリングシステム
E16実験へのDAQ-Middlewareの応用
RD セッション ホストにおける RDC クライアントの シングル サインオン (SSO) について
gate-toroku-system のしくみ
【ユーザー様向け資料 1.0】 2017年3月 株式会社オレガ.
~ 第5回 認証のためのプロキシー Web Application Proxy
JXTA Shell (1) P2P特論 (ソフトウェア特論) 第4回 /
<前提条件> iSeriesSite ワークフロー 実行環境 構成イメージ
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
宇宙科学統合解析環境の構築とAstro-E2解析支援
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
スーパーコンピュータ「京」 理化学研究所 計算科学研究センター
スーパーコンピュータ講習会 全体構成 ファイアーウオール経由での使用方法 ディスクの構成 バッチキュー 運用、その他.
認証サーバーとチャットサーバーの構築(1)
スーパーコンピュータ講習会 全体構成 ファイアーウオール経由での使用方法 ディスクの構成 バッチキュー 運用、その他.
【ユーザー様向け資料 1.0】 2019年2月 株式会社オレガ.
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
gate登録システム: 設計ポリシーから使い方まで
広島大学におけるHEPnet-J 利用状況
iSeries Site 人事・給与C/S版のハードウェア・ソフトウェア要件
物理的側面を表現する図 石原研 古賀浩之.
情報の授業 アプリ等を活用した勉強方法の改善(計画) ・R-PDCAサイクル ・アプリを活用した勉強方法の改善 計画書
SYSVOL複製 を DFS レプリケーションに移行する
gate-toroku-system のしくみ
宇宙線研究所電子計算機システム 全体構成図
コンピュータの機能 第2章.
<前提条件> C/S Bridge(C/S版)
Presentation transcript:

スーパーコンの概要 日本物理学会(首都大学) 2007年3月25日 大阪大学核物理研究センター 計算機室  外川浩章

× スーパーコンの概要 Phase I (2007.1~) 8 nodes (CMC) = 2.0 TF 6 nodes (ILE)    = 1.5 TF 計 5 TF 6 nodes (RCNP) = 1.5TF × 32GF 64, 128, 256GB Note 64GB×4nodes, 128GB×8nodes, 256GB×8nodes 128 TB (CMC suita) 64 TB (ILE) 64 TB (RCNP)

× スーパーコンの概要 Phase II (2008.7~) 100GF 10 nodes (CMC) = 16 TF 1024GB In addition to phase I 100GF 1024GB × 10 nodes (CMC) = 16 TF 768 TB (CMC suita)

×8 ×2 ×4 スーパーコンの構成 Phase I (2007.1~) RCNP and ILE CMC 35GF 256GB 32GF

×8 ×2 ×10 ×4 スーパーコンの構成 Phase II (2008.7~) RCNP and ILE CMC 35GF 256GB

スーパーコンの概要 占有ノードという固定した考え方はなくす が、占有ノードは残せる メモリの速度と容量が異なるノードの混在 Phase2ではCPU速度が異なるノードも混在 システム全体としてのスループットを追及する CMCユーザーのジョブがRCNPやILEでも流れる フェアシェアによる適切な資源割当て 利用負担金は変更なし。レンタル期間を通じての平均化。

×8 スーパーコンの運用 Phase I (2007.1~) (共有2/8) RCNP(ILE) 32GF 128GB 64GB CMC占有 CMC 35GF 256GB ×8 (共有2/8)

×8 ×10 スーパーコンの運用(案) Phase II (2008.7~) (共有2/8) (共有2.5/10) RCNP(ILE) 32GF 128GB 64GB RCNP(ILE)占有 CMC占有 CMC 35GF 256GB ×8 (共有2/8) 100GF 1024GB ×10 (共有2.5/10)

スーパーコンの運用 Phase I (2007.1~) RCNP site CMC site ILE site RCNP nodes CMC nodes (2 nodes for RCNP) ILE nodes 32GF 64GB 32GF 64GB 35GF 256GB 35GF 256GB 32GF 64GB 32GF 64GB 32GF 128GB 32GF 128GB 35GF 256GB 35GF 256GB 32GF 128GB 32GF 128GB 32GF 128GB 32GF 128GB 35GF 256GB 35GF 256GB 32GF 128GB 32GF 128GB 35GF 256GB 35GF 256GB

ネットワーク構成 fss Gfirm fss SX8 FW SX8 SX8 miho NAS NAS st1,2 FC-SW FC-SW Super SINET fss Gfirm fss SX8 DMZ-SC FW SX8 SX8 miho その他 Jumbo SERVER NAS NAS st1,2 FC-SW FC-SW FC-SW 96TB 64TB 200TB

ディスクの運用 fs at SUPER /sc/rcnp/home /sc/rcnp/work /sc/rcnp/short /sc/rcnp/data /sc/rcnp/data5 fs at IBM /home.super /work.super /short.super /data.super /data5.super Usage home directory permanent file temporary file Size 4 TB 52 TB 42 TB 16 TB Quota 100 GB/user none Comment snapshot 3センター共用

ディスクの運用 SX-8, etc miho, etc Other SuperSINET Site FC nfs nfs FC rsync NAS ST STS FC FC FC Home Work Short DataX Mirror

キューの運用 基本的には新しいジョブ管理システム(JM)に任せる 投入ジョブクラスは「sx-rcnp」の1つだけ CMCノードへの投入は別 CPU数、メモリ量、経過時間を指定してジョブを投入 後はJMが「実行予定表」にジョブを貼り付けて「予約」する。 一度予約されると、その実行開始が遅れる事はない システム障害等の不測の事態が発生した場合は除く。 あるジョブを、他の予約を破棄して優先的に実行する機能もある。 リソースの要求のされ方により、予約表には隙間ができてしまうことがある。後から投入されたジョブがこの隙間に入る場合、そのジョブでそこを埋める。(バックフィル機能) この事で既に予約されているジョブが遅れる事はない事に注意。 使用実績を反映してジョブの優先度を決定する。(フェアシェア機能)

キューの運用 RCNP sx-rcnp@rcnp R4D@rcnp CMC SXF@cmc SXL@cmc DBG@cmc LSP@cmc qsubして1分待つ。

予約状況の表示 CMCノード http://www.hpc.cmc.osaka-u.ac.jp/j/service/sx_jobjyoho.html RCNPノード https://www.hpc.cmc.osaka-u.ac.jp/manual/cis-rcnp.html

CPUの割当て sx803 64 GB sx810 128 GB sx811 128 GB 会話型 会話型 batch batch DEBUG 会話型 sx803 64 GB batch batch batch batch batch batch batch batch sx810 会話型 128 GB batch batch batch batch batch batch batch batch sx811 128 GB

ログインサーバーとフロントエンド login.hpc.cmc.osaka-u.ac.jp login.rcnp.osaka-u.ac.jp fronta frontb frontc frontd miho sx-8 会話型 sx803 会話型 sx810 会話型

ファイル転送サーバー ftp.hpc.cmc.osaka-u.ac.jp ftp1.rcnp.osaka-u.ac.jp home work short data data5 home IBM

パスワードの変更について CMCの方針で、NIS系のコマンドは使用禁止にする。 unixのコマンドでパスワードを変更する事はできない。 wwwインターフェイスが用意される。(4月2日~)

大規模デバッグジョブの募集について CMCのDDR2の4ノードを数時間予約してデバッグをしてもらう 運用開始直後でユーザーも使い方に悩んでいる 小規模なデバッグでは問題を発見、修正できない場合がある 数人で行なってもらう ユーザー当たりの同時実行数は1とする 経過時間は30分。(大きくして欲しいという声はある) 管理者と常に連絡が取れる状態で行なってもらう