InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供 東京大学 近山・田浦研究室 東京工業大学 松岡研究室 東京工業大学 合田研究室 クラスタ環境の概要 研究に使える「共有資源」を提供 メンバ間での交流促進 成果の共有 大きなスケールでの、強力な実験 広域分散環境の構築 今後5年間 20~30拠点程度 50-100 CPU コア/拠点 運用中 東京(東大本郷キャンパス)に70ノード 千葉(NII西千葉分館)に70ノード 他の資源との連携によってさらなる拡大計画 TSUBAME 東大情報基盤センター 運用ポリシー i-explosionメンバは誰でも利用可能 全ノードほぼ同一の構成とする 責任者は機能ごとに分担 各機能の責任者は、全ての拠点についてその管理を行う 各機能ごとに、研究分野に近い責任者を選ぶ (モニタリング・数値演算ライブラリなど) 環境の均一性が保たれる 新しい研究成果が素早くフィードバックされる 現在提供されている環境 一拠点70台の構成 マスターノード (NFS/NIS) Lucieノード (ゲートウェイ・コンパイル・再インストール用) 計算ノード 提供されているツール モニタリング Ganglia VGXP ミドルウェア GXP : 並列シェル MC-MPI : グリッド対応のMPI はこだて 東京 京都 広島 ▲VGXPによるクラスタのモニタリング アカウント管理 Aさん、 Bさん、 Cさん… モニタリング システム Aさん 数値演算 ライブラリ B研究室 ▲Gangliaによる一ヶ月間の平均ロード 拠点ごとではなく、機能ごとに責任者を定める
▼ アカウント申請は以下のページから行えます ▼ アカウント管理 アカウント管理を自動化 ユーザー情報をデータベースで管理 管理者画面を用いて、データベースの情報とNISサーバの情報を同期 アカウント申請の流れ 申請はWebフォームを用いて行う ログイン名 所属 SSH公開鍵 クラスタの紹介者 ☆アカウントの作成には、アカウント管理者からの紹介が必要 アカウント管理者 アカウント作成権限を持つ 管理者画面で申請を承認すると、全拠点でアカウントが作成される アカウント管理は複数人で分担 多人数のアカウントを作成する場合(研究室単位など)は、その中の一人が管理権限を得て、各人のアカウントを作成する ▼ 管理者画面 ▼ アカウント申請画面 アカウント作成の流れ アカウント希望者 アカウント管理者 アカウント希望者 クラスタ環境を紹介 Webフォームで登録申請 管理者画面で アカウントを承認 ユーザMLへ登録 intrigger-users@logos.ic.i.u-tokyo.ac.jp ▼ アカウント申請は以下のページから行えます ▼ https://www.logos.ic.i.u-tokyo.ac.jp/intrigger/registration/ Lucieによる環境構築 再インストール時に ルートファイルシステムを NFSマウント Lucie☆を用いた環境の自動構築 (☆FAI(Debianの自動インストーラ)の拡張・東工大 松岡研で開発) 容易にOSの(再)インストールができる ネットワーク越しにローカルディスクにインストール 通常はローカルディスクから起動 OSと同時にインストールするパッケージを容易に選択できる Lucie サーバ ファイル サーバ 通常起動時に ホームディレクトリを NFSマウント 計算ノード ▲各拠点でのマシン構成 再インストール後の 再起動 NFSROOTでDebianの インストーラが起動 ローカルディスクに Debianをインストール ローカルディスクから Debianが起動 通常のDebianマシンとして、 計算ノードに利用 通常の 再起動 再インストールの ための再起動 ▲Lucieでの計算ノードの状態遷移図