MC-MPI (Multi-Cluster MPI)

Slides:



Advertisements
Similar presentations
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
Advertisements

Global Ring Technologies
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
ファイルキャッシュを考慮したディスク監視のオフロード
TCPコネクションの分割 によるスループットの向上
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
ラベル付き区間グラフを列挙するBDDとその応用
分散コンピューティング環境上の Webリンク収集システムの実装
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
情報爆発A01支援班 マイサーチエンジン開発環境支援グループ 中村聡史, 大島裕明, 田中克己, 喜連川優
報告 (2006/9/6) 高橋 慧.
神奈川大学大学院工学研究科 電気電子情報工学専攻
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
第3章 第2節 ネットワークを活用した 情報の収集・発信 6 情報の多様な提示方法 7 構造を工夫した情報の表現方法 8 ウエブページの公開
Webサイト運営 09fi118 橋倉伶奈 09fi131 本間昂 09fi137 三上早紀.
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
モバイルエージェントの応用 概要 モーバイルエージェントの応用分野 AgentSpaceシステム エージェント移動 応用:ソフトウェアの配信
共同ローカリゼーション フレームワーク 井上 謙次.
PlanetLab における 効率的な近隣サーバ選択法
オンライン説明会に関する調査 上杉裕也.
ノードの情報を動的に反映したオーバレイネットワークの構築
ノードの情報を動的に反映したオーバレイネットワークの構築
ネットワークとノードの情報を利用したオーバレイネットワークの最適化
モバイルP2Pを用いた携帯電話 動画配信手法の提案 第3回
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
過負荷時のWebアプリケーションの 性能劣化を改善する Page-level Queue Scheduling
ICT活用指導力チェックシート(小学校版)
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
ネットワークトポロジーを考慮した効率的なバンド幅推定手法
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
識別子の命名支援を目的とした動詞-目的語関係の辞書構築
グリッド M1 kawai.
トポロジを考慮する データ転送スケジュラー
米山研究室紹介 -システム制御工学研究室-
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
分散環境でのStableな ブロードキャストアルゴリズムの 提案と実装
WWW上の効率的な ハブ探索法の提案と実装
TIME SIGNAL: 集合知を利用した赤信号点灯時間の取得手法
Internet広域分散協調サーチロボット の研究開発
私の立場 OSカーネルを手がけるエンジニア 大阪市立大学 創造都市研究科の学生
進化的計算手法の並列計算機への実装 三木 光範
ソフトウェア設計検証 研究室の紹介 知能情報学部 准教授 新田直也.
類似度を用いた WWW のリンク構造の解析 谷 研究室    栗原 伸行.
Webコミュニティ概念を用いた Webマイニングについての研究 A study on Web Mining Based on Web Communities 清水 洋志.
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
軽量な仮想マシンを用いたIoT機器の安全な監視
情報論理工学 研究室 研究テーマ 並列アルゴリズム.
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
P2P ネットワーク上で 実時間ストリーミングを実現するための 分散制御プロトコルの提案
InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
コーディングパターンの あいまい検索の提案と実装
マイグレーションを支援する分散集合オブジェクト
情報基礎Ⅱ (第1回) 月曜4限 担当:北川 晃.
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
「マイグレーションを支援する分散集合オブジェクト」
自然言語処理2015 Natural Language Processing 2015
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
Webページタイプによるクラスタ リングを用いた検索支援システム
自然言語処理2016 Natural Language Processing 2016
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
一問一答式クイズAQuAsにおける学習支援の方法
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
大規模粒子法による大型クルーズ船の浸水解析
まさ 2003/06/12 卒論その後の進捗 まさ 2003/06/12.
Presentation transcript:

MC-MPI (Multi-Cluster MPI) 近山・田浦研究室 力から知へ,知から力へ 力の情報処理: 大量の計算機を連携させて大規模な計算を高速に行う 並列・分散プログラミング環境, 並列・分散処理,メモリ管理,OS, プログラミング言語処理系 計算を支える根幹となる部分 日本中,世界中に広がった多数の計算機を使い超大規模な計算を高速に,かつ簡単に実現することを目標とする 知の情報処理: 計算機に知的・人間的な情報処理をさせる  コンピュータゲームプレイヤ,音楽情報処理,WWWデータの解析,大規模な 自然言語テキストの解析 人間が「うまく説明できないけれど」実現できていること 人間が発見するには困難な知識を,機械学習などの手法で計算機に学習させる 力と技術が知を産み, その知が新たな力となる 潜在する知識の発見 データマイニング 統計的自然言語処理 グラフ構造解析 大規模な実世界データ へのアクセス Web … Web Crawler crawling Collecter Extracter URL Web page Webクローラ 強いゲームプレイヤ (将棋・麻雀…) パワフルな プログラミング環境 ゲームの理解 探索アルゴリズム 並列計算技術 クラスタ管理技術 機械学習 知識獲得 クラスタ計算機 力の情報処理 接続関係を考慮した通信 トポロジ情報を用いた、高速・効率的な通信 - 用いるノードの接続関係を自動で推定 し,遠いノード同士の通信を極力減らす - 帯域幅を最大限使う  - 無駄な通信を減らす 接続関係の推定 メッセージの往復時間(RTT) の測定だけを用いる 100ノードの推定にかかる時間は20秒程度 動的なプロセスの参加・脱退 プロセスの脱退 プロトコル 適応的な並列計算において, メッセージの喪失やデッド ロックのない、プロセスの 安全な脱退を支援 脱退したい ネットワークトポロジー情報の応用 InTrigger プロジェクト 6拠点514コアが 運用中 - 最終的に20-30拠点1000コア以上 Leaf のノードから 脱退する メッセージが 転送される 残ったノードで 計算続行 深さ優先ブロードキャスト バンド幅を有効に利用するため、互いに干渉しないリンクに沿ってパイプラインを構成してブロードキャストを行う 最適ブロードキャスト  トポロジーとバンド幅の情報をもとに、スループットを最大にするパイプラインを構築する バンド幅の測定  推定したトポロジー情報のエッジごとに利用可能な最大バンド幅を推定する D0 D2 D1 6 10 8 5 転送元 転送先 S 2 4 簡単な方法 Stable Broadcast 3 各ノードが受け取る データ量の合計: 19 データ量の合計: 10 脱退の流れ 同時に複数のプロセスが脱退を希望すると,脱退しないプロセスをRootとしたTreeを構築 Leafのノードから順に脱退 MC-MPI (Multi-Cluster MPI) プロファイリング結果を基に環境・アプリに適応する  ノード間のRTT・ランク間のメッセージ数を数える 局所性を考慮したランク割り当て 低通信オーバヘッドのランク割り当てを行う 二次割り当て問題(QAP)の近似解を求める 局所性を考慮した接続確立 全対全で接続を張らない 近いノード・通信量が多いノードを中心に接続を張る リアルタイムな クラスタ監視・ 可視化システム スケーラブルな管理・監視 利用可能な計算機環境 日本中に分散した多数のクラスタ計算機 1000CPU規模 自動化されたアカウント管理 クラスタ間でアカウント情報を同期 多数の計算機の効率的な利用 多数のノードに対してコマンドを投入 ディスクイメージを用いて,簡単に多数のノードを再インストールリアルタイムに多数のノードの状態を把握 クラスタA クラスタB 8 16 24 1 9 17 25 2 10 18 26 3 11 19 27 32 40 48 56 33 41 49 57 34 42 50 58 35 43 51 59 4 12 20 28 5 13 21 29 6 14 22 30 7 15 23 31 36 44 52 60 37 45 53 61 38 46 54 62 39 47 55 63 8 16 24 1 9 17 25 2 10 18 26 3 11 19 27 32 40 48 56 33 41 49 57 34 42 50 58 35 43 51 59 4 12 20 28 5 13 21 29 6 14 22 30 7 15 23 31 36 44 52 60 37 45 53 61 38 46 54 62 39 47 55 63 8 16 24 1 9 17 25 2 10 18 26 3 11 19 27 32 40 48 56 33 41 49 57 34 42 50 58 35 43 51 59 4 12 20 28 5 13 21 29 6 14 22 30 7 15 23 31 36 44 52 60 37 45 53 61 38 46 54 62 39 47 55 63 クラスタ計算機 左: 本郷キャンパス 191ノード/382 CPU, 右: 柏キャンパス 65ノード/130 CPU) ランダムに 分担すると 性能が悪い きれいに分けたつもりでも 問題によっては 性能が悪化する 通信パターンを実測して その問題に適した分担方法を 自動的に選べるように

形式文法の推定を用いた複数タスクに対する強化学習 コンピュータ将棋プレイヤ「激指(げきさし)」 Webグラフ構造に着目したコミュニティ抽出 知の情報処理 (近山・田浦研究室) Webを対象にした多言語テキスト処理 形式文法の推定を用いた複数タスクに対する強化学習 大量に集めたWeb文書の中から,言語の垣根を越えた情報抽出を行う 翻訳関係にあるテキストペアを自動で判定・抽出 辞書情報を必要としない多言語ニュース記事の関連付け G S 1 2 3 4 5 6 7 8 試行錯誤で迷路を探索 履歴からのルールの推定 推定結果の文法を元に 強化学習し,最適ルートを獲得 複雑な特徴の自動抽出 ゲームの記録を用いた打ち手の学習 … 単純な特徴を組み合わせてふるい分け, 実際に役に立つ複雑な特徴を自動的に見つけ出す 単純な特徴 組み合わせて 複雑な特徴に 勝ち負けに 大きく影響する パターン これだけでは勝ち負けが判断できない コンピュータゲームプレイヤに,上級者の打つ手の好みを学習させる 上級者の打った手は打たなかった手より良いはず. 上級者の打った手を好んで打つようになれば強くなる. 前アマ竜王と対局中 コンピュータ将棋プレイヤ「激指(げきさし)」 Webグラフ構造に着目したコミュニティ抽出 関連するサイト間のリンクには特徴がある 特徴的な部分グラフ(二部グラフ)を見つければ,トピックを共有するページが含まれている可能性が高い 部分グラフ構造を利用してウェブコミュニティを見つけ出し,ウェブページ全体の内容理解の手助けとしたい ページの内容による分類,トピック間の相関の発見,など… ライフログデータを用いた物品検索 Web Graph Web page Link Web Community 日常生活を観察したデータ(=ライフログ)から、身の回りの物品が 「いつ」「どこで」見えていたかを検索し、物品の管理に役立てる 大量のセンサデータに対し処理を行うことが必要  分散したデータに対する大規模な計算を簡単に実現できるような環境を作り、その上で便利なアプリケーションを構築する 非専門家にも大規模並列計算 大規模計算を行いたいユーザー、計算機が置かれている環境共に多様化しており、これらを支援するソフトウェアが大切 スクリプト言語のPythonのライブラリとして提供 Remote Method Invocation (RMI)で遠隔のピアの計算を「遠隔オブジェクトへのメソッド呼び出し」に見せる 複雑なネットワーク環境への対応 NAT/firewall環境の計算資源も合わせた並列計算 スケーラブルなソリューション 900台でも安定して高速に動作する並列分散計算を目指したい グリッド用分散オブジェクトライブラリ leave join Fire Wall SSH Tunneling NAT obj.doJob(args) Transparent communication over the overlay 「電球どこ?」 「 2日前に机の上で見ました」 卒業論文のテーマは,本人の興味ある分野に関連したものを,相談しながら決めていきます. 「ネットワークトポロジを考慮したバンド幅推定の高速化手法」 卒論生からの一言: InTrigger と呼ばれる全国規模の分散環境を使った実験、また運用や管理などにも触れることができます。 「画像群中の物品発見における計算量削減手法の提案」 卒論生からの一言: 研究室内では他の人と少し毛色が違う内容で画像処理っぽいことやってます。 「自動取得したネットワーク構成情報に基づくMPI集合通信アルゴリズムの改良」 卒論生からの一言: 自分の好きなことを,好きなようにできる研究室です.すぐに相談に乗ってくれる先輩ばかりなので,楽しくやりがいがあると思います. 「Webフォーラムの構文情報を用いたトラブルシュート文書抽出」 卒論生からの一言: 並列分散処理から機械学習まで幅広い選択肢があり、様々な興味に応えてくれる研究室です。 「強化学習と進化的アルゴリズムによるゲームの局面評価関数の調整」 卒論生からの一言: 囲碁や将棋に限らず、どんなゲームでも研究対象になりえます。興味のある人はぜひ。 「並列分散環境での異常原因特定のためのログ解析法」 卒論生からの一言: 大規模な計算機環境で動いているプロセスの裏側を知ることができたりしてかなり興味深い内容です。 本年度の卒業論文テーマ例 その他:既存のトピックにとらわれず,自分の研究テーマ,新しい研究テーマを開拓する意欲のある学生諸君の参加を期待します.ソフトウェアを正しく動かすための数学的素養を身につけたい人,ソフトウェアを作って動かすことに喜びを感じられる人は極力支援します.