報告 (2006/9/6) 高橋 慧.

Slides:



Advertisements
Similar presentations
Integrated Personal Page C05823 森本万里子 C05829 西山礼恵 C05899 高木華子.
Advertisements

XML ゼミ 独習 XML ~ 第 6 章 XHTML~ 6.1 XHTML の概要 6.2 XHTML の構造 谷津 哲平.
Web アプリをユーザー毎に カスタマイズ可能にする AOP フレームワーク
モバイルエージェントシステムの実装 エージェント移動(状態とコードの一括移送) エージェント移動の特徴 システム構成 エージェントプログラム
IIS 4.0で開発をするコツ Webアプリケーション構築.
Windows HPC Server を使ってみる
情報・知能工学系 山本一公 プログラミング演習Ⅱ 第3回 配列(1) 情報・知能工学系 山本一公
第2回 プロセス管理 ジョブ、プロセスとは? プロセスの状態遷移 プロセス制御ブロック スケジューリング.
情報理工学系研究科 コンピュータ科学専攻 上嶋裕樹
The Perl Conference Japan ’98 朝日奈アンテナによる コンテンツ情報の取得と利用
クラスタの構成技術と クラスタによる並列処理
Chapter11-4(前半) 加藤健.
Webサービスに関する基本用語 Masatoshi Ohishi / NAOJ & Sokendai
パイプラインパフォーマンス管理 SAP Best Practices.
分散コンピューティング環境上の Webリンク収集システムの実装
COPPER/FINESSE System構築
Grid Workflow Scheduler
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
実行時のメモリ構造(1) Jasminの基礎とフレーム内動作
WagbyR6.5 Update 12 PPT版 更新情報
WinSCPによるデータ転送 リモートローカル間で簡単にデータ転送が可能です。
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
プログラミング演習II 2004年10月19日(第1回) 理学部数学科・木村巌.
卒研:データベースチーム 第4回 DOMを使った処理
最新情報技術を活用した超大規模 天文データ解析機構の研究開発
モバイルエージェントの応用 概要 モーバイルエージェントの応用分野 AgentSpaceシステム エージェント移動 応用:ソフトウェアの配信
~スマートフォン利用~ 店舗管理システムのご提案 サイボウズ中国.
変数のスコープの設計判断能力 を育成するプログラミング教育
リファクタリングのための 変更波及解析を利用した テスト支援ツールの提案
同期的にアドバイスを活性化できる分散動的アスペクト指向システム
Linux リテラシ2006 第6回 デーモン CIS RAT.
基礎プログラミング演習 第1回.
2004年度 サマースクール in 稚内 JavaによるWebアプリケーション入門
Occam言語による マルチプリエンプティブシステムの 実装と検証
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
コードクローンに含まれるメソッド呼び出しの 変更度合の調査
他のプロセスに あたえる影響が少ない 実行時ミラーリングシステム
分散環境でのStableな ブロードキャストアルゴリズムの 提案と実装
ゲーム開発モデルの基礎.
動的データ依存関係解析を用いた Javaプログラムスライス手法
プログラミング基礎a 第7回 C言語によるプログラミング入門 ファイル入出力
Talkプログラムのヒント 1 CS-B3 ネットワークプログラミング  &情報科学科実験I.
他のプロセスに与える影響の少ない 実行時ミラーリングシステム
M1 Kenji KANEDA (SIG-PDS)
データベース設計 第7回 実用データベースの運用例 クライアント=サーバシステム(1)
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供
Virtualizing a Multiprocessor Machine on a Network of Computers
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
「マイグレーションを支援する分散集合オブジェクト」
マイグレーションを支援する分散集合オブジェクト
表計算 Excel 演習 1.Excel を使ってみる.
Webアプリケーションと JSPの基本 ソフトウェア特論 第4回.
「マイグレーションを支援する分散集合オブジェクト」
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
ユビキタスコンピューティングの ための ハンドオーバー機能付きRMIの実装
状況に応じて適切な 例外処理が行なえる アスペクト指向分散環境実験の 支援ツール
プログラム分散化のための アスペクト指向言語
プログラミング基礎a 第9回 Java言語による図形処理入門(1) Javaアプレット入門
アルゴリズム入門 (Ver /10/07) ・フローチャートとプログラムの基本構造 ・リスト ・合計の計算
統合開発環境のための プログラミング言語拡張 フレームワーク
第2回 開発環境とゲーム 05A1030 佐々木 和也.
エイリアス関係を考慮した Javaプログラム用静的スライシングツール
プログラムの一時停止時に 将来の実行情報を提供するデバッガ
プログラミング基礎a 第7回 C言語によるプログラミング入門 ファイル入出力
ニューラルネットワークの仕組み (Raspberry PI 演習で学ぶ) AI DATA VASSEL 資料
Javaとは Javaとはオブジェクト指向言語でJava VM(Java仮想マシン)と呼ばれるプログラム上で動作します。
アーキテクチャパラメータを利用した並列GCの性能予測
1.2 言語処理の諸観点 (1)言語処理の利用分野
Presentation transcript:

報告 (2006/9/6) 高橋 慧

卒論 マイグレーションを支援する 分散集合オブジェクト 分散配列のような、インデックスで識別されるオブジェクトが書ける インデックス範囲を指定してメソッド呼び出し 動的に配分変更

フィンランドでしたこと 3Dプログラミング Neural Networkで制御 Eye Tracker (英語のプレゼン練習・作文練習)

今からすること グリッドスケジュラー (Scientific Workflow) 特徴 粒度の細かい逐次のジョブを並列に実行 必要なファイルを前もって転送 特徴 ジョブの依存性を解釈 大量のデータに対応 (Data Intensive) 賢いscheduling 設定簡単・その他使いやすくする工夫 Easy-Going Grid Scheduler : EGGS

対象とするタスク (Workflow) 依存性がある 多数の入力ファイル 条件判定・ループ (?) 中間出力 入力ファイル (たくさん) プロセス P プロセス Q 頻度集計 解析 Parser 構文木 Webページ

記述のイメージ データを基準に依存性を書く << pages[i] parser pages[i] parsed_words[i] >> parsed_words[i] << parsed_words[i] analyzer parsed_words[i] freq_result[i] >> result[i] parsed words[] pages[] (たくさん) freq_analysis parser analyzer

実行のイメージ システムが自動的に逐次のタスクを分配 Work Stealingより賢い戦略 実行前にファイルを別スレッドで転送 pages[] pages[] pages[] pages[] pages[] pages[] parsed words[] parsed words[] parsed words[] parsed words[] ソースのページを転送 各ホストでパージング 裏でファイル転送 処理中のタスクが終了すると、 すぐに次のタスクへ取りかかれる パイプライン的に 処理が進行

Data Intensiveな条件に対応 中間ファイル 各ノードのローカルディスクに保存 必要に応じて転送 不要になったら削除

賢いscheduling パイプライン的に、コマンド実行前に必要なファイルを転送 各ノードの負荷を考慮 ファイル転送時にはバンド幅を考慮 ファイルサイズから実行時間の予測 ファイル転送時にはバンド幅を考慮

使いやすくする工夫 GXPの真似 処理の途中経過を表示 Scpを用いた自己コピー 対話的なノード選択インターフェース 中間ファイルを簡単に(クラスタのローカルディスクから)取り出せる 処理の途中経過を表示 例えば10000ページ/1時間の分析なら、100ページ分析した中間結果を1分後に表示 失敗に早く気づける…?

関連研究 Dmake Map-Reduce Condor + DAGman GSFL系 Triana JOpera

Dmake – distributed make Sunが開発 ホスト名・起動する最大プロセス数を指定 Rshを利用して遠隔操作・デーモン不要 気軽に使える Data Intencive向けではない

Map-Reduce + GFS (Google) 複雑な処理を記述する自由度は低い 特定アプリでの性能は高いが、専用の記法

GSFL系 Grid Service Flow Language 並列処理を記述する言語 Globus/OGSAベース 性能はスケジュラーの実装に依存 Globus/OGSAベース スケジュラーの実装は色々 NAREGI projectのGrid Workflow 導入の手間が大きい

何が新しい? 既にあったもの 新しい、かもしれないもの ファイルの局所性を利用 パイプライン的転送 ファイルを処理した時の情報を利用して、動的再スケジューリング 時間制限付きで動的に資源を解放

進捗 今までしたこと これからすること Pythonの練習 Dumbな並列スケジュラーを書く タスク分配→パイプライン処理 コマンドをサーバーに投げて実行させる ファイルを投げる/受ける 依存性解析・DAG作って直列化 これからすること Dumbな並列スケジュラーを書く タスク分配→パイプライン処理 ジョブ記述の記法を考える サンプルアプリを考える