核融合科学研究所 計算機・情報ネットワークセンター 山本 孝志

Slides:



Advertisements
Similar presentations
Timeout と再送 往復時間 予知が困難 他のトラフィックに依存 適応再送アルゴリズム データの採取.
Advertisements

インターネットの仕組み 例) Web閲覧 インターネット サーバ リクエスト データ 携帯電話 一般家庭 インターネットサービス
Ibaraki Univ. Dept of Electrical & Electronic Eng.
ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送
大阪大学 長谷川 剛 インターネットフローの公平性 大阪大学 長谷川 剛 2001年10月19日 IN研究会.
前回の授業への質問 質問:プロトコルアナライザで測定できる範囲はどこまでか?
Webプロキシサーバにおける 動的資源管理方式の提案と実装
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
ネットワーク層.
インターネット構成法 最終課題 ~ネットワークデザイン~.
詳解TCP/IP TCPタイムアウトと再転送 れにうむ.
自律分散協調システム論 第13回「TCPと輻輳制御/QoS制御」
TCP (Transmission Control Protocol)
TCP Tahoeのウインドウ制御 (復習)
「コンピュータと情報システム」 07章 インターネットとセキュリティ
TCPデータ通信との公平性を考慮した 輻輳適応能力を有する MPEG動画像通信のための品質調整機構
詳解TCP/IP ACE B2 mewtwo.
WindowsNTによるLAN構築 ポリテクセンター秋田 情報・通信系.
TranSwitch:ネットワークフロー毎における最適な TCP への動的切替機構
TCPソケットプログラミング ソケットプログラミング TCP-echoのデータ通信手順
輪講: 詳解TCP/IP ACE B3 suzuk.
心理学情報処理法Ⅰ コンピュータネットワーク概論.
Telnet, rlogin などの仮想端末 ftp などのファイル転送 rpc, nfs
コンテンツ配信 エンコード (符号化) CBR (Constant Bit Rate) VBR (Variable Bit Rate)
伝送特性に応じた 適応型映像・音声配信機構の構築
ロングファットネットワーク上での 高速データ転送 「ATLAS地域解析センター Testbed環境の構築」
サーバ負荷分散におけるOpenFlowを用いた省電力法
ギガビットネットワークに対応する ネットワークべンチマークテスト機の試作と ギガビットルータの性能評価
画像情報特論 (3) - TCP/IP (2) TCP (Transport Control Protocol)
コンピュータとネットワークの利用 国際経営学科 牧野ゼミ3年 足立龍哉.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
TCP/UDP プロセス間の通信のためのプロトコル TCP:信頼性高、処理時間大 UDP:信頼性低、処理時間小 ftp SMTP HTTP
情報の科学的 な理解(2) 情報科教育法 8回目 2005/6/4 太田 剛.
インターネットの基礎知識 その3 ~TCP・UDP層編~
岡村耕二 情報ネットワーク 補足資料 岡村耕二 情報ネットワーク.
イーサネットフレームの構造とデータリンク層アドレス
Ibaraki Univ. Dept of Electrical & Electronic Eng.
ネットワークの基礎知識 電子制御設計製図Ⅰ   2014年5月2日 Ⅲ限目.
画像情報特論 (3) - TCP/IP (2) TCP (Transport Control Protocol)
画像情報特論 (3) - マルチメディアインフラとしてのTCP/IP (2)
画像情報特論 (3) - TCP/IP (2) TCP (Transport Control Protocol)
実行時情報に基づく OSカーネルのコンフィグ最小化
超高速ネットワークの弱点 光は速い 光は遅い 300km / 1msec (真空中) 180km / 1msec (光ファイバ中)
TCP/IP入門          櫻井美帆          蟻川朋未          服部力三.
マルチホーミングを利用した Proxy Mobile IPv6の ハンドオーバー
各種ルータに対応する P2P通信環境に関する研究
ネットワークの性能 牧野ゼミ3年 足立龍哉.
演習第6回 情報通信技術論 インターネット工学
非対称リンクにおける ジャンボフレームの性能評価
超高速ネットワークの弱点 光は速い 光は遅い 300km / 1msec (真空中) 180km / 1msec (光ファイバ中)
Diffservにおける 絶対的な品質保証法
TCP制御フラグの解析による ネットワーク負荷の推測
仮想ネットワークを考慮した SoftIRQ制御によるCPU割当ての手法
演習第4回 情報通信技術論 インターネット工学
レポート課題 レポートの提出は による。 提出期間を厳守する。 締切は2010年1月12日(火)
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
トラフィックプロファイラAGURIの設計と実装
OSI7層に関係する機器、仕様、機能など 物理層 データリンク層 ネットワーク層 トランスポート層 セッション層 プレゼンテーション層
GbEにおける TCP/IP の研究について
2007 D0活動予定 D0 kazuhisa.
異種セグメント端末による 分散型仮想LAN構築機構の設計と実装
レポート課題1 基本問題:  課題1. あるマシンまでのRTT (Round Trip Time)を測定したところ 128msec(ミリ秒)であった。このマシンに対してウィンドウサイズ64KByteでTCPの通信を行う場合のスループットの予想値を計算せよ。 ヒント1: 授業中に説明したように、スループットの値は、ウィンドウサイズを往復遅延時間で割れば良い。Byteとbitの換算に注意する。計算を簡単にするために1024≒1000として計算して良い(もちろん、この概算を使わなくても良い)。スループットは、ど
Mathematicaによる固有値計算の高速化 Eigenvalue calculation speed by Mathematica
7月13日の演習問題・解答例 について ネットワーク長が 18、22、26、28 の場合の
特定ユーザーのみが利用可能な仮想プライベート・ネットワーク
東大素セ 松本浩,田中純一, 上田郁夫,坂本宏,真下哲郎
画像情報特論 (3) - TCP/IP (2) TCP (Transport Control Protocol)
情報ネットワーク 岡村耕二.
TCP/IPの通信手順 (tcpdump)
ソケットの拡張によるJava用分散ミドルウエアの高信頼化
Presentation transcript:

核融合科学研究所 計算機・情報ネットワークセンター 山本 孝志 広帯域高遅延ネットワーク 伝送技術 核融合科学研究所 計算機・情報ネットワークセンター 山本 孝志 2006年2月28日 「核融合実験のデータ処理に関する次世代システム技術の検討」

自己紹介 核融合科学研究所 計算機・情報ネットワークセンター 1997年10月に赴任 業務:ネットワーク管理とセキュリティ管理 ワクチン、ファイヤウォール、DHCP登録、同講習会 4年前から非常勤講師を始める 大同工大 情報工学科 やっとC言語がわかってきた 確認君1号 近影

概 要 何が問題なのか どのような対策が開発されたか では、どうやって研究を進めるか TCP base UDP base 実機、シュミレーション

世界記録 Internet 2 Land Speed Record 8 Gbps 32,000km, RTT = 500ms Seattle - Tokyo - Chicago - Amsterdam - Seattle 東大, WIDE, Chelcio Comm., … http://data-reservoir.adm.s.u-tokyo.ac.jp/lsr-20051110/

距離・速度積の比較 (データレゼボワール プロジェクトより) 2005年12月 NIFS-京都大 180km x 630Mbps = 113.4Tbm/s http://data-reservoir.adm.s.u-tokyo.ac.jp/press/lsr-20041225-j/graph-j.png http://data-reservoir.adm.s.u-tokyo.ac.jp/lsr-20051110/

問題点 SuperSINET 1Gbpsの回線を生かしきれない。 TCP/IPのAck応答に起因する普遍的な問題。 SNET 100Mbp以下? ルータには何の問題もありませんよ (by NII) TCP/IPのAck応答に起因する普遍的な問題。 Long Fat pipe Network: LFN

ACK (LAN) スライディングウインドウ 傾きは光速

ACK (WAN) NIFS – Kyoto Univ.: RTT=10ms, 1Gbps*10ms /8 = 1.25MB Window=10 良好 スカスカ

TCP/IP のオプション Window Scale SACK Timestamp 最近のOSは、ほぼ対応済み。 2^16(64kB)以上に対応させる。 SACK 欠落データを個別に指定 Timestamp RTTの計測 最近のOSは、ほぼ対応済み。 ACK SACK op.

Window Size Window Sizeを大きくしましょう。 でも、だめじゃない。 Linux Windows /etc/sysctl.conf Windows Dr. TCP でも、だめじゃない。 # increase TCP max buffer size net.core.rmem_max = 16777216 net.core.wmem_max = 16777216 # increase Linux autotuning TCP buffer limits # min, default, and max number of bytes to use net.ipv4.tcp_rmem = 4096 87380 16777216 net.ipv4.tcp_wmem = 4096 65536 16777216 # turn on window scale and timestamp option HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\Tcp1323=3 # set default TCP window size (default = 16KB) HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\TcpWindowSize=131400 # and maybe set this too: (default = not set ) HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\GlobalMaxTcpWindowSize=16777216

実際のWindow = min(awin, cwin) ウィンドウサイズ 告知ウィンドウサイズ (awin) 輻輳ウィンドウサイズ (cwin) 実際のWindow = min(awin, cwin) advertised window, congestion window % sudo tcpdump tcp port smtp 07:39:18.686 IP A.49110 > B.smtp: S 0:0(0) win 8760 <mss 1460> 07:39:18.689 IP B.smtp > A.49110: S 0:0(0) ack 1 win 5840 <mss 1460> ジャンボフレームMTU: 9000バイト

輻輳回避 TCPは、他との通信の公平性を保つため、ウインドウサイズを調整して輻輳回避を行う。 Tahoe Reno New Reno Vegas P. loss

輻輳回避(WAN) 1.Gigabitクラスのバーストに耐えられない 2. 回復に予想以上の時間がかかる。 1時間以上との報告例もあり。

バースト対策 レートコントロールをする。 PAUSEパケットを入れてデータの転送速度を抑制する。 PAUSEパケットは HUBで捨てられる。 7Gbps (8.2Gbps, RTT=350ms, 24,000km, 日米1往復半) @ SC2003 cf. Comet Project http://www.comet-can.jp/

輻輳制御の開発 輻輳回避アルゴリズムの改良 AIDM; additive increases multiplicative decreases x = x + α(x) 順調なとき x = (1 – β)x パケットロス発生 α β Standard (Reno) 1/x 0.5 Scalable TCP 0.01 0.125 HighSpeed TCP Ta(x) Tb(x) Hamilton TCP fa(x) fb(x) Bic TCP slow startの改良 Vegas RTTで調節 Fast TCP Vegasの改良 Binary Increase Control TCP x = cwin テーブル: Ta(x), Tb(x) 関数: fa(x), fb(x)

輻輳制御アルゴリズムの比較例 JGNテストベット SLAC SABUL > FAST > Scalable, HS-TCP, p-Standard > Standard 鶴他、ITRC-14, 2003年11月 SLAC Bic-TCPがよい。FASTは最もよいが、逆向きの流れによる劣化が激しい。 Hadrien Bullot, et. at, J. Grid Computing, Dec 2003

UDPの例 UDPを使う? UDT (UDP-Based Data Transfer Protocol) 「結局TCPの焼き直しになる」と言われているが UDT (UDP-Based Data Transfer Protocol) SABULの後継 UDP Socket API UDT Socket API UDT Applications 汎用的な開発環境(Configurable Congestion Control; CCC)も公開。 900Mbps (1Gbp, RTT=100ms)

UDT レートコントロール パケット単位に番号を打ち、ACK, NAKを受ける。 連続した2つのパケットより帯域幅を推測 いずれもUDPを利用。 Sender Receiver データ 制御 UDT A UDT B 2 1 TCPへの影響が若干大きい (帯域を奪う)

その他 複数のTCPセッションを利用する。 ルータの変更が必要 TCPプロトコルの置き換え ジャンボフレーム bbftp GridFTP (socket sizeの自動交渉も行う?) PSockets (並列TCPのAPI, C++) ルータの変更が必要 TCPプロトコルの置き換え XCP; eXplicit Congestion control Protocol ECNを出す(らしい) ジャンボフレーム

今後の研究について

目的 SuperSINETの有効利用 SNET: LHD実験データ、シュミレーション 世界標準

何を対象にするか 輻輳制御方式を比較する 当面、開発の容易さから Linux。 TCP base & UDP base Windows Server 2003 ? FreeBSD, Mac OS X UDT/CCC

Linux? Linux kernelのソースを読む ネットワークのところだけでも 何かつかめるはず。 実装する際には必須 つかめなければ、… kernel >= 2.6.13で対応済み Reno Vegas BIC-TCP HSTCP; HighSpeed TCP HTCP; Hamilton TCP STCP; Scalable TCP Hybla Westwood

計測・実測環境 実環境での測定 PCルータで遅延を模擬する シュミレーション SuperSINETを利用する dummynet on FreeBSD Google: dummynet gigabit  11件 自分でソケットプログラミングをする on Linux 本当にできるの? シュミレーション Network Simulator 2: NS-2 C++ & Otcl cf. http://www.isi.edu/nsnam/ns/

L LFN ab Long Fat Pipe Network Short Fat Pipe Network Backborn LAN T. Yamamoto

LFN研究室 端末 A PCルータ 端末 B Mother: Intel(R) Server Board SE7520JR2 CPU: 2.80DGHz X2 Memory: 2.0GB HD: SATA 120GB, 7200rpm NIC: on board X2 細々と構築中

計画は? 3年計画 18年度 前半 実装、模擬実験 19年度? SuperSINETのどこかと実験 20年度? 新方式の開発、実装。 18年度 前半 実装、模擬実験 ラック装荷から遅延エミュレータの開発まで Which is best ? 19年度? SuperSINETのどこかと実験 全くの未定 20年度? 新方式の開発、実装。 やはり全くの未定

御清聴ありがとうございました。

参考:一般的なテクニック TCP Tuning Guide http://dsd.lbl.gov/TCP-tuning/

参考:評価方法 もちろん、帯域を有効に使っているかどうか あと、公平性 特定のストリームが有利になっていないか RTTの違い, 同じ方式内、他の方式の違い Ethernetはベストエフォート FDDI (Token方式)は原理的に公平。

Linuxの対応(詳細) アルゴリズムを簡単に切り替えられます。(kernel >= 2.6.13) sysctl -w net.ipv4.tcp_congestion_control = htcp reno: Traditional TCP used by almost all other OSes. (default) bic: BIC-TCP highspeed: HighSpeed TCP: Sally Floyd's suggested algorithm htcp:    Hamilton TCP hybla:    For satellite links scalable: Scalable TCP vegas:    TCP Vegas westwood:  optimized for lossy networks