Shishio Tsuchiya shtsuchi@cisco.com BGP談議 ~add-pathとdiverse-pathのお話~ 何か持っていると言われ続けてきました。今日何を持っているのか確信しました・・・それは BGPバックアップパス Shishio Tsuchiya shtsuchi@cisco.com.

Slides:



Advertisements
Similar presentations
だい六か – クリスマスとお正月 ぶんぽう. て form review ► Group 1 Verbs ► Have two or more ひらがな in the verb stem AND ► The final sound of the verb stem is from the い row.
Advertisements

Humble and Honorific Language By: Word-Master Leo, Mixer of Ill Beats.
て -form - Making て -form from ます -form -. With て -form, You can say... ~てもいいですか? (= May I do…) ~てください。 (= Please do…) ~ています。 (= am/is/are doing…) Connecting.
VE 01 え form What is え form? え? You can do that many things with え form?
SS2-15:A Study on Image Recognition and Understanding
米国セキュリティ調査 (2002 CSI/FBI調査 攻撃場所)
英語特別講座 疑問文 #1    英語特別講座 2011 疑問文.
All Rights Reserved, Copyright (C) Donovan School of English
The Bar バー.
1.
五段動詞の歌 ごだんどうしのうた.
英語勉強会.
SPECIAL ASSIGNMENT What is the leadership and how can you be a good leader? I am going to give you the clues in the lecture, but please find the answer.
Hello! 教室に入るとき.
第1回レポートの課題 6月15日出題 今回の課題は1問のみ 第2回レポートと併せて本科目の単位を認定 第2回は7月に出題予定
日本語の文法 文型(ぶんけい)をおぼえよう!
Chapter 11 Queues 行列.
日本語... ジェパディー! This is a template for you to use in your classroom.
と.
情報ネットワーク 岡村耕二.
Chris Burgess (1号館1308研究室、内線164)
まっすぐ行きます! Lesson 3.
What did you do, mate? Plain-Past
Training on Planning & Setting Goals
Noun の 間(に) + Adjective Verb てform + いる間(に) during/while.
Ch13-1 TB250 てフォーム.
Japanese verbs informal forms
How do you talk about Positions/ Locations?
にほんご 111 (11/09/2006) Chapter 4 Quiz #1 〜は…です。 は vs. が えいが.
A 02 I like sushi! I like origami!
Reasonので + Consequence clause
The future tense Takuya Mochizuki.
Licensing information
Chapter 4 Quiz #2 Verbs Particles を、に、で
Provisioning on Multiple Network(NIC) env
定期考査2 英語.
The Sacred Deer of 奈良(なら)
Who Is Ready to Survive the Next Big Earthquake?
Did he/she just say that? Get your head out of the gutter! Oh wait….
“You Should Go To Kyoto”
VTA 02 What do you do on a weekend? しゅうまつ、何をしますか。
Cisco Customer Loyalty
て みる.
情報の科学的 な理解(2) 情報科教育法 8回目 2005/6/4 太田 剛.
Session 8: How can you present your research?
Causative Verbs Extensively borrowed from Rubin, J “Gone Fishin’”, Power Japanese (1992: Kodansha:Tokyo) Created by K McMahon.
くれます To give (someone gives something to me or my family) くれました くれます
Term paper, Report (1st, first)
マルチホーム事例 (大阪市立大学) 学術情報総合センター 大西克実.
Where is Wumpus Propositional logic (cont…) Reasoning where is wumpus
けいご 敬語 Polite speech.
疑問詞 1年生で学習した疑問詞.
Michael Jeffrey Jordan
My Dance Circle December 13, 2018  表紙 my dance circle.
Question Words….
クイズやゲーム形式で紹介した実例です。いずれも過去のインターン作です。
いくらですか?.
2019/4/22 Warm-up ※Warm-up 1~3には、小学校外国語活動「アルファベットを探そう」(H26年度、神埼小学校におけるSTの授業実践)で、5年生が撮影した写真を使用しています(授業者より使用許諾済)。
Term paper, report (2nd, final)
ロールプレイアクティビティ ある状況設定の中で、登場人物になりきり会話をします。 CAN-DO: 状況に応じた適切な質問をすることができる。
ー生命倫理の授業を通して生徒の意識に何が生じたかー
The difference between adjectives and adverbs
Created by L. Whittingham
英語音声学(7) 音連結.
情報ネットワーク 岡村耕二.
Cluster EG Face To Face meeting
Grammar Point 2: Describing the locations of objects
岡村耕二 情報ネットワーク 岡村耕二 情報ネットワーク.
BW: 英語で書いて下さい 1)小さくする 2)うるさく話す 3)大きく書く 4)上手になる (なる=become)
Indirect Speech 間接話法 Kaho.I.
Presentation transcript:

Shishio Tsuchiya shtsuchi@cisco.com BGP談議 ~add-pathとdiverse-pathのお話~ 何か持っていると言われ続けてきました。今日何を持っているのか確信しました・・・それは BGPバックアップパス Shishio Tsuchiya shtsuchi@cisco.com

そもそもBGPって 1989年にY.レクターとK.ラフィードがカフェでナプキンに 書いたのが始まり そのナプキンを元に最初の接続実験実施RFC1105 そのナプキンは額縁に入れてシスコに飾られてる ケチャップで、ものすごく汚れていた

そもそもBGPって RFC1771が1995年3月に発行 IBM:Y. Rekhter& Cisco Tony.Li draft-ietf-idr-bgp4-01~26まで改訂し、2006年1月に RFC4271を発行した。

どこで決めてるの? IETFでは主に2つ IDR(Inter Domain Routing Group)とGROW(Global Routing Operations) IDR Working Group GROW Routing Area Operation & Management BGP4のIPv4/IPv6でBGPv4のの利用のサポート 頑健性/拡張性の改善 目的 BGP4のIPv4/IPv6での利用の際の運用的問題の考慮 45個(Obsoleteも含む) Standardが中心 RFC 6個 BCPとInfo.

BGPの特徴 RFC4271の9.2. Update-Send Processでは他のBGPス ピーカーに伝えるルートは決定プロセスにより、選ばれ たものを伝えなければならない事を定義している。 全く同じアドレスPrefix/NLRIのものの複数パスの広告 は許されていない。 以前アドバタイズされたルートと同じNLRIをもつルート は暗黙のうちに取り換えられる。

バックアップパスがあればできる事 ファーストコンバージェンス マルチパスロードバランス 安定性と正確性の向上 バックアップパスがあれば重要障害時もローカルで切り替え可能 マルチパスロードバランス 安定性と正確性の向上 MED Churn によるルートグラつき(oscillation) RFC3345 IETFでは現在add-path や diverse-pathという ソリューションが議論され、標準化中

バックアップパスを伝える手法 BGP add-path BGP Best External + Fullmesh BGP Diverse Path

add-pathって何だろう? 通常のBGP add-path 10/8,AS_PATH:64500,64501,NH:203.0.113.10 10/8,AS_PATH:64510,64511,NH:203.0.113.10 add-path 10/8,ID=1,AS_PATH:64500,64501,NH:203.0.113.10 10/8,ID=2,AS_PATH:64510,64511,NH:203.0.113.10

add-path詳細 Capability Exchange +------------------------------------------------+ | Address Family Identifier (2 octets) | | Subsequent Address Family Identifier (1 octet) | | Send/Receive (1 octet) | BGPピアにてCapability Exchangeを行う(RFC3992) Capability Valueは69 Send/Receiveでマルチパスを Receive(=1),Send(=2),Both(=3)可能かを示す

add-path詳細 NLRI Encoding Extended NLRI Encoding +--------------------------------+ | Path Identifier (4 octets) | | Length (1 octet) | | Prefix (variable) | NLRI Encoding RFC4271,RFC4760 +---------------------------+ | Length (1 octet) | | Prefix (variable) | UPDATEメッセージの中に4オクテットのPATH IDを含む 為に、Path Identifierフィールドをつける RFC3107でも同様にLengthの前部につける

バックアップパスを伝える手法 BGP add-path BGP Best External + Fullmesh BGP Diverse Path

BGP Best External MEDの値により、R2ではいつもiBGPが選択される R3では代替えパスを持たない e 10/8 MED100 i 10/8 MED 200 R1 iBGP MED:100 10/8 R3 eBGP i 10/8 via R1 MED100 MED:200 i 10/8 MED100 e 10/8 MED 200 R2 MEDの値により、R2ではいつもiBGPが選択される R3では代替えパスを持たない R1障害時にはWITHDRAWN/UPDATE、書き換えが行わ れる

BGP Best External Best Externalを有効にする R2では全体でベストパスを選出する(MEDにより選出) e 10/8 MED100 i 10/8 MED 200 R1 iBGP MED:100 10/8 R3 eBGP i 10/8 via R1 MED100 i 10/8 via R2 MED200 MED:200 i 10/8 MED100 e 10/8 MED 200 (Best External ) R2 Best Externalを有効にする R2では全体でベストパスを選出する(MEDにより選出) R2では外部経路の中のみでのベストパスを選出する(Best External) R3では代替パスを持つことが出来る

バックアップパスを伝える手法 BGP add-path BGP Best External + Fullmesh BGP Diverse Path

diverse-pathって何だろう? R1はMED100,R2はMED200とする Best Externalを有効にする iBGP R1 eBGP RR1 MED:100 10/8 10/8 via R1 via R2 R3 MED:200 RR2 R2 R1はMED100,R2はMED200とする Best Externalを有効にする RR1,RR2ではR1およびR2経由のパスを持つ つまりRRではパスダイバーシティ(diverse-path)を持つ。

diverse-pathって何だろう? RRではMEDの値よりR1経由がベストと判断する RRはベストパスをアドバタイズする iBGP R1 eBGP RR1 MED:100 10/8 10/8 via R1 via R2 R3 MED:200 10/8 via R1 RR2 R2 RRではMEDの値よりR1経由がベストと判断する RRはベストパスをアドバタイズする R3はR2経由のパスを知ることが出来ない

diverse-pathって何だろう? diverse-pathを分配する為、新しいRRを追加 iBGP R1 eBGP RR1 MED:100 RR’1 10/8 R3 RR’2 MED:200 RR2 R2 diverse-pathを分配する為、新しいRRを追加 2nd Plane RR/Shadow RRという RRとShadow RRはiBGPピアを設定しない

diverse-pathって何だろう? RRとRR’はR1経由がベストと計算する。 RR’ではベストパスを排除、残りのパスで再計算する iBGP R1 eBGP RR1 10/8 via R1 via R2 MED:100 RR’1 10/8 R3 RR’2 MED:200 10/8 via R1 via R2 10/8 via R1 via R2 RR2 R2 RRとRR’はR1経由がベストと計算する。 RR’ではベストパスを排除、残りのパスで再計算する RR’ではR2経由を見つけ、2nd Bestと認識する。 RR’ではR2経由をベストパスとしてアナウンスする R3ではdiverse-pathを持つ

バックアップパスを伝える手法 solution add-path BGP Best External +Full mesh diverse-path internet-draft draft-ietf-idr-add-paths draft-ietf-idr-best-external draft-ietf-grow-diverse-bgp-path-dist Intend to Standard Informational Author Cisco,Juniper Cisco(was with Juniper) Cisco,Verisign,KDDI 概要 BGPプロトコル拡張 ASBRの機能拡張 RRの機能拡張 導入手法 全てのルータがサポート (ASBR,RR,ABR) ASBRがサポート iBGP フルメッシュが必要 RRがサポート ASBR/ABRでのShadow RRへのセッション追加

FIBの構造の違い-Prefix Independent Convergence- BGP net oif BGP net BGP net oif BGP net … … BGP LDI IGP LDI oif BGP net oif BGP net IGP LDI oif 階層構造のFIB フラット構造のFIB Transcript: So this is just to compare and contrast what it means to be a non-optimal way of FIB organization or (inaudible) organization. Here BGP prefixes are really the curse of nature so that means BGP prefixes point to a next hop which is resolved by an IGP prefix which is resolved by an actual outgoing interface. If you were to take a simple way of programming the forwarding with respect to the actual result of (inaudible) then that means the BGP prefixes directly point to the interfaces and these interfaces are governed by how the IGP prefixes are resolved, or the BGP next hop is resolved. If you do it this way, then it is clearly non-optimal because when there is an IGP convergence that affects a BGP next hop, in addition to populating the IGP prefixes themselves, we now need to find out how the BGP prefixes have changed. And if it goes from oif1 to oif2 then all the BGP prefixes need to be repopulated all the way from the control plane to FIB to take advantage of the new interface that is going out and that is clearly prefix dependent and it is proportional to the number of BGP prefixes that are there in the network. And this is clearly a non-optimal way of handling the convergence. AUDIENCE QUESTION: You mentioned about that next hop for the BGP needs to be calculated first for the EGP, right? Am I understand right? That the convergence is done for that, for the next hop, which is somehow there is a relation between EGP and the BGP. So you do the converged calculation SPF for the next hop in the first place? PRADOSH MOHAPATRA: Uh-huh. So yes, I mean, the IGP convergence happened first, which basically means whenever there is a link failure you need to advertise the new set of LSPs or the LSAs, plug the new LSAs. So the ingress router gets to know about it, recomputes the SPF, whether it be an incremental SPF, and figures out that there is a change to either all the IGP prefixes or some set of IGP prefixes. Only those set of IGP prefixes get downloaded from the IGP to RIP to FIB. Author’s Original Notes: In classical flattened FIB with a realistic time of 10 usecs for one oif update on one network, this would mean 3.5 secs of dedicated CPU time just for the FIB update. フラット構造のFIBでは全てのコントロールプレーンはフラットに 扱われ、BGP FIBはそれぞれoifを持つ 障害が起こると1prefix毎にoifの書き換えが行われる 階層構造では即座にIGP収束後、即座に書き替えが行われる

FIBの構造だけでどれだけ違うのか? R1-R2,R3はiBGP,エミュレータより350Kルートを広告 eBGP R2 350k R1 R3 R1-R2,R3はiBGP,エミュレータより350Kルートを広告 R1-R2間のリンクに障害を発生させる 複数フローにて収束時間を測定 1,500,1K,3K,5K,10K,30K,50K,100K,200K,300K,350K番目

Convergence Time比較 フラット構造のFIB(SRB1) vs 階層構造のFIB(SRE2) BGPテーブルの場所により 収束時間が増加 場所に依存せず収束

まとめ まだまだBGPは拡張し続けてる 高速コンバージェンスの為には代替パスを如何に伝え るかがポイント add-pathではプロトコルを拡張 diverse-pathはRRの機能を拡張 Full meshであればBest Externalも使用可能 代替パスがあればPICで高速切り替え可能

参考 IETF Internet Draft Advertisement of Multiple Paths in BGP Distribution of diverse BGP paths Advertisement of the best external route in BGP Cisco Document BGP ベストパス選択アルゴリズム BGP Best External BGP PIC Edge for IP and MPLS-VPN

参考資料 NANOG48 Add Paths Overview To Add-Paths or Not Add-Paths RIPE61 BGP Add-Paths BGP Diverse Paths