DCN架构演进

1. 服务与网络三大耦合问题

  • 交换机堆叠,存在单点风险和运维困难问题
  • 物理网络大二层隧道,引入更大故障域
  • 硬件墙的引入限制整体云业务规模,硬件强性能不行,无法横向扩展

2. 名词解释

NSA(Network Service Area)

  • NWS(Network Service): 网络服务区,BR、ELB、NAT
  • MGS(Manage Service): 管理服务区,负责云平台,面向租户提供的管理面服务,如APIG、DNS
    NC(Network Cluster): 在AZ内提供计算、存储、网络节点的接入能力,一套NC包含接入、汇聚、核心三层交换机
    FA: 分为FA-AZ和FA-NC
  • FA-AZ: 负责AZ之间互连,南北向(AZ与AZ间)的流量互连和出口
  • FA-NC: 负责NC之间互连,东西向(NC与NC间)
    AZC(AZ Connector): DCN3.0下<font color="#ff0000">只用于AZ之间互连,一般是两台(认为跨AZ的流量不会很大)

3. 总结

3.1. 交换机形态

DCN2.0 TOR核心为盒式,汇聚、核心、FA均为框式
DCN3.x 部分汇聚开始采用盒式
DCN4.x和DCN5.0 核心开始采用框式,FA为框式

[!tip]
规模受限于框式设备端口数,同时框式设备时延高,成本高

3.2. FA发展

DCN3.0设计中没有FA,通过AZC(AZ Connector)只负责AZ间的流量转发,AZC不承担南北向流量。南北向(公网)流量: NC -> NWS -> Transit区,然后送往骨干网或互联网。

DCN3.1及以后引入了FA设备,不光承担了AZ间的流量,也承担了南北向流量,NC -> FA -> Transit(流量不过网络服务区了)

3.3. 堆叠

DCN3.x 完成了核心、汇聚、AZC/FA的去堆叠,网络服务区汇聚去堆叠,TOR堆叠
DCN4.x NC内全面去交换机堆叠部署,网络服务区去堆叠部署;管理服务区汇聚去堆叠,TOR存在堆叠
DCN5.x全面去堆叠,包括NC,管理服务器,网络服务区

3.4. 路由协议选择

DCN2.0协议采用OSPF,DCN3.x及以后均为BGP组网
AZ内单路由域,计算存储跨平面互访无需过墙,资源访问管理区过墙

3.5. 大二层

DCN3.x开始逐步消除大二层
DCN4.x消除NC内、网络服务区大二层
DCN5.x才消除管理服务区大二层(受制于openstack底座能力约束)

3.6. 管理墙/边界墙

DCN3.x以下均为硬件
DCN4.x硬墙、软墙结合
DCN5.0,消除硬件墙,SPM/DMZ云化

3.7. Transit区

DCN3.x引入transit区,DCN4.x也存在transit区
DCN5.0去transit区,BR网关下沉网络服务区(NWS)

[!note] transit区为了容灾需要选两个以上的机房,设计上想要离两个AZ都近是比较理想化的,实际很难找到。下沉NWS后,在AZ内建设POP点,这样可以保证有POP点的这些AZ能够实现最短距离,作为主力AZ,提高低时延。

3.8. 多VRF路由平面隔离

DCN2.0存在多VRF路由平面隔离,从DCN3.x开始,就不存在多VRF路由平面隔离。

[!tip]
多VRF路由平面隔离会极大地增加DCN管理复杂度