P4可编程设备的到来,彷佛要给数据面或转发面不可编程这段历史画上一个句号。下面这幅比拟图,可谓一图胜千言,读者自己体会。
数据面可编程,为网络创新供应了一片沃土;P4措辞,为在这片沃土上垦植(创新)供应了易用的农具。这样一来,在这片沃土上硕果累累也就合乎情理,猜想之中。下面这幅图对学术界的成果进行了一个很好的总结,包括INT、QoS、拥塞掌握、多播、负载均衡、加速打算、聚合、网络丈量、安全、测试等领域。须要这篇文献的读者加微信IEEE2000留言文献获取。

但是学术界的研究要真正落地,还须要考虑很多其他成分,如可运维性、占用资源情形、多租户共享支持、非常场景处理、平滑演进等等。
要体验新事物、尝尝新甜头,战胜一些寻衅也不是不可以。工业界利用P4可编程交流机的场景目前还不算多,紧张集中在Overlay分流分发、INT网络丈量、无线回传设备设备白盒化等领域,但星星之火,可以燎原。学术界的硕果转化为工业界的硕果,以不是完备没有可能。
事实上,一些前卫的企业,已经尝到了数据面可编程带来的甜头。比如:
1、Ucloud-同等性哈希网关
NAT64 Access 是 Ucloud 基于Intel 可编程芯片 Tofino 设计的同等性哈希网关,以旁挂的办法连接物理交流机,通过Maglev同等性哈希算法将去往 NAT64 做事器集群的流量进行分发,同时实现限速与DDoS保护功能。
NAT64 Access 与物理交流机组成三层网络,通过BGP发布地址,物理交流机将网络流量分发到多个NAT64 Access,实现NAT64 Access集群的负载均衡与高可用。NAT64 Access 与 NAT64做事器组成二层网络,做事器通过BGP向NAT64 Access发布VIP,NAT64 Access得到VIP对应的下一跳信息(MAC地址),通过Maglev算法将流量分发到集群的不同做事器。每个NAT64做事器配置不同的源IPv4地址,实现返程流量的精确到达。
NAT64 Access 通过数据面的查找表与掌握面Maglev Hash Engine实现Maglev哈希算法。同时,数据面对每个EIP针对TCP SYN报文进行入向和出向PPS限速(目前单个EIP的SYN报文的速率限定在50000,超过50000时会进行丢包,参数可调)实现DDoS安全防护。
NAT64 Access 在Tofino 数据面,紧张利用了pipeline串联、减少表依赖/合表、ingress/egress同时利用等优化操为难刁难Tofino表项进行优化,以应对 Tofino SRAM 受限的问题。
2、阿里云-流量分发网关
XGW 是阿里云基于Intel 可编程芯片 Tofino 设计的流量分发网关,如上图所示,其卖力公网、专线、跨Region之间流量汇聚与分发,支持IPv6。范例产品有:EIP和共享带脱期制、专线(比如天猫双11或某大客户数10Tbps专线上云流量)、CEN等。专线的场景示意如下:
XGW 设备类似于2U做事器,紧张部件如下:1)Intel Tofino 芯片:卖力大流量转发;2) 网卡芯片:卖力打表项转发;3)CPU:业务编排、智能调度。
其余,XGW在数据面实现了QoS能力,当客户的流量超出购买带宽时,丢弃优先级低的报文,担保高优先级的报文通过,QoS 限速示意图如下:
XGW 在Tofino 数据面,紧张利用了pipeline串联、合表等优化操为难刁难Tofino表项进行优化,以应对 Tofino SRAM 受限的问题。
更多 XGW 的实现细节,见 SIGCOMM 2021: sailfish: accelerating cloud-scale multi-tenant multi-service gateways with programmable switches
3、京东云-ToR、汇聚交流机流量可视化
京东云将部分数据中央网络的ToR、汇聚交流机(如下图所示的T0、T1)更换为了P4白盒交流机。同时,在边缘云场景,也对白盒交流机进行了一定规模的支配。
京东云利用P4可编程设备实现网络的可视化方案。由于现阶段无法实现传统设备的全P4可编程化,京东云采取稠浊支配方案(部分P4可编程设备、部分传统设备),利用Postcards模式支配INT,实现实时的网络丢包探测、拥塞、时延抖动以及路径的可视化,支配方案如下图所示。
除了流量可视化,京东云还通过P4可编程实现了LAG/ECMP的链路优先级功能。在进行网络流量转发时,优先利用高优先级的链路,当高优先级链路满载时,选择低优先级的链路分担流量,如下图所示。
京东云未来将会进一步对IDC、DCI、边缘节点的网络设备P4可编程化,已让网络更加的可视化、运维自动化,实现高等的流量调度、拥塞掌握、虚拟网络功能(LB、NAT)卸载等。
4、 中国电信-回传设备白盒化
中国电信拥有100多人的SONiC开拓团队,正在利用P4可编程设备开拓运营商的无线回传设备(4G时期,中国电信有5-10万台这种设备),估量今年将在此场景进行P4可编程设备的部分落地。
其余,P4可编程设备目前实现了小规模的数据中央网络TOR、汇聚交流机支配,运营商回传设备的支配。听说,80%的做网络安全的厂商都在利用P4可编程芯片在开拓设备。
P4可编程设备能干啥,取决于读者的脑洞有多大,再上个图,算是对本文标题的一个简要总结吧。








