想象一下,在AI训练、高性能计算、分布式存储的“心脏”——数据中心网络里,RoCEv2(RDMA over Converged Ethernet v2)正以惊人的速度传输着海量数据。它绕过了操作系统内核,让应用直通网卡,速度飙升!但高速也伴随着风险:网络一旦拥塞,数据包丢失,整个高性能应用就可能“翻车”。这时,一个低调却至关重要的守护者站了出来:PFC(Priority-based Flow Control,基于优先级的流量控制)。它就像网络流量的“精密刹车系统”,确保关键数据永不丢失。今天,就让我们一起揭开PFC的神秘面纱!
PFC是一种以Ethernet为基础的流控机制,它允许以优先级(Priority)为单位,控制特定优先级类别的网络流量。简单来说,当某个优先级的流量出现拥堵或包溢出时,PFC可以暂停对应优先级的流量,避免数据丢失,确保关键数据的稳定传输。
PFC的交互本质是接收方(Rx)向发送方(Tx)发送“暂停(Pause)” 或“恢复(Resume)” 指令。让我们分解这个过程:
1. 场景:接收端交换机端口(或网卡)的特定优先级队列的缓冲区即将被填满(达到预设阈值)。
• 在报文中明确指定需要暂停的优先级(如优先级3)以及需要暂停的时间长度(Pause Time);
• 将这个Pause Frame发送给直接相连的上游设备(发送端交换机或服务器网卡)。
• 暂停的持续时间由报文中的Pause Time字段指定(单位是512 bit time,可换算成时间)。
• 接收端可以发送一个新的PFC Pause Frame,将对应优先级的Pause Time设置为0。这就是“恢复(Resume)”信号;
• 上游设备(Tx)收到Pause Time = 0的报文后,立即恢复发送该优先级的数据帧。
理解了交互,我们再来看看这个关键的“刹车指令”——PFC Pause Frame的报文结构(基于IEEE 802.1Qbb标准):
• 超融合基础架构/HCI:保证虚拟化存储(vSAN, Ceph等)后端网络稳定高效;
为了确保PFC功能的正确性和有效性,测试是非常重要的一环。以下使用信而泰测试仪表X5-400G设备对PFC功能进行测试:
如上图所示,测试仪模拟两端口向一个端口发流的拥塞场景,从而来验证DUT的PFC功能,被测设备使用华三的s9825-8C-G;
4. 在流模板处查看,使用向导完成配后后默认是生成双向流量,去使能port3发送的流量即可;
5. 先将Port 1和Port2打往Port3的线速流量运行起来,此时可以观察到port1和port2的发送速率为100%,然后将DUT使能PFC功能后,可以观察到两端口流量的发送速率降速至50%;
6. 测试仪PFC报文统计查看,可统计到DUT发送的第5优先级的PFC报文;
信而泰现已推出X2-100G-12QSFP28、X5-400G高密度以及E2-100G-4QSFP28-Q测试模块,均支持测试RoCEv2协议,支持100G/200G/400G的多速率以太网测试,信而泰的RoCEv2深度测试,为网络设备商、云服务商及企业用户提供了不可或缺的工具,有效识别瓶颈、优化配置,极大提升RoCEv2部署信心,是推动高性能无损网络从架构设计走向大规模、高效率实际应用的关键环节。