本文来自“交换芯片决战:博通、思科、Marvell、英伟达”,当前全球范围最“顶级”的交换芯片性能是51.2T,主要的应用场景包括:AI大模型训练场景400G、800G互联、云技术超大规模400G接口互联SPIN+LEAF互联场景。
相关阅读:
1、AI大模型训练场景400G、800G互联:128个400G接口交换机,64个800G接口交换机;
2、云技术超大规模400G接口互联场景:128个400G接口交换机;
目前发布51.2T交换芯片的厂商只有4家,分别是:博通、思科、Marvell、英伟达,以下是按照各家芯片的发布时间排序。
1、英伟达Spectrum-4
2022年6月,英伟达隆重发布了新一代以太网平台 NVIDIA Spectrum-4。该平台由 NVIDIA Spectrum-4 交换机系列、ConnectX-7 智能网卡、NVIDIA BlueField-3 DPU 和 DOCA 数据中心基础设施软件组成,能够大幅加速大规模云原生应用。
作为全球首个 400Gbps 端到端网络平台,NVIDIA Spectrum-4 的单芯片交换吞吐量达到了51.2Tbps,比上一代产品高出 4 倍,能够为规模大数据中心基础设施提供超高的网络性能和强大的安全性。由 Spectrum-4 加持的 SN5000 交换机,最高可以支持 128 个 400GbE 端口或 64 个 800GbE 端口。
为了实现更好的 AI 智能管理运维,NVIDIA Spectrum-4 还优化了 RoCE 网络架构,并提供自适应路由(Adaptive Routing)和增强拥塞控制。其加密带宽不但达到了令人惊叹的12.8Tbps,而且还可以支持硬件级 MACsec 和 VXLANsec。这样一来,搭载了 NVIDIA Spectrum-4 的数据中心不仅各种应用跑得更加畅快,而且在网络与安全性能上也有了更加可靠的保障。
值得一提的是,考虑到不同企业的实际情况,NVIDIA 还为用户准备了全系列的智能网卡,实现了从 10G 到 400G 速率的全覆盖(10/25/40/50/100/200/400G),并且提供了包括 Cumulus Linux、Mellanox 系列产品在内的丰富网络 OS、软件及工具。英伟达收购 Mellanox 和 Cumulus Networks 所产生的巨大价值,也在 NVIDIA Spectrum-4 身上得到了极佳的展现。
2、博通Tomahawk 5
2022年8月,博通发布了业内首款商用51.2T容量的交换芯片Tomahawk 5,采用5nm制程,由台积电代工生产。采用Monolithic,裸die封装,每100Gbps功耗小于1W。
Tomahawk 5在支持传统可插拔光模块的基础上,更进一步兼容了CPO封装。与传统的可插拔光模块相比,CPO封装能够降低高达50%的功耗,这一显著优势使得数据中心在追求高性能的同时,也能实现更低的能耗。此外,Tomahawk 5还支持多种配置的交换机,包括64端口800Gbps、128端口400Gbps和256端口200Gbps,其性能是前代产品TomaHawk 4的两倍,充分满足了数据中心不断增长的网络需求。
在Tomahawk 5包含512个SerDes以每秒100Gb的速度运行,共同构建了高达51.2Tb/秒的带宽。这一强大的性能使得Tomahawk 5能够轻松应对数据中心日益增长的数据传输和处理压力。
除了卓越的性能表现外,Tomahawk 5还针对超大规模数据中心和云构建者的需求,提供了丰富的功能特性。其中包括网络虚拟化和分段技术,这些技术能够帮助数据中心实现更灵活的网络架构和更高效的资源管理。此外,Tomahawk 5还支持单通道VxLAN路由和桥接功能,为数据中心提供了更为强大的网络扩展能力和更高的传输效率。而其独特的“认知路由”功能则能够智能地避免网络拥塞,从而缩短作业完成时间,提升整体运行效率。
3Marvell Teralynx 10
2023年3月Marvell推出了用于 800 Gb/秒交换机的 51.2 T性能的 Teralynx 10交换芯片。据Marvell介绍,Teralynx 10 是更大、更胖(fat)的交换机 ASIC,是一款专为 800GbE 时代设计的 51.2T 可编程 5nm交换机芯片,旨在解决运营商带宽爆炸的问题,同时满足严格的功耗和成本要求。它可适用于下一代数据中心网络中的 leaf 和 spine 应用,以及 AI / ML 和高性能计算 (HPC) 结构。
Teralynx 10 具有 512 长距离 (LR) 112G SerDes。提供全面的数据中心功能集,包括 IP 转发、隧道、丰富的 QoS 和强大的 RDMA。它还提供可变的灵活转发,使运营商能够随着网络需求的发展对新的数据包转发协议进行编程,而不会影响吞吐量、延迟或功耗。
Teralynx 10采用了超低延迟结构,兼容 Teralynx 软件,而且还支持 Teralynx Flashlight 高级遥测技术,包括 P4 带内网络遥测 (INT)。
Teralynx 10单芯片尺寸为93X93mm,I/O数量为8855,在PCB设计部分,板材使用业界最新Low Dk/Df材料,PCB结构设计上采用12+12+12的结构设计,其中中间12层均采用2OZ铜箔,以满足芯片供电需求。
值得一提的是,早期Marvell主要生产面向园区网场景的中低端交换芯片,而在2021年Marvell收购了云数据中心商业交换机芯片供应商Innovium。Innovium于 2019 年 9 月推出了 Teralynx 5 芯片,速度范围从 1 Tb/秒到 6.4 Tb/秒,随后推出的Teralynx 7 直接与博通的“Tomahawk 4”StrataXGS对标, 2020 年 5 月,Innovium推出了 Teralynx 8 交换芯片,针对超大规模器和云构建器的叶、脊和数据中心互连 (DCI) 用例,使用 100 Gb/秒 PAM-4 编码跨 8 Tb/秒到 25.6 Tb/秒在给定带宽下创建以太网端口。
4思科Silicon One G200
2023年6月思科高调发布了其51.2T芯片G200以及其对应的25.6T芯片G202,针对AI/ML网络做了大量特性优化,正式开启了与Tomahawk 5/ Jericho 3/Spectrum 4在AI高性能网络领域的竞争。
Cisco Silicon One G200 是一款 5 纳米、51.2 Tbps、512 x 112 Gbps 的SerDes设备,具有可编程、确定性、低延迟等特性,且具备高级可见性和控制能力。Cisco Silicon One G200 提供了统一架构的优势,专注于基于以太网的增强型AI/ML和网络规模主干部署。
G200 展示了业界首款完全定制的 P4 可编程并行数据包处理器,每秒能够启动超过 4350 亿次查找。它以全速提供 SRv6 Micro-SID (uSID) 等高级功能,并支持复杂流程的完整运行到完成处理。这种独特的数据包处理架构确保了灵活性以及确定性的低延迟和功耗。
G200 拥有 512 个以太网 MAC地址,比博通 Tomahawk 5多一倍的MAC地址( Tomahawk 最多有 256 个 MAC 地址),支持100G及以下接口更大规模的组网;
思科从1999年收购半导体公司StratumOne Communications,之后通过多次收购半导体相关公司,积累了丰富的人才和技术资源。2019年,思科掀开了公司自研芯片的轰轰烈烈新序幕,并于当年12月首次推出了Silicon One芯片架构,当时称其目标是为“未来网络奠定通用基础”。
来源:牛逼的IT
https://mp.weixin.qq.com/s/hrK8pYrBdLBzrnPU5plJig
GPU技术篇:
更新提醒:“存储系统基础知识全解(终极版)”和“服务器基础知识全解(终极版)”已经更新发布,还没有获取的读者,请在点击“原文链接”在微店留言获取PDF阅读版本)。
转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价439元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情

继续阅读
阅读原文