腾讯发布星脉网络2.0：大模型训练效率相比上代提升20%-爱云资讯

7月1日，腾讯宣布其自研星脉高性能计算网络升级至2.0版本，星脉网络2.0搭载全自研的网络设备与AI算力网卡，支持超10万卡大规模组网，网络通信效率比上一代提升60%，让大模型训练效率提升20%，定位从天级降低至分钟级。

腾讯自研交换机从 25.6T 升级到 51.2T，容量提升一倍；自研硅光模块从 200G 升级到 400G，速率提升一倍；搭载自研算力网卡；整机通信带宽 3.2T，为业界最高。

腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上，拥塞算法也从被动拥塞算法升级为主动拥塞控制算法，将星脉网络的通信效率提升 30%，让大模型的训练效率提升 10%。

腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信，实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异，自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%，让大模型的训练效率再提升 10%。

TiTa 与 TCCL 升级带来的效果叠加，让星脉网络的通信效率共提升 60%，大模型训练效率共提升 20%。

腾讯云副总裁王亚晨这样比喻，AI大模型就像是一场F1比赛，腾讯云专门设计了星脉高性能算力网络“赛道”，并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”，共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。

腾讯发布星脉网络2.0：大模型训练效率相比上代提升20%

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业