腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
2024-07-03 09:08:30爱云资讯阅读量:14520
7月1日,腾讯宣布其自研星脉高性能计算网络升级至2.0版本,星脉网络2.0搭载全自研的网络设备与AI算力网卡,支持超10万卡大规模组网,网络通信效率比上一代提升60%,让大模型训练效率提升20%,定位从天级降低至分钟级。
腾讯自研交换机从 25.6T 升级到 51.2T,容量提升一倍;自研硅光模块从 200G 升级到 400G,速率提升一倍;搭载自研算力网卡;整机通信带宽 3.2T,为业界最高。
腾讯自研全新通信协议 TiTa2.0 的部署位置从交换机转移到了网卡上,拥塞算法也从被动拥塞算法升级为主动拥塞控制算法,将星脉网络的通信效率提升 30%,让大模型的训练效率提升 10%。
腾讯全新高性能集合通信库 TCCL2.0 采用 NVLINK+NET 异构并行通信,实现数据的并行传输。Auto-Tune Network Expert 自适应算法可以根据机型、网络规模、模型算法等差异,自动调整数据包分割大小、匹配算法等参数。星脉网络通信性能提升 30%,让大模型的训练效率再提升 10%。
TiTa 与 TCCL 升级带来的效果叠加,让星脉网络的通信效率共提升 60%,大模型训练效率共提升 20%。
腾讯云副总裁王亚晨这样比喻,AI大模型就像是一场F1比赛,腾讯云专门设计了星脉高性能算力网络“赛道”,并自研了TiTa和TCCL网络协议作为“赛事指挥中心与专业车队”,共同让“腾讯云高性能计算集群HCC的GPU服务器”这台F1赛车发挥最大的算力性能。
相关文章
- 2024腾讯犀牛鸟开源人才培养计划启动,开放混元文生图、tRPC等项目实践
- 腾讯发布星脉网络2.0:大模型训练效率相比上代提升20%
- 腾讯云发布专有云智算套件,助力企业打造专有智算云
- 腾讯云TBDS+WeData企业级数据中台荣获IDC工业领域最佳实践案例
- 腾讯李博:与广汽丰田探索大模型创新应用,共建未来出行新生态
- 腾讯主导!新一代实时语音编码标准AVS3P10即将发布
- 通过大模型备案!腾讯云助力心言集团用AIGC重构泛心理行业
- 出门问问与腾讯云深化合作,共创生成式AI与语音交互新发展
- AIGC落地应用:腾讯云如何助力产业智能化升级?
- 可对比分析多个网页内容,腾讯元宝AI解析能力升级
- 腾讯混元文生图大模型开源训练代码与新插件,持续建设开源生态
- 腾讯云联合统信软件发布国产域管解决方案,筑牢身份安全基座
- 广汽与腾讯签署深化战略合作框架协议,共谋AI时代智能化新发展
- 浪潮信息与腾讯云联合发布TDSQL数据库一体机
- 腾讯云数据库2篇论文入选行业顶会SIGMOD,技术创新获权威认可
- 亿咖通携手腾讯打造智驾、智舱,分工协作是智能汽车落地“最优解”
热门文章
头条文章
重点文章
推荐文章
热点文章