释放算网融合动力 浪潮网络推出无损以太网解决方案
2022-04-27 15:45:16爱云资讯阅读量:1,099
人工智能正持续为产业赋能,推动智慧农业、智能制造、智慧交通、智慧零售等行业发展,而算网融合也将成为实现产业智能服务的基础底座。近日,浪潮网络发布基于RoCE的无损以太网解决方案,该方案以浪潮高性能数据中心交换机组为核心,满足在AI集群、分布式存储、HPC集群、数据中心的网络要求,助力实现算力的无缝协同,释放数据潜能,为产业发展注入创新动能。
随着智算中心的发展演进,数据量呈指数级增长,数据流量对于算力和网络提出了更高要求。传统的数据中心服务以事件为基础,计算结果通常是确定的,单个事件和相应的网络通信之间几乎没有相关性或依赖性。而智算是迭代收敛优化的过程,数据集和算法之间存在高度的空间相关性,通信流之间具有强时间相关性,因此需要具备快速、高效和无损的数据中心网络来承载发展需求。
以往以HPC(高性能计算)为代表的场景应用多采用Infiniband技术组建高带宽、低延迟的网络。但是随着RoCE技术的应用发展,使以太网在带宽、延迟方面的表现日益趋同,在性价比和发展前景上也更具优势。浪潮网络紧跟市场发展需求,以支持RoCE技术的数据中心以太网交换机为核心,推出了典型的无损以太网解决方案,其具备如下优势:
计算、存储、网络、AIStation无缝融合
通过提供统一品牌的计算、存储、网络和人工智能开发平台整体解决方案,浪潮网络可以支持PFC、ECN等网络流控技术,以构建端到端、无损、低延时的RDMA(远程直接内存访问)承载网络。而交换机完美的缓存优势,可平滑吸收突发流量,有效应对TCP incast。
此外,方案具备智能缓存管理技术(近似公平丢弃、动态报文优先级),可保护短报文的作业管理流量,确保AI集群的运行效率。并支持Telemetry技术,可以提供实时网络数据和设备状态的可视化管理。同时支持RoCE-SAN业务域,RoCE网络灵活接入,AI集群主机与交换机可以同时实现单归、双归连接。浪潮AIStation可以提供统一的主流深度学习框架(Tensorflow、Pytorch、Caffe、Mxnet、PaddlePaddle),开发训练平台以及计算资源(CPU、GPU、内存、存储)管理平台。
故障主动发现、自动倒换
RoCE-SAN网络与存储业务协同、故障快速感知,交换机快速检测到故障状态,并通知给相关业务域内订阅通知消息的服务器,以便业务快速切换到冗余路径,降低对业务的影响。针对大型无损以太网环境下PFC死锁的问题,可以提供芯片级防PFC死锁机制,实现自动检测PFC死锁及恢复。
存储即插即用
RoCE-SAN网络能够自动发现设备服务器与存储设备的接入,并通知服务器自动建立与存储设备的连接关系。
目前,浪潮网络基于RoCE的无损以太网解决方案已在南京智能计算中心等项目中得以应用,无损以太网解决方案可充分发挥浪潮整体解决方案能力的优势,满足通用计算集群、GPU加速集群、异构计算集群、分布式存储集群、全闪存存储集群等场景网络的高速、低延迟连接需求。未来,浪潮网络将继续秉承以客户为中心的发展理念,携手合作伙伴打造更多结合行业场景的网络优秀实践,为加速企业数字化转型做出贡献。
相关文章
- 联想集团与中移动达成三大合作 开启算网融合新征程
- MWCS现场:联想助力智能化转型,迈向更深层次的“算网融合“
- 中兴通讯亮相算网融合基础设施论坛,分享算力网络新思考
- 算网融合,赋能行业,中国移动开启云端算力新时代
- 联想杨元庆:“双联合璧”强劲推动“算网融合”
- 算网融合 智联全球 中国联通召开2022国际合作伙伴会议
- SCOW首次亮相HPC China 2022,以算网融合助力“东数西算”工程发展
- 一文速览:如何推进算网融合健康快速发展?
- 中国移动董事长杨杰:引领算网融合创新 激发澎湃数智能量
- 深化算网融合优势,移动云再获云计算领域认可
- 超前布局新型算网融合,联通云赋能数字化发展新趋势
- 算网融合,共赢共生,移动云生态论坛517精彩来袭!
- 算网融合,以光强算,打造数字经济核心生产力
- 移动云:全方位布局,“算网融合”服务数字化经济成长
- 释放算网融合动力 浪潮网络推出无损以太网解决方案
- 数字经济算力时代,如何推动“算网融合”