浪潮信息赵帅:多元算力时代 开源开放的OpenBMC成为服务器管理优先解
2023-08-08 12:26:16爱云资讯阅读量:867
"多元算力时代下,大规模的异构服务器设备面临多种处理器架构、多种设备协议、不同管理芯片兼容的系统化设计挑战,管理固件也迎来新的变革。开源开放的OpenBMC,以创新的分层解耦软件架构,兼容不同处理器架构、算力平台和管理芯片,为多元算力基础设施提供了开放灵活的运维管理解决方案,也将推动产业形成开放、标准的管理固件生态。"浪潮信息服务器产品线总经理赵帅。
全球数字经济持续稳定增长,AIGC等创新技术应用对于算力带来了巨大的需求,算力新基建成为推动数字经济发展的核心支撑力和驱动力。据国际数据公司IDC、浪潮信息、清华大学全球产业研究院联合发布的《2022—2023全球计算力指数评估报告》显示,2022年,中国整体服务器市场规模保持6.9%的正增长,占全球市场比重达25%。其中,生成式AI计算市场规模将从2022年的8.2亿美元骤增到2026年的109.9亿美元,成为驱动互联网、金融、教育、医疗和制造等行业未来创新发展的重要引擎。
在AIGC等应用的驱动下,服务器架构正在由CPU密集型转向搭载GPU、FPGA、ASIC芯片的加速计算密集型,算力呈现出多元化的发展趋势。处理器架构也呈现多元化,x86、ARM、Power、MIPS、RISC-V等处理器架构持续并存。多元算力时代下,数据中心为保障大规模服务器的可靠稳定运行,各类异构设备统一运维的挑战日益凸显。如何实现多处理器、多芯片设备高效、稳定运行,对服务器管理控制系统BMC (Baseboard Management Controller)固件的兼容性、精细度、定制化和快速迭代能力提出了一系列新的挑战。
多元算力时代,服务器稳定可靠的"第一道防线"面临全新挑战
BMC是在服务器中嵌入的复杂而独立SOC(System on Chip)系统,是互联网、通信、金融等用户数据中心集中运维管理IT设备的核心组件,对服务器安全可靠运行、远程集中管理和控制部署至关重要。
BMC由BMC硬件和BMC固件两大部分组成。在硬件上BMC是完整的计算机系统,包含嵌入式处理器、内存(DRAM)和存储芯片(Flash),外围集成丰富的物理通道,连接数百个传感器、CPU、内存、磁盘、电源、网卡、GPU、RAID卡等各类组件,实现对服务器硬件的全方位掌控。在软件上,BMC固件基于Linux内核构建强大的嵌入式操作系统,实现远程控制、故障诊断、配置部署、固件升级等各类运维管理功能,数据中心管理平台通过BMC固件提供的Redfish、IPMI、SNMP等API接口实现海量服务器远程集中运维管理和批量部署。
BMC固件以往通常依赖IBV(Independent BMC Vendor,独立BMC固件提供商)设计的闭源商业方案,但伴随着数字化转型的快速,算力成为数字经济发展的关键要素,传统的BMC研发在架构的兼容性、开发周期、创新性方面存在越来越多的的局限性:
架构落后,平台兼容性差。算力基础设施呈现多元化发展, x86、ARM、Power、MIPS、RISC-V等通用处理器平台并存,同时GPU、FPGA、ASIC芯片等加速算力芯片百花齐放,传统BMC固件架构落后,可扩展性差,无法快速适配兼容各类算力芯片。代码闭源,存在安全风险。由于代码闭源,未经过用户和广泛的同行安全检查,隐藏的安全漏洞无法及时识别;且受限于代码封闭,数据中心用户更先进的BMC固件安全策略无法应用。开发周期长,问题处理慢。一方面,IBV Codebase代码变更频繁,已有功能、问题在产品迭代过程中延续性较差,版本稳定性也得不到保障,导致产品开发周期长;另一方面,BMC固件问题处理依赖于IBV响应速度,从用户侧反馈固件问题到问题处理完毕往往花几个月的时间,时效性无法得到保证,影响客户体验。生态封闭,阻碍固件技术创新。在多元算力飞速发展的背景下,面向特定应用场景的服务器研发,需要更多软硬件一体化设计,用户希望参与到管理固件开发中,但是传统BMC固件受限于商业模式,代码闭源,通常附带严格的代码许可使用协议,限制用户对软件的使用和分发,阻碍了固件技术创新。OpenBMC势不可挡,以开源开放加速融合多元算力的创新优势
由于传统BMC固件存在着诸多问题,且随着数据中心的不断壮大,运维需求越来越向精细化、定制化的趋势发展,业界开始探索更加开放先进的BMC固件发展之路 -- OpenBMC顺势而生。OpenBMC是一个Linux基金会项目,其目标是为BMC生成一个可定制的开源固件堆栈,该堆栈可以在服务器、网络交换机等设备上运行。OpenBMC使用Yocto、OpenEmbedded、systemd和D-Bus技术轻松构建定制的管理平台,为x86、ARM和Power等多元架构服务器平台提供统一上层接口,支撑企业、通信和云数据中心的管理服务。
OpenBMC软件架构
OpenBMC经过近十年的发展已趋于成熟,Intel、IBM、Meta(原Facebook)和Google等创始成员已经将其应用到各自产品中,国内的互联网、金融、通信、服务器、芯片等科技企业也正积极规划基于OpenBMC的BMC固件解决方案,OpenBMC应用前景势不可挡。
浪潮信息携手社区伙伴,加速OpenBMC发展
OpenBMC社区生态建设离不开业界广泛的参与和支持,作为开源技术的拥护者与重要贡献者,浪潮信息积极拥抱OpenBMC。早在2017年,浪潮信息与IBM合作贡献社区,并陆续完成多款主流服务器产品的OpenBMC适配。2022年,浪潮信息在OpenBMC社区开源代码贡献排名中保持全球第5位和中国第1位,共计贡献代码13000余行,参与社区代码审核1000余次,广泛覆盖Redfish、PLDM、LED、USB升级、OCC、时间管理、电源控制等模块,推动了社区的健康发展。
基于OpenBMC方案,浪潮信息构建起更加稳定可靠、更具扩展性且芯片级安全的开放架构通用服务器产品。以业内TOP级客户的大规模数据中心为例,其服务器规模通常高达数万或数十万台,由于需求多样,各种服务器产品配置多达400余种,每年需迭代几十次。浪潮信息通过分层解耦、模块化设计的OpenBMC方案,在BMC层面实现了软硬件的标准设计,支持服务器产品的快速、稳定迭代,从而更快、更好的满足用户资产信息管理、故障预警、远程管理和批量自动部署等需求。
充分利用OpenBMC等开源技术赋能多元算力基础设施建设,需要持续推动硬件、固件、软件、系统等多方面的协同,强化处理器、部件、管理芯片、服务器、用户各个层面的生态合作与联合优化,从开源社区中汲取能量,从而引领开放计算技术产业化落地,助力数据中心高质量发展。
相关文章
- 开辟大模型更多应用场景 浪潮云洲“知业大模型“加速赋能千行百业
- 浪潮KaiwuDB亮相第二十四届中国国际工业博览会
- 浪潮云海再破SPEC Cloud IaaS基准测试记录,三项指标领跑
- 企业大模型应用开发提速 浪潮信息发布元脑企智EPAI一体机
- 浪潮信息Infinistor:高效运维引擎,驱动企业数据价值最大化
- 专业赋能中网赛场:FILA重磅功能科技发布,引领网球装备新浪潮
- 浪潮KaiwuDB 宣布将开源版 KWDB 数据库捐赠给开放原子开源基金会
- MR头显市场将迎来41.4%爆发增长,Snap/微美全息引领AR+AI全新体验浪潮
- AI浪潮下,中小企业的增长之路——2024云栖大会上或许有答案
- 企企通联合创始人杨华:AI的浪潮下,未来供应链发展将何去何从?
- 业务与AI迎来黄金交叉点 恒为科技全方位拥抱AI浪潮
- 液气换热型液冷数据中心首个技术标准发布,浪潮信息牵头编制
- 浪潮信息:元脑企智EPAI助力金融大模型快速落地
- AI驱动智慧办公革新浪潮,微软/阿里/微美全息加速数字办公垂直领域领航
- 华为坤灵京东自营官方旗舰店开业 双方携手助推企业数智化浪潮
- 阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋