双引擎驱动:百度百舸携手昆仑芯,保障DeepSeek稳定安全部署

2025-02-19 15:35:00爱云资讯8191

2月18日晚,百度发布2024年Q4及全年财报。数据显示,百度2024全年总营收1331亿元,归属百度核心净利润达234亿元,同比增长21%。受AI驱动,百度智能云呈高速增长,四季度收入同比增长达26%,成为公司重要的增长引擎。

百度创始人李彦宏表示:“2024年是我们从以互联网为中心转向以人工智能为先的关键一年。随着我们全栈AI技术得到广泛的市场认可,智能云的增长态势愈发强劲。”在全栈AI技术方面,百度已经形成了从云基础设施、框架、模型到应用的四层架构,能够形成高效的反馈闭环,帮助大模型不断调优迭代,实现端到端的优化。

在财报电话会上,百度集团执行副总裁,百度智能云事业群总裁沈抖在谈到云基础设施时表示,得益于更快、更先进的网络架构,2024年第四季度,百度智能云将统一GPU集群的规模扩大了一倍,但仍然实现了99%的有效训练时间,这证明了百度智能云大规模提供峰值性能的能力。

此外,百度智能云近期成功点亮昆仑芯P800万卡集群,未来还将进一步点亮三万卡集群。昆仑芯万卡集群不仅为企业提供了强大的算力支持,还显著提升了资源利用率,降低了大模型训练成本,推动模型降本增效,为企业提供稳定、高效的算力支持。

春节期间,DeepSeek凭借其卓越的技术性能和创新功能,迅速在市场中崭露头角,实现了C端用户数量的爆发式增长。然而,当考虑将其应用于企业业务时,除了模型本身强大的性能之外,稳定性和安全性也是关键因素。为此,百度百舸基于昆仑芯P800,发布部署 “满血版DeepSeek R1+联网搜索” 服务。通过联网搜索功能,将最新的互联网数据融入答案生成,为企业提供更及时、准确的信息支持,让企业业务不再等待,高效运转成为常态。现在,企业用户及开发者朋友们可以通过访问aihc.baidu.com申请体验测试资格。

昆仑芯率先完成训练推理DeepSeek全版本适配

在模型适配方面,昆仑芯领先业界。在DeepSeek-V3/R1上线不久,昆仑芯便率先完成全版本模型适配,这其中包括DeepSeek MoE 模型及其蒸馏的Llama/Qwen等小规模dense模型。

昆仑芯P800在性能上表现卓越,这使得昆仑芯在部署上更加轻松,运行成本显著降低,还能轻松完成DeepSeek-V3/R1全版本推理任务。不仅如此,昆仑芯P800在DeepSeek系列MoE模型大规模训练任务中也表现出色,全面支持MLA、多专家并行等特性,仅需32台即可支持模型全参训练,高效助力模型的持续训练和微调。

同时,为了满足企业客户私有化部署的需求,百度智能云分别发布了百舸DeepSeek一体机、千帆DeepSeek一体机,均支持昆仑芯P800 单机 8 卡部署满血版 DeepSeek R1/V3。百舸DeepSeek一体机可满足高性能训练与推理需求,从开箱上电到服务上线最快仅需半天。而千帆DeepSeek一体机除了满足训推需求之外,还为企业提供了一站式的模型应用解决方案,能够满足企业全链路模型开发应用工具链需求,具备更强、更全面的应用开发能力。

百舸4.0助力昆仑芯万卡集群建设,打造“多快稳省”AI基础设施

目前,百度智能云已成功点亮昆仑芯P800万卡集群,这也是国内首个正式点亮的自研万卡集群。百度智能云将进一步点亮3万卡集群。国产昆仑芯万卡集群以及未来三万卡集群的建设,从硬件到软件,技术挑战是全方位的。而24年9月升级的百度百舸AI异构计算平台4.0,围绕落地大模型全旅程的算力需求,在集群创建、开发实验、模型训练、模型推理四大方面,能为企业提供“多芯、快、稳、省”的AI基础设施,在万卡集群的建设中发挥了至关重要的作用。

在DeepSeek最擅长的推理能力方面,百度百舸还提供了针对在线推理服务的全生命周期管理、弹性扩缩容、自研框架推理加速、完备的运维监控体系等优势能力,结合昆仑芯P800的强大算力,为用户提供服务稳定性的联合保障,同时有效降低推理成本并提升推理性能。

相关文章

人工智能技术

更多>>

人工智能公司

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>
关于我们|联系我们|免责声明|会展频道

冀ICP备2022007386号-1 冀公网安备 13108202000871号

爱云资讯 Copyright©2018-2024