阿里云AI存储全面升级,CPFS 容量提升500%
2024-08-07 16:28:11爱云资讯阅读量:16,910
8月7日,阿里云面向AI推出全新升级的存储系统CPFS智算版,单文件系统容量提升500%达到6PB级别,在大规模训练场景中,可支持更大的数据量和更高性能。同时,CPFS全新升级系统智能引擎,冷热数据流动带宽提升20倍,可大幅降低存储成本,更好支撑大模型训练及推理。
随着大模型参数和数据集规模的迅速增长,包含更多数据量的多模态大模型也成为趋势,大模型训练对存储的要求更高,需要更快的数据读写、传输和更大的存储空间。阿里云CPFS是专为AI和高性能计算而设计的存储产品。CPFS通过创新的分布式并行存储架构设计,自研的高性能RoCE RDMA网络协议和虚拟存储通道技术,多级缓存的弹性客户端,最终实现高吞吐、低延迟、Serverless化的高性能存储能力。
为更好满足模型训练不断增长的数据量和计算密度需求,CPFS单文件系统容量从1PB提升至6PB,单计算节点可支持40个容器同时挂载。同时,通过智能数据流动引擎的升级,冷热数据可以100GB/s的高带宽实现流动:在训练前将数据从对象存储OSS中快速导入到CPFS,更好满足训练时数据高并发读取;在训练结束后,将生成的结果数据从CPFS导出到OSS,大幅降低存储成本。
针对大模型训练中的数据安全问题,CPFS通过高性能虚拟化存储通道保障数据访问安全,提供租户权限鉴权、数据隔离和性能隔离,增强端到端安全隔离和数据保护能力。CPFS集成日志服务SLS提供的日志审计能力和云备份CloudBackup自动挂载备份功能也即将上线。
复旦大学、小鹏汽车、零一万物、百川智能、元戎启行等公司和机构已经使用阿里云进行AI训练和应用,通过阿里云CPFS提供的高吞吐带宽和百亿级小文件的高性能访问,数据集的并发读取和checkpoint写效率大幅提升,为模型训练和推理提速。比如,元戎启行基于阿里云的灵骏智算和CPFS分布式存储,完成了高性能的智能驾驶训练,训练效率提升120%,并通过冷热数据的分层存储方案实现大幅成本节省。
Forrester全球AI基础设施解决方案最新报告指出,阿里云AI Infra综合产品力居全球第二。此次CPFS智算版的全新升级,是阿里云存储在面向多模态等AI发展趋势做出的新探索。在存储领域,阿里云曾获中国电子学会科学技术特等奖、世界互联网领先科技成果奖,盘古分布式存储技术还曾荣获中国发明专利金奖。
相关文章
- 黑芝麻智能与阿里云达成深度合作,携手斑马智行共建舱驾融合解决方案
- Tuya物联网平台阿里云版:助力客户打造融合开放的专属物联平台
- 汽车之家与阿里云智能集团瓴羊携手,打造汽车行业数智化“灯塔”
- 阿里云发布全栈AI负载高可用 与用户共建AI时代云上IT新治理
- 阿里云获信通院企业用云治理能力评估最高等级
- 大艺科技荣膺“中国科技创新十大品牌”,与华为、阿里云共列榜单
- 赋能应用数据传输与存储,阿里云OSS等款存储类SDK适配原生鸿蒙
- 效率提升40%! 阿里云助力易点天下程序化广告升级
- 阿里云支持叠纸新游《无限暖暖》全球多平台开服!
- 携手拥抱AI时代,端木软件再次携手阿里云举办AI智领者研讨会·成都站
- vTrus SSL证书阿里云11.11首购4折倒计时!
- 阿里云通义智能语音技术助力听力熊打造领先的AI智能终端——用大模型陪伴青少年学习成长|看见新力量NO.139
- 再登榜首!阿里云蝉联中国公有云网络安全即服务市场份额第一
- 阿里云助力童语故事跑出增长“加速度”——加速开拓C端与B端场景
- 阿里云磐久AI Infra 2.0在OCP峰会上展现AI互连技术新突破
- 阿里云×端木软件携无影云电脑精彩亮相天津市“一起益企”中小企业服务大会