阿里云AI存储全面升级,CPFS 容量提升500%
2024-08-07 16:28:11爱云资讯阅读量:16,666
8月7日,阿里云面向AI推出全新升级的存储系统CPFS智算版,单文件系统容量提升500%达到6PB级别,在大规模训练场景中,可支持更大的数据量和更高性能。同时,CPFS全新升级系统智能引擎,冷热数据流动带宽提升20倍,可大幅降低存储成本,更好支撑大模型训练及推理。
随着大模型参数和数据集规模的迅速增长,包含更多数据量的多模态大模型也成为趋势,大模型训练对存储的要求更高,需要更快的数据读写、传输和更大的存储空间。阿里云CPFS是专为AI和高性能计算而设计的存储产品。CPFS通过创新的分布式并行存储架构设计,自研的高性能RoCE RDMA网络协议和虚拟存储通道技术,多级缓存的弹性客户端,最终实现高吞吐、低延迟、Serverless化的高性能存储能力。
为更好满足模型训练不断增长的数据量和计算密度需求,CPFS单文件系统容量从1PB提升至6PB,单计算节点可支持40个容器同时挂载。同时,通过智能数据流动引擎的升级,冷热数据可以100GB/s的高带宽实现流动:在训练前将数据从对象存储OSS中快速导入到CPFS,更好满足训练时数据高并发读取;在训练结束后,将生成的结果数据从CPFS导出到OSS,大幅降低存储成本。
针对大模型训练中的数据安全问题,CPFS通过高性能虚拟化存储通道保障数据访问安全,提供租户权限鉴权、数据隔离和性能隔离,增强端到端安全隔离和数据保护能力。CPFS集成日志服务SLS提供的日志审计能力和云备份CloudBackup自动挂载备份功能也即将上线。
复旦大学、小鹏汽车、零一万物、百川智能、元戎启行等公司和机构已经使用阿里云进行AI训练和应用,通过阿里云CPFS提供的高吞吐带宽和百亿级小文件的高性能访问,数据集的并发读取和checkpoint写效率大幅提升,为模型训练和推理提速。比如,元戎启行基于阿里云的灵骏智算和CPFS分布式存储,完成了高性能的智能驾驶训练,训练效率提升120%,并通过冷热数据的分层存储方案实现大幅成本节省。
Forrester全球AI基础设施解决方案最新报告指出,阿里云AI Infra综合产品力居全球第二。此次CPFS智算版的全新升级,是阿里云存储在面向多模态等AI发展趋势做出的新探索。在存储领域,阿里云曾获中国电子学会科学技术特等奖、世界互联网领先科技成果奖,盘古分布式存储技术还曾荣获中国发明专利金奖。
- 阿里云×端木软件助力温州市企业云化转型研讨会暨温州市十朵云系列活动圆满举行
- 阿里云、字节、浪潮信息、英特尔、电标院: OpenBMC是服务器固件大势所趋
- 海亮科技集团与阿里云达成合作 共建“教育科技数据库创新应用中心”
- 抵御自动化攻击,阿里云通信发布图形认证服务
- 阿里财报:阿里云AI相关收入三位数增长
- AI新玩法!阿里云联合优酷跨界打造Create@AI江湖创作大赛
- 阿里云AI存储全面升级,CPFS 容量提升500%
- 阿里云×端木软件携“乐享会”企业家走进阿里,研习名企创新精神!
- 阿里云×端木软件AI赋能中小企业数智化转型大会成功举办
- 阿里云通信保障短信服务数据安全
- 阿里云修复100年前巴黎奥运珍贵影像 巴赫:中国AI技术创造出了新体验
- 中国信通院发布国内首个《安全可信云电脑能力评估》报告 阿里云无影高分通过
- 市场份额第一!阿里云WAAP安全产品能力获IDC评测七项满分
- 2024世界科学智能大赛启动,上海科学智能研究院、复旦携手阿里云推动科学智能创新
- 阿里云通信与GSMA 签署MoU 协议
- 阿里云&端木软件联合主办AI智领者研讨会宁波站,共探智能新生态