青云科技AI智算平台2.0直击企业AI算力管理与运维挑战
2024-06-13 16:47:31爱云资讯阅读量:20,958
AI引发的算力需求到底有多大?各种预测数据虽然并不统一,但可以肯定的是AI和大模型又将带来新一轮的生产力的变革,在这个技术催生的市场变化中,企业的应用变得更加复杂,业态会更加丰富,底层架构单一的CPU或者GPU已经不能满足需求。
青云科技日前推出了AI智算平台2.0,全面解决企业AI算力的管理与运维难题。
在AIGC领域,行业面临的普遍问题是大文本和大量行业数据加速,不同的资源需要统一平台进行管理。比如,一个影视渲染行业的用户,需要渲染一部大电影,他们可以通过青云的平台进行分发,即时构建环境调度需要用到的渲染资源。
在算力调度的基础上,平台支持自定义镜像仓库,同时内置 TensorFlow、PyTorch、MPI、DeepSpeed 等常用计算框架,支持一键创建开发机、分布式任务,自动挂载并行文件存储等常用 AI 业务流程。用户只需上传代码,即可快速启动多机多节点的分布式训练,系统将自动调度到可用 GPU 进行计算,任务完成后自动释放资源。这种自动化的算力调度分发与回收机制,让算法工程师能够更专注于 AI 模型本身,加速科研成果的创新。
在AI训练方面,用户通过开源的人类自然语言模型训练图片、数据,做模型微调,再加上自己的行业知识,也能通过青云统一的多源资源调度管理平台进行分发管理。
模型服务功能的优化,让用户可以一键部署在线推理服务,极大地提升了模型开发和部署的效率。无论是公开模型还是用户上传的自有模型,均可在线推理,满足各类业务需求。
对于管理员来说,通过青云的平台,只要通过一个管理界面、一个大屏,就能看到其分布在全国的2000台资源,3000个存储节点等等,以最少的人力大大提升管理运维效率。
借助青云公有云智算专区运营经验,平台提供规格定价、在线充值、购买产品的全流程自服务管理,减少运营的技术人员、管理人员投入,同时减少客户试用沟通和准备环境的时间,加快算力中心资源售卖,提升资源运营效率。
相关文章
- 青云科技信创云完成与华为鲲鹏技术认证,助力国产数字化发展
- 曙光出席青云科技智算圆桌,软硬联合共筑 AI 生态
- 国家能源寿光公司X青云科技:入选“网络与信息安全技术创新典型案例”
- 青云科技智算实战分享 | 云边协同,铸就金融 AI 新引擎
- 青云科技信创云入选 2024 世界计算大会专题展优秀成果
- 算力无界,合作跨界,青云科技发布AI算力生态矩阵
- 青云科技发布智算十大解决方案,引领企业数智革命
- 青云科技 9 月活动 |智算方案亮相 2024 CCF HPC 年会、中国算力大会、中国-东盟先进技术展
- 青云科技 CEO 林源:降低技术门槛,让“人工智能+”场景应用真正落地
- 青云科技智算西北2区开放,3090性价比之王来了
- 青云科技云易捷让VMware国产化替换更简单
- 青云科技KubeSphere 企业版可插拔架构优势渐显,生态持续壮大
- 青云科技 KubeSphere 企业版 4.1.2 发布,可插拔架构生态日益拓展
- 青云科技携智算方案亮相 2024 CCF HPC 年会
- 青云科技RadonDB DMP 全新领航,为企业级“云原生 + AI”数据引擎增智提效
- 青云科技发布行业智算解决方案白皮书,速来了解金融 AI 落地实践