青云 QingCloud合作伙伴无问芯穹分享:加速大模型落地的最后一公里
2023-11-17 11:35:36爱云资讯1154
青云科技聚焦 AI 算力调度等能力,通过开放生态,联合 AI 硬件及软件供应商、算法模型服务商、各地不同规模的算力服务商以及行业应用服务商等,深度融合算力、算法、行业数据以及场景应用能力,让 AI 真正能释放出业务价值。
因此,青云科技 AI 算力发布会邀请了生态合作伙伴共同分享对于 AI 落地应用的技术与实践。无问芯穹商业化副总裁李枫以《加速大模型落地的最后一公里》为主题发表精彩演讲,分享了无问芯穹在大模型落地方向的探索和进展,以下为演讲全文,经整理:
最近大模型在文本对话、图像生成等 AI 内容生成领域上取得优异的性能,标志着 AI 2.0 时代的来临。
如上图所示的例子:微软 Copilot 显著提升办公软件 Office 的效率。比如我们输入一个话题,程序可以自动生成相关的问题描述与日程安排;Midjourney 的图像生成功能,使我们可以给给出描述文字得到自动生成图片,同时能实现图中所示的缩放功能。
在 AI 2.0 时代,大模型正引导了一轮巨大的技术变革,这几个视频都展示了大模型已经能服务生产对话、代码生成,而这些能力未来将赋能千行百业的技术。然而面对大模型这样的重要技术突破,我国却在算法层和算力层都受到了限制,包括最先进的模型调用被拦截、最先进的芯片被美国限制出口,因此国产化是 AI 2.0 时代突围的必经之路。
我们可以看到国内外生态差异非常明显,国外针对不同的算法模型,英伟达提供了统一的算力平台和 Cuda 的软件生态。反观国内的多种大模型、多套硬件平台导致用户难以实现高效统一部署,因此,算法模型和硬件平台的适配成为生态和落地的最大瓶颈。
为了解决模型和算力之间的瓶颈,无问芯穹致力于提供大模型软硬一体化自动化优化方案。向上,我们服务多家大模型算法企业。向下,我们联动多家国产芯片公司。产品上,我们实现了大模型在多种硬件上的 M×N 一键部署平台,降低大模型的使用门槛,让模型部署越快越好,真正成为 AI 2.0 时代大模型的基础设施。
最后,为了助力 AI 2.0 时代大模型落地,无问芯穹着力于解决四个痛点需求:
1、支持长文本或大输入
比如之前支持 2K token 的模型,我们可以用快速推理和训练,使它支持 32K token,我们就可以做好例如专业长文本的信息检索、生成、会议聊天助手等应用。
2、提升性价比
我们把语言和多模态生成模型部署到消费级显卡,甚至手机等终端设备上,让广大客户用得起。
3、垂直领域适配
用大模型通用能力帮助各行各业的人们提升体验和效率。
4、一键式部署
让大模型能低人力成本被部署到各种场景,让每个工厂、学校、家庭甚至个人都能用到它的能力。
希望无问芯穹能真正满足客户的实际需求,解决好大模型落地的最后一公里。再次感谢青云科技的邀请,无问芯穹希望携手青云科技共创 AI 新纪元。
相关文章
- 青云QingCloud收到中国信通院感谢信
- AI 时代,青云科技与曙光存储携手布局数据航海图
- 青云科技入选“新智榜单”——人工智能应用标杆 TOP100
- 青云科技作为重点厂商入选甲子光年《中国 AI 算力行业发展报告》
- 深度融合华为昇思,青云科技智算通过昇腾兼容性认证
- 青云科技获鲲鹏原生开发认证,共筑金融数字化基石
- 朝阳区金融服务矩阵发布,青云科技作为标杆企业受邀发言
- 青云科技陪伴人形机器人的 AI 训练之旅
- 青云科技加速人形机器人研发与部署落地
- “智算+超算”一套平台搞定!青云科技助力教学科研效率 10 倍提升
- 青云QingCloud出席 “雨燕行动”:ESG 理念引领,助力企业出海新征程
- 青云QingCloud携智算亮相中国工业互联网创新发展大会
- 青云科技 × 摩尔线程,共筑国产 AI 算力新生态!
- 青云科技信创云完成与华为鲲鹏技术认证,助力国产数字化发展
- 曙光出席青云科技智算圆桌,软硬联合共筑 AI 生态
- 国家能源寿光公司X青云科技:入选“网络与信息安全技术创新典型案例”