加速原生创新,智谱携手昇腾、昇思打造自主创新原生模型
2024-08-21 17:09:10爱云资讯3792
2024年8月19日,北京人工智能生态大会在中关村国家自主创新示范区会议中心颐和厅成功召开。智谱CEO张鹏作专题分享,简要介绍了昇腾对自主创新的智谱大模型的助力,以及正在打造的基于昇腾的第四代代码模型CodeGeeX4和多模态模型CogVLM2-video,华为昇腾计算业务副总裁刘鑫介绍昇腾原生进展。
智谱代码生成大模型CodeGeeX4的新版本基于昇腾AI与昇思AI框架训练,依托昇腾与昇思的多维混合分布式并行技术等软硬件能力等,将大幅提升模型开发、训练的效率及模型精度。
智谱CEO 张鹏
华为昇腾计算业务副总裁 刘鑫
模型能力
1.代码生成大模型CodeGeeX4
第四代代码模型CodeGeeX4堪称代码生成大模型的“六边形战士”,已经发布的CodeGeeX4-ALL-9B 仅用百亿级参数实现模型精度超越业界主流产品。在NaturalCodebench等测试基准上,相对于更大的模型实现了性能反超。
CodeGeeX4单一模型实现编程开发全流程覆盖,包括需求设计、前端开发、后端开发、数据处理等场景,支持代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等全面能力。模型长序列达128K,支持中文、英文、俄语、法语、西班牙语等20+自然语言和300+编程语言。同时,在模型推理可实现单卡部署,最低24GB显存即可进行量化推理,用户可在本地私有化部署,保护企业代码安全。
2.多模态大模型CogVLM2-video(视频生成文本)
多模态大模型CogVLM2-video实现视频生成文本能力,支持2K序列长度、224×224分辨率的视频理解以及中英文回答等功能。测试实践显示,CogVLM2-video在多个视频问答任务上达到了state-of-the-art SOTA模型)的性能,并能够实现一分钟内的视频理解,在几个主流性能测试数据集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表现不俗,展现出全面竞争力,同时在多类主要指标上完成对其他模型的领先。
基于昇腾与昇思的新版本CodeGeeX4
CodeGeeX4在训练过程中,调用昇腾原生的融合算子,利用昇思MindSpore AI框架的提供的多维混合分布式并行能力,通过对流水交织并行、tensor模型并行的优化,解决内存瓶颈、降低计算空泡、提升通信效率,实现“计算、网络、存储”协同优化,对比同等规模参数的模型,训练效率20%提升,加速模型的迭代创新。
另外,该模型也采用MindSpore 2.3版本原创的多级编译技术,开启O1编译选项增加自动算子融合优化,以接近动态图的启动时间获取了图模式下接近理论值的内存复用率,进而降低重计算比例,相对动态图获得15%的性能收益。
未来,智谱将与昇腾AI持续携手,打造更多领先的自主创新大模型,加速人工智能产业发展,助力中国千行百业的智能化转型,共同迈向智能新世界。
相关文章
- 满血版DeepSeek落地东南大学!昇腾先进架构和卓越性能全程护航
- 清华大学鲲鹏昇腾科教创新卓越中心专项合作启动,引领高校科研和人才培养新模式
- 上海交大师生畅用满血DeepSeek!昇腾加速中国自主创新大模型
- 优刻得率先完成基于华为昇腾国产芯片的DeepSeek模型适配
- “边学边赛”模式来到顶尖高校,昇腾AI人才生态布局渐入佳境
- 深度融合华为昇思,青云科技智算通过昇腾兼容性认证
- 高校专场赛年度收官战圆满落幕 2024昇腾AI原生创新算子挑战赛西安交通大学专场赛成功举办
- 持续发力AI+安全领域,启明星辰荣获昇腾AI创新大赛2024全国赛“银奖”!
- 巅峰盛典 星光璀璨!昇腾AI创新大赛2024总决赛成功举行
- 复旦大学与华为共建鲲鹏昇腾科教创新孵化中心 着力科研创新与人才培养
- 激发高校人才创新,引领AI技术新潮流 | 昇腾AI原生算子挑战赛上海交通大学专场
- 创新交锋 决战AI之巅 | 昇腾AI创新大赛2024全国总决赛将于厦门开赛
- 北京理工大学鲲鹏昇腾科教创新孵化中心成立 打造教育、科技、人才融合发展新标杆
- 云天励飞与昇腾联合打造智算中心解决方案,加速边缘AI向全场景渗透
- 以赛促学赋能原生人才培养 昇腾AI原生创新算子挑战赛北京大学专场赛收官
- 边学边赛 等你来战 | 昇腾AI原生创新算子挑战赛中国科学技术大学专场赛圆满落幕