千锤百炼 九天大模型是怎样炼成的?
2024-06-03 17:15:16爱云资讯3618
“九天”人工智能基座的神秘面纱在数字中国建设峰会中国移动人工智能大会上被揭开,“九天”不仅是一个技术创新的里程碑,更是助推经济社会高质量发展的强大引擎,由万卡级智算集群铸就坚实根基,千亿多模态大模型构建丰富内涵,汇聚百大要素的生态平台成就了其广阔视野与无限可能,为数字经济的蓬勃发展注入了强大动力。
“九天”亮剑,实现跨越式发展
“可上九天揽月,可下五洋捉鳖”。中国移动始终与国家的发展脉搏同频共振,自2013年起便踏上了与人工智能深度融合的探索之路,打造了全力投身人工智能技术创新和产品研发的“九天”团队,致力于将人工智能技术融入其核心业务,推动行业的智能化发展。
中国移动“九天”团队从智能客服领域入手,助力10086客服成为全球交互量最大的智能客服系统;又在大数据智能领域深入攻关,助力多个省公司显著提升了营销效益。
为进一步加快人工智能的广泛创新,中国移动2017年正式上线了“九天”人工智能平台。
该平台是国内首个运营商自主研发的人工智能平台,可助力人工智能开发者们充分利用中国移动在算力、数据等技术资源的规模化优势而敏捷、高效地实现丰富多样的人工智能算法、应用,并加速这些成果在中国移动丰富的应用场景中得到落地。
“面向通用人工智能的‘人工智能大平台’,其能力底座是大模型。”九天基础大模型研发负责人表示,AI给整个行业带来了革命性的变化,所有从事这个行业的人都会非常期待。“我相信智能化会深入到生产生活、社会治理、科学研究等方方面面,我相信它一定会让我们整个文明上升一个台阶。”
拾级而上,攻坚难题锻长板
随着科技的飞速发展,人工智能已成为引领数字化转型的重要力量。2023年3月,中国移动成立大模型研发团队,攻关通用人工智能技术,抢占科技制高点。
大模型的训推技术是一个新的方向,在全球任何一家公司都是核心机密,公开的学术论文只能窥看到冰山之一角,但这些已经是研发团队获取训练技术的最佳途径。
在九天基础大模型研发工作中,研究人员很多时候要摸着石头过河,甚至要勇闯技术“无人区”,日夜不辍地提炼技术要点,为大模型攻关积累了知识底座,结合训练过程,形成了完整的训练日志,成为了大模型攻关过程中最宝贵的知识财富。
“众人拾柴火焰高”,没有现成标准可遵循、没有成熟经验可借鉴,在这种情况下,研发团队在多方渠道收集了近500万亿字符的原始文本数据,其规模近乎覆盖了人类有史以来全量的文本类知识。他们对这些数据进行一轮又一轮的精洗和去重,优选的比例是100:1,打造出近5万亿字符的高质量训练数据集,为大模型训练奠定了数据基础。
最开始的半年时间里,算力不足、平台的断点续训功能也未开发完成,研发团队24小时日夜监控千卡集群的训练状态,第一时间处理故障、恢复训练任务。但因为对模型的超参数设置把握火候不够,训练一次次归零,一次次从头再来。在挫折面前,他们展现出极强的韧性和抗压能力,坚守一线,直到模型最终收敛出完美的曲线。
新技术要敢于在实际的生产中锤炼。在大模型训练过程中,对于高性能算力资源面临着严重的“卡脖子”问题,相应的框架、加速技术等也难以直接使用,亟需实现全链路高度自主可控的大模型训练。
现在九天语言大模型已实现在近万卡集群上进行训练,速度达130T Flops,无故障训练时长在同等规模芯片训练中达到国际领先水平,已与中石油、中航信、中化等央企建立合作,加速产业赋能。
积力所举,则无不胜;众智所为,则无不成。中国移动将与产业一道,不断建强“九天”人工智能基座,立足于在重点领域形成创新突破,推进AI在通信服务领域的创新发展及落地应用,带动我国大模型产业生态融通共赢。
相关文章
- 顶尖大模型厂商齐聚2025 TUYA全球开发者大会,共探AI如何重塑行业生态
- 海信重磅发布“云信·通途交通大模型”: 以AI之力,解锁智能交通无限可能
- 大模型用于招采评审,这样解决“AI幻觉”问题!
- AUDI携手Momenta联合打造行业首个 “德系电动豪华标准+飞轮大模型” 智能辅助驾驶方案
- 华为开发者大会 2025 发布邀请函,盘古大模型、昇腾AI云服务新进展即将公布
- 凯迪拉克VISTIQ亚洲首秀,搭载Momenta飞轮大模型定义豪华纯电智能出行
- 大模型赋能智慧交通,宇视携30+创新产品方案亮相武汉交博会
- 2025上海车展 | 讯飞星火大模型“朋友圈”持续扩大,智能座舱、智慧声场引领汽车交互新体验
- 腾讯智慧出行技术开放日:升级全栈AI能力,助力汽车产业大模型应用
- 罗盘大模型应用开发平台Compass Copilot助力企业快速搭建大模型应用
- 全国首个“AI大模型+智能体”智能查号系统,亚信科技携手天津联通打造
- 腾讯云李力:构建稳定安全的基础设施,助力大模型应用落地
- 中国电子商会大模型应用产业专业委员会正式成立 构建大模型落地“最后一公里“枢纽
- UU跑腿全面接入MCP大模型上下文协议 开启智能服务生态新纪元
- 腾讯云大模型知识引擎已率先接入MCP!拓展AI应用边界
- 腾讯云王麒:大模型+知识库,是企业落地AI的最佳路径