中国信通院人工智能研究所魏凯：基础模型与工程化体系为人工智能+铺平道路-爱云资讯

如果只用一个字描述2024年的人工智能，那就是“快”。一切仿佛按下了加速键，基础大模型技术加速迭代，工程化和应用赋能加速落地，安全治理也从原则走向实践。展望2025年，人工智能的进步仍然不会减速。”在12月23日举办的“2025中国信通院深度观察报告会”上，中国信通院人工智能研究所所长魏凯围绕“人工智能”这一主题分享了最新实践与发展洞察。

技术创新非常活跃

在魏凯看来，这一年，基础大模型技术加速迭代，工程化和应用赋能加速落地，安全治理也从原则走向实践。目前以大模型为主线的人工智能技术还远未定型，技术创新非常活跃。头部企业沿着规模定律，不断刷新基础大模型的能力上限。无论以任何一种基准得分为参照，梳理一年来前沿模型的提升趋势，都会呈现一条陡峭向上的曲线。

下半年以来，关于预训练扩展遇瓶颈讨论越来越多，似乎已成为行业共识。在此背景下，o1等模型的推出，为大语言模型开辟了新的扩展方向，扩展定律从另外一条路上继续前进。与此同时，从Sora、可灵、Vidu，到GPT-4o，多模态生成模型和理解模型今年也取得快速进步，正在打开机器认知和理解世界的全新通道，对后续具身智能和AGI发展奠定基础。基础模型越来越大，同时也在变得更小，今年出现了很多只有几十亿参数的小模型，在某些方向上性能可以达到以往千亿甚至万亿参数的水平，小模型能力聚焦，有望大大降低算力和应用成本，加速私有部署和边缘与端侧AI的普及。

算力与数据要素结构性变革

魏凯认为，基座大模型演进的新趋势，也会引发算力和数据两大要素的结构性变化。在算力方面，虽然现在万卡集群建设如火如荼，但随着预训练的主体的逐步收敛，考虑到高昂的建设运营成本，未来全球估计只有少数公司真正需要超大规模训练集群，超大规模训练需求有可能很快达到顶峰，增速逐渐放缓。与此相对的，应用的普及和推理侧的扩展，运行大模型所需的推理算力需求将得到激发，推动智算算力结构做出相应调整。

在数据方面，有很多观点认为，规模定律放缓或走到尽头，与数据墙有关。研究显示，全球可公开获取的互联网数据已接近天花板。未来突破数据墙，有两个途径：一是合成数据，二是数据精标，这就对人工智能的数据要素供给提出了新要求。此外，在以CommonCrawl等为源头的公开互联网数据集之外，企业数据和深网（deep web）数据是有待进一步挖掘“蓝海”。我国数据资源总量丰富，可以抓住机遇，加快培育高水平数据标注产业，挖掘高质量数据资源潜力。

工程化体系为人工智能+铺平道路

“基础模型只是整个人工智能应用架构中的一部分，甚至只是一小部分。” 魏凯强调。他进一步表示，今年，围绕大模型的工程化体系不断成熟，AI原生应用的架构实践往前迈出了一大步。检索增强生成（RAG）、智能体，甚至多智能体工作流等工程化技术得到了快速发展。

如果把大模型比作操作系统，那么智能体就像是APP。智能体以大模型为智能中枢，融合规划、记忆和工具调用等能力，在众多领域初步展现出巨大潜力。人工智能的工程化技术，看似技术含量不高，但实际上至关重要，是联结前沿技术和用户实际场景的桥梁，在降低幻觉、提升应用效果的同时，能显著降低用户使用大模型的门槛。互联网大厂纷纷推出了MaaS服务和智能体开发平台。

“但总体上看，人工智能应用服务领域的企业仍然不够多、不够强。我们正在与大厂合作，积极培育大模型服务提供商生态。” 魏凯说。

实际上，基座模型不断进步和工程化持续成熟，为人工智能+铺平了道路。“我们看到，今年随着国家实施人工智能+行动，大力推动人工智能赋能新型工业化，大模型在工业领域的应用案例越来越多，我们统计发现，价值链两端率先启动。”

在工业领域的源头创新方面，大模型在软件开发中的应用最为广泛，材料和药物研发、仿真设计等也在探索，AI提升研发效能方面的成效初现。在后端场景中，企业管理、客户服务、市场营销这三个场景，充分发挥了当前大模型的强项，成为各类企业较为普遍的入门场景。此外，消费端办公助手、智能搜索等应用量大面广，有望极大提升企业员工的人效，同样也是人工智能赋能实体经济的重要方向。

魏凯同时也强调称：“人工智能+还处于初期，政府部门和企业要应用人工智能，也是系统工程，不仅需要持续夯实数字化基础，更需要加快理念、组织和流程等变革。”

中国信通院人工智能研究所魏凯：基础模型与工程化体系为人工智能+铺平道路

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业