Meta发布两款Llama 4人工智能模型

2025-04-08 10:07:34爱云资讯33951


(爱云资讯消息)Meta正式发布Llama 4系列AI模型,新一代技术现已应用于网页端及WhatsApp、Messenger和Instagram平台的Meta AI助手。此次开放下载的两款新模型包括:可在单块Nvidia H100 GPU运行的轻量版Llama 4 Scout,以及性能对标GPT-4o和Gemini 2.0 Flash的旗舰版Llama 4 Maverick。Meta首席执行官马克·扎克伯格透露,目前仍在训练中的Llama 4 Behemoth将成为全球性能最强的基座模型。

据Meta公司称,Llama 4 Scout模型具备1000万token的上下文窗口(即AI模型的工作记忆),在广泛采用的基准测试中表现优于谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型以及开源模型Mistral 3.1,同时仍可部署在单个Nvidia H100 GPU上运行。对于更大规模的Maverick模型,Meta宣称其性能对标OpenAI的GPT-4o和谷歌Gemini 2.0 Flash,在编码和推理任务中仅使用不到一半的激活参数就达到了与DeepSeek-V3相当的效果。

与此同时,Llama 4 Behemoth拥有2880亿激活参数,总参数量达到2万亿。虽然尚未发布,但Meta表示Behemoth能在多项STEM基准测试中超越竞争对手(此处指GPT-4.5和Claude Sonnet 3.7)。

对于Llama 4,Meta称其采用了混合专家模型(MoE)架构,这种设计通过仅调用模型特定模块来执行给定任务,从而节省资源。Meta公司计划在4月29日举办的LlamaCon大会上讨论AI模型与产品的未来规划。

与以往模型一样,Meta将Llama 4系列为开源,但Llama的许可证限制一直备受争议。比如,Llama 4许可证要求月活用户超7亿的商业实体在使用模型前必须获得Meta许可。而开源倡议组织早在2023年就指出,这一条款使其不符合开源定义。

相关文章

人工智能技术

更多>>

人工智能公司

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>
关于我们|联系我们|免责声明|会展频道

冀ICP备2022007386号-1 冀公网安备 13108202000871号

爱云资讯 Copyright©2018-2024