Meta发布两款Llama 4人工智能模型-爱云资讯

（爱云资讯消息）Meta正式发布Llama 4系列AI模型，新一代技术现已应用于网页端及WhatsApp、Messenger和Instagram平台的Meta AI助手。此次开放下载的两款新模型包括：可在单块Nvidia H100 GPU运行的轻量版Llama 4 Scout，以及性能对标GPT-4o和Gemini 2.0 Flash的旗舰版Llama 4 Maverick。Meta首席执行官马克·扎克伯格透露，目前仍在训练中的Llama 4 Behemoth将成为全球性能最强的基座模型。

据Meta公司称，Llama 4 Scout模型具备1000万token的上下文窗口（即AI模型的工作记忆），在广泛采用的基准测试中表现优于谷歌的Gemma 3和Gemini 2.0 Flash-Lite模型以及开源模型Mistral 3.1，同时仍可部署在单个Nvidia H100 GPU上运行。对于更大规模的Maverick模型，Meta宣称其性能对标OpenAI的GPT-4o和谷歌Gemini 2.0 Flash，在编码和推理任务中仅使用不到一半的激活参数就达到了与DeepSeek-V3相当的效果。

与此同时，Llama 4 Behemoth拥有2880亿激活参数，总参数量达到2万亿。虽然尚未发布，但Meta表示Behemoth能在多项STEM基准测试中超越竞争对手（此处指GPT-4.5和Claude Sonnet 3.7）。

对于Llama 4，Meta称其采用了混合专家模型（MoE）架构，这种设计通过仅调用模型特定模块来执行给定任务，从而节省资源。Meta公司计划在4月29日举办的LlamaCon大会上讨论AI模型与产品的未来规划。

与以往模型一样，Meta将Llama 4系列为开源，但Llama的许可证限制一直备受争议。比如，Llama 4许可证要求月活用户超7亿的商业实体在使用模型前必须获得Meta许可。而开源倡议组织早在2023年就指出，这一条款使其不符合开源定义。

Meta发布两款Llama 4人工智能模型

相关文章

人工智能技术

人工智能公司

人工智能硬件

人工智能产业