全球最强开源模型!阿里通义千问登顶国内第一:超越一众开闭源
2024-07-10 17:38:41爱云资讯5107
7月10日消息,根据SuperCLUE发布的中文大模型基准测评最新报告,阿里通义千问开源模型Qwen2-72B-Instruct以卓越的表现位居国内通用能力第一,更在全球范围内成为最强开源模型。
SuperCLUE报告详细披露了对国内外33个大模型的综合测评结果,Qwen2-72B在一级总分上以77分的高分与Claude-3.5-Sonnet并列第二,仅次于OpenAI的GPT-4o。
这一得分超越了百度文心一言4.0、讯飞星火V4.0、Llama-3-70B等开闭源大模型。
具体来看,在理科、文科和Hard三个维度的具体测评中,Qwen2-72B展现了全面而均衡的能力。
特别是在理科任务上,Qwen2-72B与GPT-4o的分差仅为5分,显示出其在计算、逻辑推理和代码测评方面的强劲实力。

在文科任务和Hard任务上,Qwen2-72B同样表现不俗,得分均达到了76分,与GPT-4o的得分相差无几。
特别值得一提的是,在端侧小模型测评中,Qwen2-7B以70亿参数的模型规模,超越了上一代320亿参数的Qwen1.5-32B和130亿参数的Llama-3-8B-Instruct,夺得了排名第一的宝座。
这一成绩不仅证明了Qwen2-7B在小尺寸模型中的极致性能,也极大提升了端侧小模型落地的可行性。
数据显示,截至目前Qwen系列模型的下载量已突破2000万次,其应用场景覆盖了工业、金融、医疗、汽车等多个垂直领域。
相关文章
- 阿里云升级Premier级别WhatsApp官方商业解决方案提供商,赋能全球企业高效连接20+亿用户
- 叫叫亮相阿里云AI势能TECH DAY:AI为教育插上想象的翅膀
- 重磅发布!亚信科技、阿里云大模型一体机,让百行千业用上普惠AI
- 接入 DeepSeek、联合阿里云,传音AI战略玩出新高度!
- 阿里云 Chat App 打通模型服务, 0代码接入智能体应用
- AI耳机AIxFU来了!基于阿里云通义大模型深度打磨,性能、智能、价格重新定义行业标准
- 变革通话体验,中国移动携手阿里云通义、华为打造“交互通话”新时代
- 倍益康亮相阿里巴巴国际站跨境出海生态大会,拓展国际市场商机
- 阿里正式推出AI旗舰应用 新夸克发布“AI超级框”
- 阿里云“上云采购季”开启:AI主流大模型直降88%,超200款云产品爆优惠
- 中国移动阿里云和中兴通讯联合打造的能力开放解决方案荣获GSMA GLOMO “Open Gateway挑战奖”
- 阿里开源模型万相2.1引爆视频赛道!谷歌/微美全息加入全模态AI开源新时代!
- 阿里云PolarDB重磅发布云原生与Data+AI新特性,打造智能时代数据引擎
- 恺英网络携手阿里云 共探游戏产业新未来
- 阿里云操作系统控制台上线,追踪隐式资源,巧解内存难题!
- 阿里云推出短信模板 AI 助手,模板审核通过率高达 98%