GLM-4-Plus在SuperCLUE基准测评和司南Compass Arena榜单均位居国内第一
2024-11-16 13:24:32爱云资讯127875
11月8日,中文大模型测评基准SuperCLUE发布《中文大模型基准测评2024年10月报告》,智谱GLM-4-Plus凭借出色的能力表现,在43个国内外大模型中位居第一梯队,总得分位列国内大模型首位。
SuperCLUE中文大模型基准测评旨在通过多维度综合性测评,对国内外大模型的发展趋势和综合效果进行实时跟踪。本次10月报告聚焦通用能力测评,选取了国内外有代表性的43个大模型,采用多维度、多层次的综合性测评方案进行测评。测评结果显示,o1-preview的推出进一步拉大了与其他模型的差距,国内大模型第一梯队竞争激烈,持续迭代表现不俗。其中国内闭源模型GLM-4-Plus、SenseChat 5.5、AndesGPT-2.0表现优异,与ChatGPT-4o-latest相距2分以内。基于大模型在基础能力和应用能力的表现,共有23个国内大模型入选SuperCLUE模型象限。智谱GLM-4-Plus位居【卓越领导者】,代表模型在基础和场景应用上处于领先位置,引领国内大模型发展。
11月14日,在司南OpenCompass公布的大语言模型对战榜单Compass Arena中,智谱GLM-4-Plus的竞技场评级分数位列榜首,领先GPT-4o-20240513。
Compass Arena 大语言模型对战榜单致力于构建一个完全基于用户真实反馈的公正、开放、透明的榜单。用户根据与大模型的真实对话体验进行投票,依据投票结果,使用 Elo 评分系统对大模型进行排名。
据悉,GLM-4-Plus 是智谱全自研 GLM 大模型的最新版本,它标志着智谱继续瞄准通用人工智能,持续推进大模型技术的独立自主创新。作为智谱最新旗舰模型,在语言理解、逻辑推理、指令遵循、长文本输出方面都有较大突破。GLM-4-Plus 成为智谱全模型家族坚实的能力底座,在代码计算、数据分析、图像/视频特征识别等领域均实现性能的大幅提升,及成本的大幅下降,目前已上线智谱开放平台。
相关文章
- 联通数科“同舟AI+”:加速大模型落地应用
- 垂类模型接入智能终端 易车蓝图大模型与荣耀YOYO达成战略合作
- 易车蓝图大模型加入荣耀YOYO生态 融合进阶“智能革命”时代
- 鼎捷携手DeepSeek大模型,开启中国制造业AI智慧化新时代
- 率先接入DeepSeek V3最新版!腾讯云大模型知识引擎高效搭建金融AI应用
- 中国AI再出王炸!全球首个音乐推理大模型Mureka O1上线,硅谷彻底碎了
- 腾讯云x DeepSeek:率先上线最新版V3模型API接口、大模型知识引擎内置新模型服务
- 百度发布文心4.5与X1大模型,微美全息软硬协同算力生态树立AI典范
- 宇视发布大模型交通事件检测相机,让道路拥有会思考的眼睛
- 第一线DYXnet协同华为构建AI算网 加速企业大模型私域部署
- AI把脉精准捕捉熬夜信号!知医邦ChatiSS查体大模型助力基层诊疗
- 全球领先宠物医疗AI大模型Vet1正式发布,推动宠物行业智能化变革
- 华为软件应用市场发布:循环智能核心大模型应用产品正式上架授牌
- 把误报降下来!宇视大模型精准打击矿山盗采
- 突破复杂版面及图表解析难题,合合信息“大模型加速器”再升级
- 润和软件亮相华为中国合作伙伴大会2025,发布DeepSeek一体机,引领行业大模型敏捷落地