商汤又“夺金”!SuperCLUE-V多模态大模型基准发布10月榜单
2024-10-14 13:53:36爱云资讯8999
在这个金秋,“日日新·商量”又拿了金牌!
今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。凭借卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。
今日,中文多模态大模型测评基准SuperCLUE-V发布10月榜单:商汤日日新·商量多模态大模型(SenseChat-Vision5.5)凭借多个任务上的出色表现,总得分位列国内大模型第一梯队,智夺金牌。凭借卓越的多模态基础能力和出色的应用能力,商汤SenseChat-Vision 5.5荣获了总分73.56的高分,并在数理逻辑维度取得第一,体现其强大的推理能力。
SenseChat-Vision5.5基础能力突出,
数理逻辑维度超越GPT-4o
本次SuperCLUE-V涵盖了国内外最具代表性的11个开源/闭源多模态理解大模型,聚焦多维度能力评估,包括基础能力和应用能力两个大方向,以开放式问题形式对多模态大模型进行评估,涵盖了8个一级维度30个二级维度。报告称SenseChat-Vision 5.5在基础能力-数理逻辑推理任务如图表推理、场景推理方面具备领先优势。榜单显示,在数理逻辑分析能力中,SenseChat-Vision 5.5超越国内外所有参评模型包括GPT-4o的最新版本,位列第一。
前瞻构造高阶思维逻辑数据,
用推理能力增强AI大模型智能
如今,复杂推理成为各模型之间的重要能力壁垒。对于大模型能力的分层,商汤科技董事长兼CEO徐立此前就提出三层架构(KRE)理论,即:第一层知识(Knowledge),世界知识的全面灌注;
第二层推理(Reasoning),理性思维的质变提升;
第三层执行(Execution),世界内容的互动变革。
目前,SenseChat5.5已经应用在商量网页版(WEB)——一款擅长高效搜索、整理、输出信息的智能应用,工作、学习、生活中的任何问题,问问商量,都能解决。
相关文章
- 商汤大装置亮相“智算申城”,端到端能力赋能AI产业
- 商汤2024年度业绩:“三位一体”战略成效显著,生成式AI连续两年实现三位数增长
- 王晓刚:商汤绝影引领智能汽车进入AGI时代 | GTC 2025
- “城市服务”学会“深度思考”,商汤这两款产品接入DeepSeek!
- 中标昆明AI赋能项目 商汤智慧城市版图再落一城
- 商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
- 商汤推出“日日新”融合大模型,勇夺“双冠王”
- 商汤科技当选工信部人工智能标准技术委员会首届委员单位
- 新身份!商汤大装置推动AI云标准制定
- 市场份额稳居前三!商汤智算服务持续领跑
- 商汤科技董事长徐立:强化创新,以人工智能助力高质量发展
- 钛动科技闪耀量子位MEET 2025,与零一万物、商汤科技等共探AI新浪潮
- 蝉联两届!商汤董事长徐立论文再获“时间检验奖”
- 商汤绝影首发AI汽车创新产品,世界模型「开悟」全新升级
- 商汤用AI大模型重建未来城市样貌
- 提效30%,降本80%!商汤大模型让智慧园区效能倍增