大语言通用能力第一!多模态图像理解能力第一!

2025-03-14 11:15:51爱云资讯15370

据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤“日日新”融合大模型斩获国内第一梯队成绩。

其中,核心的通用基础能力与多模态图像理解能力上,商汤“日日新”实现双双登顶,在16家国产主流大模型中排名第一。


通用基础能力:三大维度全面领先

此次评测的“通用基础能力”涵盖数理科学、语言能力和道德风险控制三大核心维度。商汤日日新在这三个方面均表现出色,位列第一,得分超越国际均线,展现出多维度的综合优势。

数理科学能力方面,商汤日日新以 88 分的高分位列第二,在数学推理、代码编写、科学常识等细分领域,展现出极强的逻辑推理和计算能力。报告特别指出,逻辑推理和数学能力已成为衡量大模型实力的关键分水岭。而商汤在这方面的优势尤为显著。

语言能力方面,在意图理解、角色扮演、开放式推理等方面表现优异,尤其是在语境适应性、指令遵循及输出稳定性上表现出色,确保了生成内容的准确性和一致性。

道德责任能力方面,以 75.88 分的成绩位居榜首,在风险信息识别、偏见控制等方面表现突出,充分体现了商汤在伦理安全与风险控制上的严格标准。

多模态能力:图像理解与生成双突破

在多模态能力评测中,商汤日日新同样表现亮眼。在多模态图像理解能力评测中,商汤日日新以 84.05的高分位居榜首,在文字识别、物体定位、图像风格识别、图片逻辑理解等九个细分维度中夺得三项第一,显示出强大的图像理解能力。

其中,文字识别能力在复杂背景和低质量图像中表现远超中国及国际行业平均水平;物体定位能力精准度国内领先;图像风格识别准确率显著高于中国大模型均线。

在多模态生成能力评测中,商汤秒画在商业型和艺术型图像生成方面表现优异,尤其是在商业图像生成中,图像质量、指令遵循和风格多样性得分领先,展现出强大的技术实力和应用潜力,能够很好地满足广告、电商等商业场景的需求。

专业应用能力:多行业场景表现优异

在专业应用能力评测中,商汤日日新同样处于第一梯队,位居前二。其综合能力涵盖 AI 智能体、专业文本处理及超长文本处理,展现出在复杂决策、专业知识理解与长文本推理方面的强大能力。

在行业应用能力方面,商汤日日新在金融、医疗、政务、教育等 14 个行业场景中均表现优异,体现了其对不同领域知识的深度理解和应用能力,以及强大的行业适配性和落地能力。

自 2023 年 4 月首次发布以来,日日新 SenseNova 大模型体系已进行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行业内率先实现了原生融合模态训练的突破,打破了大语言与多模态分立的局面,支持文本、图像、视频、语音等多源异构信息的综合处理,为多场景应用奠定了坚实基础,推动了AI大模型的工业化发展。

相关文章

人工智能技术

更多>>

人工智能公司

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>
关于我们|联系我们|免责声明|会展频道

冀ICP备2022007386号-1 冀公网安备 13108202000871号

爱云资讯 Copyright©2018-2024