大语言通用能力第一!多模态图像理解能力第一!
2025-03-14 11:15:51爱云资讯15368
据弗若斯特沙利文(Frost & Sullivan, 简称“沙利文”)联合头豹研究院发布的《2025年中国大模型年度评测》结果显示:在语言和多模态核心能力测评中,商汤“日日新”融合大模型斩获国内第一梯队成绩。
其中,核心的通用基础能力与多模态图像理解能力上,商汤“日日新”实现双双登顶,在16家国产主流大模型中排名第一。
通用基础能力:三大维度全面领先
此次评测的“通用基础能力”涵盖数理科学、语言能力和道德风险控制三大核心维度。商汤日日新在这三个方面均表现出色,位列第一,得分超越国际均线,展现出多维度的综合优势。
数理科学能力方面,商汤日日新以 88 分的高分位列第二,在数学推理、代码编写、科学常识等细分领域,展现出极强的逻辑推理和计算能力。报告特别指出,逻辑推理和数学能力已成为衡量大模型实力的关键分水岭。而商汤在这方面的优势尤为显著。
语言能力方面,在意图理解、角色扮演、开放式推理等方面表现优异,尤其是在语境适应性、指令遵循及输出稳定性上表现出色,确保了生成内容的准确性和一致性。
道德责任能力方面,以 75.88 分的成绩位居榜首,在风险信息识别、偏见控制等方面表现突出,充分体现了商汤在伦理安全与风险控制上的严格标准。
多模态能力:图像理解与生成双突破在多模态能力评测中,商汤日日新同样表现亮眼。在多模态图像理解能力评测中,商汤日日新以 84.05的高分位居榜首,在文字识别、物体定位、图像风格识别、图片逻辑理解等九个细分维度中夺得三项第一,显示出强大的图像理解能力。
其中,文字识别能力在复杂背景和低质量图像中表现远超中国及国际行业平均水平;物体定位能力精准度国内领先;图像风格识别准确率显著高于中国大模型均线。
在多模态生成能力评测中,商汤秒画在商业型和艺术型图像生成方面表现优异,尤其是在商业图像生成中,图像质量、指令遵循和风格多样性得分领先,展现出强大的技术实力和应用潜力,能够很好地满足广告、电商等商业场景的需求。
专业应用能力:多行业场景表现优异在专业应用能力评测中,商汤日日新同样处于第一梯队,位居前二。其综合能力涵盖 AI 智能体、专业文本处理及超长文本处理,展现出在复杂决策、专业知识理解与长文本推理方面的强大能力。
在行业应用能力方面,商汤日日新在金融、医疗、政务、教育等 14 个行业场景中均表现优异,体现了其对不同领域知识的深度理解和应用能力,以及强大的行业适配性和落地能力。
自 2023 年 4 月首次发布以来,日日新 SenseNova 大模型体系已进行了多次大版本迭代。今年 1 月推出的日日新融合大模型更是在行业内率先实现了原生融合模态训练的突破,打破了大语言与多模态分立的局面,支持文本、图像、视频、语音等多源异构信息的综合处理,为多场景应用奠定了坚实基础,推动了AI大模型的工业化发展。
相关文章
- 大语言通用能力第一!多模态图像理解能力第一!
- 2025 GDC大会AI应用成亮点,微美全息多模态AI开源探索未来
- 金山云完成阶跃星辰最新两款开源多模态大模型适配
- 海纳AI获5000万融资:多模态算法+亿级数据,领跑AI招聘技术革命
- 涂鸦智能×DeepSeek:多模态AI重塑宠物养护新范式
- 天数智芯完成阶跃星辰开源多模态大模型适配,共筑AI开源新生态
- 让大模型“看得懂”,腾讯混元多模态图文理解模型居全球第一梯队
- 基石智算大模型服务公测中,创建自己的多模态 AI 应用!
- 微筑科技多模态智能技术:为工业安全生产注入强劲动力
- 超级文生视频模型Sora正式来了!多模态训练数据是关键
- 出门问问多模态大模型又添新备案!「序列猴子」语音大模型成功完成备案
- 明略科技向港交所递交上市申请,多模态数据智能应用释放成长潜力
- 彩讯股份与智象未来达成战略合作,推动多模态大模型及AI应用落地
- ChatGPT引领AIGC飞跃,微美全息多模态AI赋能企业增长
- 度小满联合哈工大创新研发SmartTrim 助推多模态在金融领域落地
- 技术解码 | 多模态大模型AI安全员为无人驾驶保驾护航