文心一言数学和中文理解能力全球第?清华最新报告出炉
2024-04-22 10:20:24爱云资讯阅读量:1,012
4月21日,由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》,结果显示:文心一言4.0表现亮眼,与国际一流模型水平接近,且差距已经逐渐缩小。
在人类对齐能力评测中,文心一言4.0位居国内第一;中文理解上,文心一言4.0领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,和文心一言4.0分差超过1分。
在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中;在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。
在安全性评测上,国内模型文心一言4.0拿下最高分(89.1分),Claude-3仅列第四。
据悉,自文心一言首发至今,用户数已突破2亿。
相关文章
- 百度薛苏:文心一言APP月活超千万,调用量超14亿
- 五一出游“含AI率”狂飙 文心一言APP旅游智能体用户首日暴增12倍
- 文心一言数学和中文理解能力全球第?清华最新报告出炉
- 百度李小婉:四大能力全面升级,文心一言APP专业版更流畅高效
- 百度Q3财报:营收344.47亿元 文心一言用户数已达7000万
- 小度全面拥抱文心一言,发布多款AI原生新物种
- 文心一言开放首日,百度搜索超3亿次需求由生成式智能引擎解决
- 金山办公:已与百度文心一言开展联合测试
- 百度袁佛玉:文心一言将改变云计算市场游戏规则
- 百度文库接入文心一言,国内首个生成式AI文档服务即将上线
- 万兴科技:已有商用账号开通GPT-4 API接口,旗下亿图将率先试用文心一言
- 中兴通讯服务器助力百度“文心一言”,开创AI新时代
- 李彦宏:文心一言对标ChatGPT门槛很高,百度在全球大厂中第一个做出来
- 文心一言发布在即 百度智能云升级三大配套云服务
- 百度将于3月16日围绕文心一言召开新闻发布会
- 标普云宣布成为百度文心一言首批生态合作伙伴 AIGC加速企业数字化经营