360联合北大震撼发布!5%参数量逼近Deepseek-R1满血性能
2025-02-25 17:00:12爱云资讯9417
2025年2月24日——由360与北京大学联合研发的中等量级推理模型Tiny-R1-32B-Preview正式亮相,仅以5%参数,逼近Deepseek-R1-671B的性能。
核心突破:小模型,大能量
▪ 数学领域:以78.1分(AIME 2024评测)逼近原版R1模型(79.8分),远超Deepseek-R1-Distill-Llama-70B(70.0分);
▪ 综合性能:在编程(LiveCodeBench 61.6分)、科学(GPQA-Diamond 65.0分)领域全面领先最佳开源70B模型Deepseek-R1-Distill-Llama-70B;
▪ 效率跃迁:仅需5%参数量,性能达原版R1的95%以上,推理成本大幅降低。
技术革新:领域专精+模型融合
研究团队使用「分治-融合」策略:
▪ 基于DeepSeek-R1生成海量领域数据,分别训练数学、编程、科学三大垂直模型;
▪ 通过Arcee团队Mergekit工具智能融合,突破单一模型性能上限,实现多任务均衡优化。
开源承诺:推动技术普惠
▪ 模型仓库:https://huggingface.co/qihoo360/TinyR1-32B-Preview
▪ 即将公开完整技术报告、训练代码及部分数据集;
▪ 践行开源精神,助力AI社区共筑高效推理新生态。
研发团队表示:「Tiny-R1-32B-Preview是蒸馏技术的里程碑,未来将持续探索更轻量、更强大的通用模型,推动AI技术普惠化进程。」
360 团队: Lin Sun, Guangxiang Zhao, Xiaoqi Jian, Weihong Lin, Yongfu Zhu, Change Jia, Linglin Zhang, Jinzhu Wu, Sai-er Hu, Xiangzheng Zhang
北大团队: Yuhan Wu, Zihan Jiang, Wenrui Liu, Junting Zhou, Bin Cui, Tong Yang
相关文章
- 润和软件亮相华为中国合作伙伴大会2025,发布DeepSeek一体机,引领行业大模型敏捷落地
- 智能时代的温情革命,涂鸦智能携手DeepSeek引领AI陪伴新未来
- OPPO ColorOS行业首家支持DeepSeek联网识图 ,已完成50+款机型升级覆盖
- 徐州移动借DeepSeek东风全力打造政务智能化“高速路”
- 深度融合DeepSeek,圣瞳工业巡检智能体开启工业智能化新纪元
- 从DeepSeek与Manus走红的背后 看小笨智能创新引领力
- 六度人和携手腾讯云接入DeepSeek, 客户意向转化率提升30%
- 美摄接入DeepSeek等大模型,用多模态融合重构视频创作新边界!
- 接入 DeepSeek、联合阿里云,传音AI战略玩出新高度!
- 企企通接入DeepSeek大模型,AI重构智能供应链
- 百世集团接入DeepSeek 深化物流AI场景应用助力质效双升
- 双卡锐炫来助阵,本地部署DeepSeek也能性价比
- deepseek加速企业破圈实践,药易购以数智化发展构建大健康产业新生态
- 开箱即用的DeepSeek大模型应用:优刻得以AI赋能医药健康行业
- 舒达宣布正式接入DeepSeek用AI解读智能睡眠报告,2025年再掀智能床革新浪潮
- “DeepSeek重塑职教生态:教育智能体赋能‘双高双优’建设研讨会”召开