大学生从零打造AI大模型,ASC22超算竞赛发出极限挑战
2022-02-17 10:05:13爱云资讯阅读量:437
2022 ASC世界大学生超级计算机竞赛(ASC22)已进入预赛阶段。来自全球各地的300多支参赛队伍正在挑战一道人工智能难题 -- AI语言大模型。组委会提供了100GB高质量中文数据集,要求参赛队基于此数据集实现一个47亿参数的“源”AI语言大模型,以此激发参赛大学生对自然语言处理的兴趣与创造力,激励他们向这一人工智能“皇冠上的明珠”发起冲击。
AI大模型以其优秀的精度表现以及在应用中较高的智能化水平,成为了当今人工智能研究的热点。李飞飞教授联名发表的论文中提出,AI大模型的意义在于突现和均质,突现意味着通过大模型隐含的知识和推纳可带来让人振奋的科学创新灵感,而均质则表示大量模型可以为诸多应用任务泛化支持提供统一强大的算法支撑。
过去一年中,AI大模型领域涌现出了一批优秀成果,如“源1.0”、“威震天·图灵”。这些大模型不但能胜任传统的自然语言处理任务,还会写诗、编程、写小说、写论文摘要等等,在医疗、金融、零售、气象、新闻传播、文学艺术等领域表现出了广阔的应用前景。
虽然大模型拥有巨大的发展潜力和应用前景,但同样面临着算力挑战。以“源”为例,其采用2128颗加速器训练了16天,算力开销巨大。于是,分布式训练性能优化成为大模型研究的重要方向。
ASC22组委会提供了100GB高质量中文数据集,要求参赛队基于这一数据集实现一个47亿参数的“源”AI语言大模型。但是,组委会并未提供大模型设计的参考代码。这就意味着参赛队需要从零开始,自行完成模型结构构建和全部训练过程,并合理设计模型训练策略,以期得到最佳的计算性能。因此,这道赛题也变得更具挑战性:在追求极致性能的同时,还要满足精度约束,这也是在实际大模型研发中,行业人士经常会面临的关键问题。
正如ASC发起人、中国工程院院士王恩东所说,随着人工智能与算力的完美融合,计算正在向智算演变,可能让下一代超级计算机成为超级智算机,它不仅是计算性能的数量级跃升,同时也能更好地集成机器学习和物理建模。因此,ASC22将自然语言处理这个高性能计算和人工智能完美结合的前沿应用设为赛题,将成为参赛队比拼AI与超算融合能力的绝佳试验场。
AI大模型赛题专家、浪潮人工智能研究院首席研究员吴韶华表示,这道赛题瞄准的是分布式训练性能优化方向,要求参赛队伍在100GB的数据集上完成10亿个令牌的训练,在满足精度的条件下,性能越快,得分越高。而训练性能的提升,将直接降低大模型的训练开销、降低集群能耗,进而降低碳排放。希望通过该赛题,参赛队伍能对自然语言处理领域的前沿研究形成清晰的认知,并且通过创新实践,找到具有普适意义的方法,取得计算性能上的突破。
ASC世界大学生超算竞赛由中国发起组织,并得到亚洲及欧美相关专家和机构支持,旨在通过大赛平台推动各国及地区间超算青年人才交流和培养,提升超算应用水平和研发能力,发挥超算的科技驱动力,促进科技与产业创新。ASC超算大赛迄今已举行至第10届,吸引超万名世界各国大学生参赛,是全球最大规模的超算竞赛。在最新的2022年赛季,来自世界各国的300多支队伍报名参赛,经初赛选拔的队伍将参加5月7日-11日在位于合肥的中国科学技术大学举行的总决赛。
相关文章
- 高性价比普惠算力!东方超算智算一体机重磅发布
- “全国一体化算力网应用优秀案例”发布,国产超算互联网平台入选
- 算力应用大提升!国家超算互联网“滨城”尝鲜,赋能协同创新
- 智算中心和超算中心有区别,青云科技AI智算平台无区别支持建设与运营
- 超算迎来“通久必专”转折点?专用超算玩家已建起产业应用护城河
- 以显微镜之父命名的超算安腾,颠覆了6次获得诺奖的显微镜技术?
- 比全球最强超算Frontier还要快的安腾超算为何不在超算Top500榜单上?
- 九章云极DataCanvas公司牵手国家超算互联网,实现算法与算力一体化服务
- 落地大模型时代的超算应用,青云QingCloud的实践经验
- 青云科技联合济南超算模式创新,入选产业数字化案例金奖
- 国家超算互联网启动公测,用户可享创新算力服务
- 繁荣算力生态,国家超算互联网亮相乌镇峰会
- 以终为始 繁荣创新|东软睿驰总经理曹斌:基于中央超算芯片的软件开放技术框架
- 首批13家数据中心加盟东方材料全资子公司东方超算“全国一体化超级算力集群”
- 东方超算在京发布“东方超算-银河” 全国一体化超级算力调度平台
- 超算与智算融合是未来必然趋势!超算赋能大模型发展应用论坛成功举办