英伟达的人工智能进展 自然语言处理变得越来越快
2019-12-27 17:49:31爱云资讯1254
当英伟达(NVIDIA)宣布在实现实时人工智能对话的语言理解方面取得突破时,我们措手不及。我们还在努力消化ACL的过程,这是全世界计算语言学最大的研究事件之一,Facebook、Salesforce、微软和亚马逊都参与了其中。虽然这代表了两种不同的成就,但它们仍然紧密相连。以下是英伟达的突破,以及它对整个世界的意义。
正如ZDNet昨天报道的,英伟达表示,其人工智能平台目前拥有迄今为止最快的训练记录、最快的推理和最大的训练模型。NVIDIA已经成功地在53分钟内训练了一个大型的BERT模型,并且让其他的BERT模型在2.2毫秒内产生结果。但我们需要把它放在背景中来理解它的重要性。BERT(来自《变形金刚》的双向编码器表示)是研究人员于2018年底在谷歌AI语言上发表的研究论文(论文、开放源代码和数据集)。伯特最近在自然语言处理领域取得了一系列突破,并在人工智能领域引起了轰动,因为他在各种各样的自然语言处理任务中展示了最先进的成果。
NVIDIA所做的是使用谷歌发布的数据集(两种风格,BERT- large和BERT- base)和它自己的gpu,以减少训练BERT机器学习模型所需的时间,然后将其用于应用程序。这就是机器学习的工作原理——首先是一个训练阶段,在这个阶段中,模型通过显示大量数据来学习,然后是一个推理阶段,在这个阶段中,模型处理新的数据。
NVIDIA使用了不同的配置,产生了不同的结果。NVIDIA DGX SuperPOD使用92台运行1472台NVIDIA V100 gpu的DGX- 2h系统来训练BERT模型,而同样的任务需要一个NVIDIA DGX-2系统2.8天。2.2毫秒的推理结果在不同的系统/数据集上(运行NVIDIA TensorRT / BERT-Base的NVIDIA T4 gpu)。
最重要的是,英伟达将BERT训练提高了好几天,而以前这是常规训练。但这里的神奇之处在于硬件和软件的结合,这就是为什么whyNVIDIA要发布自己对BERT的调整,这可能是整个社区最大的胜利。
数据、人工智能、物联网:零售业的未来
零售购物的数字化转型将电子商务的许多好处带入实体店,其结果也同样具有颠覆性。
阅读更多
我们询问了英伟达如何以及为什么选择解决这个问题。英伟达发言人表示,他们认为人工智能对话是人类与智能机器和应用程序互动的基本组成部分。然而,这是一个非常具有挑战性的问题,无论是在计算上还是在算法上;他们补充说,这是他们非常感兴趣的地方。这是一个跨公司的努力,许多不同的团队为实现这些突破做出了贡献。这些团队包括英伟达人工智能研究、数据中心规模基础设施、人工智能软件和工程。英伟达表示,这表明它可以将其人工智能平台的市场领先性能扩展到新兴用例。这有两个方面。它是技术上的奇迹,它的实际适用性。让我们打开。
就BERT的培训而言,NVIDIA阐明了软件优化包括在PyTorch中实现的自动混合精度和在一篇论文中阐述的兰姆大批量优化技术的使用。关于更多细节,有一篇关于此的博客文章,人们也可以访问NVIDIA的BERT github存储库中的代码。为了实现NVIDIA T4推理优化GPU上的BERT推理的2.2毫秒延迟,NVIDIA开发了针对TensorRT、NVIDIA推理编译器和运行时的若干优化。工作的重点是Transformer层的有效实现和融合,它是BERT (BERT-base有12个Transformer层)和当今可用的最先进的NLU模型的核心构件。TensorRT包含几个关键功能,可以实现非常高的推理吞吐量,从融合内核到自动选择精度等等。NVIDIA进一步增加了新的优化来加速NLU模型,并计划继续改进库来支持人工智能工作负载。
NVIDIA比以前更快地处理BERT自然语言
简而言之,所有这一切意味着,你现在可以训练出比以往更好、更快的语言模型,并将它们部署到会话人工智能应用程序中,并以比以往更快的速度运行。当然,这很好。从理论上讲,英伟达的做法可能会让所有人受益。BERT的优化以开源的形式发布,NVIDIA硬件可供所有人使用。但是,通常的警告是适用的。尽管能够在很短的时间内训练出像BERT这样的语言模型,与之前的技术相比,这是很好的,但这还不够。
即使假设NVIDIA发布的是可用的,有多少组织能够真正做到这一点?
首先,从他们的存储库中获得这些开源模型,让它们运行,提供正确的数据,然后将它们集成到会话AI应用程序中,这不是很多人能做的事情。是的,企业中缺乏数据科学技能已经被多次提及。但是记住这一点很有用——对于一般的组织来说,这并不容易。
然后,从他们的Github盒子里拿出来,NVIDIA的BERT模型处理特定的数据集。这意味着,如果你严格按照规定的流程操作,而你的竞争对手也这么做,你最终将拥有一个以同样方式响应的人工智能会话应用程序。
将大数据转化为商业见解
企业擅长收集数据,而物联网正将其带入一个新的阶段。但是,最先进的组织正在使用它来推动数字转换。
相关文章
- 英伟达宣布在台积电亚利桑那州工厂投产Blackwell人工智能芯片
- 英伟达RTX 5060 Ti显卡即将上市,性能比RTX 4060 Ti提升20%
- 英伟达下一代Rubin GPU将采用台积电SoIC技术
- 国产高密度算力产品Shanghai Cube发布 对标英伟达SuperPod!
- 新思科技携手英伟达加速芯片设计,提升芯片电子设计自动化效率
- 英伟达首个“量子日”重磅来袭,微美全息多路径量子技术激活应用生态
- 立讯精密亮相英伟达GTC,高速互连赋能AI算力升级
- 神雲科技于 GTC 2025 震撼发布由英伟达加速的先进MiTAC AI服务器解决方案
- 英伟达将修建加速量子计算研究中心,向量子计算机演进
- 英伟达CEO黄仁勋称通用机器人时代已经到来
- 英伟达推出RTX Pro 6000 Blackwell GPU:拥有96GB的显存和600W的功耗
- 英伟达推出下一代AI超级芯片Blackwell Ultra GB300和Vera Rubin
- 英伟达GeForce RTX 5070创始人版显卡推迟到3月下旬上市
- 文远知行一度暴涨140%,因英伟达持有173.86万股
- 英伟达或于3月发布RTX 5070,以应对AMD的RDNA 4显卡
- 自动驾驶浪潮汹涌,英伟达/微美全息AI大模型赋能加速智能化变革步伐