小i机器人SQuAD1.1榜单全球第三 机器阅读理解能力上新高度
2019-08-01 14:28:27爱云资讯611

关于SQuAD1.1
SQuAD被誉为自然语言处理领域金字塔尖的比赛,旨在促进智能搜索引擎的发展。国际机器阅读理解评测SQuAD自2016年发布以来,便受到了业界的广泛关注,共吸引了包括谷歌、微软亚洲研究院、IBM研究院、阿里巴巴达摩院、上海交通大学等众多国内外知名研究机构和高校的踊跃报名。
在SQuAD1.1数据集当中,阅读理解的主要难点是上下文的语义理解。所提问题的答案并不能靠简单的近邻或相似度对答案进行匹配,而是需要通过NLP的语义分析,在考虑前后文信息后从全文中寻找到最合适的答案位置。想要做好这一点,需要算法能力达到人类阅读理解的思考水平。
参赛者需要提交一个系统模型,该系统模型在阅读完数据集中的一篇文章后,逐一回答若干个基于文章内容的问题。然后,与人工标注的答案进行比对,得出精确匹配(Exact Match)和模糊匹配(F1-score)等相关评价指标。EM表示预测答案和真实答案完全匹配,而F1用来评测模型的整体性能的结果。

小i机器人BERT+WWM+MT单模型
小i机器人研究院团队在基于Whole Word Masking的BERT预训练模型基础之上,引入辅助任务如NewsQA等数据集,采用多任务学习的思路来改进现有模型的效果,进一步提升模型的最终预测评价指标 (主要为Exact Match和F1值), 小i机器人参赛模型在此次比赛中获得EM指标 (精准匹配率)达到88.650,F1指标(模糊匹配率)达到94.393的优异成绩。
具体地来说,小i机器人研究院团队针对目标任务和辅助任务中的问题和答案的属性和语义特征,来综合判断辅助任务中的数据样本与目标任务中的数据样本之间的相关性,最后将这个相关性指标引入到模型训练过程中损失函数的计算过程中,以充分利用并学习到来自目标任务和有关辅助任务中的知识,从而最终提升模型的预测效果。
参赛模型相关技术已广泛落地应用
技术评测不只是“花拳绣腿”,能否将技术更好的应用到实际产品中才是评测的最终目的。此次小i机器人用以参赛模型的相关技术已被成熟运用于小i服务的数十个行业的有关产品和实际项目中,已实现可商业化可应用化。例如,小i在开发的智能对话系统iBot平台中,就融合了基于机器阅读理解的Discovery Bot能力,可用于解决系统未收录的知识问题的提问。通过引入这一能力,可进一步减少人力资源,不断提升对话系统的回复准确率,同时辅助完善相关的问答知识库积累。
在比赛指标上超越人类水平远远不是终点,人类探索的脚步从未停止。小i机器人一直坚持“大脑”研发,专注于认知智能相关技术的自主研发和产业化应用,并用“智能+”赋能传统行业AI升级,推动人工智能产业化发展进程。
相关文章
- 小i机器人频获专利技术高值奖项,持续创新加深竞争护城河
- 小i机器人经典出海案例:小i大模型助力Nexify搞定千人听证会纪要?
- 重磅新闻!小i机器人袁辉受邀出席2023年《财富》全球论坛,华藏引领全球AI崭新征程!
- 小i机器人与ABB电气正式达成战略合作, 以人工智能重塑产业数智化未来!
- 大模型推动服务升级 华为云、小i机器人抢跑智慧政务商业落地
- 助力大模型生态构建 小i机器人携手战略伙伴打造疗愈智能音箱
- AI驱动直播电商创新 小i机器人推动平台数智化转型
- AI企业应用落地引关注,小i机器人上周大涨35.42%
- 大模型步入“落地战”,小i机器人发布“华藏”加速产业推进
- ChatGPT打开了小i机器人的想象空间
- 正式敲钟,国内领先AI企业小i机器人登陆纳斯达克
- 小i机器人用AI助力企业转型,赋能产业发展
- 小i机器人创始人袁辉:人工智能产业在海南发展前景广阔
- 小i机器人以多项AI服务为疫情防控提供技术支撑
- 共抗疫情,小i机器人向社会公众无偿推出三项公益AI服务
- 小i机器人获上海市科委授牌 入选首批技术创新中心企业