第四范式AutoML刷新知识图谱最强榜单OGB世界纪录
2021-04-29 08:33:32爱云资讯阅读量:500
近日,在国际顶级图学习标准OGB(Open Graph Benchmark)挑战赛中,第四范式凭借AutoML(自动机器学习)技术,在与斯坦福大学、康奈尔大学、Facebook、阿里巴巴等国际顶尖高校与科技巨头同场竞技中脱颖而出,以较大优势斩获ogbl-biokg、ogbl-wikikg2两项任务榜单第一。
近年来,知识图谱因可挖掘实体之间的潜在关系、提供更高效的搜索结果,被广泛应用在智能搜索、智能问答、社交网络、金融风控等诸多行业应用中。作为知识图谱领域重要的技术手段,图学习已成为机器学习最重要的研究领域之一,受到了学术界和工业界的广泛关注。
OGB是目前公认的图学习基准数据集代表,由斯坦福大学Jure Leskovec教授团队建立,于2019年国际顶级学术会议NeurIPS上正式开源。其囊括了节点性质预测、边性质链接预测、图性质预测等知识图谱领域众多权威赛题,以质量高、规模大、场景复杂、难度高著称,素有知识图谱领域“ImageNet”之称,成为众多科技巨头、科研院所和高校团队试验技术成色的试金石。
此次,第四范式参与了ogbl-biokg、ogbl-wikikg2两项数据量庞大且极具业务价值的知识图谱链接预测任务,均在处理嘈杂、不完整知识图谱等方面挑战巨大。其中,ogbl-biokg包含多个海量生物医学知识库,构成了500多万个三元组(实体-关系-实体、实体-属性-属性值),在药物属性预测及生物医学研究方面具有重要意义。ogbl-wikikg2来源于Wikidata知识库,需要在1700多万个事实三元组中精准预测实体间的潜在关系,可有效提升推荐系统、智能问答等场景应用效果。
为了精准理解数据集中复杂语义信息、挖掘潜在关系,业界通常以评分函数(SF)作为衡量知识图谱中三元组可编程性的重要指标,但现有评分函数设计仅专注于某一类语义模型,无法应对实际应用中千变万化的知识图谱任务场景。
受AutoML启发,第四范式本次采用AutoSF(自动评分函数)参赛,通过理解生物医学、维基百科等复杂知识图谱中的不同语义信息,设计出更符合场景认知特性的评分函数,实现在对应任务上的性能突破。同时,AutoSF设计的评分函数可高效利用模型参数,在具有更小模型复杂度的基础上,预测性能位居第一,以较大优势超过PairRE、TransE、ComplEx、RotatE等其他知名评分函数。
相关文章
- 第四范式上市不到4个月总裁裴沵思离职 首席架构师胡时伟接任
- 支持大模型研发,第四范式与西安智算中心达成战略合作
- 联网企业内应用 第四范式类GPT产品“式说”新增多模态及企业级Copilot能力
- 第四范式 用技术领跑人工智能产业
- 第四范式,为您的智能化转型业务保驾护航
- 第四范式携手工银科技 首批入驻雄安人工智能算法开放平台
- 第四范式获信通院尖峰开源项目及开源人物双料大奖 受国家级认可
- 第四范式以链主身份承办“创客北京2021”专项赛道
- 消息称第四范式预计本月提交在港 IPO 申请 AI 创企加速上市闯关
- 爱数与第四范式达成合作,推出OCR智能内容识别解决方案
- 第四范式AutoML刷新知识图谱最强榜单OGB世界纪录
- 第四范式携手华中科技大学电信学院 共建人才培养实训基地
- 第四范式两款人工智能产品斩获iF国际设计大奖
- 第四范式完成D轮7亿美元融资
- 第四范式完成D轮7亿美元融资,博裕、春华、厚朴领投
- 第四范式、Intel研究成果入选国际顶会VLDB 全面优化超高维在线预估系统