图学习+分子表示学习,飞桨刷新药物分子性质预测榜单
2021-03-18 10:54:14爱云资讯753
国际权威榜单Open Graph Benchmark(OGB)上的HIV和PCBA数据集包括多种生物活性实验。其中,HIV数据集关注不同化合物是否能够抑制HIV病毒在细胞内的复制,PCBA数据集关注不同化合物针对100多种疾病靶点的有效性。以其中能增强功能性SMN2蛋白表达的化合物为例,这些化合物能够改善因SMN1蛋白突变失效引起的脊髓肌肉萎缩。 成功预测化合物这类性质对于发现针对多种疾病的有效药物具有重要意义。
近日,飞桨在OGB该两项分子性质预测榜单登上榜首,在AI药物发现领域取得了新的技术突破。

飞桨登顶OGB分子性质预测数据集HIV和PCBA
基于飞桨能力实现分子性质预测
飞桨基于图学习框架PGL,使用深度图神经网络(GNN),配合生物计算平台螺旋桨PaddleHelix对药物发现领域的理解,设计自监督学习任务学习化合物分子表示,并应用到分子性质预测中。核心技术包括:
分子表示学习为了将化合物分子作为图神经网络方法的输入,需要首先将化合物分子特征化。OGB已经针对每个化合物提供了一系列基于图结构的结点和边的特征,可以对应到化合物的原子和化学键,但这些特征都较为微观,无法表示化合物分子的宏观化学特性。飞桨通过表示学习的方法,首次将分子的宏观化学特性(官能团、分子指纹等信息)和图神经网络相结合,取得了融合宏观化学特征的分子表示,并利用这个分子表示取得了ogbg-molhiv的榜首。
图学习技术APPNP是基于个性化PageRank改进的特征传播算法,通过迭代的方式来近似Personal PageRank的解析解。APPNP算法不引入额外的模型参数,能够很好地调节局部信息和多阶邻居关系。飞桨通过结合GINE plus和APPNP技术,在不引入额外的模型参数下,获得更好的模型表达能力,并取得ogbg-molpcba榜首。
飞桨图学习框架PGL
百度深度学习平台飞桨PaddlePaddle开源图学习框架PGL v2.0版本,全面支持动态图机制,可支持百亿规模大图,用户可以通过PGL实现高效而又满足工业应用需求的图神经网络。PGL支持的百度内外部业务也是遍地开花,全面覆盖推荐系统、搜索引擎、智慧金融、智能地图、安全风控、生物医药等场景。

生物计算螺旋桨PaddleHelix
螺旋桨PaddleHelix是基于百度深度学习平台飞桨的生物计算平台。提供了包括RNA二级结构预测、大规模分子和蛋白质表示学习、药物靶点亲和力预测、ADMET成药性预测等,在新药研发和疫苗设计环节具有广阔应用前景的技术能力。

螺旋桨PaddleHelix可以帮助生物学、药物化学、计算机交叉学科背景的学习者、研究者和合作伙伴更便利地构建AI算法模型。螺旋桨PaddleHelix生物计算平台将保持开源开放原则,与合作伙伴共建共享,未来形成一套完整的面向行业的生物计算生态和服务。
想获取更多算法的技术细节,欢迎关注PGL【http://github.com/PaddlePaddle/PGL】和PaddleHelix【http://github.com/PaddlePaddle/PaddleHelix】,比赛相关代码已同步开放。
相关文章
- 摩尔线程加入飞桨硬件生态共创计划,加速人工智能生态和创新应用发展
- 十个大模型、六大发布 WAVE SUMMIT 2022飞桨持续夯实AI底座
- WAVE SUMMIT 2022将于5月20日召开 飞桨将迎来大规模升级
- 中科曙光×百度飞桨,以算力助跑开发者同台竞技
- 河南师范大学等27所高校联合百度飞桨推出“人工智能微专业”
- 百余位高校教师齐聚“云端课堂”,百度飞桨师资培训班落地重庆大学
- “创客北京2021”百度飞桨人工智能产业创新应用专项赛决赛圆满结束
- 2021全国人工智能师资培训走进北理工,百度飞桨助力高校教师提升AI能力
- 百度飞桨人工智能产业赋能中心于上海浦东启动运营
- 岳麓山下齐聚全国高校教师 飞桨深度学习师资培训开班助AI教学
- 支持更大规模产业应用!百度飞桨获KDD CUP 2021两金一银
- “创客北京2021”百度飞桨AI产业创新应用专项赛正式启动
- 开源生态融合,DeepModeling开源社区使用飞桨攻坚分子动力学
- 产教融合新范式 飞桨助力高校创新AI人才培养
- 融合创新 伙伴同行 飞桨推动产业走通AI工业大生产之路
- 飞桨全新发布推理部署导航图,助力打通AI应用最后一公里