百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix

百度正式发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix,进军生物计算领域 。
在本月 20 号召开的 WAVE SUMMIT+2020 深度学习开发者峰会上,百度正式发布了基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix,进军生物计算领域 。本次发布的螺旋桨 PaddleHelix 生物计算开源工具集,提供了包括 RNA 二级结构预测、大规模的分子预训练、药物 - 靶点亲和力预测、以及 ADMET 成药性预测等一系列算法和模型,重点满足生物医药,疫苗设计和精准医疗方面的 AI 需求 。

百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix

文章插图
靶蛋白(Protein)- 药物配体(Ligand)复合物 (来源:PDBBind-cn.org)
传统的药物发现方法包括基于靶点结构的药物设计(Structure Based Drug Design,SBDD),基于碎片的药物设计(Fragment Based Drug Design,FBDD),老药新用 (Repurposing),以及计算机虚拟药物设计(Computational-Aided Drug Design,CADD)等等 。这些方法均存在依赖体内(in vivo)体外 (in vitro) 实验验证,或者消耗大量计算资源等问题 。因此近年来,基于分子的结构和知识来直接预测亲和性的 AI 药物设计(AIDD)逐渐被广泛认可和应用 。相比于 CADD,AIDD 展现出了性能上的巨大优势,但其效果同时受到生物计算领域数据量的限制 。下面的表格(表 1)展示生物计算一些重要问题的典型数据量,其中绿色的是有标注数据 。我们看到,尽管这个领域有大量的无标注数据(仅有分子结构或者序列,没有性质,或者次级结构),有标注数据却非常少,难以支撑高质量的深度模型 。

百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix

文章插图
新冠 S 蛋白的野生型 mRNA 结构和 LinearDesign 结构
精准医疗
精准医疗(precision medicine)的概念是指,根据患者特征(patient characteristics)实现准确的疾病诊断和分类,从而进行个性化匹配用药和跟踪治疗 。相较于传统的 one-size-fits-all 治疗方案,精准医疗致力于通过临床数据、生活环境、特别是分子组学数据精确刻画个体特征,通过挖掘和探究隐含在多模态数据层面的信息进行综合分析和判断,最终提供更好更适配的药物选择和治疗方案从而提升患者的治疗效果最终提高个体的生存时间和生存质量 。

百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix
文章插图
部分图片素材来自网络
螺旋桨 PaddleHelix 也将提供基于多维数据(临床随访数据、蛋白组数据、基因组数据、转录组数据、甲基化组数据、小 RNA 数据、单细胞组数据)的表示学习算法模型、药物响应模型、疾病预后模型等,旨在帮助行业内的医疗专家、研究人员和从业者更好的利用组学数据和分子特征更精确的刻画个体表示做组群区分,从而在精准医疗的三个维度预防、预测、治疗(Prevention、Prediction、Treatment)构建更好更准确的医疗模型,帮助到更多的患者得到最好最适配的治疗 。
结语
在 WAVE SUMMIT+2020 深度学习开发者峰会上,百度集团副总裁、深度学习技术及应用国家工程实验室副主任,吴甜女士对螺旋桨 PaddleHelix 的发展做了简短的概述,希望未来与合作伙伴共建,逐步形成一套完整的面向行业的生物计算生态和服务 。
我们也期待,螺旋桨 PaddleHelix 的发布能带来更多的跨界惊喜,在生物医药、精准医疗、疫苗设计等领域发挥出更大的价值 。
【百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix】 责任编辑:PSY
.dfma {position: relative;width: 1000px;margin: 0 auto;}.dfma a::after {position: absolute;left: 0;bottom: 0;width: 30px;line-height: 1.4;text-align: center;background-color: rgba(0, 0, 0, .5);color: #fff;font-size: 12px;content: "广告";}.dfma img {display: block;}
百度进军生物计算领域 发布基于飞桨的生物计算平台 - 螺旋桨 PaddleHelix
文章插图

    推荐阅读