火山引擎助深势科技发布行业首个三维分子预训练模型Uni-Mol

新药物的不断出现,一定程度上提高了人类生存质量和平均寿命。药物设计领域,由于药物分子有千万种组合方式,而且结构多样,候选药物的化学空间变得很大。

如何才能加速药物的设计?成立于2018年的深势科技,致力于运用人工智能和分子模拟算法,结合先进计算手段求解这一重要科学问题。

分子模拟算法的挑战

深势科技是 “AI for Science”科学研究范式的践行者,为人类文明最基础的生物医药、能源、材料和信息科学与工程研究打造新一代微尺度工业设计和仿真平台。

这家高新技术企业具有强大的科研与产业落地能力。例如在医药领域,深势科技通过Hermite Uni-FEP、Uni-Fold、RiD等模块,将自由能微扰理论、分子动力学、增强采样算法与高性能计算相结合,精准预测蛋白质结构及构象变化,并以化学精度高效评估蛋白与配体的结合自由能,为药物研发人员提供高效精准的理论指导,提升药物设计与优化效率。

由于分子模拟算法对算力等资源呈线性依赖,深势科技在底层资源调度、算法优化等方面遇到了以下挑战:

1. 计算任务数量多,波动大,需要底层平台提供灵活高效的弹性调度能力;

2. 大模型,大内存训练;

3. 海量非结构化文件数据读取。

深势科技选择了火山引擎科学计算解决方案,获取高效、可靠、灵活的高性能计算服务。

行业首个三维分子预训练模型

火山引擎为深势科技提供了基于GPU加速的科学计算解决方案,可以根据业务流量自动弹性扩容,以及自动采集各节点健康状态并制定相应自愈策略,实现智能运维。比如说,当遇到节点不可用时,该方案能够替换和重新调度节点上的容器,保障业务平稳健康运行。

图片1.png

科学计算解决方案依托火山引擎的云基础产品,提供可弹性伸缩的加速计算服务器GPU,挂载高性能的文件服务集群以及超高并发吞吐的并行文件存储,并搭配专为AI和科学计算等高性能计算场景设计的机器学习平台,赋能深势科技专注于核心业务发展。

深势科技相关负责人表示:“使用科学计算解决方案后,我们可以专注于构建应用本身,无需直接购买和管理底层服务器等基础设施,有效降低了IT维护成本。”

火山引擎科学计算解决方案有力的保障了深势科技的研发进度。近日,深势科技发布了首个三维分子预训练模型 Uni-Mol (https://github.com/dptech-corp/Uni-Mol)。

图片2.png

Uni-Mol框架示意图

Uni-Mol 直接将分子三维结构作为模型输入,而非采用一维序列或二维图结构。从三维信息出发的表征学习让 Uni-Mol 在几乎所有与药物分子和蛋白口袋相关的下游任务上都超越了 SOTA(state of the art),也让 Uni-Mol 得以能够直接完成分子构象生成、蛋白-配体结合构象预测等三维构象生成相关的任务,并超越现有解决方案。

未来,深势科技还会基于火山引擎平台推出一系列蛋白质自由能、绝对自由能的计算功能,为行业带来具备革新性的先进生产力工具,加速药物设计等发展。(作者:汤平平)

(0)
上一篇 2022年6月27日 15:13
下一篇 2022年6月27日 15:42