从神农尝百草,到李时珍踏遍神州写下《本草纲目》,他们无一不是在身体力行寻找治病救人的药。如今,药物的研发虽然不必行万里路,却也一样要不断的尝试,持续的研发。
作为国内药物研发创新的代表,星药科技(Galixir)从2019年成立以来始终在使用尖端人工智能技术赋能药物研发。星药通过使用人工智能的前沿算法,结合计算化学、药物化学和生物学的工具及经验,全方位攻克小分子药物早期研发流程中的疑难问题,快速发现活性高、成药性好且结构新颖的候选分子。在这一过程中,火山引擎为星药科技提供了一系列的技术产品支持,大幅降低了药物研发过程中的算力需求门槛。
智能时代的药物研发
星药科技目前已经和国内外药企以及研究机构进行了诸多合作,推进多个药物研发管线,覆盖中枢神经系统疾病、自体免疫类疾病、肿瘤、呼吸系统疾病等不同疾病领域,作用机制包括抑制剂和激动剂等不同类别。
通过技术创新,星药科技将单个临床前药物研发管线的成本和时间大幅降低和缩短,使得同时储备多条药物研发管线、优化整体战略布局都成为了可能。星药科技独立通过将蛋白结构建模,分子设计、性质预测、逆合成分析与智能计算平台M1及Pyxir平台有机结合,配合生物实验平台,形成了“AI-计算-实验迭代”的药物研发新范式。尤其在M1计算平台中,星药科技FEP和Docking计算精准度已达到业界先进水平,邀测情况良好,并已完成商业化落地。
技术的发展很难一帆风顺,一些难题在研发过程中逐渐浮出水面:
首先,面对业务量的波动,需要实现按需调度的弹性伸缩算力,最大化利用计算资源;
其次,以往计算节点较多,需要大量专人开发维护集群,才能保证应用的高可用性;
第三,医药研发有海量非结构化文件数据读取需求,这就需要有高吞吐的数据读取能力。
面对以上难点,也为了建立更多增益的差异化管线,尤其是未成药、难成药靶点的药物管线,星药科技需要有一个充足的、动态的、极致性价比的算力资源,一个可以提供无限计算、存储等扩展能力的云超算平台。如果能实现这样的云超算平台,就可以满足其计算任务需求,为药物研发新范式提供动态资源,从而在更短时间内获得期望的实验结果。
火山引擎高性能计算平台
星药科技引入了火山引擎的高性能算力资源、机器学习平台及高性能并行文件系统等资源。基于火山引擎高性能计算平台,星药科技能够无缝集成弹性容器,灵活调度底层计算资源,实现了海量实例快速秒级启动,从而灵活应对计算高峰。
火山引擎机器学习平台帮助星药科技无缝对接了已有集群资源调度引擎Slurm,支持全流程的数据管理、代码开发、模型训练等全生命周期工作流;通过机器学习平台对Gromacs的GPU性能优化,大幅提升效率、降低成本;同时,减少了星药科技对Slurm集群的维护负担,节省人力成本30%。
火山引擎与星药科技的合作解决方案
星药科技通过集成火山引擎的技术产品,获得了如下能力:
● 高可用弹性算力集群。其能够利用云上的高可用、灵活伸缩的特性,实现资源的按需实时调用,无需关心扩容策略。
● 高性能并行存储–vePFS。提供亚毫秒级时延,20G/s吞吐,百万级IOPS,同时可以在线弹性扩展,容量与性能实现线性灵活增长。
● 机器学习平台。能够支持Slurm提交任务;支持NVIDIA Clara系列工具(如Gromacs)的云端应用,实现医疗生信行业任务的GPU加速;支持从数据托管、代码开发、模型训练、模型部署的全生命周期工作流。
● 迁移对接便利:利用Terraform,在多个可用区快速批量创建云上高性能计算集群,节省人力成本,实现资源弹性敏捷。
总体来看,星药科技在与火山引擎合作后,通过引入IntelAVX512优化指令集,使得整体性能提升了30%;通过火山引擎机器学习平台提供的Slurm提交任务,能够卸下自己维护Slurm集群的重担,减少人力成本投入30%;同时,在火山引擎机器学习平台中优化Gromacs的GPU性能,将原本需要7小时处理的任务降低到不足3小时,同时算力成本降低至60%,药物研发的先导化合物发现阶段整体效率提升20%。
在联手火山引擎后,星药科技更高效准确地找到比对标药物活性更好、并具有更大专利空间的全新分子,进而大幅度节省药物开发环节的时间和成本。双方联手实现以“AI驱动的研发管线”和“AI赋能的计算平台”的双循环,赋能药物研发产业,让新药的研发更加高效。(作者:袁梦)