共计 1186 个字符,预计需要花费 3 分钟才能阅读完成。
代码链接:
新框架中引入了动力系统的视角,将问题表述为学习一个向量场,并由该向量场描述分子在潜在空间中的演化过程。
具体而言,ChemFlow将分子生成模型的潜在空间视为一个连续的空间,其中每个点对应于一个分子的潜在表示。通过学习一个向量场,ChemFlow可以在潜在空间中定义一个流,该流将分子分布的质量从当前区域传输到具有期望分子属性或结构多样性的目标区域。
这样的视角和方法有许多优势:
实验验证
为了验证ChemFlow框架的有效性,研究者们在多个任务上进行了广泛的实验,包括分子操控、单目标和多目标的分子优化任务,涵盖了物理化学性质、药物相关属性和蛋白质-配体结合亲和力等多种指标。实验在有监督(spv)和无监督(unsup)的设置下,评估了ChemFlow的性能。
分子优化
分子优化任务旨在通过在潜在空间中导航,实现对分子特定属性的精确控制。例如,通过调整分子的潜在表示,ChemFlow可以增加或减少其溶水性(plogP)、类药性(QED)对特定蛋白质(ESR1和ACAA1)的结合亲和力等属性。
其中,HJ是哈密顿-雅可比方程(Hamilton Jacobi),LD是朗之万动力学(Langevin Dynamics)。实验结果表明,ChemFlow能够有效地在潜在空间中找到通往目标属性区域的路径,生成的分子在保持原有结构特征的同时,实现了预期的属性变化。
单目标分子操控
分子操控任务旨在限定优化后分子与原分子的相似度的情况下,探索目标属性最高的分子。
实验表明ChemFlow及相关基于流的方法在多种相似度约束下都取得了较好的优化效果,尤其是在中等约束(δ = 0.2, 0.4)时,表现出较高的成功率和更好的优化。同时,基于福克-普朗克方程流约束的生成方法在所有相似度约束下都获得了最高的成功率。
多目标分子操控
多目标操控任务更加具有挑战性,因为需要在多个属性之间进行权衡和平衡。ChemFlow通过引入多目标的损失函数,以及在向量场的学习过程中平衡各个目标,成功地在多个属性之间取得了平衡。
实验结果显示,ChemFlow在多目标优化任务中,同样表现出色,能够生成在各个属性上均具有良好表现的分子。
此外,作者还为ChemFlow准备了可互动的分子设计接口,供感兴趣的读者把玩。
Demo链接:
结论与展望
ChemFlow是一个基于流学习的分子生成模型架构,通过在潜在空间中学习向量场,实现了对化学空间的高效探索。新的框架引入动力系统的视角,统一了之前的方法,并展示了在分子操控和优化任务中的性能和潜力。
未来,相信随着采用更大的训练数据集,更强大的生成模型和更多实际应用的探索,ChemFlow将在分子科学、药物设计和材料发现等领域带来新的机遇,促进化学空间探索的高效化和智能化!