共计 2874 个字符,预计需要花费 8 分钟才能阅读完成。
近几年,大家肯定听说过许多「AI 根据序列设计蛋白质结构和功能」的研究。那么「AI 根据所需功能反向设计蛋白质序列」会怎么样呢?
关于这个问题,单单从字面上就感觉后者比前者要复杂很多,事实也是如此。
由于训练目标是序列恢复生成,所以根据理论逆向推导出的蛋白质序列,很难保证能够在「真实世界」中折叠成我们所期待的样子。
为了解决这一问题,悉尼科技大学(University of Technology Sydney)、浙江大学杨易团队、华盛顿大学(University of Washington) David Baker 团队等重新定义了训练目标,增强了序列生成的可设计性。
他们提出了 ResiDPO(Residue-level Designability Preference Optimization)算法,通过残基级结构反馈(pLDDT)优化蛋白质,提高其可设计性,同时解决了蛋白质结构预测中目标错位问题。
为此,团队还构建了一个带 pLDDT 标签的大规模数据集。研究人员使用该数据集,结合 ResiDPO 对 LigandMPNN 进行微调,最终得到 EnhancedMPNN 模型,显著提升了设计效率:酶和结合剂设计成功率分别提高 3 倍和 2 倍,同时降低计算成本,加速了功能性蛋白质的研发周期。
该研究以「Improving Protein Sequence Design through Designability Preference Optimization」为题,于 20256 年 5 月 30 日发布在 arXiv 预印平台。
蛋白质序列设计仍存在挑战性
计算设计具有特定功能的蛋白质,在解决医学和生物技术领域的突出挑战方面具有巨大潜力。
当前的计算蛋白质设计流程通常将问题分解为两个阶段——首先生成骨架结构,然后进行「逆折叠」,最终得到相关序列。
虽然基于深度学习的蛋白质序列设计 (PSD) 已取得众多突破,超越了 Rosetta 等传统的基于物理的方法,但仍存在挑战。
现有方法主要优化序列恢复——即在给定骨架的情况下复制天然序列的能力。然而,对于蛋白质结构和功能设计的成功,最重要的是设计序列与设计目标结构的折叠紧密程度。
正如预期的那样,无论是蛋白质结合剂设计还是酶设计,可设计性与实验成功率之间都存在很强的相关性。
挑战在于,针对序列恢复优化的 PSD 模型通常可设计性较差。使用 RFDiffusion 和 ProteinMPNN 等现有方法进行酶设计,可设计性成功率仅为 3%。
这在计算上非常低效,阻碍了快速迭代和实验验证。科学家迫切需要能够直接优化可设计性的方法。
提出了 ResiDPO
为了应对这些挑战,研究人员着手直接优化一个类似 ProteinMPNN 的模型。该模型的灵感来源于诸如基于人类反馈的强化学习 (RLHF) 等对齐技术的成功,这些技术用于弥补大型语言模型(LLM) 中的目标函数差距。
他们的目标是明确地对齐 PSD 模型,使其能够生成具有高可设计性的序列。蛋白质在这方面比自然语言模型更具优势。
首先,为了避免主观的人类偏好,他们选择了 AlphaFold2 预测的局部距离差异测试 (pLDDT) 分数,该分数与结构准确性高度相关(图 6),并为可设计性提供了定量的、客观的奖励信号。
其次,针对特定主链设计的固定长度序列允许进行细粒度的残基级奖励分配,这与 LLM 通常使用的序列级奖励不同。
然后,该团队提出了 ResiDPO,这是直接偏好优化 (DPO) 框架的一种升级,专门用于蛋白质设计。
图示:ResiDPO 通过实现残基水平可设计性,实现精确的蛋白质序列优化。(来源:论文)
ResiDPO 优于标准 DPO
标准 DPO 虽然能够有效地利用序列级偏好来对齐语言模型,但在单纯应用于 PSD 时会面临挑战。它会优化一个单一的损失函数,平衡偏好学习与一个 KL 散度项,该项正则化为原始模型分布。这可能会产生梯度冲突,尤其是在试图提高高可设计性序列的概率时。
ResiDPO 通过利用残基级 pLDDT 得分作为奖励来克服了这个问题。它解耦了 DPO 损失:对于预测可提高可设计性的残基(例如,初始 pLDDT 较低),它优先最大化偏好奖励信号;对于已经对结构做出正向贡献的残基(例如,基础模型中 pLDDT 高且置信度高),它优先使用 KL 正则化来维持已学习到的结构特征。
这种解耦提供了更清晰、更稳定的优化目标,直接增强了可设计性,避免了灾难性遗忘。
ResiDPO 的性能评估
酶设计
为了评估 ResiDPO 的性能,该团队使用了 RFDiffusion2 的酶活性位点支架基准。该基准提供了来自五个 EC 类别的五种酶,并确定了催化位点。
对于每种酶,研究人员用 RFDiffusion2 基于催化口袋生成 1,000 个骨架,并在 0.1 的温度下使用 LigandMPNN、DPO 微调的 LigandMPNN 和 ResiDPO 微调的 LigandMPNN(EnhancedMPNN)为每个骨架设计了 8 个序列。在骨架和序列生成过程中,催化残基均固定(未设计)。他们根据 pLDDT > 80 和 Cα RMSD < 1.5 Å 的标准评估设计成功率。
图示:LigandMPNN、DPO 微调 LigandMPNN 和 ResiDPO 微调 LigandMPNN(EnhancedMPNN)在酶设计上的设计成功率。(来源:论文)
如上图所示,与 LigandMPNN 和 DPO 相比,ResiDPO 显著提高了序列设计的成功率。EnhancedMPNN 的平均序列设计成功率达到 17.57%,比 ligandMPNN(6.56%)提高了近三倍。
此外,可设计性的提升也显著提高了骨架成功率(即至少有一个成功序列的骨架比例),从 LigandMPNN 的 19.74% 提升至 EnhancedMPNN 的 40.34%。
这表明 ResiDPO 不仅改进了序列设计,还扩展了可设计的骨架集,潜在地召回了更多可设计的从头蛋白质,并节省了大量的计算资源。
蛋白质结合剂设计
图示:LigandMPNN、DPO 微调 LigandMPNN 和 ResiDPO 微调 LigandMPNN(EnhancedMPNN)在结合剂设计基准上的设计成功率。(来源:论文)
如上图所示,在蛋白质结合剂设计中,基线 LigandMPNN 的序列设计成功率为 7.07%。使用标准 DPO 进行微调后,该成功率略微提升至 10.40%。EnhancedMPNN 利用 ResiDPO,实现了 16.07% 的序列设计成功率,比基线 LigandMPNN 的成功率提高了一倍以上(约 2.27 倍)。
这说明,虽然 ResiDPO 并未针对蛋白质复合物或相互作用数据进行过明确的训练,但它在提高复杂多链系统的可设计性方面具有强大的泛化能力。
结语
总而言之,ResiDPO 通过残基级优化显著提升了蛋白质设计的成功率与效率。这一突破不仅降低了计算成本,加速了蛋白质工程周期,也为 AI 驱动的功能蛋白质设计提供了新范式。未来,研究人员还可以进一步优化算法,探索更复杂的生物应用场景。
论文链接:https://arxiv.org/abs/2506.00297v1