预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

238次阅读
没有评论

共计 1286 个字符,预计需要花费 4 分钟才能阅读完成。

该深度学习模型旨在捕捉蛋白质-DNA 相互作用的物理化学和几何背景,以预测结合特异性,表示为基于给定蛋白质-DNA结构的位置权重矩阵(PWM)。DeepPBS 跨蛋白质家族发挥作用,并充当结构确定和结合特异性确定实验之间的桥梁。

预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

图示:DeepPBS 用于预测跨蛋白质家族的结合特异性的性能。(来源:论文)

DeepPBS 的输入不仅限于实验结构。蛋白质结构预测方法(包括 AlphaFold、OpenFold 和 RoseTTAFold)以及蛋白质-DNA 复合物建模器(例如 RoseTTAFoldNA (RFNA)、RoseTTAFold All-Atom、MELD-DNA 和 AlphaFold3)的快速发展,导致可供分析的结构数据数量呈指数级增长。

这一场景凸显了对用于分析蛋白质-DNA 结构的通用计算模型的需求日益增长。研究人员展示了 DeepPBS 如何与结构预测方法结合使用,以预测没有可用实验结构的蛋白质的特异性。

此外,通过使用 DeepPBS 反馈优化结合 DNA,可以改进蛋白质-DNA 复合物的设计。研究人员表明,此流程与最近的家族特定模型 rCLAMPS 相比性能相当,同时更具通用性:具体而言,DeepPBS 不受蛋白质家族限制,可以处理生物组装并可以预测 DNA 侧链偏好。

预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

图示:DeepPBS 在预测蛋白质-DNA 复合物结构中的应用。(来源:论文)

在可解释性方面,可以从 DeepPBS 中提取与 DNA 相互作用的蛋白质中不同重原子的「相对重要性」(RI)分数。

作为对癌症发展有重要意义的蛋白质的案例研究,研究人员通过这些 RI 分数分析 p53-DNA 界面,并将其与现有文献联系起来进行验证。

并且,DeepPBS 分数与现有知识非常吻合,并且可以汇总以与丙氨酸扫描诱变实验产生合理的一致性。

预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

图示:以 p53-DNA 界面中 DeepPBS 重要性分数的可视化为例进行研究,并进行实验验证。(来源:论文)

在额外的原理验证研究中,研究人员将 DeepPBS 应用于针对特定 DNA 序列的计算机设计的蛋白质-DNA 复合物,该复合物来自最近一项结合结构设计与 DNA 诱变实验的研究。DeepPBS 也可用于分析分子模拟轨迹。

「对于研究人员来说,找到一种适用于所有蛋白质、而不局限于某个研究透彻的蛋白质家族的方法非常重要。这种方法还使我们能够设计新的蛋白质。」Rohs 说道。

预测蛋白质-DNA结合特异性,南加州大学团队开发几何深度学习新方法

图示:将 DeepPBS 应用于针对特定 DNA 序列的计算机设计 HTH 支架。(来源:论文)

当前版本的 DeepPBS 存在固有的局限性。它是针对双链 DNA 量身定制的,尚不适用于单链 DNA、RNA 或化学修饰碱基。

然而,该模型有可能扩展以适应这些不同的场景以及其他聚合物-聚合物相互作用,并可能适用于机械突变。DeepPBS 架构可以在应用和工程增强方面进行优化和扩展。

尽管如此,Rohs 表示,DeepPBS 的应用将会非常广泛。这种新的研究方法可能会加速设计针对癌细胞特定突变的新药和治疗方法,并带来合成生物学的新发现和 RNA 研究的应用。

DeepPBS:

论文链接:

相关报道:

文章来源:https://www.jiqizhixin.com/articles/2024-08-19

正文完
 
yangyang
版权声明:本站原创文章,由 yangyang 2024-08-19发表,共计1286字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)