共计 2384 个字符,预计需要花费 6 分钟才能阅读完成。
细胞间通讯(CCC)是确保生物系统和谐运作的基本生物学过程。
越来越多的证据表明,同一类型或簇的细胞在不同的生态位下可能表现出不同的相互作用模式,但大多数主流方法在细胞类型或簇水平上进行 CCC 推断,而忽略了生态位的异质性。
北京大学的研究人员提出了基于空间转录组学的细胞间通讯和亚型探索工具(Spatial Transcriptomics-based cell‒cell Communication And Subtype Exploration,STCase),该工具能够基于空间转录组学(ST)在单细胞/点水平上描述 CCC 事件。
STCase 包含一个可解释的多视图图神经网络(GNN),该神经网络通过 CCC 感知注意力机制识别每种细胞类型的微环境,并揭示微环境特有的 CCC 事件。
相关研究以「Interpretable niche-based cell‒cell communication inference using multi-view graph neural networks」为题,于 2025 年 5 月 27 日发布在《Nature Computational Science》。
细胞间通讯(Cell‒cell communication,CCC)对于生物维持体内稳态和应对外界刺激至关重要。
探索 CCC 的传统方法因缺乏空间信息导致假阳性率高。空间转录组技术(ST)可以通过整合基因表达和位置信息显著提升 CCC 研究。但是,现有 ST 方法仅能推断细胞类型间的全局交互,会忽略细胞微环境异质性可能遗漏关键 CCC 事件。此外,当前的单细胞分辨率方法也未能系统结合 CCC 推断功能微环境。
近期的研究虽然尝试通过子聚类分析识别亚群间 CCC,却常忽视细胞/空间点之间交互关系在子聚类过程中的重要性。
在最新的研究中,北京大学的研究团队在单细胞/空间点层面精确识别 CCC 事件,并将其纳入细胞类型的子聚类分析中,以便识别在 CCC 层面具有功能异质性的细胞微环境。
此外,他们借助多视角图神经网络(multi-view graph neural network)的可解释性特征,进一步揭示出具有特定功能的微环境特异性 CCC 事件。该方法称为 STCase。
STCase
具体而言,STCase 方法首先通过整合由配体-受体对(Ligand-Receptor Pair, LRP)激活的转录因子(Transcription Factor, TF)及其下游靶基因所构成的细胞内信号通路,在单细胞/空间点分辨率上识别候选 CCC 事件,从而提升推断的准确性。
该模块包括以下四个步骤:
(1)聚合配体和受体的基因表达信息,并考虑配体的扩散效应,计算初步的 CCC 评分;
(2)通过置换检验筛除不显著的CCC事件;
(3)使用 SCENIC 方法计算下游TF的激活评分;
(4)将初步 CCC 评分与 TF 激活评分进行整合,分为宽松模式与严格模式两种方式。
在宽松模式下,即使下游 TF 激活评分未显示细胞内信号通路的活化,预测得到的 LRPs 仍会被保留;而在严格模式下,此类 LRPs 将被筛除。
图示:STCase 的概述和评估。(来源:论文)
值得一提的是,研究人员还构建了一个高可信度的 LRP 数据库——STCaseDB,用于准确推断 CCC 事件。STCaseDB 整合了多个数据来源,并经过多轮筛选,确保其中的 LRPs 具有高置信度,同时还关联了每对 LRP 所对应的下游 TF 信息。
STCase 进一步基于整合后的 CCC 评分,对细胞类型进行子聚类,并识别特定微环境(niche)中的 CCC 事件。该模块也包括四个步骤:
(1)基于空间邻接图(Spatial Adjacent Graph, SAG)构建多视角图神经网络(multi-view GNN),该图整合了ST数据中的空间坐标和基因表达信息,其中每一个 GNN 视角对应一个LRP;
(2)将CCC评分与可变LRP权重相乘,作为图边的权重,用于训练一个自编码器风格的模型以编码潜在表示;
(3)通过内积解码对潜在表示进行优化,目标是尽可能准确地重构原始 SAG;
(4)利用潜在表示与 LRP 权重,分别进行基于微环境的细胞类型子聚类与微环境特异性 CCC 事件的识别。
在网络训练过程中,每个 LRP 权重被设定为可学习参数,用以表示其在细胞子聚类中的贡献。
在 GNN 完成细胞聚类之后,还可以进一步分析 LRP 权重,以识别在不同微环境中调控功能差异的 CCC 事件,从而揭示由于空间定位不同,LRPs 对同一细胞类型产生的不同影响。
图示:使用 STCase 将 SCC 分为三种亚型。(来源:论文)
另外,STCase 还提供了多种可视化工具,帮助用户进一步解释分析结果。
研究人员 对 STCase 进行了评估,结果表明它许多方面展现出良好的结果。例如,它能够准确捕获人类支气管腺体中已报道的免疫相关 CCC 事件。它还识别出了口腔鳞状细胞癌的三个不同微环境,并发现了可能影响肿瘤预后的微环境特异性 CCC 事件。
不过,它仍然存在一些局限性,需要在未来的研究中加以解决:
第一,STCase 识别的 CCC 事件基于已知 LRPs 的整合,因此无法检测尚未发表的 LRPs。
第二,STCase 假设基因表达水平模拟蛋白质丰度,这可能会引入偏差并降低结果的准确性。
第三,尽管 STCase 通过 SCENIC 方法整合下游通路的 TF 激活分数来提高预测准确性,但细胞内信号通路的固有复杂性以及该策略未能解释通路间串扰,可能导致假阳性预测。
第四,在特定条件下发现 CCCs 还需要进一步的实验验证。
尽管如此,STCase 所展现的能力依旧是值得肯定的。未来,STCase 也许会成为解读各种生理和病理环境下具有生物学意义的 CCC 事件的宝贵工具。
论文链接:https://www.nature.com/articles/s43588-025-00809-6