共计 1310 个字符,预计需要花费 4 分钟才能阅读完成。
图 1: Eye2Gene 模型。
Eye2Gene 是由 15 个 CoAtNet 深度卷积神经网络组成的集成模型,它接受给定患者三种不同成像模态中的一张或多张视网膜扫描图像,并输出 63 种不同 IRD 基因的基因级预测得分。
对于上述三种模态,都训练了五个不同的 CoAtNet 深度卷积神经网络,总共产生了 15 个具有相同架构但不同网络权重的神经网络。对于每种模态,五个网络将会组合成三个特定模态的模型。Eye2Gene 便是由这三种模型组合而成。
表 1:不同 IRD 诊所测试数据的 Eye2Gene 结果概述及人口统计学特征。
为了评估 Eye2Gene,团队分别进行了 524 例患者数据的内部测试与 836 例患者的外部测试。对于 FAF、IR 和 OCT,单网络的平均前五准确率分别为 68.9%、70.8% 和 74.9%,在跨网络集成后分别提高到 71.0%、72.7% 和 77.2%。
实战测试
俗话说得好,发明一个工具的最终目的是投入使用。新模型的表现如何,还是需要与临床专家进行对比。研究团队邀请了八位专注于 IRDs 的眼科专家(5-15 年的经验),根据每位患者的 FAF 图像,预测导致该疾病的基因。
从历史上看,FAF 一直是用于表征 IRD 的广泛使用的成像方式,也可能是眼科专家最熟悉的方式。在这项对比任务中,专家实现了眼科专家的平均前五准确率为 29.5%,而 Eye2Gene 为 76%。
人类的表现随着经验的增加而提高,但 Eye2Gene 的表现明显优于任何单一的人类专家。
除此之外,Eye2Gene 在辅助遗传变异优先级确定中也有着不错的发挥。在超过 75%的患者中,Eye2Gene 提供的正确基因排名高于或等于 Exomiser-hiPHIVE 评分。
图 2:Eye2Gene 用于基因优先级排序。
作为下一代的表型工具, Eye2Gene 可用于识别新的基因-表型分组,还可以区分遗传性与非遗传性疾病。它可以根据具有相似表现的条件(鉴别诊断)作为筛查工具使用,提供受试者操作特征曲线下面积(AUROC)为 0.98。
Eye2Gene 在基因优先级排序方法的表现相当出色,并且优于之前发表的基于较小且不那么多样化的成像数据集训练的图像 AI 方法,在基于 FAF 图像的扫描任务重达成最低 90.8% 最高 96.3% 的准确率。
尽管 Eye2Gene 因其在在基于遗传检测的基因标签上进行训练的原因无法超越遗传检测,但该模型也意不在此。通过基于 AI 的视网膜扫描表型分析,它可以指导遗传检测的处方和解释。
开源的线上模型
团队表示,为了展示 Eye2Gene 如何用于辅助诊断 IRD 患者,Eye2Gene 将会被作为网络应用程序在线提供,以供研究人员使用。
迄今为止,只有四项研究尝试将 AI 应用于 IRD,所有研究的数据集规模都小于 150 名患者,并且涉及的基因数量也较少。相比之下,Eye2Gene 由于训练数据集是世界上最大的 IRD 基因型个体数据集之一,具有更广泛的应用潜力。
Eye2Gene 的预测不会取代遗传检测或在专门的视网膜疾病中心进行的咨询,更多的是提示何时更值得进行分子检测,以及指导特定的遗传检测及其解释。