近日,数学与系统科学学院李振彰博士团队的论文《A deep learning based smartphone application for early detection of nasopharyngeal carcinoma using endoscopic images》发表在Nature子刊《npj Digital Medicine》上,我校为第一作者单位和通讯单位。该期刊目前影响因子为15.2,是中科院分区1区Top期刊。





李振彰团队的研究成果主要是开发了一款基于深度学习的智能手机应用程序“Nose-Keeper”,能够利用内窥镜图像早期检测鼻咽癌,整体准确率超过92%。成果被“早筛网”、“石榴号--现代科技”等微信公众号和“全国体外诊断网”报道。

鼻咽癌(NPC)是头颈部最常见的恶性肿瘤,尤其在东亚和东南亚地区发病率较高。由于其早期症状常常不具特异性,易导致诊断延误,从而影响预后。对于已确诊的晚期病例,其10年总生存率通常仅为50%至70%。相比之下,若能够及时发现鼻咽癌,患者的5年生存率可接近94%,这充分凸显了早期诊断的重要性。因此,实现鼻咽癌的早期检测,无疑对提高患者生存率和改善预后具有至关重要的意义。

研究团队采用多中心、回顾性研究方法,致力于构建一个大规模的鼻内窥镜白光图像数据集。该数据集来源于三家位于鼻咽癌高风险区域的医院,共收集了39,340张鼻内窥镜白光图像。这些图像涵盖了2,134名鼻咽癌患者以及11,824名非鼻咽癌患者的临床数据。





在研究过程中,团队引入了八个先进的深度学习模型,并开发了一款支持互联网的智能手机应用程序——“Nose-Keeper”。该应用程序不仅具备早期检测鼻咽癌和五种常见鼻腔疾病的功能,还能对健康个体进行评估。为了确保模型具有良好的泛化能力并有效避免过拟合,研究团队采用了将数据划分为内部训练集、内部验证集和内部测试集的策略。

经测试,在内部测试集上,所有模型均表现出令人瞩目的性能,平均总体准确率超过92%,充分显示了深度学习模型在鼻内窥镜图像诊断中的巨大潜力。其中,表现最为突出的是SwinT模型,其平均总体准确率高达0.9515;而ResNet模型的平均准确率相对最低,为0.9280。

在特异性和敏感性这两个关键指标上,SwinT模型表现尤为卓越。在鼻咽癌检测中,其特异性达到了96.39%,敏感性高达99.91%。此外,在非鼻咽癌类别的诊断中,SwinT模型的敏感性超过86.00%,特异性也超过95.00%。

在外部测试集上,SwinT模型的总体准确率为92.27%,其对鼻咽癌的敏感性和特异性分别达到了96.39%和99.91%。在与耳鼻喉科医生的诊断对比实验中,SwinT模型在鼻咽癌和其他鼻腔疾病的诊断中均表现出更优的性能。

这项研究为鼻咽癌的早期检测和诊断提供了一种全新且高效的工具,特别是在资源有限的地区,有望显著提高鼻咽癌的早期诊断率,从而改善患者的生存率。