皮肤鳞状细胞癌(cSCC)是第二种最常见的皮肤癌。虽然大多数病例是可以治疗的,但一小部分病例可能会变得严重并扩散,导致更差的预后。
根据一项发表在《JAMA Dermatology》上的新研究,基于GPT-4大型语言人工智能模型构建的皮肤鳞状细胞癌(cSCC)风险预测工具在识别可能有不良预后的患者方面,表现优于当前系统。
cSCC是第二种最常见的皮肤癌。尽管大多数病例是可以治疗的,但一小部分病例可能会变得严重并扩散,导致更差的预后。
准确识别哪些肿瘤更具危险性对于决定如何治疗患者非常重要,报告中提到。
侵袭性鳞状细胞癌。
现有的工具或模型,如AJCC8和BWH分期系统,通过某些特征对肿瘤进行分组,但它们往往忽略了重要的风险因素,并将非常不同的肿瘤归为一组,这使得预测谁可能会有不良预后变得更加困难。
许多因素会增加患cSCC的风险,包括免疫抑制、慢性伤口、白皙皮肤、男性性别、年龄较大、某些遗传条件、紫外线(UV)辐射暴露以及之前曾患过鳞状细胞癌的历史,根据美国国立卫生研究院的数据。
2012年的估计发病率是每10万美国男性中有140例,每10万女性中有50例。
为了解决这些局限性,研究人员在PubMed、Embase和Cochrane Library上搜索了1999年至2023年底的研究。
经过严格的筛选,选择了10项将风险因素与严重结果(如复发、扩散或死亡)联系起来的研究。
这些研究被用来通过检索增强生成(RAG)过程来训练一个大型AI模型GPT-4,称为AIRIS。
该AI创建了一个新的评分系统,以预测哪些cSCC肿瘤更具危险性。
AIRIS使用来自NYU Langone Health和Mayo Clinic的肿瘤数据进行了测试。
数据集包括2,379例经活检证实的cSCC病例,包含完整的临床信息。
AIRIS的预测结果与AJCC8和BWH系统的预测结果进行了统计测试比较。
研究人员使用标准指标(如敏感性、特异性和AUC)衡量了AIRIS预测不良预后的能力。还测试了AIRIS的一致性和区分高风险和低风险病例的能力。
结果发现,AIRIS在预测cSCC患者的不良预后方面,在多个关键领域优于BWH和AJCC8系统。
在低风险组中,AIRIS显示较少的不良预后:局部复发(LR)50.9%、淋巴结转移(NM)26.3%、远处转移(DM)17.5%和疾病特异性死亡(DSD)27.8%。
相比之下,BWH和AJCC8系统在低风险组中的不良预后几乎是AIRIS的两倍,表明结果不够一致。
总体而言,AIRIS也显示出进一步的进展。
对于高风险的AIRIS分类,不良预后率显著增加:局部复发(LR)49.1%、淋巴结转移(NM)73.7%、远处转移(DM)82.5%和疾病特异性死亡(DSD)72.2%。
在诊断性能方面,AIRIS对所有结果的敏感性更高——范围从49.1%到82.5%,但略低于BWH和AJCC8。
尽管总体准确性较低,但AIRIS表现出更强的预测能力,AUC值分别为:局部复发(LR)0.69、淋巴结转移(NM)0.81、远处转移(DM)0.85和疾病特异性死亡(DSD)0.80——均高于传统系统。
尽管收集了大量的数据,但研究仍有一些优势。
例如,审查了超过2,000个原发肿瘤以验证AIRIS。AIRIS包括了重要的患者风险因素,如免疫抑制、淋巴血管侵犯和在途转移,这些因素通常在传统的分期系统中缺失,研究作者指出。
这有助于AIRIS更好地预测不良预后,并显示出比当前标准更高的敏感性和风险辨别能力。
然而,研究的局限性包括cSCC中不良预后的事件发生率相对较低,这使得验证具有挑战性。
此外,像GPT这样的大型语言模型依赖于概率预测,并且可能基于其训练数据和输入产生偏见。
尽管RAG有助于将模型基于可靠的文献进行扎根,但仍需仔细验证AI生成的输出,作者建议。
未来的改进建议包括对免疫抑制类别的加权,并整合多模态数据,包括成像或基因谱型,以进一步个性化风险预测。
(全文结束)