国内健康环球医讯家医百科科学探索医药资讯

GPT-4 AI模型在预测cSCC预后方面优于传统工具

GPT-4 AI Model Outperforms Traditional Tools in Predicting cSCC Outcomes

美国英语科技与健康
新闻源:Managed Healthcare Executive
2025-06-12 05:00:00阅读时长3分钟1494字
皮肤鳞状细胞癌cSCC预后GPT-4AIRIS传统工具不良预后风险因素预测能力疾病治疗

内容摘要

一项新研究表明,基于GPT-4大型语言模型构建的皮肤鳞状细胞癌(cSCC)风险预测工具,在识别可能有不良预后的患者方面表现优于现有的系统。

皮肤鳞状细胞癌(cSCC)是第二种最常见的皮肤癌。虽然大多数病例是可以治疗的,但一小部分病例可能会变得严重并扩散,导致更差的预后。

根据一项发表在《JAMA Dermatology》上的新研究,基于GPT-4大型语言人工智能模型构建的皮肤鳞状细胞癌(cSCC)风险预测工具在识别可能有不良预后的患者方面,表现优于当前系统。

cSCC是第二种最常见的皮肤癌。尽管大多数病例是可以治疗的,但一小部分病例可能会变得严重并扩散,导致更差的预后。

准确识别哪些肿瘤更具危险性对于决定如何治疗患者非常重要,报告中提到。

侵袭性鳞状细胞癌。

现有的工具或模型,如AJCC8和BWH分期系统,通过某些特征对肿瘤进行分组,但它们往往忽略了重要的风险因素,并将非常不同的肿瘤归为一组,这使得预测谁可能会有不良预后变得更加困难。

许多因素会增加患cSCC的风险,包括免疫抑制、慢性伤口、白皙皮肤、男性性别、年龄较大、某些遗传条件、紫外线(UV)辐射暴露以及之前曾患过鳞状细胞癌的历史,根据美国国立卫生研究院的数据。

2012年的估计发病率是每10万美国男性中有140例,每10万女性中有50例。

为了解决这些局限性,研究人员在PubMed、Embase和Cochrane Library上搜索了1999年至2023年底的研究。

经过严格的筛选,选择了10项将风险因素与严重结果(如复发、扩散或死亡)联系起来的研究。

这些研究被用来通过检索增强生成(RAG)过程来训练一个大型AI模型GPT-4,称为AIRIS。

该AI创建了一个新的评分系统,以预测哪些cSCC肿瘤更具危险性。

AIRIS使用来自NYU Langone Health和Mayo Clinic的肿瘤数据进行了测试。

数据集包括2,379例经活检证实的cSCC病例,包含完整的临床信息。

AIRIS的预测结果与AJCC8和BWH系统的预测结果进行了统计测试比较。

研究人员使用标准指标(如敏感性、特异性和AUC)衡量了AIRIS预测不良预后的能力。还测试了AIRIS的一致性和区分高风险和低风险病例的能力。

结果发现,AIRIS在预测cSCC患者的不良预后方面,在多个关键领域优于BWH和AJCC8系统。

在低风险组中,AIRIS显示较少的不良预后:局部复发(LR)50.9%、淋巴结转移(NM)26.3%、远处转移(DM)17.5%和疾病特异性死亡(DSD)27.8%。

相比之下,BWH和AJCC8系统在低风险组中的不良预后几乎是AIRIS的两倍,表明结果不够一致。

总体而言,AIRIS也显示出进一步的进展。

对于高风险的AIRIS分类,不良预后率显著增加:局部复发(LR)49.1%、淋巴结转移(NM)73.7%、远处转移(DM)82.5%和疾病特异性死亡(DSD)72.2%。

在诊断性能方面,AIRIS对所有结果的敏感性更高——范围从49.1%到82.5%,但略低于BWH和AJCC8。

尽管总体准确性较低,但AIRIS表现出更强的预测能力,AUC值分别为:局部复发(LR)0.69、淋巴结转移(NM)0.81、远处转移(DM)0.85和疾病特异性死亡(DSD)0.80——均高于传统系统。

尽管收集了大量的数据,但研究仍有一些优势。

例如,审查了超过2,000个原发肿瘤以验证AIRIS。AIRIS包括了重要的患者风险因素,如免疫抑制、淋巴血管侵犯和在途转移,这些因素通常在传统的分期系统中缺失,研究作者指出。

这有助于AIRIS更好地预测不良预后,并显示出比当前标准更高的敏感性和风险辨别能力。

然而,研究的局限性包括cSCC中不良预后的事件发生率相对较低,这使得验证具有挑战性。

此外,像GPT这样的大型语言模型依赖于概率预测,并且可能基于其训练数据和输入产生偏见。

尽管RAG有助于将模型基于可靠的文献进行扎根,但仍需仔细验证AI生成的输出,作者建议。

未来的改进建议包括对免疫抑制类别的加权,并整合多模态数据,包括成像或基因谱型,以进一步个性化风险预测。


(全文结束)

声明:本文仅代表作者观点,不代表本站立场。

本页内容撰写过程部分涉及AI生成(包括素材的搜集与翻译),请注意甄别。

7日热榜