这项进展未来可能带来许多新的诊断应用。糖尿病视网膜病变(DR)是一种由糖尿病引起的眼部疾病,威胁视力,目前通过视网膜成像进行筛查。研究人员已成功应用大型语言模型来识别糖尿病视网膜病变(DR),并从非结构化医疗报告中分类其严重程度。这一突破表明,大型语言模型能够处理各种医学应用中的非结构化数据集,如患者记录。
AI已经在诸如疾病诊断、患者监测和医疗资源规划等任务中得到应用。大型语言模型(LLM),例如ChatGPT和Bard,也因其在各种专业任务中的辅助作用而受到广泛关注。在医疗领域,这些模型正在开发用于文本分类,如从放射学报告中提取关键发现。
由教授Kimmo Kaski领导的研究小组长期专注于基于AI的眼病检测,博士后研究员Joel Jaskari表示。该研究小组此前探索了用于图像分析的AI模型,特别是深度卷积神经网络,以评估DR的严重程度。
“糖尿病视网膜病变影响了大量糖尿病患者。如果不及时治疗,可能会导致失明。因此,早期检测非常重要。”Jaskari指出。
视网膜成像是DR的主要筛查方法。检查报告中记录了包括疾病严重程度在内的发现。然而,对DR严重程度进行统计分析需要结构化的注释,当报告是非结构化时,生成这些注释可能非常耗时。在赫尔辛基大学医院(HUS),视网膜发现通常由医生记录为详细的自由文本报告。
为了训练他们的AI模型,研究人员使用了2016年至2019年间赫尔辛基大学医院专科就诊的超过40,000份患者记录。在这些就诊中,拍摄了视网膜图像,医生记录了任何显著发现,如DR的迹象和严重程度,这些记录是非结构化的文本报告。
Jaskari强调,与HUS等合作伙伴的合作对于量身定制适用于芬兰医疗保健的AI解决方案至关重要。虽然全球存在DR的数据集,但它们不能反映芬兰人口或当地医疗实践。此外,芬兰医疗系统生成了足够大的数据集,可以训练适用于国内需求的AI。
“现代AI方法,如GPT模型,本质上是数据驱动的。它们必须用特定任务的数据集进行训练,这使得这种合作对于推进医疗AI研究至关重要。”Jaskari解释道。
从非结构化医疗报告中提取DR严重程度对于传统编程来说非常困难,甚至不可能。最初,医生和护士手动分析了一半的数据集,之后研究人员决定训练一个语言模型来处理剩余的报告。
“我们使用图尔库大学NLP小组开发的芬兰语GPT模型进行了微调,使用手动分析的报告。目标是使模型能够以类似于医疗专业人员的方式分类医疗报告中描述的DR严重程度。我们将这个专门的模型命名为DR-GPT。”Jaskari提到。
研究表明,DR-GPT能够以极高的准确性分析自由形式的芬兰语医疗报告。该模型对未标记数据的注释与手动标记的数据结合,创建了一个全面的数据集,用于训练基于图像的AI,显著提高了其性能。
Jaskari指出,研究表明,经过芬兰语训练的大型语言模型在分析芬兰语数据集时可以取得优异的结果。这一结论进一步得到了DR-GPT从具有挑战性的非结构化医疗报告中提供准确结果的能力的支持。
“我认为DR-GPT的方法也可以应用于其他医疗数据集。事实上,微调GPT模型是一个非常通用的方法,我相信类似的芬兰语AI模型可以为许多其他目的进行训练。”Jaskari说。
该模型还可以应用于其他语言:Jaskari解释说,作为DR-GPT基础的FinGPT模型与其他语言的现有模型非常相似。
“世界各地的研究人员可以使用他们选择语言的预训练GPT模型作为基础模型,并应用我们在研究中报告的修改。我相信最终的模型将类似于DR-GPT,但使用不同的语言。”Jaskari总结道。
该研究于10月发表在科学期刊PLOS One上。
(全文结束)

