一个坚实的数据基础对于人工智能培训尤为重要,特别是在医疗保健行业。特蕾莎·阿伦斯(Theresa Ahrens)在接受采访时解释了目前还缺少什么。
特蕾莎·阿伦斯获得了分子医学学位,并在弗赖堡大学阿尔伯特·路德维希分校完成了关于表观遗传癌症疗法的博士学位。(图片来源:弗劳恩霍夫IESE)
heise在线:数据集偏向性的问题为何如此严重?
性别尤其是种族背景等都是人工智能偏见的来源。但可以说,几乎没有数据集是完全无偏见的。我们必须意识到这一点。医疗保健领域现有的数据主要来自异性恋、年长的白人男性。女性、儿童、有色人种等群体均被低估。研究一再表明,这些人群在医疗保健行业中的决策质量显著较低。医学研究过去和现在都严重偏向男性。数据基础的偏见自然会自动转移到人工智能系统及其建议上。研究的任务是调查由扭曲的数据基础引起的偏见,并尽可能地建立人工智能系统并标准化数据集。
heise在线:那么如何进行标准化?
首先,必须再次强调,目标应该是有一个无偏见的数据库。然而,如果发现存在系统性的偏差,可以采取多种方法来减少这些偏差。例如,可以生成合成数据集,并用现实数据补充未充分代表的人群。此外,由于这个问题普遍且具有挑战性,新的方法仍在不断开发中。
是否存在人工智能过度依赖同一数据的情况?
这当然是可能的。在这种情况下,训练数据集与目标群体不完全匹配,无法代表目标群体。另一个现象是过拟合。在这种情况下,人工智能系统在数据集上的训练过多。必须始终关注过拟合,并确保训练数据集和人工智能训练本身相互协调。这些人工智能系统在首次使用实际医疗实践中的真实数据时往往表现不佳。例如,这些数据可能有更多的背景噪声或其他差异。因此,用于人工智能开发的数据集应尽可能反映常规使用中的数据。
谁负责?
研究人员和人工智能制造商有责任监控人工智能系统并确保质量管理。审批机构也应进行适当的检查。
目前正努力为人工智能系统收集尽可能多的数据。您认为还需要多久才能有足够的数据可用?
我无法给出具体时间。但按照目前的进展,我认为在我的有生之年可能无法受益,特别是因为通常需要时间序列数据。这意味着需要一个人多年的数据。这类数据用于预测疾病等。因此,我强烈支持加速这些项目。虽然收集了很多数据,但大多数数据存储在孤岛中,无法访问。
从2025年中期开始,计划将电子患者文件中的数据传输到健康研究数据中心。这对您来说是一线希望吗?
是的,这是一线希望,我也很期待。但即使这样,我们也要到2025年才能获得数据点。在医疗领域,纵向研究通常持续一生,最好是几代人。因此,能够从家庭中获取健康数据将特别有趣。在这方面,健康研究数据中心无疑是朝着正确方向迈出的一步。
丹麦、挪威和瑞典已经拥有更先进的国家级数据库。在类似新冠病毒危机的情况下,这些数据可以更快地分析,措施的效果也可以更好地评估。例如,一项有趣的研究很快表明,在封锁期间,极早产儿和死产的数量减少了。
欧洲健康数据空间也将带来这一变化,数据将存储长达100年。这会有帮助吗?
还有很长的路要走。但EHDS无疑是欧盟层面的重要一步,尤其是在国际卫生合作方面。然而,欧洲健康数据不一定能直接适用于德国。例如,最近的一项研究表明,所谓的门静脉肝性脑病评分(PHES)在德国和丹麦之间不能直接转移,新的丹麦标准值已被定义。这个例子表明,即使人口群体看似非常相似,仍然存在差异。
国家之间的比较有时是有帮助的,但也存在文化差异。例如,在挪威,人们非常活跃,花更多的时间在户外,这对他们的健康有积极影响。饮食也是一个因素,但其他生活条件如气候也是决定性的。人们在阳光下待多长时间?在哪些地方?健康保险公司提供什么样的预防护理?有什么治疗建议或药物?这些因国家而异,甚至在德国的不同健康保险基金之间也有所不同。
目前也在讨论是否可以将开发的人工智能系统简单地从美国或亚洲国家转移到欧洲,因为存在文化差异或医疗保健系统不同。从监管角度来看,这些系统是分开的。这意味着它们必须重新通过审批过程。但对于新目标群体,人工智能输出也需要重新进行质量保证。
您肯定需要一个好的国家数据库,但也可以从国际数据中获益匪浅。数据越多,潜在的人工智能偏见就越低。然而,到目前为止,德国医疗保健行业的数据状况相当糟糕。解决这个问题是一项巨大的任务。合并、标准化和协调数据也是挑战。然而,数据量的潜力显然超过了这些挑战。
仅仅增加对研究项目的宣传是否足够?
科学当然需要向公众迈出一步,推动科学传播,减少数据保护方面的担忧。数据捐赠也是重要的一环。在这里,数据的质量保证或项目中适当的数据管理也很重要。
不同的研究问题需要不同的数据集。研究问题必须非常明确。多元化的团队也有帮助,例如,如果第一个女性碰撞测试假人不是最近才创建的。社会的多样性必须考虑在内。这可以通过相应多样化的数据库和多元化的研究团队实现。
数据的质量如何?
在专业管理的医疗登记册中,质量由运营商确保。在电子患者记录和欧洲健康数据空间中的数据,尤其是在初期,质量可能会因个体或国家而有很大差异。
从社会的角度来看,如果人们考虑他们上传到EPR的内容,并清楚地了解社会利益,这将是有帮助的。理想情况下,EPR中的数据收集应尽可能自动集成到各种流程中。填写EPR不应成为患者的额外负担,也不应成为各种医疗保健职业的额外负担。
您使用哪些已有的数据集?您计划进行哪些研究项目?
例如,MIMIC数据集(MIMIC-III临床数据库v1.4)针对重症监护患者,结构良好,国际上广泛使用。我们还可以访问自己的研究。欧洲也有相应的重症监护数据集。这是因为重症监护室生成了大量的数据,因为患者的生理指标得到了广泛的连续监测。这也表明,这种常规数据和数据访问对研究非常宝贵。
(mack)
(全文结束)

