“无论我往哪里看,都有一组组数据渴望被连接起来,”武田制药研发技术副总裁Brian Johnson博士说。如果你仔细想想,他说得对。你的医生在你每次就诊时都会输入关于你的数据。保险公司多年来一直在收集你的数据。然后还有科学家利用基因组数据进行研究,如23andMe这样的网站。还有来自临床试验的电子患者报告数据(ePRO)、社交媒体数据等等,你懂的。
“我们已经到了这些数据集成熟但互不相关联的地步,”Johnson说。“如果我们能通过技术连接这些数据,我们就能获得任何人的健康事件、疾病状态等更为丰富的信息。所以,我对此非常兴奋。”
这种完全连接的数据连续体的概念,尤其是在临床试验方面,并不是新的。我想你已经知道为什么它还没有实现——这将花费很多钱并且需要大量的人工劳动。比如说,如果你想连接一个人的电子病历(EMR)、社交媒体和临床数据。近年来,你需要聘请每个数据集的专家来仔细研究所有内容,试图找到使不同数据点相互关联的方法。当然,将所有这些数据连接在一起会产生巨大的价值,但成本投入几乎等于你所获得的价值。“而且你不一定能确定你提出的每一个关于如何连接数据的问题都能得到好的答案,”Johnson说。“但我可以肯定的是,每一个问题都会耗费我大量的金钱和时间。”
Johnson表示,生成式AI正在改变这一切,但在享受其成本和时间节省之前,需要做出一些调整。例如,为了使AI最有效地工作,它必须理解不同数据源之间的关系(例如,商业、质量、监管)。因此,你提前所做的工作越多,使这些关系尽可能合理和统一,AI的表现就会越好。还有一个问题是学习如何最好地询问AI以获得所需的结果。为此,你可能需要投资于雇用(或培训)提示工程师。“他们倾听科学家、临床医生和监管人员面临的复杂问题,并将其转化为AI可以理解的提示,从而得出我们需要的答案,”Johnson说。“例如,借助生成式AI,我可能更好地理解监管机构提出问题的原因,然后给出更好的答案。或者更好地说,我可能基于已发送的数据预测他们的问题,并准备好答案。”
改善健康公平必须纳入计划
尽管Johnson相信AI在临床运营中的变革力量,但他也谨慎推广其使用,因为目前存在医疗公平差距。“我们关于有色人种的数据集如此之少,质量又如此令人怀疑,我非常担心这一差距会进一步扩大,”他说。“毕竟,AI的质量取决于我们拥有的数据。”
这种对改善健康公平的重视已成为他在武田制药工作的单独部分,他负责寻找专注于提高包容性访问和更优质数据的初创公司。一个例子是Acclinate,该公司专注于在临床试验开始前向有色人种普及临床试验的价值。(另见:数据能否帮助提高临床试验的多样性?)另一个例子是新泽西州的Inside Edge Consulting。“他们在过去20年里一直在社区中工作,努力提高临床试验的参与度,”Johnson说。“因此,他们拥有20年的数据,显示谁是信任建立者,谁是好参与者,什么是好的试验地点等等。因此,我们正在寻找方法将这些知识制度化,并引入这些能力,因为如果我们不这样做,不仅会错过缩小医疗公平差距的机会,还会错失在临床过程中利用生成式AI的优势。”
(全文结束)

