在不断发展的AI领域中,生命科学行业的领导者正在利用AI开发创新解决方案,以解决医疗保健中的关键问题,并推动超越现状。在医疗保健领域,AI被用于分析医学图像和诊断、预测患者结果以及个性化治疗方案。AI有潜力创新和加速临床试验开发和执行的各个方面。
临床试验的挑战
临床研究人员在站点设计、数据管理、患者招募和保留方面面临诸多挑战。这些挑战可能严重影响新疗法的开发成功。一个关键挑战是在临床试验中招募和登记多样化的患者群体。尽管越来越多的人认识到临床试验多样性的重要性,但研究人员仍难以纳入来自不同种族、民族和社会经济背景的参与者。这种缺乏多样性导致了对不同人群治疗反应理解的不足,最终影响治疗的普遍性和有效性。物流障碍、对医疗系统的不信任以及有限的试验场地访问进一步加剧了这一问题,使得实现代表性强和包容性的临床研究变得困难。
另一个行业面临的挑战是获得历史试验数据。历史临床试验可以提供关于哪些方法已经奏效和哪些没有的见解,在加速研究中发挥重要作用。然而,由于监管要求、技术保护协议、专有数据和严格的隐私要求,临床试验数据的访问受到限制。这些问题足够严重,即使有适当的数据共享承诺、政策和协议,去标识化的患者级临床试验数据的共享仍然有限。
合成数据/模拟器
临床试验中的一个令人兴奋的发展是AI驱动的合成数据技术,称为Simulants。Simulants是一种AI驱动的数据解决方案,从跨赞助的历史临床试验数据中生成合成数据,包含通过临床试验协议和电子病例报告表(eCRFs)捕获的协变量、终点、临床和患者特征,确保高保真数据集。Simulants利用已建立的分析数据模型标准,提供可追溯性和用户熟悉度。Simulants解决了临床试验领域的关键挑战:通过创建平衡、代表性的合成临床试验数据来解决当前试验数据中的偏差,同时保护患者隐私。
Simulants使那些无法访问特定类型患者或疾病数据的公司能够访问这些数据并在其研究中使用,以构建更安全和有效的试验。这种新方法正在改变临床试验的设计和执行方式,提供了显著的风险降低和疗效提升的好处。
设计模拟器
Simulants由康奈尔大学和伊利诺伊大学香槟分校的世界领先研究人员开发,基于一种能够将临床试验数据作为输入并生成高保真合成版本的AI模型,其中患者重新识别的风险最小化。与传统匿名化不同,Simulants使用一组AI算法将每个患者记录分解成片段,与相似记录结合,生成一个原始数据的混合版本。这提供了一种安全的方式访问敏感数据,同时保留了基础数据集的特性并保护隐私。
合成数据的创建涉及从eCRFs中转换患者数据,从原始输入到合成输出,经过几个细致的步骤。首先,必须在eCRF数据库中找到相关研究的数据。应用过滤标准,如感兴趣的指示、作用机制、队列组和大小以及新研究感兴趣的变量,以确定适当的数据。过滤后,数据会进行标准化处理。这包括去标识化以保护患者隐私、聚合小群体以保持匿名性,以及合并多个赞助者的研究以确保赞助者保密。标准化数据集然后通过Simulants算法生成包含合成患者的数据库。
合成数据会与原始数据进行严格比较,以评估保真度、实用性和隐私性。只有当数据满足所需的患者和赞助者隐私水平,并且保真度和实用性被认为可接受时,合成数据才被视为可用于分析。Simulants AI算法的规则简单易描述,但其能力范围却非常广泛,使其成为AI对临床试验社区潜在影响的完美示例(见图1)。
Simulants数据具有高保真度,能够在分析中可靠地重现结果,就像在原始数据中进行一样。这使得Simulants在推进疾病过程的科学理解和药物工作方式方面极具价值,并且可以有多种不同的应用。此外,Simulants允许研究人员在临床环境中测试之前,使用历史数据探索更多可能性。
使用Simulants生成的合成数据可以预测哪些患者可能会经历某些药物的严重、危及生命的副作用,并识别最有可能对治疗产生反应的患者亚群,确保试验结果对患者更安全和有效。AI模型还可以帮助理解不同环境下的试验运行系统差异,使更容易理解不同地理区域开发的药物的相对益处,并预测其在全球范围内的结果。
几家制药和生物技术公司已成功利用Simulants数据优化其临床试验,与达索系统公司的Medidata合作。例如,一家领先的生物技术公司使用Simulants生成的合成数据设计和执行早期CAR-T项目。获得的见解帮助他们完善试验方案并更好地了解不良事件。
Simulants的优势
行业内的研究人员亲眼见证了Simulants如何为更安全和高效的临床试验铺平道路。合成数据生成为研究人员提供了一个实用且易于访问的解决方案,使他们能够使用高质量数据而无需复杂的数据共享协议或复杂的数据处理程序。这项技术增强了药物开发过程的效率,使试验设计更加有效,更好地针对有未满足医疗需求的患者队列,并改进新型终点的识别。
利用合成数据进行CAR-T项目
在一家领先的欧盟生物技术公司的最近研究中,研究团队能够利用Simulants数据确认其临床领导者的安全性假设。该公司正在开发CAR-T项目,但由于治疗引起的不良事件(AEs)、预处理方案的复杂性、剂量选择和患者选择等因素面临挑战。使用3000多名接受CD19自体CAR-Ts和双特异性抗体治疗的非霍奇金淋巴瘤、急性淋巴细胞白血病和实体瘤患者,创建了一个高保真的合成数据集。
访问这个合成患者队列使生物技术公司能够调查血液肿瘤学指征的通用性,并分析治疗引起的不良事件。全面分析导致了测量次数的更新,使主要研究者能够主动而不是被动地应对特定事件。此外,它促进了对接受伴随药物治疗的患者进行特别护理,无论是他们已经接受过某种药物还是该药物是试验的一部分,因为这影响了安全事件的频率和严重程度。这种方法不仅确认了安全性假设,还导致了更准确和有效的试验设计,最终提高了患者护理水平并提升了公司在竞争激烈的CAR-T治疗领域的地位。
展望未来
通过利用AI技术,Simulants可以提供高保真的合成数据——减少试验风险、增强试验设计并改善结果。这种创新方法解决了临床研究中的关键挑战,如患者招募和保留、患者安全和敏感历史试验数据的共享。通过创建代表性的合成数据集,Simulants确保临床试验反映了目标患者群体,最终导致更具普遍性和有效性的治疗。
Simulants的优势不仅限于提高试验效率。通过保护患者隐私和赞助者知识产权,Simulants促进了更道德和可信的研究环境。
随着医疗保健行业继续拥抱AI,Simulants的整合有望在临床研究和患者护理方面带来重大进展。这项技术可以加速药物开发过程,更快地将改变生活的治疗方法推向市场。随着AI技术如Simulants的日益采用,临床开发的未来看起来更加光明——支持更有效和包容性的试验,改善全球患者的健康结果和安全性。
(全文结束)

