MDClone 有限公司认为它已经找到了解决医疗保健领域数据问题的方法——合成数据。任何与医疗保健合作的技术公司都必须管理大量未组织的数据,同时还要处理受保护的健康信息或医疗记录。合成数据可以避免后者的问题。
“我们必须发明或构建一种称为合成数据的东西,”MDClone 首席技术官 Luz Erez(如图)在接受 CUBE 采访时说,“合成数据所做的就是混合患者数据,因此原始数据和你得到的数据之间没有一对一的关系。最终,它是不含 PHI(受保护的健康信息)的,但你在其中进行的任何统计分析几乎总是正确的。我们已经构建了这个平台,现在正在提供该平台。你不需要机构审查委员会。你不需要了解编程。你只需提出问题,它非常自然。你会得到数据。它是合成的,所以你可以将其带给其他人。”
Erez 在 Cloudera Evolve24 事件期间与 CUBE Research 的 Bob Laliberte 和联合主持人 Rebecca Knight 进行了独家直播访谈。他们讨论了合成数据的好处以及与 Cloudera Inc. 合作将人工智能整合到医疗保健中的好处。
Erez 声称,没有 Cloudera 就没有 MDClone。他们的合作使 MDClone 能够在本地工作——这对于不想将数据移至云端的医疗保健组织至关重要——并扩展其数据。
“举个例子,我们遇到了 Log4J 安全漏洞,”Erez 解释道,“如果我们不使用 Cloudera 而是从零开始构建自己的堆栈,我们就需要检查每个组件,确保安全,然后为所有客户重新安装。这是一个本地安装,非常繁重。我们选择了 Cloudera……第二天早上,我们就可以为客户提供安装包了。”
合成数据已成为生成式人工智能的关键,保护患者信息的同时仍允许 AI 产生准确的结果。Erez 表示,对于 MDClone 的最大客户,如国家卫生研究院,整合所有数据也是必要的步骤。
“我们称之为权重矩阵,”他说,“权重矩阵是信息的持有者,并集中在一个地方。因此,我们提供了这些功能,采用混合方式——将其迁移到一个混合集中式解决方案,从多个来源收集信息。我们今天已经有一个非常好的产品,[食品药品监督管理局和国家卫生研究院]……有许多用途,因为有如此多的用例。”
(全文结束)

