为什么23andMe的基因数据可能成为AI公司的“金矿”Why 23andMe’s Genetic Data Could Be a ‘Gold Mine’ for AI Companies

环球医讯 / AI与医疗健康来源:time.com美国 - 英语2025-03-26 04:00:00 - 阅读时长5分钟 - 2122字
基因检测公司23andMe宣布破产后,其持有的1500万人的基因数据可能被出售,这些数据对AI公司来说可能是训练数据集的宝贵资源,但同时也引发了隐私和伦理方面的担忧。
23andMe基因数据AI公司破产数据出售训练大模型行业价值医学研究伦理隐私问题数据主权
为什么23andMe的基因数据可能成为AI公司的“金矿”

基因检测公司23andMe在经历了多年的财务困境后于周日晚上宣布破产。这意味着所有极其私密的用户数据可能面临出售——而这庞大的基因数据可能会吸引那些希望训练数据集的AI公司的兴趣,专家表示。

“数据是新的石油——而且这是非常高质量的石油,”天普大学福克斯商学院教授苏博达·库马尔(Subodha Kumar)说。“随着越来越多复杂和严格的算法的发展,这对许多公司来说是一座金矿。”

但是,任何试图收购23andMe的AI相关公司都将面临重大的声誉风险。许多人对将他们的基因数据用于追踪祖先,却可能被用于他们从未同意的方式感到恐惧。

“任何人接触这些数据都存在风险,”福克斯商学院商业分析与颠覆性技术中心主任库马尔说。“但同时,不接触这些数据,他们也可能会错过一些重要的东西。”

训练大模型

像OpenAI和谷歌这样的公司已经投入了大量时间和资源来影响医疗领域,而23andMe的数据宝库可能会吸引拥有足够财力收购它的大型AI公司。23andMe本周的估值约为4800万美元,远低于2021年的峰值60亿美元。

这些公司正努力构建最强大的通用模型,这些模型需要大量的详细数据进行训练。但研究人员指出,高质量的数据源正在枯竭,这使得新的和强大的信息源更加珍贵。今年早些时候,《TechCrunch》对风险投资家的一项调查发现,超过一半的受访者认为“专有数据的质量或稀有性”是AI初创公司相对于竞争对手的优势。

“我认为23andMe的数据对于一些大型AI公司来说可能非常有价值,因为它代表了实际基因数据的真实数据,”Open Data Labs首席执行官兼Vana网络创建者安娜·卡兹劳斯卡斯(Anna Kazlauskas)说。“生物出版物中可能存在的一些人为错误,你可以避免。”

库马尔表示,23andMe的数据对于公司在推动自主AI(即无需人类参与即可执行任务的AI)方面尤其有价值,无论是在医学研究还是公司决策中。

“自主AI模型的整个目标一直是模块化方法:你先解决小问题,然后将它们组合在一起,”他说。

谷歌和OpenAI的代表尚未回应置评请求。

行业价值

23andMe的数据也可能对使用AI处理大量数据的不同行业有价值——首先是医学研究。

23andMe已经与葛兰素史克等制药公司达成协议,利用该公司的数据集开发新疾病治疗方法。库马尔表示,在天普大学,他和他的同事正在开展一个项目,为卵巢癌患者创造个性化治疗方案——并发现基因数据在理解结构方面“非常、非常强大”。

然而,Insilico Medicine创始人兼首席执行官亚历克斯·扎沃龙科夫(Alex Zhavoronkov)认为,23andMe的数据可能不像某些人想象的那样有价值,尤其是在药物发现方面。“大多数低垂的果实已经被摘取了,公共领域已经发表了大量与主要学术论文一起的数据,”他在给《时代》杂志的一封电子邮件中写道。

但许多其他行业的公司也可能感兴趣。这是一个异常庞大且细致的数据集:这种数量的基因数据,尤其是附带个人健康和医疗记录的数据,很少公开获取,卡兹劳斯卡斯说。“所有这些背景数据使其非常有价值——而且难以获取,”她说。

潜在感兴趣的行业包括保险公司,他们可以利用这些数据识别具有更高健康风险的人,从而提高保费。金融机构可以在评估贷款过程中追踪基因标记与消费模式之间的关系。电子商务公司可以利用这些数据向特定医疗条件的人投放广告。

伦理和隐私问题

但公司也面临着巨大的声誉风险。2023年,23andMe遭受了一次黑客攻击,泄露了数百万用户的个人信息,严重损害了公司的声誉。库马尔表示,来自其他行业的竞标者可能比23andMe的数据保护措施更少。“我担心的是,有些公司不习惯拥有这类数据,他们可能没有足够的治理措施,”他说。

这一点尤其危险,因为基因信息本质上是敏感的,一旦泄露就无法更改。自愿提供数据的人的家庭成员的基因信息也面临风险。鉴于AI已知的偏见,此类数据的滥用可能导致在招聘、保险和贷款等领域出现歧视。周五,加州总检察长罗布·邦塔(Rob Bonta)发布了一份针对23andMe客户的“紧急”警报,建议客户根据加州隐私法要求该公司删除其数据并销毁其基因样本。

电子前沿基金会网络安全主管伊娃·加尔佩林(Eva Galperin)担心23andMe的基因数据可能在市场上处于永久流动状态。“一旦出售了数据,就没有限制它会被转售多少次,”她说。这可能导致基因数据落入那些不优先考虑伦理问题或没有强有力数据保护措施的组织手中。

Insilico Medicine的扎沃龙科夫表示,所有这些担忧意味着潜在的AI相关竞标者将被劝阻不要尝试购买23andMe及其数据。“他们的数据集实际上是毒药,”他说。“无论谁购买并用它进行训练,都会受到负面宣传,收购方可能会受到调查或起诉。”

无论最终结果如何,卡兹劳斯卡斯表示,至少她感谢这个困境引发了关于数据主权的更大讨论。“我们未来应该希望避免这种情况,即你决定做一次基因测试,五年后,这家公司陷入财务困境,现在你的基因数据有可能被卖给出价最高的人,”她说。“在这个AI时代,这些数据非常有价值。”


(全文结束)

大健康

猜你喜欢

  • 2025 AGS:开发和评估用于设定目标眼压的AI模型2025 AGS:开发和评估用于设定目标眼压的AI模型
  • 高剂量维生素D可能将热量从脂肪转移到肌肉,研究揭示——你需要了解的内容高剂量维生素D可能将热量从脂肪转移到肌肉,研究揭示——你需要了解的内容
  • 孤独星球:全球如何应对社交孤立孤独星球:全球如何应对社交孤立
  • 荷兰健康研究人员建议在药品决策中考虑环境可持续性荷兰健康研究人员建议在药品决策中考虑环境可持续性
  • 医疗科技中的人工智能代理服务:商业合同的关键考虑因素医疗科技中的人工智能代理服务:商业合同的关键考虑因素
  • 新型AI模型DYNA精准区分有害与无害基因变异,助力疾病诊断新型AI模型DYNA精准区分有害与无害基因变异,助力疾病诊断
  • 重新构想:希望之城的新数字领导重新构想:希望之城的新数字领导
  • 尤克莱尔县健康状况新数据发布尤克莱尔县健康状况新数据发布
  • 2025年及以后将塑造创业未来的数字健康和福祉平台商业模式2025年及以后将塑造创业未来的数字健康和福祉平台商业模式
  • 设计基于人工智能的健康保险自动化:行业挑战带来的启示设计基于人工智能的健康保险自动化:行业挑战带来的启示
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康