研究人员今天(2024年11月8日)发布了一个雄心勃勃的2型糖尿病研究的主要数据集,该研究旨在探索可能影响2型糖尿病发展的生物标志物和环境因素。由于研究参与者包括没有糖尿病的人和其他处于不同病情阶段的人,初步发现揭示了一幅与以往研究不同的信息图景。
例如,来自参与者家中定制环境传感器的数据清楚地显示了疾病状态与暴露于微小污染颗粒之间的关联。收集的数据还包括调查问卷、抑郁量表、眼部成像扫描和传统的血糖及其他生物学变量测量。
所有这些数据都打算通过人工智能进行挖掘,以获得关于风险、预防措施和疾病与健康之间路径的新见解。“我们看到的数据支持2型糖尿病患者之间的异质性,即人们并不是都在应对同样的问题。由于我们收集了大量详细的数据集,研究人员将能够深入探索这一点,”华盛顿大学医学院眼科教授Cecilia Lee博士说。
她对收集到的数据质量表示兴奋,这些数据代表了1,067人,仅占研究预期总参与人数的25%。Lee是AI-READI(人工智能就绪和公平的糖尿病洞察图谱)项目的负责人。这一由美国国立卫生研究院支持的倡议旨在收集和分享全球科学家可以分析的人工智能就绪数据,以寻找新的健康和疾病线索。
初始数据发布在11月8日的《自然代谢》杂志上。作者重申了他们的目标,即收集比以往测量的更多种族和族裔多样性的健康信息,并使生成的数据在技术和伦理上准备好进行人工智能挖掘。“这一发现过程令人振奋,”也是UW Medicine眼科教授的Aaron Lee博士说,他是该项目的首席研究员。“我们是一个由七家机构和多学科团队组成的联盟,这些团队之前从未合作过。但我们有共同的目标,即利用无偏见的数据,并在共享数据的同时保护数据的安全。”
在西雅图、圣迭戈和阿拉巴马州伯明翰的研究站点,招募者正在集体招募4,000名参与者,纳入标准旨在促进平衡:* 种族/族裔(每组1,000人——白人、黑人、西班牙裔和亚洲人)* 疾病严重程度(每组1,000人——无糖尿病、糖尿病前期、非胰岛素控制药物治疗和胰岛素控制的2型糖尿病)* 性别(男女各半)
“传统上,科学家们在研究病理发生——人们如何患病——和风险因素,”Aaron Lee说。“我们希望我们的数据集也能用于研究健康发生,即促进健康的因素。因此,如果您的糖尿病好转,可能有哪些因素在起作用?我们预计,主要数据集将在这两个方面带来关于2型糖尿病的新发现。”
通过从大量人群中收集更详细的特征数据,研究人员希望创建一个人可能从疾病进展到完全健康,或从完全健康进展到疾病的虚拟健康史。数据托管在一个定制的在线平台上,分为两套:一套需要使用协议的受控访问数据集,另一套是去除了HIPAA保护信息的注册公开版本。
2024年夏季涉及204名参与者的试点数据发布已被全球110多个研究组织下载。研究人员必须验证身份并同意伦理使用条款。(了解更多关于访问数据的信息,请访问aireadi.org。)
AI-READI联盟包括华盛顿大学医学院、阿拉巴马大学伯明翰分校、加州大学圣迭戈分校、加州医疗创新研究所、约翰斯·霍普金斯大学、原住民生物数据联盟、斯坦福大学和俄勒冈健康与科学大学。该项目位于西雅图UW Medicine的Angie Karalis Johnson视网膜中心。Cecilia Lee担任Klorfine家族捐赠主席。Aaron Lee担任Dan和Irene Hunter捐赠教授。
这项工作得到了美国国立卫生研究院(资助编号OT2OD032644和P30 DK035816)的支持。作者的利益冲突声明包含在已发表的论文中,如有需要可提供。
(全文结束)

