大型语言模型中的细分健康数据:评估亚裔美国人代表性的数据公平性Disaggregated Health Data in LLMs

环球医讯 / AI与医疗健康来源:arxiv.org美国 - 英语2025-08-07 09:21:08 - 阅读时长4分钟 - 1633字
本研究通过统计和机器学习工具评估大型语言模型(LLMs)在亚裔美国人细分群体健康信息检索中的表现,重点分析数据公平性。研究揭示了LLMs在呈现细分健康数据时的差异性,强调了在数据生命周期中维护公平性的必要性,为负责任的AI发展提供了重要参考。
大型语言模型健康数据亚裔美国人数据公平性健康信息检索健康信息多样性健康信息准确性系统性偏差数据优化建议
大型语言模型中的细分健康数据:评估亚裔美国人代表性的数据公平性

引言

本研究评估大型语言模型(LLMs)在细分健康信息检索中的能力。LLMs(如GPT-3、Claude、Perplexity等)已成为信息检索的重要工具,其生成式AI服务通过人机对话交互帮助公众便捷获取科学知识。然而,这种技术普及也引发了关于使用风险的讨论,促使"负责任AI"概念的兴起,其中"数据公平性"成为核心议题。通过系统分析LLMs生成的细分健康信息,本文评估公开健康数据中种族群体代表性的公平性。

数据细分与LLM中的数据公平性

美国政府通过"Equitable Data工作组"强调数据公平性对多民族社会的重要性,指出需要通过数据细分确保边缘群体在政策决策中的可见性。例如,在现有统计中,中东/北非裔与亚裔细分群体常被忽视。研究显示:印度裔家庭收入中位数为12.37万美元,而缅甸裔仅为4.44万美元;25%的缅甸裔和19%的老挝裔生活在贫困线以下;印度裔高等教育持有率达74%,而柬埔寨裔仅15%。

LLM的数据公平性问题更为复杂:不同于传统人口调查中数据收集的偏差(如抽样误差、无应答误差),LLMs使用二次信息内容(政策报告、新闻、论文)进行训练,导致偏差叠加。此外,某些"有趣"发现可能被反复输入系统,算法处理过程缺乏透明度,且生成结果可能反向强化训练数据偏差。这使得数据公平性渗透整个数据生命周期。

方法与数据收集

本研究选取全球广泛使用的ChatGPT作为数据收集平台。通过美国人口普查局的21个亚裔细分分类(如孟加拉裔、不丹裔、缅甸裔等),采用提示词"生成特定人群应关注的重要健康问题",设置10次生成循环获得1000份样本。使用GPT-3.5模型(温度参数1),数据采集于2024年8-10月。

分析结果

研究问题1:LLM健康信息检索的相似性

通过健康状况级、话题级(BERTopic+对应分析)多维度分析发现:

  • 低差异组:华裔、台湾裔、韩裔在所有指标中距离参考组(亚裔美国人)最近,表现为文化、社会因素的趋同性
  • 高差异组:菲律宾裔(欧式距离2.4595)、缅甸裔、斯里兰卡裔显示显著差异,可能与文化/社会因素相关
  • 区域集群:东亚群体(中日韩)聚集在参考组附近,东南亚群体(缅越老)距离较大(欧式距离1.0-1.3),南亚群体(印巴斯)表现中等至高度差异

研究问题2:健康信息多样性

通过词数、条件数、辛普森多样性指数分析:

  • 南亚群体(印度/巴基斯坦/斯里兰卡)在词数(nWords)和条件数(nConds)上显著较高,可能与其人口规模、英语熟悉度有关
  • 东南亚群体(缅/老/越)在所有指标中数值最低,反映语言和健康状况指标的多样性不足
  • 东亚群体(中/日/韩)虽在RQ1中与参考组最相似,但细分信息可能存在语言(英语)获取障碍

研究问题3:健康信息准确性

通过正则表达式提取健康状况并验证发现:

  • 准确呈现的状况:心理健康问题、心血管疾病、糖尿病、乙肝、肥胖、癌症、呼吸道疾病等普遍性健康问题在多数群体中得到准确反映
  • 遗漏的重要状况:苗族女性宫颈癌发病率(36.6/10万)比泛亚裔群体高3倍以上,越/柬/缅裔的肝癌高发问题未被充分呈现。这些缺失可能源于数据聚合化处理和英语资料可及性限制

讨论与结论

本研究揭示LLMs在呈现亚裔细分群体健康信息时的系统性偏差:

  1. 东亚群体代表性差异:华/台/韩群体虽总体最接近参考组,但特定健康问题(如乳腺癌、胃癌)被过度泛化
  2. 南亚群体多样性:印/巴/斯里兰卡群体在代谢综合征、胆囊疾病等细分领域呈现较好代表性,但不丹/尼泊尔群体存在信息缺失
  3. 东南亚群体代表性不足:除菲律宾裔外,多数群体在健康状况数量和多样性上存在显著不足,重要问题如肝癌、宫颈癌未被充分呈现

研究建议:需优化提示词设计、整合权威医学数据源、持续承诺数据公平性,以确保LLMs能准确反映多元群体的健康挑战。

【全文结束】

大健康

猜你喜欢

  • 什么是微生物组及其重要性什么是微生物组及其重要性
  • 管理医疗领域人工智能的益处与风险 | 乔恩·摩尔管理医疗领域人工智能的益处与风险 | 乔恩·摩尔
  • 微生物群医学微生物群医学
  • 一个简单的修改欺骗了人工智能,并揭示了医学伦理中的危险缺陷一个简单的修改欺骗了人工智能,并揭示了医学伦理中的危险缺陷
  • 你能信任来自ChatGPT的AI医疗建议吗?你能信任来自ChatGPT的AI医疗建议吗?
  • 人工智能与心理健康护理——伦理关切与监管回应人工智能与心理健康护理——伦理关切与监管回应
  • 微生物多样性:其如何影响整体健康与福祉微生物多样性:其如何影响整体健康与福祉
  • 当代微生物组研究的蓝图当代微生物组研究的蓝图
  • 罕见疾病研究设计的创新方法罕见疾病研究设计的创新方法
  • Q&A:专家探讨GPT-5与HIPAA合规性(第二部分)Q&A:专家探讨GPT-5与HIPAA合规性(第二部分)
  • 人工智能应为心理健康设置红黄绿灯标识人工智能应为心理健康设置红黄绿灯标识
  • 医疗支付中的AI:300位领导者的实践与投资方向医疗支付中的AI:300位领导者的实践与投资方向
  • 酸奶搭配温泉浴可促进肠道健康酸奶搭配温泉浴可促进肠道健康
  • 人工智能在医疗保健领域的日益影响:诊断、治疗和研究的革命人工智能在医疗保健领域的日益影响:诊断、治疗和研究的革命
  • 用于医疗实践管理的创新人工智能用于医疗实践管理的创新人工智能
  • AI疾病预测研究论文AI疾病预测研究论文
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康