在美国消化疾病周(Digestive Disease Week, DDW)上展示的研究包括了关于人工智能(AI)与医生在回答胃肠道癌症患者问题时的质量和同情心比较、媒体报道中用于描述肝硬化的污名化术语以及结肠镜检查前一晚可以食用的餐食。
AI比医生更有同情心
研究人员表示,ChatGPT在回答胃肠道癌症患者的问题时,在质量和同情心方面均优于医生。
在5分制的Likert量表上,AI的回答在质量和同情心方面分别得分为4.2分,而医生的回答在这两方面的得分分别为3.0分和2.0分(P < 0.001),宾夕法尼亚州阿勒格尼健康网络的研究员Muhammad Anees博士报告称。
然而,他指出,医生的回答被认为更具可读性,并且写作水平更低。
研究人员使用社交媒体平台Reddit,在子版块r/AskDocs中寻找患者提问。该子版块约有675,000名成员,包括患者及其家属,他们会向经过验证的医疗保健提供者提问。他们选择了15个关于胰腺癌、肝癌、食道癌、胃癌和结肠癌的问题,每个疾病部位三个问题。
他们将这些问题输入ChatGPT 3.5,然后将AI生成的回答与实际医生在子版块中的回答进行比较。他们使用Flesch阅读易度评分(FRES)评估每条回答的可读性,并使用Flesch Kincaid年级水平评估其写作水平,然后将匿名回答呈现给12位美国认证的医学和外科肿瘤学家,以5分制Likert量表评估回答的质量和同情心。
医生的回答具有更好的可读性,FRES评分为58.8,而AI回答为30.9;医生的回答写作水平为8.4年级,而AI回答为13.5年级。
Anees说:“有效的沟通教育对于这些癌症患者非常重要,因为它有助于改善治疗结果。”这项研究的结果表明,“大型语言模型在提供或增强胃肠道癌症患者教育方面具有价值。”
大型语言模型还可能“通过帮助回应患者的查询来减少职业倦怠”,从而提高效率。
媒体对肝硬化的报道常使用污名化术语
一项分析显示,关于肝硬化的媒体报道中经常使用污名化语言,通常与物质和酒精使用有关。
马萨诸塞州总医院的Olivia Kahn-Boesel博士报告称,在所包含的新闻文章中,37%的文章中有328个污名化术语。
最常见的污名化术语是“滥用”(13%的文章)、“过度饮酒”(9%)、“滥用者/使用者”(8%)和“成瘾/成瘾者”(7%)。与酒精相关的常见术语包括“流行病”(24篇文章)、“低风险饮酒”(22篇文章)以及讨论谁“应该”接受肝脏移植(15篇文章)。
研究人员在其海报中指出:“媒体报道对医疗状况的影响会塑造公众的知识、看法和偏见,进而影响健康行为。”
他们总结道:“媒体报道中频繁使用污名化术语来讨论肝硬化,这会延续偏见。需要准确和代表性的媒体报道来减少污名并指导健康行为。”
该分析涉及2010年至2023年间出现在九家美国报纸和电视网上的媒体报道:《波士顿环球报》、《纽约时报》、《华尔街日报》、《华盛顿邮报》、《今日美国》、ABC、CNN、CBS和NBC。研究人员在LexisNexis和ProQuest档案中搜索了包含“肝硬化”、“肝衰竭”、“肝病”和“肝移植”等术语的文章,确定了至少100字长的新闻故事、特写、采访或社论。他们排除了关于儿科、动物或主要与肝硬化或相关风险因素无关的故事。
在搜索到的7,079篇文章中,有341篇文章符合标准,其中57%发表于2017年至2023年。大多数文章(86%)是新闻或特写,6%是采访,4%是社论。
在这些文章中,主要关注的是病毒性肝炎(39%),其次是酒精(21%)和非酒精性脂肪肝病(NAFLD)/代谢功能障碍相关脂肪性肝病(MASLD;10%),尽管MASLD是美国肝硬化的首要原因。近三分之一(30.3%)的文章关注酒精相关肝病,其中74%发表于2017年之后。
结肠镜检查前一天的低纤维晚餐不会影响肠道清洁质量
一项单中心随机对照试验显示,结肠镜检查前一天晚上吃低纤维晚餐不会影响肠道清洁的质量。
比利时鲁汶大学医院的Pieter Sinonquel博士报告称,在前一天晚上吃低纤维晚餐的患者和遵循标准准备方案的患者中,98.8%的患者都有充分的肠道准备。
干预组和对照组之间的最佳肠道准备(波士顿肠道准备评分8-9)也没有显著差异(81.4% vs 87.6%)。
干预组的251名患者被允许在下午4点吃一顿低纤维晚餐,而对照组的250名患者则遵循标准的肠道准备程序,他们的最后一顿低残渣晚餐也在下午4点。两组的肠道清洁都从晚上6-8点开始,使用NER1006聚乙二醇溶液进行分剂量清洗。内窥镜医师不知道患者遵循哪种清洁方案。
两组在息肉检出率(67.3% vs 68.7%)、腺瘤检出率(48.3% vs 46.6%)、晚期腺瘤检出率(15.2% vs 14.1%)或锯齿状息肉检出率(8.9% vs 10.3%)方面没有显著差异。两组的依从性也相似(93.4% vs 96.4%),定义为摄入超过75%的两个剂量,并且在安全性方面没有显著差异,72.9%的干预组参与者和73.2%的对照组参与者报告没有或仅有一个不良事件。最常见的不良事件是恶心。
患者报告的结果——包括对准备的接受程度、对准备清洁成功的信念、以及遵循准备、饮用NER1006、遵循饮食指示和在结肠镜检查前保持禁食的难易程度——在两组之间也没有显著差异。
(全文结束)

