每年有超过一百万的儿童受到言语和语言障碍的影响,及早识别和治疗这些状况是帮助这些儿童克服这些问题的关键。由于时间和资源有限,临床医生迫切需要工具来使言语障碍的诊断更快、更准确。
西北大学助理教授Marisha Speights构建了一个数据管道,用于训练儿童语音筛查的临床人工智能工具。她将在联合举办的第188届美国声学学会会议和第25届国际声学大会上展示她的工作,该会议将于5月18日至23日举行。
基于人工智能的语音识别和临床诊断工具已经使用多年,但这些工具通常仅在成人语音上进行训练和使用。这使得它们不适合涉及儿童的临床工作。必须开发新的AI工具,但由于缺乏大规模的儿童语音记录数据集,这变得尤为困难,部分原因是构建这些数据集具有独特的挑战性。
“有一种普遍的误解认为收集儿童的语音与成人一样简单——但实际上,它需要一个更加受控且发展敏感的过程。与成人语音不同,儿童语音高度可变、声学特征独特,并且在大多数训练语料库中代表性不足。”西北大学助理教授Marisha Speights说道。
为了解决这个问题,Speights及其同事开始收集和分析大量儿童语音录音以构建这样的数据集。然而,他们很快意识到一个问题:数千个语音样本的收集、处理和注释在没有他们试图构建的自动化工具的情况下非常困难。
“这是一个有点像‘先有鸡还是先有蛋’的问题,”Speights说,“我们需要自动化工具来扩大数据收集规模,但我们需要大规模的数据集来训练这些工具。”
作为回应,研究人员构建了一个计算管道,将原始语音数据转换为可用于训练AI工具的有用数据集。他们从全国各地收集了代表性的儿童语音样本,使用定制软件验证转录并增强音频质量,并提供了一个平台,以便专家进行详细的注释。
结果是一个高质量的数据集,可以用于训练临床AI,使专家能够使用强大的工具来更容易地诊断言语障碍。
“言语-语言病理学家、医疗保健临床医生和教育工作者将能够使用基于AI的系统更早地发现言语-语言问题,尤其是在专家资源有限的地方。”Speights说。
来源:美国声学学会
(全文结束)

