一种使用人工智能的脑植入技术能够将一名瘫痪女性的思想几乎实时转化为语音。美国研究人员在周一表示,尽管这项技术仍处于实验阶段,但这一最新成果提高了这些设备可能帮助失去沟通能力的人重新获得声音的希望。
加州的研究团队此前曾使用脑-计算机接口(BCI)来解码安(Ann)的想法,并将其翻译成语音。安是一位47岁的四肢瘫痪患者,她在18年前中风后无法说话。然而,从她的想法到语音被计算机读出之间有8秒的延迟,这意味着流畅的对话对安来说仍然遥不可及。她曾是一名高中数学教师。
但该团队的新模型在《自然神经科学》杂志上公布,可以将安的想法以80毫秒为增量转化为她以前的声音版本。“我们的新流式处理方法能够在她意图说话后的1秒内将她的脑信号转换为定制的声音,”加州大学伯克利分校的高级研究作者戈帕拉·阿努曼奇帕里(Gopala Anumanchipalli)告诉法新社。他补充说,安的最终目标是成为一名大学辅导员。
“虽然我们离实现安的目标还有很远,但这一里程碑使我们更接近于大幅提高发声瘫痪者的生活质量。”
听到自己的声音感到兴奋
在研究过程中,安会被展示屏幕上的句子——例如“你爱我吗”——她会在心里对自己说这些话。然后她的想法会被转化为她的声音,这是研究人员通过她受伤前的录音重建的。阿努曼奇帕里说,安“非常兴奋地听到自己的声音,并报告有一种归属感”。
BCI在我们决定说什么、用什么词以及如何移动发声肌肉之后拦截大脑信号。该模型使用了一种称为深度学习的人工智能方法,该方法经过训练,基于安之前尝试无声地说出数千个句子。
这项技术并不总是准确的——词汇量也有限,只有1024个词。
未参与该研究的英国纽卡斯尔大学神经假肢教授帕特里克·德吉纳尔(Patrick Degenaar)告诉法新社,这是一项“非常早期的原理验证”研究,但仍然“非常酷”。他指出,这个系统使用的是不穿透大脑的电极阵列,与亿万富翁埃隆·马斯克的Neuralink公司使用的BCI不同。
这种电极阵列的安装手术在医院中相对常见,用于诊断癫痫,这意味着这项技术更容易大规模推广。阿努曼奇帕里估计,如果资金充足,这项技术可以在五到十年内帮助人们进行交流。
(全文结束)

