斯克里普斯研究所的科学家们最近开发了MovieNet,这是一种变革性的人工智能(AI)模型,能够以人类大脑的微妙程度理解动态图像。与擅长分析静态图像的传统AI模型不同,MovieNet旨在识别和解释随时间变化的复杂场景。
这项创新详细记录在《美国国家科学院院刊》上,其应用前景广泛,从医疗诊断到自动驾驶车辆都大有可为。
“大脑不仅仅看到静止的画面;它会创建一个持续的视觉叙事,”斯克里普斯研究所多里斯神经科学中心的主任霍利斯·克莱因(Hollis Cline)说道,“静态图像识别已经取得了很大进展,但大脑处理流动场景的能力——就像看电影一样——需要一种更复杂的模式识别形式。通过研究神经元如何捕捉这些序列,我们能够将类似的原理应用于AI。”
模仿大脑的灵感
克莱因和第一作者马萨基·希拉莫托(Masaki Hiramoto),斯克里普斯研究所的研究科学家,基于大脑如何处理现实世界的视觉序列展开了他们的工作。研究重点放在了蝌蚪身上,其视顶盖——大脑的视觉处理区域——能够高效地检测和响应移动刺激。
“蝌蚪有一个非常好的视觉系统,加上我们知道它们能够高效地检测和响应移动刺激,”希拉莫托解释道。
研究人员在蝌蚪的大脑中发现了能够检测亮度变化和物体旋转变化的神经元。这些神经元以100到600毫秒的时间片段处理视觉数据,结合光影模式来创建连续的叙事。克莱因和希拉莫托训练MovieNet模仿这一神经过程,将动态视频片段编码为一系列可识别的线索。
AI观看视频片段
为了评估MovieNet,研究人员向模型展示了蝌蚪在各种条件下游泳的视频片段。该模型在区分正常游泳行为和异常行为方面的准确率达到82.3%,比人类观察者高出18%,并且超过了谷歌的GoogLeNet等领先AI模型的表现,后者仅达到72%的准确率。
“这是我们在真正潜力方面看到的地方,”克莱因指出,强调了MovieNet处理动态数据能力的重要性。与传统AI模型不同,MovieNet能够高效地处理和压缩信息,从而在减少数据和计算需求的情况下实现高精度。
更环保的AI方法
MovieNet的一个突出特点是其能源效率。传统AI模型需要巨大的计算资源,导致显著的环境足迹。相比之下,MovieNet通过简化数据为基本序列,减少了能源需求,同时不牺牲性能。
“通过模仿大脑,我们设法使我们的AI更加不那么苛求,为不仅强大而且可持续的模型铺平了道路,”克莱因说。这种效率使MovieNet成为一种环保的替代方案,为在高成本一直是障碍的行业中扩展AI铺平了道路。
医学领域的变革潜力
MovieNet解释细微变化的能力对医学具有深远的影响。该模型可以帮助早期检测诸如神经退行性疾病和心律不齐等健康状况。例如,帕金森病相关的微小运动变化——通常肉眼无法察觉——可以被AI标记,使临床医生能够更早介入。
在药物发现方面,MovieNet的动态分析可以带来更精确的筛选技术。传统方法依赖于静态快照,可能会错过关键的变化。通过跟踪细胞对化学暴露的反应,MovieNet可以提供关于药物如何与生物系统相互作用的更深入见解。
“当前的方法会错过关键变化,因为它们只能分析间隔拍摄的图像,”希拉莫托说道,“随着时间的推移观察细胞意味着MovieNet可以在药物测试期间跟踪最细微的变化。”
AI的技术飞跃
MovieNet的创新不仅在于准确性,还在于它通过实现动态场景的细致分析填补了现有AI技术的空白。其识别和解释实时视觉数据变化的能力为AI设定了新的标准,使其成为需要连续监测和精确识别的应用中的重要工具。
例如,在自动驾驶汽车中,AI可以通过检测和响应道路条件或行人行为的变化来增强安全性。同样,在医学成像中,它可以提高检测可能指示早期疾病阶段的细微异常的能力。
像活脑一样思考的AI模型
克莱因和希拉莫托计划增强MovieNet的适应性,扩展其在各种环境和应用中的能力。这包括改进模型以处理更复杂的情景,并探索其在其他领域(如环境监测和野生动物观察)中的应用。
“从生物学中汲取灵感将继续成为推进AI的肥沃领域,”克莱因说,“通过设计像活体生物一样思考的模型,我们可以实现传统方法无法实现的效率水平。”研究团队设想了一个未来,像MovieNet这样的生物启发式AI将在各个行业掀起革命,不仅推动我们对AI的理解,还开启了可能重新定义行业并改善生活的创新之门。
(全文结束)

