Meta 的 Llama 3.2:凭借设备端和多模态能力重新定义开源生成式人工智能Meta’s Llama 3.2: Redefining Open-Source Generative AI with On-Device and Multimodal Capabilities

环球医讯 / AI与医疗健康来源:www.unite.ai未明确 - 英语2024-09-28 01:00:00 - 阅读时长5分钟 - 2165字
本文介绍了 Meta 最新推出的 Llama 3.2 在开源生成式人工智能领域的重要发展及其意义。
MetaLlama3.2开源生成式人工智能多模态能力设备端部署医疗保健人工智能创新可访问性
Meta 的 Llama 3.2:凭借设备端和多模态能力重新定义开源生成式人工智能

Meta 最近推出的 Llama 3.2 是其 Llama 系列大型语言模型的最新版本,这是开源生成式人工智能生态系统发展中的一个重大进展。这次升级在两个方面扩展了 Llama 的能力。一方面,Llama 3.2 允许处理多模态数据——整合图像、文本等——使更广泛的受众更容易获得高级人工智能能力。另一方面,它扩大了在边缘设备上的部署潜力,为实时、设备端的人工智能应用创造了令人兴奋的机会。在本文中,我们将探讨这一发展及其对人工智能部署未来的影响。

Llama 的发展历程

Meta 与 Llama 的旅程始于 2023 年初,在此期间,该系列经历了爆炸式的增长和采用。从仅用于非商业用途且仅特定研究机构可访问的 Llama 1 开始,该系列随着 2023 年 Llama 2 的发布进入了开源领域。今年早些时候推出的 Llama 3.1 是发展中的一个重要步骤,它引入了具有 4050 亿参数的最大开源模型,与专有竞争对手相当或超越。最新发布的 Llama 3.2 通过引入新的轻量级和专注于视觉的模型,使设备端人工智能和多模态功能更易于使用,进一步推进了这一进程。Meta 对开放性和可修改性的执着使 Llama 成为开源社区的领先模型。该公司相信,通过坚持透明度和可访问性,我们可以更有效地推动人工智能创新——不仅为开发者和企业,也为世界各地的每个人。

Llama 3.2 介绍

Llama 3.2 是 Meta 的 Llama 系列的最新版本,包括各种旨在满足不同需求的语言模型。最大和中等规模的模型,包括 90 亿和 110 亿参数,旨在处理包括文本和图像在内的多模态数据。这些模型可以有效地解释图表、图形和其他形式的视觉数据,使其适用于构建计算机视觉、文档分析和增强现实工具等领域的应用程序。轻量级模型,具有 10 亿和 30 亿参数,专门为移动设备采用。这些纯文本模型在多语言文本生成和工具调用能力方面表现出色,使其在边缘设备上的检索增强生成、总结和创建基于个性化代理的应用程序等任务中非常有效。

Llama 3.2 的意义

Llama 3.2 的发布在两个关键领域的进步值得关注。

一个新的多模态人工智能时代

Llama 3.2 是 Meta 的第一个具有文本和图像处理能力的开源模型。这是开源生成式人工智能发展中的一个重大进展,因为它使模型能够分析和响应视觉输入以及文本数据。例如,用户现在可以上传图像,并根据自然语言提示接收详细的分析或修改,例如识别对象或生成标题。马克·扎克伯格在发布期间强调了这一能力,称 Llama 3.2 旨在“实现许多需要视觉理解的有趣应用”。这种集成拓宽了 Llama 在依赖多模态信息的行业的应用范围,包括零售、医疗保健、教育和娱乐。

设备端功能的可访问性

Llama 3.2 的一个突出特点是其针对设备端部署的优化,特别是在移动环境中。具有 10 亿和 30 亿参数的模型的轻量级版本专门设计用于在由高通和联发科硬件驱动的智能手机和其他边缘设备上运行。这种实用性允许开发人员创建应用程序而无需大量的计算资源。此外,这些模型版本在多语言文本处理方面表现出色,并支持 128K 个标记的更长上下文长度,使用户能够以其母语开发自然语言处理应用程序。此外,这些模型具有工具调用功能,允许用户参与代理应用程序,例如直接在其设备上管理日历邀请和规划旅行。

在本地部署人工智能模型的能力使开源人工智能能够克服与云计算相关的挑战,包括延迟问题、安全风险、高运营成本和对互联网连接的依赖。这一进步有可能改变医疗保健、教育和物流等行业,使它们能够在没有云基础设施或隐私问题的限制下,并在实时情况下使用人工智能。这也为人工智能进入连接有限的地区打开了大门,使前沿技术的访问民主化。

竞争优势

Meta 报告称,Llama 3.2 在性能方面与 OpenAI 和 Anthropic 的领先模型具有竞争力。他们声称,Llama 3.2 在各种基准测试中优于 Claude 3-Haiku 和 GPT-4o-mini 等竞争对手,包括指令遵循和内容总结任务。这种竞争优势对于 Meta 至关重要,因为它旨在确保开源人工智能在快速发展的生成式人工智能领域与专有模型保持同步。

Llama 堆栈:简化人工智能部署

Llama 3.2 发布的一个关键方面是引入了 Llama 堆栈。这套工具使开发人员在不同环境(包括单节点、本地、云和设备端设置)中使用 Llama 模型变得更加容易。Llama 堆栈包括对 RAG 和启用工具的应用程序的支持,为部署生成式人工智能模型提供了灵活、全面的框架。通过简化部署过程,Meta 使开发人员能够轻松地将 Llama 模型集成到他们的应用程序中,无论是云、移动还是桌面环境。

结论

Meta 的 Llama 3.2 是开源生成式人工智能发展中的一个关键时刻,为可访问性、功能性和通用性设定了新的基准。凭借其设备端功能和多模态处理,该模型为从医疗保健到教育等行业开启了变革的可能性,同时解决了诸如隐私、延迟和基础设施限制等关键问题。通过使开发人员能够在本地高效地部署先进的人工智能,Llama 3.2 不仅扩大了人工智能应用的范围,而且在全球范围内使前沿技术的访问民主化。

大健康

猜你喜欢

  • 面对技术惰性?推动供应商伙伴“前进”或离开面对技术惰性?推动供应商伙伴“前进”或离开
  • 塑造未来医疗保健的技术创新塑造未来医疗保健的技术创新
  • 加拉姆塞的恐怖统治:利用领导力意志和人工智能应对加纳的环境破坏加拉姆塞的恐怖统治:利用领导力意志和人工智能应对加纳的环境破坏
  • 都柏林公司聘请新首席技术官以增强用于健康福利导航的人工智能都柏林公司聘请新首席技术官以增强用于健康福利导航的人工智能
  • 乌克兰政府将使用人工智能化身和视频帮助公民了解社会关怀乌克兰政府将使用人工智能化身和视频帮助公民了解社会关怀
  • SynsorMed 推出远程护理服务——利用人工智能技术革新慢性病管理SynsorMed 推出远程护理服务——利用人工智能技术革新慢性病管理
  • Cognoa 的人工智能儿童自闭症诊断在怀俄明州获得医疗补助覆盖Cognoa 的人工智能儿童自闭症诊断在怀俄明州获得医疗补助覆盖
  • 生命科学领域的人工智能市场有望实现爆炸性增长,复合年增长率达27.9%,至2029年生命科学领域的人工智能市场有望实现爆炸性增长,复合年增长率达27.9%,至2029年
  • Welshare Health 开发用于去中心化医疗研究的人工智能驱动应用Welshare Health 开发用于去中心化医疗研究的人工智能驱动应用
  • RIT 科索沃 CIT 学生在 Scopus 索引书籍中发表人工智能研究RIT 科索沃 CIT 学生在 Scopus 索引书籍中发表人工智能研究
大健康
大健康

热点资讯

大健康

全站热点

大健康

全站热文

大健康