Arm® 今日宣布多项全新的战略合作,继续致力于推动人工智能 (AI) 的创新,并将 AI 的体验变为现实。除了自身已能实现 AI 开发的技术平台之外,Arm 还与 AMD、英特尔、Meta、微软、NVIDIA 和高通技术公司等领先的科技企业携手合作,通过多项计划,聚焦于先进 AI 能力的实现,由此带来更快响应、更加安全的用户体验。这些合作计划将在所有计算进行之处,助力 1500 多万名 Arm 开发者,构建其所需的基础框架、技术和规范,带来新一代的 AI 体验。
Arm 执行副总裁兼首席架构师与院士 Richard Grisenthwaite 表示:“AI 的广泛应用依赖于软、硬件创新的持续协同。小到边缘侧运行工作负载的小型传感器,大到处理复杂工作负载以训练大语言模型 (LLM) 的大型服务器,软硬件的协同发展将在每个技术节点中,助力 AI 能力的提升。随着整个生态系统不断发掘 AI 的真正潜力,我们也将面临安全性、可持续性和数据瓶颈等诸多挑战。因此,继续探索行业内的协作至关重要,为此,我们才能实现 AI 的规模化,包括加大边缘侧的推理能力。”
助力边缘 AI 发展
当下生成式 AI 和 LLM 正成为人们关注的焦点,而鉴于在智能手机领域,70% 的第三方 AI 应用都运行在 Arm CPU 上,Arm 已引领边缘 AI 长达多年。在探索如何以可持续的方式实现 AI 并高效传输数据的同时,行业也需要继续发展以实现在边缘侧运行 AI 和机器学习 (ML) 模型,然而,开发者在此却面临着计算资源日益受限的难题,使这个任务的实现充满了挑战。
Arm 正与 NVIDIA 展开合作,针对 NVIDIA TAO 进行适配。这是一套针对 Arm Ethos™-U NPU 使用的低代码开源 AI 工具包,有助于构建性能优化的视觉 AI 模型,并将其部署于搭载 Ethos-U 的处理器上。NVIDIA TAO 提供了一个易使用的界面,可在免费且开源的领先 AI 和 ML 框架——TensorFlow 和 PyTorch 上进行构建工作,为开发者带来轻松无缝的模型开发和部署环境,同时赋能边缘设备实现更复杂的 AI 工作负载,提升 AI 体验。
在所有设备与市场中推动神经网络的应用
在边缘侧推进神经网络的部署是实现 AI 可持续增长的重要一环。Arm 携手 Meta,通过 ExecuTorch,将 PyTorch 引入基于 Arm 架构的边缘侧移动和嵌入式平台。ExecuTorch 可助力开发者更轻松地在移动和边缘设备上,部署先进的 AI 和 ML 工作负载所需的先进神经网络。Arm 与 Meta 的合作将确保通过 PyTorch 和 ExecuTorch,开发者能在未来更轻松地开发和部署 AI 与 ML 模型。
与 Meta 的合作依托于 Arm在 Tensor 运算符集架构 (TOSA) 方面的巨大投入,TOSA 为 AI 和 ML 加速器提供了通用框架,并支持广泛的深度神经网络工作负载。在基于 Arm 架构的各种处理器和数十亿的设备上,TOSA 也将成为 AI 和 ML 的坚实基石。
推动产业规模化的 AI
若要以相对低的成本实现 AI 规模化落地,支持广泛的数据格式至关重要。Arm 一直在为诸多专注于 AI 工作负载的新型小数据类型提供支持。
去年,Arm、英特尔和 NVIDIA联合发布了新型 8 位浮点规范,即“FP8”。自此 FP8 格式发展迅猛,参与合作的企业已扩大至 AMD、Arm、谷歌、英特尔、Meta 和 NVIDIA,并共同制定了正式的OCP 8 位浮点规范 (OFP8)。在最新的 A-profile 架构更新中,Arm 添加了与该标准一致的 OFP8,以助力其在行业内神经网络中的快速普及。OFP8 是交换 8 位数据格式,使软件生态系统能够轻松共享神经网络模型,从而不断提高数十亿设备上的 AI 计算能力。
开放的标准对于推动 AI 生态系统的创新、一致性与互操作性至关重要。为继续支持相关标准的行业协作,Arm 于近日正式加入了 MX 联盟,该联盟旗下成员包括了 AMD、Arm、英特尔、Meta、微软、 NVIDIA 和高通技术公司。近期,MX 联盟针对名为微扩展的新技术,进行技术规范的合作。这项技术基于芯片设计领域多年的探索与研究,是一种用于 AI 应用的窄位(8 位和 8 位以下)训练与推理的精细扩展方法。该规范对窄位数据格式进行了标准化,以消除行业的碎片化,实现 AI 的规模化。
秉承合作精神,MX 联盟通过开放计算项目 OCP,以开放、免许可的形式发布了 MX 规范。OCP 项目由超大规模数据中心运营商和计算基础设施领域的其他行业参与者组成,旨在促进相关技术在业内的广泛采用。这也体现了各方认识到在生态系统中对可扩展 AI 解决方案提供公平访问的必要需求。
前所未有的 AI 创新
Arm 已成为全球 AI 部署的基础。Arm 致力于为开发者提供构建先进、复杂的 AI 工作负载所需的技术,而上述的种种合作只是Arm 众多举措中的一部分。从传感器、智能手机和软件定义汽车,到服务器和超级计算机,Arm 将成为未来 AI 发展的基石。