元宇宙的火热预示着一个虚拟世界的时代即将到来,这个新世界的丰富离不开更大带宽、更低时延、更多兼容和更高安全的网络作为基础支撑。本文深入探讨了元宇宙业务所需要的网络环境应该具备的特点。
NVIDIA公司创始人兼CEO黄仁勋先生不止一次地提到:元宇宙是下一代互联网。除了让2D的网页变成3D环绕的虚拟世界,还能够通过增强现实、混合现实等手段组成“虚拟+现实”的数字世界。
元宇宙的愿景给数据中心带来了极大的挑战,一方面数据中心面临着海量的3D场景数据和大带宽高吞吐的I/O需求——远远超过2D网站和视频流媒体的数据量。另一方面,数据中心还需要能够即时地获取、捕捉和处理大量用户的互动信息,并利用AI灵活地生成和调配资源。
为了满足这些需求,数据中心只有将计算机视觉、图形和物理模拟融合在一个可扩展的架构中,并以数据中心作为计算单元,才能将CPU、GPU和DPU提供的计算资源耦合在一起,真正做到协调统一的以数据和实时响应为中心提供服务。
那么,元宇宙数据中心里繁多的GPU和CPU处理器,都将不可避免地对网络提出如下要求:
高带宽和低延迟:元宇宙需要大量的数据传输和实时互动,因此需要一个高带宽和低延迟的网络基础设施,以保证流畅的交互体验。
高可扩展性:随着元宇宙的发展,业务需求和数据量都会不断增加,因此网络基础设施需要具备高度的可扩展性,可以轻松地增加带宽、存储和计算资源,以满足不断增长的业务需求。
高可靠性和可用性:元宇宙的业务需要24/7不间断地运行,因此网络基础设施必须具备高度的可靠性和可用性,包括冗余设计、备份和恢复等措施,以确保业务的连续性和数据不丢失。
可管理和监控:元宇宙的网络基础设施需要高效的管理和监控工具,以便管理员可以实时监控网络状态、故障和性能指标,并快速识别和解决问题。此外,网络基础设施需要支持自动化配置和管理,以降低运维成本和减少人为错误。
安全性:元宇宙涉及大量的用户数据和财务交易,因此网络基础设施必须具备高度的安全性,包括数据隔离、访问控制、网络加解密等措施,以确保用户数据和交易信息的安全性。
另一方面,从用户角度来看,元宇宙除了对VR、AR等头戴显示盒穿戴设备的需求外,对于网络接入也提出了需求——从Wi-Fi场景到移动互连接入,其应用领域也不同。区别于家用娱乐的场景,元宇宙在商用场景里,尤其是在数字孪生、增强现实等应用领域,对5G和边缘计算提出了新的挑战:
精准的实时响应:和对数据中心的要求类似,用户在接入元宇宙时,对延迟非常敏感。由于元宇宙到达用户端的本质,是通过网络分发内容到分布式云原生(Cloud-Native)的边缘网络,一个准确的时钟使应用程序能够在不同节点和位置的公共时间轴上运行,这反过来又精确地实现了一致性、事件排序、因果关系以及任务和资源的调度。
5G移动网络则要求这些区域具有极高的精度,以允许许多不同的用户设备(UE)同时连接并在RRU和BBU之间移动时保持连接。如今的5G通信已经能够以Gbps数据速率和亚毫秒级延迟连接数十亿台设备。它在容量、密度、带宽和低延迟方面的优势,使其成为目前元宇宙用户接入的最佳通信方式。
零信任:对于边缘计算而言,大量元宇宙设备和用户接入,必然会带来安全问题。零信任作为一种安全策略,默认所有用户、设备和应用程序都不可信,进而可以强调用户身份验证和设备鉴权。同时能够确保边缘设备只能访问其需要的资源,这可以减轻网络负荷,提高网络的可靠性和稳定性。此外,零信任还能够简化网络管理,提高效率。
来源:NVIDIA
无感知的业务迁移:在元宇宙中,用户会涉及大量的虚拟现实、增强现实和实时互动等场景,这些场景对网络延迟和带宽有着很高的要求。而无论是用户移动转换基站,还是因为边缘计算满载,在进行业务迁移时,用户能够感知到卡顿变化,就会影响用户的体验。
类似的,业务的高可用性和稳定性也会影响用户体验,其牵扯到不同的网络节点、设备和频繁切换都要求不被用户感知,确保体验。
元宇宙需要智能网络基础设施
可以看出,无论是在数据中心端,还是在用户侧的5G边缘计算中,智能的网络基础设施都是关键。DPU和新一代智能交换机,以及相匹配的标准软件开发框架,如NVIDIADPU、Spectrum-3交换机和DOCA软件生态,是为云原生的数据中心、AI工厂以及元宇宙量身打造的网络设施。
其中最关键的NVIDIADPU作为新一代数据中心计算核心之一,与CPU和GPU一样“三位一体”成为构建数据中心的关键芯片。
对于元宇宙数据中心而言:NVIDIABlueField-2DPU可以提供200Gb/s的高带宽、延迟低至100纳秒以内,并且拥有包括RDMA、SR-IOV、VirtIO-net、VirtIO-blk等实时迁移技术,IPsec/TLS,NVMESNAP3.0和RegEX硬件卸载引擎,而GPUDirect等功能更是可以为GPU计算提供极大的便利,进而释放数据中心CPU资源。此外,在NVIDIABlueField-2DPU上还集成了一颗8核心ARM处理器,能够极大地方便用户利用DOCA开发环境在其上做定制化开发。
即将面世的NVIDIABlueField-3DPU则拥有16核心的ARM处理器,带宽达到400Gb/s,可以极大地提升数据中心网络带宽,其自身的SPECINT2K17计算能力相比上一代有近4倍的提升。这对于处理海量数据和高I/O访问有着至关重要的优势。
在NVIDIA现有的元宇宙工具Omniverse中,就推荐使用ConnectX-6Dx智能网卡或者NVIDIABlueField-2DPU来构建企业的数字孪生场景,搭配Spectrum-3智能交换机能够为数据中心提供端到端的200Gb/s通信带宽和极低的延迟。对比未使用DPU和智能交换机的场景,其效率提升在20%以上。
而对于5G通信下的边缘网络,NVIDIADPU所独具的5Tfor5G技术精准时钟特性能够在通信节点间规范时钟精度,高效并且经济地实时传输海量数据。NVIDIABlueField-2DPU可以提供小于16nm的时钟精度,超过了严格的ITU-TG.8273.1/G.8273.2配置文件定时规范,而新一代NVIDIABlueField-3DPU则将这一精度提升了一倍。
此外,NVIDIABlueField-2和BlueField-3DPU都支持SR-IOV、VirtIO实时迁移,可以在不消耗CPU资源的情况下完成相关业务的实时迁移,极大地避免了因为CPU占用和缓慢的业务迁移所导致的卡顿现象,能够保证边缘计算的效率,确保用户使用元宇宙时的体验。
而作为DPU的灵魂,NVIDIADOCA软件开发环境将零信任作为自身的网络安全模型,重新定义了安全边界,DPU可在每台主机和所有网络流量上通过加密、细粒度访问控制和微分段实现了网络的筛选。BlueField提供隔离,在与主机域分离的信任域中部署安全代理。如果主机受损,这种隔离将阻止恶意软件访问安全软件,从而帮助防止攻击扩散到其他服务器。
综上,在元宇宙的实际应用中,后端数据中心面临着海量的数据访问压力和高I/O挑战,而AI和交互复杂性带来的计算压力和东西向流量压力也远远胜过今日。用DPU和智能交换机打造的网络基础设施能够为数据中心带来更高的效率,保证高带宽低延迟的同时,在安全性、可扩展性和稳定性方面也能够提供相当大的优势。而对于5G场景下边缘侧的网络而言,能够在零信任的情况下保证接入VR/AR的用户能够实时地在元宇宙里互动,是计算能力和智能网络基础设施的责任所在。NVIDIADPU、智能交换机和DOCA软件生态能够极大地减轻计算压力,优化网络负载并积极参与到实时业务迁移,5G通信中,为用户提供绝佳的体验。(文︱孟庆 NVIDIA网络市场总监)