【赛迪网讯】2023年是AI的崛起之年,随着ChatGPT的火爆引起的生成式AI应用的大爆发极大地加速了世界从数字化进入智能化的新纪元。智能时代是一次人类生产和生活的全方位变革,虽然这个过程才刚刚开始,智能化的影响还没有深入我们大多数人的工作、生活当中,但硬件基础设施的建设往往会更早地未雨绸缪,因此,5G网络、数据中心等智能时代必不可少的基建建设在近几年已经如火如荼地在进行当中了。
数据存储同样是智能化时代重要支撑。近日,北京市星辰天合科技股份有限公司(简称:XSKY星辰天合)在北京首钢园举办了主题为“星星之火”的 XSKY 星海全闪架构暨星飞存储发布会,“星海(XSEA,eXtreme Shared-Everything Architecture,极速全共享架构)”及“星飞(XINFINI)全闪分布式存储”共同亮相发布会现场,以充分满足智能化时代客户对高容量、大规模、可持续扩展的高性能存储需求。
为何选择分布式全闪存储架构
与会期间,XSKY星辰天合CEO胥昕接受赛迪网采访时表示,数据平权是智能时代的一个突出特征。所谓“数据平权”是指在AI训练的场景下,不能只训练一部分数据而忽略其他数据。因此,这意味着在智能化时代,需要进行AI训练的数据量普遍增加。因此对存储就需要满足可持续扩展、高性能、高容量、大规模等要求。
XSKY星辰天合CEO胥昕
同时,产业化的AI训练是GPU集群式的训练,需要使用大量的GPU。这种情况下单点存储无法满足需求,就更需要分布式存储的架构来应对分布式计算,以提高效率并减少数据流量。
正是在以上的大背景下,星辰天合的星海分布式全闪存储架构才应运而生。胥昕表示,数据存储架构研发周期较长,升级换代的周期也较长,大约5至7年才会有大的变革。因此,星辰天合充分预测了未来相当长一段时期的市场需求,有信心确保分布式全闪架构能够在未来几年内保持领先地位。
全闪存储架构在中国方兴未艾
根据2019年英特尔的一份报告显示,美国在VMware上的全闪部署比例高达80%,而中国仅为6%。到了今天,IDC的数据显示中国的全闪存储比例也才刚刚超过30%。在数字化领域,中美之间尤其在基建方面中国并不存在明显差距,比如5G网络的建设中国就领先世界。那么是什么原因造成中美之间巨大的差距呢?
胥昕总结认为,一方面是因为中国的人口更多。
“数据是由人产生,而不是物联网。当车上没有乘客时,它不会采集数据。同样,更多的患者意味着医院的数据更多,更多的学生意味着学校的数据更多。”
因此,与美国相比,中国用户对存储的单位成本敏感度更高,所以更愿意选择更具成本优势的传统存储。
其次,是端到端的产业化水平美国高于中国。但可喜的是随着近年来中国优秀的网络和DPU企业如雨后春笋般涌现,这将大大推进全闪存储架构的普及。
Shared Everything是星海分布式全闪架构的一个重大创新点,它是指星海架构采用全共享模型,使得每个节点都能直接访问所有 SSD,提供更好的性能可扩展性和服务质量,并且拥有全局视角的逻辑。这种技术早在2015年前,就在高端存储中已经存在。然而,由于节点故障隔离和网络互联的问题,分布式技术更倾向于采用Shared Nothing架构。但随着技术的进步,例如更高速的网络互联和更高效的编码技术,使得Shared Everything在分布式环境下成为可能。
全闪存储适用于先进智能制造
虽然从数字化走向智能化的大趋势看,全闪架构将是未来存储的大势所趋,但胥昕并不认为应该一刀切地鼓励企业迅速选择走向全闪存储。“不同的应用场景需要不同的解决方案。数据规模变化不大的场景可能只需要传统阵列全闪,而其他场景则需要更可扩展的解决方案。”胥昕说道。
关于全闪架构的存储更适用于哪些行业和场景的问题,胥昕认为,除了归档、备份和图片、音频、视频等冷对象,利用QLC和其他数据精简技术,其他行业都能采用混闪架构。而全闪则适用于所有数据密集型访问和需要高性能数据的客户。例如先进制造、金融、科研院所和高校等行业。
胥昕举了一个先进制造的存储案例,阿特斯光伏发电有限公司是我国光伏发电的头部企业。其生产的产品供应给其他客户之后,如果出现问题,客户需要查询产品的资料,厂商需要在大量产品中找出问题产品。在传统混散存储方式下,这需要很长时间。而现在的全闪存储系统可以在几秒钟内找到问题产品,这就是新架构的意义。
对企业来说,存储的质量并不取决于极限性能的数据,而是长期的稳定的高性能保障。星海全闪架构的推出正是为了兼顾稳定性和高性能而产生。随着中国进入智能时代,大数据和云计算的普及,星辰天合作为全闪存储架构的先驱将推动新一轮全闪存储的普及、升级,让“全全闪”时代更早到来。