日前,存储性能委员会(Storage Performance Council,简称SPC)公布了最新的SPC-1基准评测报告,浪潮存储AS5500G5以超330万IOPS(每秒读写操作的次数)、0.387ms时延的评测值,创造了8控存储产品性能的全球最高成绩。这是继16控存储性能领跑之后,浪潮存储在8控领域再次突破,成为唯一在两大存储主流市场夺冠的厂商。
8控和16控存储是业界的主流产品,主要覆盖15K–100K美元的市场,占整体存储市场份额的60%左右。浪潮存储在这一领域的性能优势,将提升浪潮存储在主流市场的产品竞争力。
本次,浪潮存储8控性能夺冠,应该说,这是浪潮存储这些年苦练内功的印证。浪潮存储坚持了近二十年的技术创新和积累,这方面完全没有捷径可走,不仅在硬件设计上下苦功和创新,比如多控之间的信息同步链路,率先采用基于Optane介质的缓存层等等,更关键的是在软件层面的深层优化,比如用户态驱动,QoS,智能感知等等。
存储性能委员会公布最新的SPC-1基准评测数据
“综合性能指数”
大家都知道IOPS越高越好,但是却少有人深刻的理解IOPS底层的生成机制。有两个因素对IOPS有加成作用,或者说,存储系统终极目标就是这两个参数:
1.处理单个I/O耗费的时间(延迟)
2.有多少个并发线程在处理I/O(并发)
显而易见,并发数/延迟=IOPS。当然,现实中的模型远非如此简单,现实中一般采用异构处理流水线方式处理I/O,也就是流水线中的模块处理的是不同I/O的同一个子步骤,与此相比还有同构流水线,。一个理想的提升流水线吞吐量的原则,就是将每一步的处理延迟做到相等且最小,或者将慢速处理步骤并行化。
浪潮存储AS5500G5的IOPS和延时
根据并发数/延迟=IOPS,并发数越高越好,延迟越低越好。前者是可以很容易的实现的,只需要采用高核心数CPU,以及软件的并行化优化,就可以相对较为轻松的达到目的。但是对于延迟的优化,可就是难上加难了,这就像公路,同时修两个车道把路拓宽,简单,但是想把路修成高速路,其耗费的成本就会很高,对于I/O路径,也是一样,优化I/O处理速度的一些办法包括砍掉那些附加软件功能,重写内核,采用用户态驱动绕过内核,等等,这里面哪一样都不简单。
不妨思考一下,既然这样,存储厂商为了实现高IOPS,是否可以疯狂提升并发数,而对延迟不闻不问呢?这样做IOPS确实可以上来,但是只会在压力测试的时候,通过将队列深度提升以满足这些并发线程的胃口,但是延迟并不会有降低。
在实际场景下,相当一部分应用根本不会以高并发异步I/O模式工作,这类应用发出的都是同步I/O,以至于底层队列根本压不满,存储系统的高并发度根本无用武之地,导致实际性能惨不忍睹。
那么,既然IOPS越高越好,延迟越低越好,是否可以用IOPS与Latency的比值来断定一款存储系统的真实能力呢?也不客观,因为厂商可以只优化其中一个参数来实现高比值。
我们认为,应该用一种横向比较的比值作为性能指标。比如就拿本次登顶8控SPC1的浪潮,和排第二的产品相对比。IOPS越高越好,延迟越低越好,那就用浪潮IOPS/第二名产品IOPS=I,浪潮延迟/第二名产品延迟=L,然后得出I/L=1.828
1.828这个比值,可以体现出厂商在提升并发度同时优化I/O路径降低延迟方面做的工作的一个均衡价值。也可以这么理解,浪潮8控AS5500G5相比第二名8控产品,在综合I/O性能方面为后者的1.8倍。
如果以某个标准模型性能作为参考,算出每个厂商与这个标准值的比值,就可以得出各个厂商的一个标准指数,我们不妨将这个指数称之为“综合性能指数”。
新指标对业务应用的意义
延迟对性能的影响几乎深入到各个业务场景。例如国有六大行,每天需要处理超过1亿笔交易,这些都对承载核心业务的存储系统性能提出了巨大的挑战,通常情况下,亿级规模用户对存储性能要求就要数十万级别IOPS,同时时延需要保持在1ms以下,而核心数据库和报表业务对IOPS与时延要求会更高。
再看银行数字化营销,针对于银行智能客服、智能投顾、智能风控、智能营销等智能业务场景,涉及到AI的某些特定模型,对存储系统性能要求极为苛刻,尤其是IOPS和时延性能指标。例如,在训练阶段,以大量随机小IO为主,要求存储具备极强的IO并发处理能力;在推理阶段,要求存储时延低,能快速响应。
未来以交易所、理财机构、保险机构为主的金融机构会面临巨大的IT架构压力,其中对存储系统最大的挑战就是IOPS处理能力和控制时延能力。以股票交易为例,交易途中,存储系统需要高并发接收和处理成百万乃至上千万亿的交易数据时,如果并发能力差、时延高,将导致买卖操作的卡顿,引发股民情绪波动,影响满意度,严重的会导致用户流失。
在金融领域,浪潮存储在某大行帮助客户把在线交易量提升3-5倍,在线交易时间缩短10%-30%,银行桌面系统响应时间缩短60%以上,而在AI自动驾驶领域,将模拟计算反馈时间缩短90%以上。其得益于浪潮存储系统对延迟的优化。
综上,综合性能指数对于现代互联网化的业务场景具有深刻价值。
总结:
随着各行业规模的不断扩大,智慧化转型的不断加速,数据应用于营销、决策和分析已经变得越来越重要,快速响应市场变化的能力已经成为企业的决胜因素,而作为坚实的数字化底座,智算中心数据存储性能将持续得到关注,成为转型“标配”。(本文来源于:大话存储)