当前,全球信息技术产业正处于新一轮科技革命和产业变革的加速演进中,算力的提升和智能化应用已经成为国家竞争力的重要标志。算力作为新一代信息技术产业的核心驱动力,是实现国家数字化转型的关键基础设施,对于提高我国数字经济的创新能力,提升国家整体科技实力具有重要意义。
智算中心作为新型基础设施,已经成为大模型训练的标配,是企业提升自身算力和人工智能计算能力,降低成本、优化服务,开拓新业务的重要载体。
中国电子云致力于服务数字经济高质量发展,服务百行千业加快智能化转型,在中国电子云专属云平台CECSTACK V5的基础上,打造系列高安全数字基础设施产品,正式推出中国电子云专属云平台CECSTACK V5 一体化算力平台(简称“CECSTACK V5一体化算力平台”)。
中国电子云专属云平台CECSTACK V5一体化算力平台
“CECSTACK V5一体化算力平台”基于先进的云原生理念设计,实现多元异构算力的统一管理和调度,为政府和行业客户提供通用计算、智能计算和高性能计算等类型算力的一体化算力服务。
“CECSTACK V5一体化算力平台”打造的“一云多芯”技术,广泛兼容国际和国内不同体系架构的CPU/GPU芯片,基于应用商店为应用和AI模型提供全生命周期安全防护,确保业务分发的可信、安全、合规。
CECSTACK V5一体化算力平台
“CECSTACK V5一体化算力平台”在面向专属云通用计算服务的基础上,为客户进阶提供智算中心软件平台和高性能计算HPC软件平台,以满足客户对智能计算和高性能计算的场景需求。
智算中心软件平台是一站式机器学习(深度学习)平台,提供完备的人工智能全生命周期开发与应用能力,形成数据、算法、服务闭环链路。预置丰富的训练框架、加速引擎和可视化模型开发方式支撑机器学习(深度学习)和基础、行业大模型的训练、微调和验证。人工智能应用的一键发布使人工智能能力触达主流人群,真正实现人工智能的全民化。
智算中心软件平台
高性能计算HPC软件平台是在云上执行大型复杂工作负载的创新技术平台。平台支持国际和国内GPU算力以及基于最新硬件的性能加速,依托RDMA基础网络与网卡直通结合,构建无损网络,大幅降低节点间时延、拓展链路带宽上限。平台具备灵活的资源配置,可支持快速创建和扩展高性能计算集群。通过集成PBS、Slurm等多种HPC调度器和分析工具,支持科学家和工程师更加准确和深入地探索目标课题。
高性能计算 HPC软件平台
“CECSTACK V5一体化算力平台”作为新一代的算力基础设施,将有效推动算力和应用协同创新,推进算力基础设施高质量发展,充分释放算力对数字经济的驱动作用。
算力原生 领先的分布式云原生架构
“CECSTACK V5一体化算力平台”采用云原生架构,以自主研发的新型大规模分布式云操作系统CCOS为基础,为通用计算、智能计算和高性能计算等应用场景提供大规模、高可靠和可扩展的计算、存储、网络服务以及安全和灾备能力,具备完善的运营、运维、安全防护等云服务能力。
“CECSTACK V5一体化算力平台”统一管理搭载CPU/GPU的计算集群,提供裸金属、虚机、容器和Serverless等多种算力输出方式,基于无损网络技术实现低时延、大带宽、大规模可扩展的高性能网络,提供高效存储匹配计算规模的横向扩展,满足计算集群高并发的数据访问需求。
开放兼容 支持多元异构和通用框架
“CECSTACK V5一体化算力平台”支持多元异构算力,兼容国际和国内CPU/GPU。支持在同一集群内同时运行x86、ARM、申威等多种架构CPU算力,支持运行国际和国内主流GPU算力,支持通过一个应用市场同时支撑通用计算、智算和超算应用的分发。
“CECSTACK V5一体化算力平台”支持集成智算和超算的通用框架、引擎和工具,包括机器学习、深度学习等人工智能模型开发框架和各类超算集群调度器,借助云原生的弹性资源能力,实现AI开发框架的按需置备和超算集群调度器的水平扩展,为数据科学家和AI应用开发者创建托管的开发、调试和运行环境。
一云多芯 全栈信创
友好易用 提供一站式的机器学习和模型训推平台
“CECSTACK V5一体化算力平台”提供一站式的机器学习/深度学习和模型训推平台,为数据科学家和AI应用开发者构建数据探索、模型管理和实时协作的交互环境,加速自动化机器学习/深度学习生命周期的方方面面。
1、 MLOps理念构造智算超算流水线
实现探索型的数据分析,帮助开发者迭代式和可视化地转换、聚合和预处理数据,挖掘数据价值以提取特征。
2、流行通用的人工智能框架和工具训练模型
自动化执行训练、调试和部署过程,根据推理结果偏离告警触发模型的再训练。跟踪模型生命周期过程的历史版本和产物,支撑模型和人工智能应用的持续迭代和发布。
3、全链路智能辅助数据标注能力
面向大模型训练场景,根据大模型各阶段训练过程的特点,提供全链路的智能辅助数据标注能力,包括标注需求构建、标注任务分发、标注执行、标注质量评估等,使整个标注过程智能高效、便捷协作、安全可控。
4、 支持大模型能力构建的全链路工具
针对不同应用场景与需求,提供大模型Pre-train、SFT、RLHF、测试评估到部署上线等全生命周期的便捷操作工具,降低大模型额能力构建的门槛,助力大模型的快速落地应用。
5、开箱即用的开源大模型预置
典型的开源大模型预置,加速L0级大模型能力的构建,为垂直行业的应用夯实基础。
未来,中国电子云将服务更多的政企客户,为政府及关键客户提升企业的算力和人工智能计算能力,推动算力、算法、数据三位一体的协同发展,助力产业转型升级,为数字中国建设贡献核心力量!