4月9日,CITE 2021第九届中国电子信息博览会在深圳会展中心隆重召开,金蝶天燕作为国内基础软件的代表企业,受邀出席,并在大会上正式发布重磅新品——金蝶天燕监控运维平台(AMP) V3.0。
据了解,金蝶天燕监控运维平台(AMP)是金蝶天燕为政府、金融、运营商等行业IT设施提供一站式监控服务产品。平台围绕基础设施、平台&中台、业务应用系统的可用性和可观测性,以金蝶天燕20年信息技术应用创新领域核心技术积累为基础,为运维人员提供一站式的智能化运维服务支撑平台。
本次发布的AMP V3.0版本是金蝶天燕在结合金融、运营商、军工等行业经验积累与AIOps智能运维领域最新探索,以数据为基础、以算法为支撑、以场景为导向,精心打造的下一代智能运维平台产品。
作为基础软件的领军企业,金蝶天燕成立20多年,累计服务10多万家政企客户。对于为何要切入运维市场,新发布的AMP v3.0相比市场上其他AIOps产品有哪些亮点?金蝶天燕智能运维产品研发负责人罗先桥先生给予了回答。
金蝶天燕智能运维产品研发负责人罗先桥介绍AMP
随着云计算和大数据技术的成熟应用,业务应用的云化和微服务架构的不断演进,应用部署的规模性和复杂性日益上升,给IT运维带来巨大的挑战。中间件平台作为应用运行的关键基础支撑,一方面自身需要适应上述各种复杂的底层计算环境,同时也要提供稳定可靠的应用运行容器及相关分布式中间服务。中间件PaaS平台、基础计算环境、数据存储、以及业务应用自身,这其中任何一个层面出现故障都将影响业务系统的可用性,严重的情况下甚至会中断服务。
金蝶天燕的产品研发和技术服务团队在给用户提供原厂技术服务的过程中,遵循标准的运维服务流程,和客户的IT数据中心团队一起积累了大量运维经验。结合自身在大数据平台和AI人工智能的技术优势,适时推出AMP 智能运维平台产品,希望帮助用户构建智能化的全栈运维平台体系,一起应对云环境下大规模复杂运维的技术挑战。
罗先桥先生介绍说,智能运维是当前运维领域的热门研究方向,是传统运维在大数据和AI等新技术发展下的必然阶段,其核心是运维大数据和机器学习算法。智能运维的能力主要体现在预测潜在运维风险、及时发现问题,精准定位问题,快速解决问题,提升运维效率。当前智能运维可落地的场景,主要集中在故障管理、效率提升、容量规划、成本管理优化等几个大的方面。
AMP V3.0 相比市面上其他AIOps 产品有自己的一些特色。首先,采集的运维数据更全面,指标粒度丰富。相比一些运维厂商产品聚焦在单一基础设施的通用指标的监控层面,AMP更进一步到观测层面。监控能告诉你发生了什么故障,观测则能帮助运维人员分析诊断这个故障为什么会发生。AMP尤其对中间件、分布式服务、Kubernetes容器云、微服务应用的指标和运行观测支持更丰富。平台同时针对Metric、Trace、Log 三个维度的监控数据进行统一采集和分析。
AMP V3.0 内置成熟算法及模型具有较高准确率和业务动态适应性。多模块产品服务灵活组合提供运维业务支持。当前V3.0 版本平台落地支持的智能化运维场景,包括告警风暴收敛,故障根因分析、异常检测这几个方面。后续将考虑在故障自愈,故障预测等场景提供平台支持。
AMP 集成了金蝶天燕ADRP数据智能产品的大数据可视化能力、内置丰富的图表组件和模板,可灵活展示被观测对象的各种指标内容,自定义各种运维数字大屏。同时针对信创市场,AMP产品在设计之初就以支持信创产业为核心产品指标,全面适配国产鲲鹏、飞腾、龙芯等芯片架构的国产操作系统、国产数据库、国产应用中间件,可以在上述搭配组合的环境稳定高效运行。
当前,云计算已经成为主流,软件应用出现服务化、云化的强劲发展趋势。传统计算设施和云设施,单体架构、分布式架构和微服务架构应用将在较长时间内共存。在业务不断升级迭代和技术演进的过程中,如何高效运维保障业务持续可用,并快速应对外部环境的变化,是所有进行数字化转型的组织面临的重大挑战。对于正在积极进行云转型的金蝶天燕来说,智能运维产品的推出一定程度上对以上问题给出了解决方案,探索了一个可落地的技术方向。随着AIOps领域的研究不断深入,平台技术规范标准化,以及更多关联丰富的运维场景的支持,IT运维将迎来更大的市场发展机遇。