11月1日,腾讯云对外宣布向量数据库正式全量开放公测,同时性能层面带来巨大提升。腾讯云数据库副总经理罗云表示,除了公测之外,腾讯云向量数据库单索引已经支持百亿级向量规模,支持百万级QPS毫秒级查询延迟,领先行业平均水平1.5倍以上,计算成本低于行业水平2倍以上,各项数据达到了业界领先水平。
从今年7月份正式发布以来,腾讯云向量数据库已经服务腾讯集团内部40多个业务,日请求量达1600亿次,服务的外部客户数也已经达数百家,帮助教育、SaaS、工具、游戏等多行业客户在快速的进行AI方向的探索,并首家通过中国信通院向量数据库测试。
据罗云介绍,作为国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库,腾讯云向量数据库实现核心能力的跨越式提升。架构层面采用云原生分布式架构,达到企业级稳定性要求;独家集成Embedding功能,对齐传统数据库的使用体验,用户无需关注向量生成过程,就可以实现超高配速快速处理数据,助企业轻松拥抱AGI生态;此外,集合DMC可视化管理工具,快速执行数据库操作,让测试、运维更简单。
有数据显示,将腾讯云向量数据库用于大模型预训练数据的分类、去重和清洗相比传统方式可以实现10倍效率的提升,如果将向量数据库作为外部知识库用于模型推理,则可以将成本降低2-4个数量级。企业原先将现有数据接入一个大模型需要花1个月左右时间,使用腾讯云向量数据库后,最短3天时间即可完成,极大降低了企业的接入成本。
据介绍,向量数据库是通过把数据向量化,然后进行存储和查询,可以极大地提升效率和降低成本。它能解决大模型预训练成本高、存在幻觉、没有“长期记忆”、知识更新不及时等问题,突破大模型在时间和空间上的限制,加速大模型落地行业场景。在该领域,腾讯云目前走在业内前列,针对企业的普遍诉求,腾讯云第一时间联合合作伙伴推出了一系列端到端的向量数据库解决方案,加速向量数据库在企业的大规模应用。