通过向量存储、AutoML 和 Lakehouse 增强功能,以及 JSON 和 JavaScript 支持,MySQL HeatWave 有效提高了易用性
Oracle 宣布将对 MySQL HeatWave 进行革新,包括支持向量存储、生成式 AI、新增数据库内机器学习功能、MySQL Autopilot 增强功能、新增 HeatWave Lakehouse 功能、支持 JavaScript、加速 JSON 查询以及支持新的分析运算符。目前在私有预览中,向量存储支持客户利用大型语言模型 (LLM) 的功能及专有数据,其准确性比仅使用公开数据进行训练的模型更高。通过生成式 AI 和向量存储功能,客户可以使用自然语言与 MySQL HeatWave 交互,并高效地在 HeatWave Lakehouse 中搜索各种格式的文档。
甲骨文公司首席企业架构师 Edward Screven 表示:“此次宣布推出的 MySQL HeatWave 增强功能,是我们在解决客户数据、分析和 AI 等紧迫问题的又一个重要里程碑。我们之前在 HeatWave 中添加了具有高性价比、自动化机器学习、湖仓一体和多云功能的实时分析。现在,向量存储和生成式 AI 为客户带来了强大的 LLM,客户可以用一种直观的方式来与企业中的数据交互,并获得业务所需的准确结果。”
为满足希望对各种数据类型和数据源执行分析、事务处理、机器学习和生成性 AI 的客户,MySQL HeatWave 中增加了额外的功能,适用于与 MySQL 兼容的工作负载和非 MySQL 工作负载。
生成式 AI 和向量存储(私有预览)
向量存储以各种格式(如 PDF)摄取文档,并将其存储为通过编码器模型生成的嵌入。对于给定的用户查询,向量存储将对所存储的嵌入和嵌入式查询执行相似性搜索,识别相似度高的文档,然后这些文档将用于增强给 LLM 的提示,使其能够提供更符合情境的答案。
MySQL HeatWave AutoML
MySQL HeatWave 所提供的数据库内机器学习包含全自动化的训练模型管道。客户无需将数据迁移到单独的机器学习服务中,即可轻松、安全地将存储在 MySQL HeatWave 中的数据用于机器学习训练、推断和解释。具体新增功能如下:
· HeatWave Lakehouse 支持:客户可以利用 HeatWave AutoML训练、推断和解释 MySQL 数据库的数据,以及现在才开始支持的对象存储的数据,并为机器学习提供更多的数据。
· 文本列支持:客户可以对文本列执行机器学习任务(包括异常检测、预测、分类、回归和推荐系统),进一步扩大 HeatWave AutoML 的可用数据语料库。
· 增强型推荐系统:现在,HeatWave AutoML 支持贝叶斯个性化排序 (BPR),可以基于隐式反馈(如购买历史和浏览行为)和显式反馈(如评分、点赞)来生成个性化推荐方案。例如,分析人员可以预测用户可能会喜欢的商品、特定商品能够吸引的用户以及某个商品的评分。
· 训练进度监视器:客户现在可以使用 HeatWave AutoML 监视模型训练的进度,从而更好地管理资源。
MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的内置功能,使用机器学习驱动的自动化来提高性能和可扩展性,并且无需具备数据库调优的专业知识即可操作。该功能将学习如何执行查询,以改进未来查询的执行计划。MySQL Autopilot 新的增强功能包括:
· MySQL Autopilot 索引(限量发布):帮助客户减少耗时的任务,包括为联机事务处理(OLTP) 工作负载创建合适的索引,以及随着工作负载的不断变化而持续维护索引。MySQL Autopilot 可使用机器学习技术,根据各个应用工作负载进行预测,自动判断客户需要从表中创建或删除的索引,以此优化 OLTP 吞吐量。此外,Autopilot 索引功能还可根据推荐的索引来预测预期的改进效果,不仅无需创建索引,也不会对用户的租户产生计算或存储成本。
· 自动压缩:帮助客户判断适合该列的压缩算法,加速数据压缩和解压,进而提高加载和查询性能。通过减少内存使用量,客户可以将成本降低多达 25%。
· 自适应查询执行:帮助客户在查询开始执行后,优化查询的执行计划,将临时查询的性能提高多达 25%。该功能使用部分查询中获取的信息,调整数据结构和系统资源,然后根据运行时实际的数据分布,单独优化每个 HeatWave 节点的查询执行。
· 自动加载和卸载:Autopilot 可自动将应用工作负载中使用的列加载到 HeatWave,并自动卸载从未查询或很少查询的表。这有助于释放内存,降低客户的成本,并且无需手动执行此任务。
其他 MySQL HeatWave 增强功能
· JavaScript 支持(限量发布):客户可以在 JavaScript 中写入存储过程和函数,然后在 MySQL HeatWave 中执行。有鉴于此,开发人员可以在 JavaScript 中编写丰富的应用逻辑,并通过在 MySQL 数据库中执行程序来获得高性能。JavaScript 应用的性能得以有效提升,因为数据无需从数据库迁移到客户端,并且代码可在 GraalVM 运行时即时 (JIT) 编译。
· JSON 加速:开发人员和数据库管理员(DBA)现在可以利用 HeatWave,对存储在 MySQL 数据库中的 JSON 文档进行实时分析,从而将查询速度提高几个数量级。
· 新的分析运算符:通过新支持的分析运算符(包括 CUBE、Hyper Log、Qualify 和 Table 示例),客户可以将更多工作负载迁移到 MySQL HeatWave。
· 批量摄取到 MySQL HeatWave:在从 CSV 文件批量加载数据的同时,并行构建索引子树,帮助客户实现更高的数据摄取性能,从而可以更快地查询数据,这意味着能够更快地释放用于加载数据的系统资源,降低客户的成本。
NAND Research 首席分析师兼创始合伙人 Steve McDowell 表示:“MySQL HeatWave 工程团队显然正在加大 AI 和机器学习的创新力度。现在,客户不仅能够以全面自动化的方式,使用数据库和对象存储中的数据进行机器学习模型训练,还可以借助全新的 AI 和向量存储功能,以自然语言与 HeatWave 进行交互。相关的模型训练除了使用公开提供的数据外,也使用了企业自己的数据,让客户能够获得精准符合业务目的的答案。客户可以自由选择 LLM,而这一点凸显了 MySQL HeatWave 工程团队的开放式协作策略。”
MySQL HeatWave 可在一个 MySQL 数据库服务中提供事务处理、实时分析、机器学习、数据池查询和基于机器学习的自动化功能。作为 Oracle Distributed Cloud 策略的核心,MySQL HeatWave 在 OCI 和 Amazon Web Services 中原生提供,作为 Oracle Database Service for Azure 的一部分提供,以及通过 OCI Dedicated Region 在客户数据中心内提供。