Oracle 为 MySQL HeatWave 添加了机器学习特性

甲骨文正在为其数据分析云服务 MySQL HeatWave 添加新的机器学习功能。
MySQL HeatWave 在单个 MySQL 数据库中结合了 OLAP(在线分析处理)、OLTP(在线事务处理)、机器学习和 AI 驱动的自动化。
该公司在周四宣布更新时表示,新的机器学习功能将被添加到该服务的 AutoML 和 MySQL Autopilot 组件中。
虽然 AutoML 允许开发人员和数据分析师在 MySQL HeatWave 中构建、训练和部署机器学习模型,而无需转移到单独的机器学习服务,但 MySQL Autopilot 为 HeatWave 和 OLTP 提供了基于机器学习的自动化,例如自动配置、自动编码、自动查询计划、自动形状预测和自动数据放置等功能。
甲骨文表示,AutoML 添加的基于机器学习的新功能包括多变量时间序列预测、无监督异常检测和推荐系统,并补充说所有新功能都已普遍可用。
“多变量时间序列预测可以预测多个按时间排序的变量,其中每个变量都取决于其过去值和其他因变量的过去值。例如,考虑到用于发电的各种能源,它被用来建立预测模型来预测冬季的电力需求,”甲骨文研究高级副总裁 Nipun Agarwal 说。
与让受过时间序列分析或预测培训的统计学家为所需输出选择正确算法的常规做法相比,AutoML 的多变量时间序列预测会自动预处理数据以选择 ML 模型的最佳算法并自动调整模型,公司说。
“HeatWave AutoML 自动预测管道使用了一项专利技术,该技术由高级时间序列预处理、算法选择和超参数调整等阶段组成,”Agarwal 说,并补充说这种自动化可以帮助企业节省时间和精力,因为他们不需要有训练有素的统计人员。
根据 Constellation Research 首席分析师 Holger Muller 的说法,多变量时间序列预测功能是 Oracle 的 MySQL HeatWave 所独有的。
“时间序列预测,多变量或其他方式,目前不作为提供机器学习增强分析的单一数据库的一部分提供。例如,AWS 为时间序列提供了一个单独的数据库,”Muller 说。
除了多变量时间序列预测,Oracle 还在 MySQL HeatWave 中添加了基于机器学习的“无监督”异常检测。
该公司表示,与使用特定算法检测数据中特定异常的做法相比,AutoML 可以从未标记的数据集中检测不同类型的异常,并补充说,当企业用户不知道异常类型是什么时,该功能可以帮助他们数据集。
“HeatWave AutoML 生成的模型为所有类型的异常(本地、集群和全局)提供了高精度。该过程是完全自动化的,数据分析师无需手动确定要使用的算法、要选择的功能以及超参数的最佳值,”Agarwal 说。
此外,AutoML 添加了一个推荐引擎,它称之为推荐系统,支持 MySQL HeatWave 中算法选择、特征选择和超参数优化的自动化。
“使用 MySQL HeatWave,用户可以调用 ML_TRAIN 过程,该过程会自动训练模型,然后存储在 MODEL_CATALOG 中。要预测推荐,用户可以调用 ML_PREDICT_ROW 或 ML_PREDICT_TABLE,”Agarwal 说。
此外,甲骨文还在 HeatWave 中为业务用户添加了一个交互式控制台。
“新的交互式控制台允许业务分析师使用可视化界面构建、训练、运行和解释 ML 模型——无需使用 SQL 命令或任何编码,”Agarwal 说,并补充说该控制台使业务用户更容易探索条件场景他们的企业。
“添加交互式控制台符合企业试图让机器学习负责的做法。该控制台将帮助商业用户深入池中,因为他们希望发展成为‘公民数据科学家’,以避免陷入过多的困境,”dbInsight 首席分析师 Tony Baer 说。
该控制台最初可用于 AWS 上的 MySQL HeatWave。
甲骨文还表示,它将为 AWS 上的 HeatWave 添加对 Amazon S3 存储的支持,以降低成本并提高服务的可用性。
“当数据从 MySQL(InnoDB 存储引擎)加载到 HeatWave 时,会向构建在 S3 上的横向扩展数据管理层制作一份副本。当操作需要将数据重新加载到 HeatWave 时,例如在错误恢复期间,多个 HeatWave 节点可以并行访问数据,并且数据可以直接加载到 HeatWave 中,无需任何转换,”Agarwal 说。
添加到 MySQL HeatWave 的新功能包括 MySQL Autopilot 的两个新增功能——自动形状预测顾问与交互式控制台的集成和自动卸载。
“在交互式控制台中,数据库用户现在可以访问 MySQL Autopilot 自动形状预测顾问,该顾问会持续监控 OLTP 工作负载,以在任何给定时间推荐正确的计算形状并提供解释——让客户始终获得最佳性价比,”阿加瓦尔说。
据该公司称,自动卸载功能可以根据工作负载历史推荐要卸载的表。
“释放内存可以减少运行工作负载所需的集群大小并节省成本,”Agarwal 说,并补充说这两个功能都已普遍可用。
Oracle 正在提供更小形状的 HeatWave,以吸引数据量更小的客户。
该公司表示,与早期标准 HeatWave 节点的 512GB 大小相比,较小的形状将具有 32GB 的大小,能够以每月 16 美元的价格处理高达 50GB 的数据。
此外,该公司表示,其标准 512GB HeatWave Node 的数据处理能力已从 800GB 增加到 1TB。
“随着这一增长和其他查询性能的改进,HeatWave 的性价比优势进一步提高了 15%,”Agarwal 说。

关注公众号“大模型全栈程序员”回复“小程序”获取1000个小程序打包源码。更多免费资源在http://www.gitweixin.com/?p=2627