甲骨文(Oracle)数据仓库分析工具MySQL HeatWave更新,除了强化自动机器学习(AutoML)功能,增加支持的机器学习用例,同时也扩展MySQL HeatWave的多云支持。
HeatWave是甲骨文的高性能MySQL查询工具,使用户能够快速地查询存储在MySQL数据库的资料,而HeatWave原本就有提供内置在数据库中的原生机器学习服务,能够直接执行机器学习训练、推理和解释资料,提供自动训练回归、分类和单变量时间串行预测模型。
而本次MySQL HeatWave的新功能,甲骨文扩展HeatWave AutoML生命周期自动化,新支持多变量时间串行预测、非监督异常侦测和推荐系统,资料分析师可以不需要专业人员协助,就能以互动式控制台,构建、训练、执行和解释这些机器学习模型。
多变量时间串行预测是以过去多变量时间串行,预测未来资料变化的一种方法,像是可用于创建模型,预测冬季用电需求等,多变量时间串行有多种可用的预测算法,而挑选适合的算法并非一件简单的工作,现在MySQL HeatWave所提供的AutoML,能够预处理资料,并且自动选择最适合的机器学习模型算法,还能自动调校模型。
官方提到,他们在自动化预测工作管线中,使用由高端时间串行预处理、算法选择和超参数调校等多阶段组成的专利技术,使得用户可以不需要专业统计人员,就可以完成多变量时间串行预测。
MySQL HeatWave新支持的无监督异常侦测,则可让用户能够简单地从未标记的资料集中,侦测不同类型的异常,官方解释,有多种算法都能够用于侦测资料异常,但是通常只能侦测特定类型的资料,因此当用户不知道资料集中存在哪些异常资料,算法可能无法正确运行。
而MySQL HeatWave所生成的模型,能够针对各类型的资料异常,执行高精确度预测,而且该过程完全自动化,分析师不需要选择算法、特征,也不用担心超参数的数值。另外,MySQL HeatWave中的推荐系统现在也完全自动化,算法、特征和超参数优化都不需要用户决定。
甲骨文改进了在MySQL HeatWave与AWS服务的集成,MySQL HeatWave可在AWS上原生运行,并且提供S3优化存储层,当MySQL资料要加载至HeatWave时,系统会将资料复制到S3扩展资料管理层,好处是当需要资料恢复,重新加载资料到HeatWave时,多个HeatWave节点可以平行访问资料,这大幅加速资料恢复速度和服务可用性,使得原本4 TB的HeatWave集群从S3恢复只要3.5分钟,比从MySQL重新加载资料需时140分钟要快上许多。
MySQL HeatWave控制台开始支持MySQL自动形状预测(Autopilot Auto-shape Prediction),该机器学习功能将会即时监控OLTP工作负载,预测应用程序的执行状况和性能需求,根据历史性能分析趋势,像是吞吐量、缓冲区命中率,自动推荐适合的数据库形状。数据库的形状指得是数据库执行实例的配置,包括CPU、内存和存储空间等。