Google与Databricks宣布合作,要在Google云计算上提供Databricks平台,集成两家企业的资料工程以及机器学习服务,让用户可以在Google云计算架构上,用到Databricks的资料分析和机器学习解决方案。
通过Google全球云计算网络,Databricks用户可以更快地创建湖边小屋(Lakehouse),以可扩展且灵活的方式,构建资料科学和机器学习应用。用户在Google云计算上交付Databrick,除了获得安全性和资料保护功能之外,还可以快速地在全球网络上配置Databrick,根据业务需求调整使用量。
Google云计算上的Databricks与BigQuery深度集成,用户可以自由地选择资料分析服务,并且扩展其现有的Databricks湖边小屋,使用BigQuery进行分析,官方提到,在Google云计算上提供Databricks的特点,在于用户可以跨资料湖、数据仓库和多种商业智能工具,扩展人工智能分析规模。
另外,预先构建的连接器,可以让用户快速地将Databricks、BigQuery、Google云计算存储、Looker和Pub/Sub集成在一起,而且在Google的人工智能平台,使用在Databricks所创建的资料工作流程,无论是速度以及规模都可获得提升,并可利用人工智能平台的Prediction功能,简化Databricks内置模型的部署。
官方提到,这是Databricks首次在云计算上提供容器化部署,其使用GKE(Google Kubernetes Engine)作为基础,支持Databricks以容器的形式部署在云计算,借由把GKE当作操作环境,Databricks可以利用托管服务实例安全、网络政策和运算功能,进而提供分析、人工智能和机器学习功能。
Google云计算和Databricks的集成,可让用户使用Google人工智能平台托管服务,减少部署Databricks模型的成本开销,并且Databricks用户可以搭配使用Google云计算服务,加快新资料工作管线、分析应用程序和机器学习模型推出的速度。由于Databricks、Google云计算和额外分析应用程序,都在共享的基础设施上执行,因此官方提到,从定价角度来看,提供了规模经济,且减少企业分析基础架构的管理工作。
这项合作还包括共同支持开源社群的承诺,致力开放式创新和开源软件,鼓励开源创新和协作,让共同的客户能够更简单地使用开源技术。用户之后将可以从Google云计算市场部署Databricks,简化采购和用户配置,并使用单一登录以及统一计费。