Grafana Lab发布可高扩展的Prometheus实例Cortex 1.0

Grafana Lab发布了Cortex 1.0,Cortex是个以Prometheus为基础的开源时间串行数据库与监控系统,具有水平扩展,以及几乎无限的留存资料能力,目前为CNCF沙盒项目。Cortex 1.0增加了多个让用户更容易用于生产的改进,像是提供详细的部署步骤,以及简单入门模式。

Grafana Lab提到,他们已经把Cortex用在生产环境中三年,包括Grafana Cloud的托管日志和指标平台,都是使用Cortex作为后端,因此他们很有信心,Cortex可以成为Prometheus企业级解决方案,供用户进行大规模部署,并且提供一定的可靠性。

为了要让用户顺利的在产品环境使用Cortex,官方提供了生产文件,可指导用户构建Cortex部署的必要步骤,而且也提供一站式Grafana仪表板,和现成的Prometheus警示功能,这些功能与Grafana Lab内部用的系统相同,可大规模执行多个生产用Cortex集群。Cortex 1.0版本还讲求让用户简单入门,提供一键入门模式,降低开始使用Cortex的门槛。

Cortex项目在2016年的时候启动,Grafana Labs是在2018年并购Kausal后,开始参与Cortex的开发工作。Cortex的重点在于为Prometheus提供水平扩展、高可用性、多租户和长期存储的功能,Cortex可以在一个集群跨多台机器上运行,因此可以提供超过单一机器的资料吞吐量与存储量,用户可以从多个Prometheus服务器,发送指标到单个Cortex集群中,并执行全局聚合查询。

由于Cortex在集群中执行时,会在机器之间复制资料,因此即便其中有机器故障,也不会影响图表资料,而且Cortex在单一集群中,可以对不同的Prometheus数据源,独立处理资料和查询,因此能与不受信任的各方,共享同一个集群。另外,Cortex还支持Amazon DynamoDB、Google Bigtable、Cassandra、S3、GCS和微软Azure,用户可用来存储长期指标资料。