过去5年大力拥抱开源云原生物科技术的美国零售巨头Target,在2020年展开了转型的威力,数字渠道销售业绩全年增长了150%,也带来庞大基础架构的容量增长需求,爆量时期每2、3周,对基础架构的容量需求就会暴增一倍,但对Target运维团队来说,一点都不麻烦,只是多按几个按钮,就可以轻松扩展需要的容量,背后就是靠了一套用K8s打造的多云管理平台。
Target拥有2座大型数据中心,使用了2朵公有云,42个小型数据中心分散全美各地,更在1915家分店中,设置了微型的边缘机房,合计要管理的大小机房将近2千个。再加上Target重要系统已经全面微服务化,商店平台有4百只微服务,70只共享服务,再加上10个runtime引擎,三大关键平台,分散部署在公私云地混合环境上的百万个VM上。
Target拥有2座大型数据中心,使用了2朵公有云,42个小型数据中心,更在1915家分店中,设置了微型的边缘机房,合计要管理的大小机房将近2千个。图片来源/Target
“底层部署越简单,开发团队就越能专注在业务优先的任务上。”Target首席信息官Mike McNamara强调:“要真正落实多云架构,得有一套多云管理工具。”TAP(Target Application Platform)就是他口中的多云管理工具。
过去,Target曾经历过一段部署黑暗期。4千人的IT,不同项目团队的工作方法差异很大,各自应对数据中心、公有云环境、分布式机房或分店边缘主机环境,而有各自有爱用的工具,以及百百款自行定义的配置,当时要进行跨团队调试,几乎是非常困难的挑战。2015年,Mike McNamara进入Target担任首席信息官,他的任务就是要推动数字转型,拥抱开源云原生物科技术,让Target变成善用科技的零售公司。他也开始统一IT团队的工作方法和工具。
为了上云,他要求团队打造一套通用的多云部署工作方法,希望创建一个基础架构的抽象化管理平台,让开发者减少处理底层的运维杂事,将心力聚焦在面对顾客的体验上。这就是为何Target要自己开发TAP平台的原因。
TAP是一套通过K8s集群,通过简单的自助式接口,包括了API、CLI或UI接口,提供了一站式环境,可以涵盖开发者所需要的一切功能。图片来源/Target
TAP是一套通过K8s集群来管理底层基础架构和上层应用部署的重要平台,提供了一站式环境,涵盖开发者所需要的一切功能,通过简单的自助式接口,包括了API、CLI或UI接口,来提供一套CI/CD集成工具,很容易将程序代码部署到不同公有云、数据中心、边缘主机上,也能进行自动化扩展。另外,TAP还提供了一套基础架构的标准化设置,包括了标准配置设置,通用的机密管控做法和标准监测矩阵的设置方式。
TAP提供的不只是共享工具,也包括了一套应用程序工程框架,可提供基础架构部署在Target的标准做法,让不同的基础架构团队来依循,包括开发团队、存储团队、网通团队和SRE团队,都使用同一套工具和框架。
对Target内部开发者而言,通过同样的自助式表单来执行部署工作,填妥这只AP所需资源,指定不同的部署环境,不用考虑不同公有云环境的配置差异,也不需学习不同的CI/CD工具,或不同平台上各自的机密管理做法,完全不用申请部署许可,就可以上架到正式环境中执行。部署全程通过TAP来进行,也会套用公司预先制定的标准做法和规定。
这套TAP平台从2018年开始激活,2019年1月时,只用来部署和管理数千个VM,但是到了2021年,已经有超过十万个VM通过TAP来管理。