台积电数字转型的下一步,靠AI推动全面转型(下)

2018年,对台积电IT来说,是重大考验与高度创新的一年。一方面在当年8月,发生了计算机病毒感染事件,导致芯片出货延迟及成本增加,另一方面,在同年10月,台积电推出了虚拟设计环境VDE(Virtual Design Environment),让客户可以通过云计算进行芯片设计。

先来看考验面,台积电早在2014年报中,就开始将网络攻击风险列入风险管理中,2016年报中更纳入勒索软件攻击风险。早在几年前,台积电也已经在内部中央危机指挥中心运行演练中,增加了信息系统服务中断的演练。

但是,2018年这起影响台积台湾厂区的计算机病毒感染事件,让台积电进一步在2018年报中的运营风险项目下,纳入“信息技术安全之风险及管理措施”,不像过去列于“危害风险”中。网络攻击风险也增加了国际云计算供应商遭攻击的风险。甚至,在2019年的致股东报告书中,台积电对信息架构和信息安全的重视程度,拉高到与研发基础架构并列,都视为要强化的业务基本体质。

病毒事件后,台积电也陆续采取了多项安全做法,尤其要加强开发自动化工具,来减少人为作业造成的安全风险,这些大多是信息部门的任务。除了构建机台自动化扫毒及杀毒系统,强化网络防火墙与网络管控来防止病毒跨机台及跨厂区扩散。也依计算机类型构建端点杀毒措施,并且投入开发及部署安全监控程序、加强计算机弱点扫描及软件更新,也要创建一个集成的自动化安全运维平台。针对人员安全素养强化上,加强钓鱼邮件侦测及员工识别能力测试。还委托外部专家来执行安全评定。

另外,台积电积极更加要强化供应链安全、推动和发展机台安全标准,例如在2019年7月成立了供应商信息安全协会,后续开始定期发布供应链安全电子报,沟通安全规范。

安全考验,没有影响台积电创新的脚步,所以,在2018年10月,台积电将OIP所发展累计的数字设计及定制化设计流程,都放到云计算环境,推出了这款VDE虚拟设计环境服务,等于是将传统的芯片设计自动化流程服务上云,让客户也能善用云计算力和扩展弹性来设计芯片。VDE结合了制程技术档、制程设计组件、基础硅知识产权以及设计参考流程等OIP芯片设计辅助资料档。不只如此,还启动了第五大OIP联盟“云计算联盟”,将云计算供应商纳入了原本的芯片制造生态系统中。

台积电从2016年进入了智能制造第三阶段,要引进各种数字科技,以机器学习和AI来驱动全面数字转型,沈文冰在IT线上征才活动中解释,这次转型不只要推动生生产机制造智能化,还要将数字科技和资料导向(Data-Driven)做法,应用到其他重要领域,例如数字供应链管理、高性能云计算的应用、工作场所现代化,还有在外部客户、供应商与内部员工的协同合作上。

举例来说,5G结合IoT应用,台积电在2020年中开始规划5G企业内网,希望能提供更快速、即时和完整的信息来帮助决策,将应用到机台控制、生生产机制造规划、职场安全与信息安全等,尤其在先进制程机台上,控制设备传感器产生的资料频率、数量和种类都暴增,光是一天就会产生1∼2TB的数值和图片资料,所以,台积电也正与内部专家,以及机台、硬件、云计算企业要共同打造边缘运算的软硬件。

除此之外,“软件开发是IT战力的重要指标。”沈文冰强调。所以,台积电软件开发策略,在2019年就定调为Mobile-First和Cloud-First,软件开发团队也导入了DevOps和敏捷开发。

像是台积电的下一代智能工厂,就导入了移动应用、MR、IoT、大数据和AI技术。

例如软件开发团队协助打造的厂务IoT平台,可以24小时搜集生产环境的资料,利用云计算Hadoop来训练传感器搜集的庞大数据,创建AI模型,再提供到本地端边缘运算来进行即时监控,云计算大数据也可作为后续良率分析之用。这套厂务IoT平台是一个端到端的垂直集成应用,不只要处理的资料量庞大,也需要快速分析。台积电IT也将这套应用系统部署在Kubernetes平台上,以便快速扩展和管理。

另外像在厂务运维上,也有一套手机App形态的厂务软件,让工厂运维人员直接就能通过手机App来管理。

“The Fab Runs on Code”(跑在程序代码上的芯片厂)这句话是台积电用来形容IT软件开发的重要性,一座芯片厂需要依赖许多IT团队开发的软件产品。台积电IT开发的软件产品(台积习惯以IT产品来形容自建系统),可以分成两大类,一类是工厂相关,如MES系统、Fab自动化、良率分析相关的软件产品,另一类则是与业务部门、商业管理相关的产品。前者包括与制程良率分析(Process Yield Analysis)、品质管理、厂务(Facility)、MES、设备控制、设备自动化、IT运维平台、安全、资料等相关系统,后者则像是CRM、ERP、eBusiness、Product Data Master、供应链、人资、供应商管理等。

跑在程序代码上的芯片厂这句话是台积电用来形容IT软件开发的重要性,一座芯片厂需要依赖许多IT团队开发的软件产品。台积电IT开发的软件产品包括两大类如下图。

台积电软件开发部门一位主管胡君怡指出,台积电开发团队这两年从传统的瀑布型开发流程,转型成DevOps模式。开发部门调整开发模式后,有几个重要改变,她补充,以前产品发布频率约需要2到3个月一次,但是现在可以做到每周,甚至是每天发布的频率,“开发速度变快了,而且产品品质可以更好。”

“DevOps可说是IT的数字转型,”胡君怡认为,当IT在台积公司的角色越来越重要之后,通过IT转型,可以运用更多数字科技,来强化每一个员工,提高公司的生产力。

当IT的角色更重要之后,新的课题就是如何提高IT工程师的生产力,所以,台积电也有一个专门部门,负责开发IT工程师每天所用的平台。

胡君怡也在线上征才活动上首度公开了台积电自建的云计算开发平台,通过适当的DevOps工具,可以简化IT开发流程,例如通过CI/CD部署,快速将应用程序提供给内部用户。这个开发平台目前支持了约1千名以上的工程师的开发工作。目前,台积多数应用程序也都导入到K8s环境上,已经有不少系统采用了微服务架构。少数仍在使用传统语言开发的老旧系统,则正在评估如何转移。

“我们做全世界最先进的芯片,所以,也要做出全世界最好的AI和开发出最强的软件。”这是胡君怡对IT开发团队的期盼。

台积电首度公开了自建的云计算开发平台,通过适当的DevOps工具,简化IT开发流程,例如通过CI/CD部署,快速将应用程序提供给内部用户。

台积电现在已经广泛应用AI,也在2020年底首度公开了AI四大类应用布局。在制程研发面,用AI协助理解高复杂、高维度的制程开发挑战。Fab量产面像是用AI和ML分析传感资料和检测图片,来进行品质检验、缺陷检查,协助快速产生高品质的芯片。业务面,由是在市场动态分析上,大量使用了AI技术,也用来分析顾客行为模式。对IT团队的IT运维工作上,也利用AI协助IT内部复杂系统的运维,或是用AI来进行异常侦测等。

台积电自己有一套ML开发专属平台,可快速调度和提供GPU等计算资源,可提供非结构化资料或结构化资料的存储系统或数据库,也用了不少开源AI框架和技术。但凡最先进的AI技术,联合学习(Federated Learning),迁移学习,主动学习等,台积电也都会尝试。

台积电拥抱AI的策略是全面性的推广,不只有IT,更希望扩大到全公司,从AI文化着手,举办多场训练和工作坊,要让更多人接触AI的世界。目前内部已经训练了1千位的人员,包括不少主管级人员。“想把内部环境,打造成AI Friendly的环境。”台积电负责AI征才说明的主管林幸怡这样说。

撑起各项IT应用的基石,就是IT信息基础架构。在2020年底,台积电也首度披露IT基础架构三大工作重心,更可以细分成9类任务。

第一是要运用各种基础架构新技术协助企业数字转型,包括要发展完整移动应用、导入协同合作和线上会议服务、云计算服务集成利用,第二项重心是发展软件定义的数据中心,所台积电IT基础架构团队正努力要将自家数据中心,通过软件定义转型成真正的私有云,未来主要任务,除了继续使用虚拟化技术,台积电目前也正在发展容器化和基础架构程序化(Infrastructure as Code)。目前正在将原本系统微服务化,让原本系统运行的资源,调整成可以自动扩展数量的微服务容器,方便未来可以部署到公有云上。第三项重心则是要持续进行基础架构创新,包括导入新时代5G、IoT制造、AIOps技术等。

在基础架构程序化的做法上,台积电会将各应用环境所需要的主机、网络、存储所对应的基础架构资源、组态设置都文件化,变成了范本和政策,搭配已经创建的完整DevOps环境、CI/CD流程,确保可以重复创建完整的环境,减少人为设置疏失,也能随时用公有云来构建相同的基础架构。

“希望台积电未来数据中心,可以像公有云企业的数据中心一样,创建统一入口,通过程序化的定义来管理。”台积电IT信息基础架构团队负责征才说明的主管郭清典这样说。

不只将数据中心发展成软件定义的私云,台积电也积极拥抱公有云。为了将内部私云的管理,延伸到公有云平台,台积电也制定了一个公有云安全蓝图,通过内部安全部门评估,参考外部安全实务,架构出云计算服务安全服务的功能分类和构建流程,作为导入公有云服务的参考指南。

台积电全面数字转型的脚步,从2016年先从智能制造展开,在2020年底最新披露的转型策略是聚焦5大领域,包括用AI来打造敏捷智能制造,例如打造半导体机台边缘运算软硬件、数字供应链管理、善用高性能云计算,例如要将适合的业务上云(像是云计算CRM和云计算HCM),也开始聚焦工作场所的现代化(如继续开发更多内部移动App、推动RPA、智能会议室等),还要发展团队协作,例如通过AR/MR远程协作、用MR支持研发部门3D模型设计和模拟流程,或实现以用户为中心的团队协作合作平台等。

台积电不只要用IT重新定义了半导体制造生产,还要用IT和AI重新定义新的自己。