机器学习×钙钛矿材料:让AI帮你优化太阳能电池材料的制程参数

为了2050净零排放的目标,太阳能发电为不可或缺的再生能源之一,其中“钙钛矿太阳能电池”是近年最热门的研究领域,不仅成本低廉、光电转换效率也可达到25%。然而,钙钛矿材料在环境中容易降解,影响使用寿命。材料科学家为了做出性能好又稳定的钙钛矿“料理”,无不卯足了劲,替这道菜加上各种“食材”,但是越复杂的菜,调出好味道就越困难。人脑毕竟有限,如果交给机器呢?台湾中央研究院“研之有物”专访院内应用科学研究中心包淳伟研究员,他与团队训练了一套机器学习模型,可以又快又准的找出复杂钙钛矿材料的优化条件!

光电好伙伴:复杂钙钛矿材料

对太阳能电池来说,钙钛矿材料具有优异的光电性质和低生产成本,近年也广泛应用在LED、激光、光传感器和光触媒。

钙钛矿是什么呢?最初是指钙与钛的氧化物CaTiO3,而现在常讲的“钙钛矿材料”为一种统称,泛指拥有相似结构的金属卤化物材料,通式为ABX3。要调配出优秀的钙钛矿材料并不容易,科学家必须像大厨一样,运用各种“食材”煮出ABX3

钙钛矿材料ABX3的结构示意图,同一个位置可以放入不同的相应元素。 (Source:Journal of Energy Chemistry,研之有物整理)

钙钛矿材料ABX3的“食材”有哪些?

  • A的位置:可放入1价的有机或无机阳离子,例如甲胺(CH3NH3,简称MA)、甲脒(HC(NH2)2,简称FA)或铯离子(Cs)。
  • B的位置:可放入2价的无机金属阳离子,通常是铅离子(Pb2)。
  • X的位置:可放入-1价的卤素阴离子,如碘(I)溴(Br)、或氯(Cl)离子。

由于钙钛矿材料在环境中容易降解、影响使用寿命。研究发现,添加多种有机和无机离子的钙钛矿太阳能电池可大幅提升性能和稳定性,因此科学家为了调配出最好的钙钛矿材料,加料不手软,成分也越来越复杂。

在众多复杂钙钛矿材料中,包淳伟研究员探讨的是MAyFA1−yPb(BrxI1−x)3,下标符号y和1-y表示相对含量,如果MA占60%、FA就是40%,因为MA和FA会竞争同一个位置;同理Br和I也然。

图为钙钛矿材料通式ABX3对应到混合离子钙钛矿材料MAyFA1−yPb(BrxI1−x)3之示意图。

问题来了,MAyFA1−yPb(BrxI1−x)3这个材料这么复杂,比例要怎么配比较好呢? “你累计的经验越多,就猜得越准”,包淳伟说。

2016年曾经有海外团队为了找出离子浓度配方与MAyFA1−yPb(BrxI1−x)3组件性能的关系,不惜花重本“土法炼钢”,分别将两组相对含量7等分(0, 1/6, 2/6, 3/6, 4/6, 5/6, 1),做出49种不同的钙钛矿太阳能电池,再去测量光电转换效率,得出最佳比例为MA2/6FA4/6Pb(Br1/6I5/6)3

然而,为何这样的浓度配方可以得到最佳组件呢?很遗憾的,实验团队由于实验表征手段的限制,并不能解答这个重要的基础问题。因此,实验团队仍然需要学生们焚膏继晷的爆肝,用试误法(trial and error)把最佳配方“踹”(try)出来。

海外团队为了找到MAyFA1−yPb(BrxI1−x)3最佳比例,做出49种不同的钙钛矿太阳能电池,黄框处即为最佳比例。左图为相应浓度的组件外观,右图为相应浓度的材料表面微结构。 (Source:Energy & Environmental Science)

不过,一直反复试误并非好方法,毕竟每做一次实验就是一次成本。因此,科学家也设法从理论模拟着手,包淳伟强调“模拟的好处是可以在计算机空间中创造一个最纯净的系统”,而原子尺度模拟,更可以达到原子级的分辨率,提供许多实验无法测量的资讯。

要如何模拟一个材料系统?

材料科学注重现程(Process)、性质(Property)和结构(Structure)之间的关系。当我们对结构不够了解时,往往只能通过不同的制程参数,慢慢做出我们想要的性质,可能在失败多次之后,才能抓到一些诀窍。

理论模拟帮助科学家在做出样品之前,先创建能量模型,找出能量最低、最稳定的微结构。当我们了解结构之后,可以避免有问题的制程参数设置,进而得到较好的材料性质。

首先,如果要知道材料性质,有个最精准也最耗时的方法:“第一原理计算”,只用量子力学原理,从头开始把原子间的作用力和能量计算出来。

因为计算繁琐,应用上只能模拟1纳米以内(10-9米)的三维材料,抓到数个皮秒(10-12秒)内的原子状态,若再往外扩展所耗费的时间和成本难以想象。

相对地,计算材料性质也有省时省力的方法:“分子动力学模拟”,运用古典的牛顿力学,搭配统计力学去计算系统的微观结构和能量。

分子动力学模拟大约可以模拟100纳米内的三维材料,抓到数个微秒(10-6秒)内的原子状态,可模拟的系统尺寸和时间都比第一原理计算要来得多!可惜准确度对于现在化学组成高度复杂的新颖材料而言是一个极大的挑战。

有没有一种方法,可以做到又快又准呢?有有有!它就是近年大热门的“机器学习”!

第一原理计算仅适合用在1纳米以内尺度,计算准确耗时;分子动力学模拟可用于100纳米尺度,计算省时却不够精准;通过机器学习创建的神经网络模型,可以快速模拟100纳米尺度的材料,也保留高准确度。 (Source:包淳伟,研之有物整理,下同)

时间就是金钱,请爱用机器学习

当包淳伟看到2016年海外团队的MAyFA1−yPb(BrxI1−x)3钙钛矿研究之后,他认为“结构”这块还有很多地方可以讨论,如果通过理论模拟,先找出最低能量的微结构,或许就能更有效率地探索离子浓度空间,找出决定最佳配方的关键要素!

由于第一原理计算和分子动力学模拟都不够好用,包淳伟就将念头转到近年热门的“机器学习”,他和团队就先从简单的PbI2开始,慢慢做到复杂的钙钛矿材料。一开始包淳伟的团队使用布朗大学开发的原子尺度机器学习组件(Atomistic Machine-learning Package,AMP)来进行训练与测试,然而,由于AMP组件性能无法达到预期,包淳伟团队就走上了自行开发机器学习分子动力学模拟程序的不归路。

训练神经网络模型时,包淳伟采用第一原理计算的结果当作机器学习素材,并设计函数进行反馈校正,直到预测的原子能量误差远小于热扰动。

这套神经网络模型如何运行?先输入原子坐标(位置矢量r),再换算成“原子指纹”(特征矢量G,表示该原子与其他原子之间独一无二的相对关系),之后通过神经网络,快速输出整个材料系统的原子能量和作用力。

从输入到输出,要模拟原子走一个步阶(注1)有多快?假设以2,000颗原子的计算量来看,自行开发的机器学习方法只要约0.1秒,第一原理计算则要花费3小时,足足快了十万倍(注2)!

包淳伟与团队成功训练出可以模拟复杂钙钛矿材料系统的神经网络模型。

此神经网络模型可以准确预测MAyFA1−yPb(BrxI1−x)3钙钛矿材料的系统能量和受力。纵轴表示包淳伟团队的神经网络模型模拟结果,横轴表示第一原理计算结果。

AI告诉我们什么?

包淳伟团队成功训练出来的神经网络模型,可以在2,000颗原子左右的材料系统上进行数百万种可能的原子排列采样,并计算出复杂钙钛矿材料的最低能量结构,模拟出不同原子在材料中最稳定的位置、它们的振动,以及它们受到挤压时会怎么跑。

多亏了神经网络的快速计算,即使是MAyFA1−yPb(BrxI1−x)3这么复杂的系统也能处理,跑了将近100万次结构模拟,得出不同成分比例下81种最低能量的微结构(如下图),这是第一原理计算绝对跑不出来的成果。

MAyFA1−yPb(BrxI1−x)3钙钛矿材料的最低能量原子结构,纵轴y为MA浓度(CMA,从MA0-FA1到MA1-FA0),横轴x为Br浓度(CBr,从Br0-I1到Br1-I0),各自9等分。为求图片简洁,省略x, y = 0或1的结构图。

找出系统最低能量的原子组态还不够,包淳伟团队想要进一步检验钙钛矿材料MAyFA1−yPb(BrxI1−x)3是否能稳定地保持混合状态,因此计算不同浓度成分下的离子混合能Emix(如下图)。

MAyFA1−yPb(BrxI1−x)3钙钛矿材料的混合能Emix分布,蓝色表示混合能为负(维持单一固溶相),红色表示混合能为正(析出相异固溶相),可以看到Br和MA浓度高的时候,容易析出化合物。其中,纵轴y为MA浓度(CMA),横轴x为Br浓度(CBr)。

从MAyFA1−yPb(BrxI1−x)3混合能分布初步来看,Br浓度(CBr)或MA浓度(CMA)越高的时候,混合能就越高,系统越容易析出相异的固溶相。

除了混合能之外,研究团队更进一步检验了不同浓度成分下的其他结构参数,例如短程有序参数αAB(正值表示AB析出;负值表示AB混合)、晶格扭曲ηs(shear strain)与晶格畸变ηv(volumetric strain),观察析出化合物时,是否真的会改变晶格的几何结构。

为了将模拟结果和实际情况对照,包淳伟再将模拟出来的结构以第一原理计算出不同浓度成分下的材料能隙(Eg),以及用内差法比对2016年海外团队的实验数据,得出不同浓度成分下的组件短路电流(Jsc)和光电转换效率(power conversion efficiency, PCE)。

有了这些关键数据,我们终于可以完成钙钛矿材料MAyFA1−yPb(BrxI1−x)3优化制程参数的最后一里路!

钙钛矿材料设计优化!

还记得我们一开始跑模拟的目标吗?帮助研究团队在花大钱做实验之前,先找出最稳定的结构,从结构参数回推好的制程参数,进而得到较好的材料性质。

那么要如何把这么多参数的相关性一网打尽呢?有个好工具叫“皮尔森相关性矩阵”(Pearson correlation matrix)。

MAyFA1−yPb(BrxI1−x)3钙钛矿材料通过机器学习方法模拟之后,计算出性质参数(Eg、Jsc、PCE)、结构参数(Emix、α、ηs、ηv)与制程参数(CMA、CBr)与之间的相关性。其中,r为相关系数,红色正值表示两者正相关,蓝色负值表示两者负相关。

上图的矩阵集成了结构参数、制程参数与性质参数的相关性。这张表格要怎么解读呢?

首先看结构参数,混合能(Emix)越高,晶格扭曲(ηs)程度越大,MA和FA不互溶,Br和I也不互溶,钙钛矿材料MAyFA1−yPb(BrxI1−x)3不能保持稳定的混合状态。

再来看制程参数和结构参数,Br的浓度(CBr)和MA的浓度(CMA)越高,晶格扭曲明显增加,使得混合能越高。尤其是Br,Br加得越多,MA和FA不互溶,Br和I也不互溶,容易析出其他固体相,在材料中引入缺陷。

最后看性质参数与结构参数,会发现混合能越高,光电转换效率(PCE)和组件短路电流(Jsc)越差。

因此,如果要提升光电转换效率,必须降低Br和MA的掺杂浓度来减少晶格扭曲,以降低混合能,使得MA和FA,Br和I都能充分混合,让析出物和缺陷减少。使电流传输时不会受到材料缺陷或晶界的阻碍,光电转换效率才会好。

要做出好的钙钛矿材料MAyFA1−yPb(BrxI1−x)3必要条件之一:“降低Br和MA的掺杂浓度,尽量让材料维持单一固溶相”。

这就是理论模拟的科学力量,预先评估一款材料设置的制程参数好不好。如果要通过实验方法穷举出上述的优化原则,不仅金钱花费巨大,时间成本也相当高。

包淳伟与研究团队通过近年热门的机器学习技术,创建了模拟材料系统的神经网络模型,因为神经网络快速运算的特性,大幅降低花耗时间和成本,并且模拟结果相当准确。

包淳伟团队从简单的化合物模拟开始,终于在2021年成功发布复杂钙钛矿材料MAyFA1−yPb(BrxI1−x)3的优化条件,成果发布在权威期刊《Journal of Physical Chemistry Letters》。

目前除了继续改善神经网络模型之外,也开始和其他海外研究团队合作解决混合复杂元素的材料系统问题,例如高熵合金。最近包淳伟团队与香港研究团队在《自然》期刊发布了一种超弹性高熵合金,而包淳伟团队也正在使用机器学习辅助原子尺度模拟来研究它有趣的塑性变形性质。

要做出好的材料,结构、制程与性质缺一不可,机器学习辅助的模拟方法可以帮助科学家快速找到最低能量的结构,这是传统模拟方法无法做到的。

目前除了继续改善神经网络模型之外,最近包淳伟团队与香港研究团队在《自然》期刊发布了一种超弹性高熵合金,而包淳伟团队也正在使用机器学习辅助的原子尺度模拟来研究它有趣的塑性变形性质。

注1:原子走一个步阶的意思是:原子从某个位能井跳到下一个位能井。注2:此为研究团队早期模拟MAPbI3的成果,之后的神经网络模型效率更好。