一种基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法

xiaoxiao19天前  17


本发明涉及深度学习及半导体材料与器件领域。具体涉及一种基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法,可以广泛应用在钙钛矿光电转换器件的效率优化领域。


背景技术:

1、钙钛矿发光二极管(peled)因其高量子效率、高亮度、单色性好等优点而受到广泛关注,在显示和照明领域显示出巨大的应用潜力。目前在钙钛矿发光二极管效率优化的众多方法中,通过在钙钛矿前驱体溶液中添加有机功能分子添加剂,可以改善钙钛矿发射层结晶度、抑制器件非辐射复合损失和提高光耦合效率,基于该方法peled的外量子效率(eqe)已经提高到20%以上。然而,对特定添加剂分子性能的实验验证工作通常都非常耗时耗力,再加上添加剂分子种类过于繁杂,对每一种分子都进行实验验证并不可能。因此,亟需一种可以对潜在添加剂分子进行高通量筛选的方法。

2、近年来,随着人工智能和机器学习算法的不断发展,利用深度学习联合实验验证进行先进材料和器件结构的优化筛选已广泛应用于半导体光电材料和器件领域。在peled的高效添加剂预测方面,在文献报道可以使用分子描述语言“smiles”和“redik”包来实现特征提取及分子数据化,再搭建机器学习网络模型并使用数据化后的分子进行训练,从而实现对添加剂分子的性能进行预测等功能。[1]zhang,l.,et al.(2022).angew chem inted engl61(37):e202209337.然而这些方法适用的器件结构比较固定,算法过程较为繁琐,不利于对添加剂分子进行高通量筛选。

3、现有技术中主要存在如下问题:

4、[1]目前的钙钛矿发光二极管发射层添加剂筛选方法,大部分采用的是暴力实验验证的方式。这种方式昂贵且耗时,大大提高了器件的制备成本。

5、[2]目前的钙钛矿发光二极管发射层添加剂筛选方法中,基于机器学习的预测方法存在特征提取不完全,特征选取不合理的问题。进而导致训练模型的泛化能力差,预测准确性低。

6、[3]目前的钙钛矿发光二极管发射层添加剂筛选方法中,基于机器学习的预测方法存在计算流程复杂,模型设计不合理等问题。导致添加剂高通量筛选费时费力。


技术实现思路

1、针对现有方法的不足,本发明提供了一种基于深度学习的peled发射层高效添加剂筛选方法。其应用流程如图1所示。流程①表示引入特征后网络模型的训练,流程②表示高通量材料数据库导入,流程③表示有效添加剂的筛选,流程④表示peled器件的制备,流程⑤表示高效添加剂的实验验证。该方法使用inchi作为分子描述语言,并利用inchikey维度一致的特性,保证预测准确性的同时,简化了哈希值序列的生成过程。

2、一种基于深度学习的peled发射层高效添加剂筛选方法,包括:

3、(1)建立数据集

4、收集固定器件结构的peled添加剂及其eqe组成若干组键值对,并按照eqe进行升序排序。排序后选取eqe的中位数,低于该中位数的添加剂标记为0,并称该添加剂为无效添加剂,高于该中位数的添加剂标记为1,并称该添加剂为有效添加剂。选取其中90%的键值对作为训练集,用于训练dnn二分类网络模型,剩余10%的键值对作为验证集,用于评估该模型的准确率。训练集中标记为1和标记为0的添加剂应各占50%。

5、(2)获取inchikey

6、获得添加剂分子式和结构式并标记0或1后,查询national library of medicine库得到其inchikey。由inchi经sha-256算法得到的散列字符串inchikey是完整inchi字符串的压缩表示,包含固定的27位字符。字符的维度一致,且能良好地反映添加剂的分子式、异构、电荷质子化、同位素富集等信息。

7、(3)分子数据化

8、所得的相同维度的inchikey需转化为相同维度的哈希值并矩阵化后,才能作为dnn二分类网络的输入层,进行模型训练。inchikey均由acsii码字符组成。因此通过字符逆编码程序,可将其转化为固定维度为189位的哈希值序列。至此获得网络训练所需数据集。

9、(4)dnn二分类网络模型

10、将固定位数为189位的哈希值序列矩阵化后按标记0或1分组输入dnn二分类网络训练。该dnn二分类网络的结构为输入层、输出层和隐藏层。其中隐藏层数设置为2层,隐藏层的数量对应哈希值序列转化为inchikey以及inchikey转化为inchi的过程。迭代训练完毕后固定权重参数。将验证集中的有机分子代入模型并比对,计算模型理论的预测正确率。

11、(5)模型优化

12、由于样本数据集规模较小,过拟合现象较为严重。通过使用不同的激活函数(如sigmoid函数、tanh函数、relu函数、leaky relu、maxout函数),添加正则项修正损失函数,使用dropout等方式降低网络模型的过拟合。记录预测结果并计算准确率。

13、(6)更换训练集和验证集重复步骤(2)到步骤(5)若干次,记录并计算模型的平均准确率。

14、(7)添加剂有效性预测。获取待预测添加剂的分子式及结构式。查询待预测的添加剂的inchikey,经过分子数据化后转化为对应的189位哈希值序列,将该序列输入模型中进行预测。输出结果为1则说明该添加剂适用于该结构的peled器件的发射层添加剂。输出结果为0则说明该添加剂不适用于该结构的peled的发射层添加剂。

15、进一步的,在所述步骤(1)中,数据集来自近年来基于

16、ito/pedot:pss/cspbbr3+peabr+additive/tpbi/lif/al的peled的相关文献中的eqe数据及实验室中使用的部分添加剂实验数据。并且该数据集中应不包含任何待预测的添加剂及其标记组成的键值对。

17、进一步的,在所述步骤(2)中,inchikey作为inchi语言的压缩,格式和算法均为非专有,同时软件也是开源。inchikey的前14个字符编码核心分子骨架(方程、连通性、氢位置和电荷)。连字符之后是第二个10个字符的字符串,前8个字符编码补充核心数据的特征(立体化学、互变异构、同位素替换和金属连接)。剩下的两个字符表示原始inchi是否为标准inchi以及inchi软件的版本号。inchikey的最后一个字符是指示(去)质子化状态的字符。inchi和inchikey已经普遍用于数据库、出版物和化学信息学软件中的化学结构处理,不同的分子对应的inchikey基本不会重复。选择inchikey作为分子描述符能够充分保留分子的结构性质和特征。

18、进一步的,在所述步骤(3)中,所使用的字符编码程序具体功能为对照ascii码表,将inchikey中的每一位字符转化为对应的7位二进制字符,进而生成位数固定为189位的哈希值序列。

19、与传统的筛选方法相比,本发明的优点有:

20、(1)可以大幅降低添加剂预测工作的成本。使用机器学习的方法进行预测,减少了昂贵且耗时的器件制备成本。

21、(2)可以提高算法的兼容性。相比smiles等其他分子描述语言,inchi及inchikey的格式和算法均为非专有,软件也是开源的。使用inchi和inchikey能够验证和匹配管理大型公共数据库以及专有数据库中的数百万种化学品。

22、(3)降低了筛选算法的复杂程度。相比其他机器学习方法,该dnn二分类模型使用inchi作为分子描述语言,经过sha-256算法压缩后的inchikey具有维度一致的特点,利用该特性在未牺牲预测准确性的前提下,简化了预测过程。

23、(4)能够预测尚未发现的化合物作为添加剂的有效性。inchikey能够为每个化合物生成不同的标识符,能为特定化合物提供相同的标识符。这也适用于已知的和尚未知的化合物。


技术特征:

1.一种基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法,其特征在于,步骤如下:

2.根据权利要求1所述的基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法,其特征在于:所述步骤1中收集器件结构为ito/pedot:pss/cspbbr3+peabr+additive/tpbi/lif/al的钙钛矿发光二极管文献中的eqe数据,以及实验室中使用的部分基于该结构所制备器件的实验数据。

3.根据权利要求1所述的基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法,其特征在于:通过将inchikey具有维度一致的特点应用到分子数据化的过程中,从而在不牺牲模型泛化能力的前提下简化高通量筛选过程,降低筛选算法的复杂程度。

4.根据权利要求1所述的基于深度学习的高效钙钛矿发光二极管发射层添加剂筛选方法,其特征在于:所述的步骤三中分子数据化的字符编码程序具体功能为对照ascii码表,将inchikey中的每一位字符转化为对应的7位二进制字符,进而生成位数固定位189位的哈希值序列。


技术总结
本发明公开了一种基于深度学习的钙钛矿发光二极管发射层添加剂筛选方法。本发明以钙钛矿发光二极管为研究对象,基于深度学习中的DNN二分类算法,融合InChI及InChIKey等分子描述语言,开发了一种基于深度学习的钙钛矿发光二极管发射层添加剂筛选策略,从而在不牺牲模型泛化能力的前提下简化高通量筛选过程。主要步骤包括建立数据集;获取InChIKey;分子数据化;DNN二分类网络模型的建立及优化;添加剂有效性预测。

技术研发人员:梅鸿宇,邵宇川,梁涛,杨陈楹
受保护的技术使用者:中国科学院上海光学精密机械研究所
技术研发日:
技术公布日:2024/9/23

最新回复(0)