本发明涉及计算机,具体而言,涉及一种人脸识别模型训练方法、装置、设备及存储介质。
背景技术:
1、人脸识别技术在安全、身份验证和人机交互等领域具有广泛应用。在研究中发现,随着深度学习模型的广泛采用,人脸识别模型变得越来越复杂,参数量庞大,计算和存储需求也大大增加。因此在应用人脸识别模型进行人脸识别、身份验证等任务时,往往需要为模型配置较大的存储空间和计算资源才能够确保模型的正常运行,从而增加了模型部署与运行的条件限制,降低模型部署与应用的便捷度和灵活度,不便于模型的应用。
技术实现思路
1、有鉴于此,本发明的目的在于提供一种人脸识别模型训练方法、装置、设备及存储介质,以减少模型的体积,控制模型部署和运行时所需的存储和计算资源,从而减少模型部署与运行的条件限制,提高模型部署与应用的便捷度和灵活度,便于模型的应用。
2、第一方面,本技术实施例提供了一种人脸识别模型训练方法,所述方法包括:
3、获取初始网络模型,其中,所述初始网络模型为结构重参数化模型;
4、基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,并根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型;
5、利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型;
6、获取若干中间计算量模型,根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,其中,所述中间计算量模型为在对所述初始网络模型进行层数剪裁过程中得到的模型;
7、对所述目标网络模型进行重参数合并得到人脸识别模型。
8、可选地,在对所述目标网络模型进行重参数合并得到人脸识别模型后,所述方法还包括:
9、基于所述人脸识别模型对待认证人员进行身份认证。
10、可选地,所述基于所述人脸识别模型对待认证人员进行身份认证,包括:
11、在身份注册阶段,采集具有目标身份的人员不同角度的注册人脸图像;
12、将各注册人脸图像分别输入至所述人脸识别模型中得到各注册人脸图像的图像特征值;
13、计算各注册人脸图像的图像特征值的平均值,将所述平均值确定为具有所述目标身份的人员的注册人脸特征值;
14、在身份认证阶段,采集待认证人员的实际人脸图像;
15、将所述实际人脸图像输入至所述人脸识别模型中得到所述待认证人员的实际人脸特征值;
16、计算所述实际人脸特征值与所述注册人脸特征值之间的相似度;
17、将所述相似度与预设阈值进行比较,若所述相似度超过所述预设阈值,则将所述待认证人员的身份确定为所述目标身份,若所述相似度未超过所述预设阈值,则将所述待认证人员的身份确定为非所述目标身份。
18、可选地,所述基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,包括:
19、计算所述原始计算量和所述目标计算量之间的计算量差值;
20、根据所述初始网络模型中各层的单层计算量确定出若干剪裁层组合,其中,所述剪裁层组合中各层的单层计算量的和值满足所述计算量差值;
21、分别以各剪裁层组合对所述初始网络模型进行层数剪裁得到若干目标计算量模型。
22、可选地,所述根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型,包括:
23、基于所述初始网络模型与各目标计算量模型构建第一超网络集合,对所述第一超网络集合中的各模型进行梯度优化;
24、计算梯度优化后的各目标计算量模型的各阶段的最后特征层与梯度优化后的所述初始网络模型对应阶段的最后特征层之间的第一损失函数值;
25、基于梯度优化后的各目标计算量模型对应的第一损失函数值对梯度优化后的各目标计算量模型进行参数更新得到若干侯选网络模型。
26、可选地,所述利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型,包括:
27、获取车舱内的不同维度的人脸图像,基于各维度的人脸图像构建各维度的人脸图像测试集;
28、对于各侯选网络模型,计算不同维度的人脸图像测试集在该侯选网络模型中的f1分数;
29、基于为各维度配置的指标权重,根据各维度的人脸图像测试集的f1分数计算该侯选网络模型的性能分数;
30、将各侯选网络模型中性能分数最高的侯选网络模型确定为所述优选网络模型。
31、可选地,所述根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,包括:
32、基于所述初始网络模型、各中间计算量模型与所述优选网络模型构建第二超网络集合;
33、计算所述第二超网络集合中每两个相邻模型的各阶段的最后特征层之间的第二损失函数值;
34、基于每两个相邻模型的各阶段的最后特征层之间的第二损失函数值对所述优选网络模型进行参数更新得到所述目标网络模型。
35、第二方面,本技术实施例提供了一种人脸识别模型训练装置,所述装置包括:
36、初始网络模型获取模块,用于获取初始网络模型,其中,所述初始网络模型为结构重参数化模型;
37、第一阶段训练模块,用于基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,并根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型;
38、第二阶段训练模块,用于利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型;
39、第三阶段训练模块,用于获取若干中间计算量模型,根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,其中,所述中间计算量模型为在对所述初始网络模型进行层数剪裁过程中得到的模型;
40、第四阶段训练模块,用于对所述目标网络模型进行重参数合并得到人脸识别模型。
41、可选地,所述装置还包括身份认证模块;
42、所述身份认证模块,用于在对所述目标网络模型进行重参数合并得到人脸识别模型后,基于所述人脸识别模型对待认证人员进行身份认证。
43、可选地,所述基于所述人脸识别模型对待认证人员进行身份认证,包括:
44、在身份注册阶段,采集具有目标身份的人员不同角度的注册人脸图像;
45、将各注册人脸图像分别输入至所述人脸识别模型中得到各注册人脸图像的图像特征值;
46、计算各注册人脸图像的图像特征值的平均值,将所述平均值确定为具有所述目标身份的人员的注册人脸特征值;
47、在身份认证阶段,采集待认证人员的实际人脸图像;
48、将所述实际人脸图像输入至所述人脸识别模型中得到所述待认证人员的实际人脸特征值;
49、计算所述实际人脸特征值与所述注册人脸特征值之间的相似度;
50、将所述相似度与预设阈值进行比较,若所述相似度超过所述预设阈值,则将所述待认证人员的身份确定为所述目标身份,若所述相似度未超过所述预设阈值,则将所述待认证人员的身份确定为非所述目标身份。
51、可选地,所述基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,包括:
52、计算所述原始计算量和所述目标计算量之间的计算量差值;
53、根据所述初始网络模型中各层的单层计算量确定出若干剪裁层组合,其中,所述剪裁层组合中各层的单层计算量的和值满足所述计算量差值;
54、分别以各剪裁层组合对所述初始网络模型进行层数剪裁得到若干目标计算量模型。
55、可选地,所述根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型,包括:
56、基于所述初始网络模型与各目标计算量模型构建第一超网络集合,对所述第一超网络集合中的各模型进行梯度优化;
57、计算梯度优化后的各目标计算量模型的各阶段的最后特征层与梯度优化后的所述初始网络模型对应阶段的最后特征层之间的第一损失函数值;
58、基于梯度优化后的各目标计算量模型对应的第一损失函数值对梯度优化后的各目标计算量模型进行参数更新得到若干侯选网络模型。
59、可选地,所述利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型,包括:
60、获取车舱内的不同维度的人脸图像,基于各维度的人脸图像构建各维度的人脸图像测试集;
61、对于各侯选网络模型,计算不同维度的人脸图像测试集在该侯选网络模型中的f1分数;
62、基于为各维度配置的指标权重,根据各维度的人脸图像测试集的f1分数计算该侯选网络模型的性能分数;
63、将各侯选网络模型中性能分数最高的侯选网络模型确定为所述优选网络模型。
64、可选地,所述根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,包括:
65、基于所述初始网络模型、各中间计算量模型与所述优选网络模型构建第二超网络集合;
66、计算所述第二超网络集合中每两个相邻模型的各阶段的最后特征层之间的第二损失函数值;
67、基于每两个相邻模型的各阶段的最后特征层之间的第二损失函数值对所述优选网络模型进行参数更新得到所述目标网络模型。
68、第三方面,本技术实施例提供了一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面中任一种可选地实施方式中所述的人脸识别模型训练方法的步骤。
69、第四方面,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面中任一种可选地实施方式中所述的人脸识别模型训练方法的步骤。
70、本技术提供的技术方案包括但不限于以下有益效果:
71、本技术在第一阶段基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,并根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型,能够初步将模型层进行剪裁后进行参数优化,以减少模型的体积和计算量,同时提高模型精度。
72、在第二阶段利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型,能够在初步剪裁优化得到的模型中筛选出性能最好的模型作为后续优化的目标,以进一步提高模型的精度。
73、在第三阶段获取若干中间计算量模型,根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,能够以渐进式的优化方式对再次模型进行参数更新,更进一步提高模型的精度。
74、最后在第四阶段对所述目标网络模型进行重参数合并得到人脸识别模型,进一步减少网络模型的深度,在对网络模型进行体积压缩的同时保证了模型的精度,得到最终的人脸识别模型。
75、采用上述方法,通过对初始网络模型进行层数裁剪、参数更新、迭代优化、参数合并的多轮处理得到人脸识别模型,能够依据目标计算平台所提供的计算资源情况,合理压缩网络模型结构,减小模型的体积,控制模型部署和运行时所需的存储和计算资源。此外,压缩后的模型能够更快地响应实时应用的需求,可以更快地传输到远程设备或云服务器,使得模型更容易部署到不同的设备和平台上,提高模型部署与应用的便捷度和灵活度,便于模型的部署与应用。
76、为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
1.一种人脸识别模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在对所述目标网络模型进行重参数合并得到人脸识别模型后,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述人脸识别模型对待认证人员进行身份认证,包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述初始网络模型的原始计算量和目标计算量对所述初始网络模型进行层数剪裁得到若干目标计算量模型,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据所述初始网络模型与各目标计算量模型之间的损失函数值对各目标计算量模型进行优化得到若干侯选网络模型,包括:
6.根据权利要求1所述的方法,其特征在于,所述利用不同维度的人脸图像测试集对各侯选网络模型进行指标性能测试,根据指标性能测试结果确定出优选网络模型,包括:
7.根据权利要求1所述的方法,其特征在于,所述根据所述初始网络模型、各中间计算量模型和所述优选网络模型之间的损失函数值对所述优选网络模型进行优化得到目标网络模型,包括:
8.一种人脸识别模型训练装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至7中任一所述的人脸识别模型训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至7中任意一项所述的人脸识别模型训练方法的步骤。
