一种基于稀疏编码和字典学习的人脸识别方法与流程

xiaoxiao6月前 39

本发明涉及生物识别，尤其涉及一种基于稀疏编码和字典学习的人脸识别方法。

背景技术：

1、人脸识别技术作为生物识别技术的重要组成部分，广泛应用于安全监控、身份验证、公共安全和金融支付等多个领域。随着信息技术和人工智能的发展，传统的人脸识别方法主要依赖于高维度的图像数据进行特征提取和匹配。然而，由于人脸图像通常包含大量的冗余信息和噪声，直接使用这些高维数据进行识别会导致计算复杂度高且容易受到噪声影响，从而降低识别精度。为了解决这些问题，稀疏编码和字典学习技术被引入到人脸识别领域。

2、现有的人脸识别技术大多依赖于直接处理高维度的人脸图像数据，这不仅计算复杂度高，而且容易受到噪声和冗余信息的影响，导致识别精度下降。虽然一些方法尝试通过降维技术来减小数据维度，但这些方法在保留关键信息和去除冗余信息方面往往表现不足。

3、传统的字典学习方法通常使用预先设定的固定字典来表示人脸图像。然而，固定字典无法适应不同人脸图像的多样性和复杂性，导致表示能力不足，影响识别性能。自适应字典学习技术虽然提出了解决方案，但在处理多样性和复杂性方面仍存在一定的局限性。

4、在实际应用中，人脸图像常常会受到表情变化、姿态变化、遮挡等因素的影响。现有的方法在处理这些变形和遮挡问题时表现较差，导致识别性能下降。虽然一些方法尝试通过鲁棒性增强技术来应对这些问题，但效果仍不理想。

5、稀疏表示的求解通常涉及复杂的优化问题，计算开销较大，不适合实时应用。虽然一些方法提出了高效的稀疏编码算法，如omp（正交匹配追踪）和lasso（最小绝对收缩和选择算子），但在保证稀疏性和重建误差最小化的前提下，计算速度仍需优化。

6、在复杂环境下，如光照变化、噪声干扰等因素影响下，现有的人脸识别方法识别准确率容易受到影响。虽然一些方法尝试融合多种特征提取技术和强大的分类器来提高识别准确率，但在复杂环境中的表现仍有待改进。

7、因此，如何提供一种基于稀疏编码和字典学习的人脸识别方法是本领域技术人员亟需解决的问题。

技术实现思路

1、本发明的一个目的在于提出一种基于稀疏编码和字典学习的人脸识别方法。本发明充分利用了稀疏编码、字典学习和多模态特征融合技术，详细描述了高效、鲁棒的实现人脸识别的算法。该方法包括从摄像头和图像库中获取图像、进行图像增强和归一化处理、构建和优化字典、生成稀疏特征向量、融合多模态特征、训练分类器以及动态调整识别参数。具备识别精度高、计算效率高、适应复杂环境和实时性能强的优点。

2、根据本发明实施例的一种基于稀疏编码和字典学习的人脸识别方法，包括如下步骤：

3、s1、从实时摄像头和本地图像库中获取彩色人脸图像，将彩色人脸图像转换为灰度人脸图像，使用图像增强技术进行增强处理，对灰度人脸图像进行归一化处理，并基于三维人脸模型进行对齐，处理面部姿态变化；

4、s2、从公开人脸图像数据库中收集带有标签的初始训练数据，通过层次聚类方法进行字典初始化，将训练数据分成若干聚类，每个聚类中心作为字典初始元素，采用多层次字典学习机制，通过稀疏编码和字典更新的交替迭代，不断优化字典；

5、s3、利用已学习到的字典，将待识别的灰度人脸图像表示为字典原子的稀疏线性组合，采用正交匹配追踪稀疏编码算法求解稀疏表示，并将稀疏编码得到的稀疏系数向量作为稀疏特征向量，将灰度人脸图像的稀疏特征向量与红外图像和可见光图像的特征进行融合，生成多模态特征向量；

6、s4、利用多模态特征向量和初始训练数据训练分类器，采用支持向量机，通过核函数优化设计新的核函数，并利用并行计算优化实时性能；

7、s5、对新的待识别的灰度人脸图像进行稀疏编码，提取特征向量，使用训练好的分类器进行分类并输出识别结果；

8、s6、在整个识别过程中，构建自主校正机制，基于实时识别结果和环境变化，动态调整预处理、稀疏编码和分类参数。

9、可选的，所述s1包括以下步骤：

10、s11、从实时摄像头和本地图像库中获取彩色人脸图像；

11、s12、将彩色人脸图像转换为灰度人脸图像：

12、；

13、其中，分别表示彩色图像的红、绿、蓝三通道像素值，表示灰度图像的像素值；

14、s13、使用图像增强技术对灰度人脸图像进行增强处理，采用直方图均衡化技术，计算每个像素点的累计分布函数：

15、；

16、其中，表示灰度级为的像素个数，表示图像的总像素数；

17、使用对比度限制自适应直方图均衡化技术，设定对比度限制阈值，进行局部对比度增强；

18、s14、对灰度人脸图像进行归一化处理，将灰度图像的像素值归一化到\left [ {0,1} \right ]范围；

19、s15、基于三维人脸模型进行对齐，处理面部姿态变化，使用多任务级联卷积神经网络进行人脸关键点检测，确定眼睛、鼻子和嘴巴的关键点位置；通过三维人脸模型对齐算法，将检测到的关键点与标准三维模型对齐，使用仿射变换矩阵进行对齐。

20、可选的，所述s2包括以下步骤：

21、s21、从公开人脸图像数据库中收集带有标签的初始训练数据；

22、s22、通过层次聚类方法进行字典初始化，将训练数据分成若干聚类，每个聚类中心作为字典初始元素；

23、s23、引入多层次字典学习机制，将字典学习过程分为多个层次，逐层优化字典：

24、s24、在字典更新过程中结合非负矩阵分解算法，对初始字典进行非负矩阵分解，得到基矩阵和系数矩阵，在每次迭代中，保持非负约束条件，更新基矩阵和系数矩阵：

25、；

26、；

27、其中，和分别表示第次迭代的字典矩阵和稀疏系数矩阵，为学习率，表示字典矩阵的元素逐个取对数；

28、s25、通过稀疏编码和字典更新的交替迭代，不断调整字典，直到字典和稀疏表示收敛，生成最终学习到的字典。

29、可选的，所述s23包括以下步骤：

30、s231、对初始训练数据进行层次聚类，分成若干子集，每个子集代表一个层次，通过聚类中心作为字典的初始元素；

31、s232、在第一个层次，使用稀疏编码算法对每个训练样本进行编码，表示为字典的线性组合，优化稀疏系数向量；

32、s233、对每个层次的字典进行更新，在稀疏编码和字典更新之间交替进行迭代，优化字典矩阵：

33、；

34、其中，表示第层的字典矩阵，为学习率，表示范数；

35、s234、引入多层次字典学习机制，将字典学习过程分为多个层次，逐层优化字典，在每个层次上，将上一个层次的输出作为当前层次的输入，继续进行稀疏编码和字典更新；

36、s235、在每个层次引入自适应稀疏度调节机制，根据当前层次的特征复杂性和重建误差动态调整稀疏度控制参数：

37、；

38、其中，为稀疏度调节的学习率，为稀疏度调节的正则化参数，和分别表示重建误差和稀疏度对稀疏度控制参数的偏导数；

39、s236、在每个层次采用基于梯度的自适应字典更新策略，通过监测每次迭代的重建误差，动态调整字典更新步长和方向：

40、；

41、其中，为字典更新的动态步长，为字典更新的正则化参数；

42、s237、通过多层次字典学习和优化，在不同粒度上提取特征，逐层提升字典的表达能力和区分能力，最终生成学习完成的字典。

43、可选的，所述s3包括以下步骤：

44、s31、利用已学习到的字典，将待识别的灰度人脸图像表示为字典原子的稀疏线性组合；

45、s32、采用正交匹配追踪稀疏编码算法快速求解稀疏表示：

46、；

47、其中，表示范数，表示零范数，为稀疏度控制参数；

48、s33、将稀疏编码得到的稀疏系数向量作为稀疏特征向量；

49、s34、将灰度人脸图像的稀疏特征向量与红外图像和可见光图像的特征进行融合，生成多模态特征向量：

50、；

51、其中，表示多模态特征向量，表示灰度人脸图像的稀疏特征向量，表示红外图像的特征向量，表示可见光图像的特征向量。

52、可选的，所述s4包括以下步骤：

53、s41、将多模态特征向量与初始训练数据中的标签相结合，所述标签为每张人脸图像的身份或类别信息；

54、s42、通过核函数优化设计新的核函数：

55、；

56、优化后的核函数公式为：

57、；

58、其中，表示原始核函数，和分别为特征映射后的向量，为核函数参数，表示优化后的核函数；

59、s43、采用支持向量机进行分类器训练，使用优化后的核函数：

60、；

61、；

62、其中，w为权重向量，b为偏置，为松弛变量，c为惩罚参数，为标签，为优化后的核函数；

63、s44、将训练数据和多模态特征向量划分为多个子集，在多核处理器上并行进行支持向量机训练和预测，使用并行计算进行核函数计算和模型参数更新。

64、可选的，所述s6包括以下步骤：

65、s61、基于实时识别结果监测识别性能：

66、；

67、；

68、其中，tp 为真正类，tn 为真负类，fp 为假正类，fn为假负类；

69、s62、根据识别性能动态调整预处理参数,动态调整灰度转换公式的权重系数

70、；

71、其中，为权重系数；

72、根据环境光照情况进行调整：

73、；

74、其中，为基于当前光照条件的调整量，通过实时光照检测算法获取；

75、s63、根据识别性能动态调整稀疏编码参数，调整稀疏度控制参数 t优化稀疏表示：

76、；

77、其中，为初始稀疏度控制参数，为基于当前识别性能的调整量：

78、；

79、其中，k为调整系数，为识别准确率对稀疏度控制参数的偏导数；

80、s64、根据识别性能动态调整分类参数，调整惩罚参数c和核函数参数优化分类性能：

81、；

82、；

83、其中，和为初始参数，和为基于当前识别性能的调整量；

84、；

85、；

86、其中，和为调整系数，和为识别准确率对惩罚参数和核函数参数的偏导数；

87、s65、基于环境变化实时调整预处理步骤，在不同光照条件下，动态调整对比度限制自适应直方图均衡化的阈值：

88、；

89、其中，为初始阈值，为基于当前光照条件的调整量：

90、；

91、其中，为调整系数，为图像对比度对阈值的偏导数。

92、本发明的有益效果是：

93、本发明提出了一种基于稀疏编码和字典学习的人脸识别方法，结合了稀疏编码、字典学习和多模态特征融合技术，具备以下有益效果：

94、（1）高效特征提取：通过稀疏编码技术，将高维度的人脸图像数据转化为低维且稀疏的特征向量。这些特征向量能够有效保留人脸的关键信息，减少冗余，提高识别效率和准确率。

95、（2）自适应字典构建：采用多层次字典学习机制，从训练数据中自适应地构建字典，使得字典中的原子能够更好地表示人脸图像。通过迭代优化，字典逐步调整，以最佳方式适应训练数据的特征，提高表示能力和识别性能。

96、（3）处理图像变形和遮挡：稀疏编码和字典学习方法具有较强的鲁棒性，能够在图像变形和遮挡的情况下保持较高的识别准确率。通过稀疏表示，可以更好地捕捉图像的局部特征，对抗变形和遮挡的影响。

97、（4）快速稀疏表示求解：采用高效的稀疏编码算法，如正交匹配追踪（omp）和lasso，通过迭代和贪婪策略，快速求解稀疏表示。在保证稀疏性和重建误差最小化的前提下，加快计算速度，满足实时应用需求。

98、（5）提高识别准确率：通过融合多种特征提取方法（如hog、lbp）和稀疏编码，构建更加鲁棒的特征表示。结合强大的分类器（如支持向量机svm），并通过核函数优化和并行计算，在复杂环境中保持高识别准确率。

99、（6）自主校正机制：在整个识别过程中，构建自主校正机制，基于实时识别结果和环境变化，动态调整预处理、稀疏编码和分类参数，进一步提高识别的精度和适应性。

技术特征：

1.一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s1包括以下步骤：

3.根据权利要求1所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s2包括以下步骤：

4.根据权利要求3所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s23包括以下步骤：

5.根据权利要求1所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s3包括以下步骤：

6.根据权利要求1所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s4包括以下步骤：

7.根据权利要求1所述的一种基于稀疏编码和字典学习的人脸识别方法，其特征在于，所述s6包括以下步骤：

技术总结
本发明公开了一种基于稀疏编码和字典学习的人脸识别方法，包括以下步骤：S1，从摄像头和图像库获取彩色人脸图像，转换为灰度图像，进行增强、归一化处理和三维对齐；S2，从公开人脸图像数据库收集带标签的训练数据，通过层次聚类初始化字典，采用多层次字典学习机制优化字典；S3，利用学习到的字典，将灰度人脸图像表示为稀疏线性组合，采用正交匹配追踪算法生成稀疏特征向量，并与红外和可见光图像特征融合；S4，利用多模态特征向量和训练数据训练支持向量机分类器，通过优化核函数和并行计算提高实时性能；S5，对新图像进行稀疏编码和分类，输出识别结果；S6，构建自主校正机制，动态调整预处理、稀疏编码和分类参数。

技术研发人员：李泓松,孙军,钟雯
受保护的技术使用者：上海匠心互娱网络科技有限公司
技术研发日：
技术公布日：2024/9/23

专利

最新回复(0)