本发明涉及一种基于敏感变量筛选的多光谱桃果实质地无损测定模型建立方法。
背景技术:
1、质地是影响桃果实品质、耐贮性和商品价值的重要指标。随着市民对高品质桃要求的提高,及农业生产人员结构的老龄化、人工分选成本的高价化,智能无损分级设备的研发和使用也迈上了新台阶。目前,关于果实硬度和糖度的无损检测模型多集中于近红外光谱和高光谱成像(nmr)技术的研究,其中,基于近红外光谱技术在水果糖度的无损检测领域得到了成熟的应用。但是果实硬度的无损检测存在检测精度低、稳定性和重复性差,与硬度相关的近红外光谱吸收归属不明确等问题,检测结果和建模结果尚不能满足生产中的应用要求。且多数硬度无损测定模型的建立仅针对果实硬度这一单一指标,硬度这个概念很宽泛,某种程度上可简单理解为材料强度,果实硬度不能全面表现果实质地的变化。桃为球形果,水果质地是一个更加宽泛的概念或多个属性的合集,其代表了水果的硬度、紧实程度、咀嚼性、含水量等,建立果实质地无损测定的综合评价模型仍是未来研究的重点。
技术实现思路
1、技术问题:本方法可快速、有效、准确地在非破损状态下检测不同类型桃果实在采收、运输、储存到销售过程中的果实硬度变化,应用范围广。利用此函数建立的硬度预测模型,可实现对所有类型桃果实硬度的无损伤检测,用更加科学的术语描述果实的硬度状态。
2、技术方案:本发明采用的技术方案为:
3、一种基于敏感变量筛选的多光谱桃果实质地无损测定模型的建立方法,包括以下步骤:
4、1)样本的选取:以不同年份、不同肉质类型的桃果实为已知样本,选取成熟度一致、未破损、大小一致、无明显疤痕的桃果实;
5、2)数据采集:采用漫反射模式获取桃果实阴阳两面与赤道交界处部位的光谱数据,随后于相同的部位相同的顺序测定每个果实的8个质地参数,包括果实弹性fe、果皮硬度ph、果皮脆性pf、果肉组织硬度fp、果肉脆性ff、果肉紧实度fs、咀嚼性chu、可溶性固形物ssc,得到光谱数据的自变量矩阵和质地参数的因变量矩阵;
6、3)敏感波段筛选:采用模型对获得的数据进行敏感波段筛选,筛选模型为:
7、
8、式中,m为自变量个数,其个数等于自变量矩阵x的维度;k为提取的潜变量个数,其个数等于主成分数量个数;ωhj为自变量xj在潜变量tn上的权重,反映输入变量xj对潜变量tn的边际贡献;ch(y;th)是因变量矩阵y与第h潜变量的得分矢量th之间的回归系数;
9、4)基于步骤3)筛选出的敏感波段数据,结合光谱和质地数据利用偏最小二乘回归方法构建预测模型,用于预测待测样品的果实质地,建立偏最小二乘回归预测模型为其中表示待预测的输入矩阵,表示最终预测结果,t表示潜变量,p和c分别表示潜变量t对x和y的回归系数。
10、优选的,步骤4)的详细计算方法为:
11、初始化:将自变量矩阵置为x,因变量矩阵置为y;
12、step 1:计算对x的加权权重w,其中w表示x和y的相关性
13、w=xty;
14、step 2:计算对x进行加权后的潜变量t,潜变量数量表示了模型中使用的主成分数量
15、t=xw;
16、step 3:分别计算潜变量t对x和y的回归系数p和c
17、
18、step 4:分别计算残差矩阵对xres和yres
19、xres=x-tpt,yres=y-tc;
20、step 5:最后再分别将残差矩阵xres和yres置为x和y,重复上述步骤直至将所有的主成分全部迭代完成,并获取最后一次迭代时的相关系数;
21、step 6:根据上述所得参数计算出最后的预测结果b=p(tpt)-1ct,
22、其中表示待预测的输入矩阵,表示最终预测结果。
23、优选的,还包括步骤5):采用随机森林模型对前述获得的偏最小二乘回归预测模型进行验算,随机森林模型为其中,m表示随机森林中的决策树数量,表示每个决策树的预测结果,表示最终预测结果;
24、详细计算方法如下:
25、step1:从原始训练集中基于有放回抽样的方式,随机选择n个样本,作为训练集构建决策树;
26、step2:针对每个决策树,在每个节点上随机选择k个特征子集,采用平方误差se来选择最佳切分点作为左右子节点构建决策树,其中yi是第i个样本的真实输出值,是样本输出的平均值;
27、
28、step3:重复步骤1和步骤2,构建m个决策树;
29、step4:对每个决策树的预测结果取平均值,其中,m表示随机森林中的决策树数量,表示每个决策树的预测结果,表示最终预测结果。
30、优选的,还包括步骤5):采用bp神经网络对前述获得的偏最小二乘回归预测模型进行验算,bp神经网络的构建具体为:通过构建一个四层的全连接神经网络来预测桃果实性状参数,该神经网络由输入层、两个全连接隐藏层和一个输出层构成,神经元的输出与输入的关系表示为:其中,是上一层的输出到第k隐藏层的权重,是第k层的第i个神经元的偏置,是第k层的第i个神经元的带权输入。
31、优选的,步骤2)中仅采用600nm~1040nm范围内的光谱数据。
32、优选的,步骤1)中同一种肉质类型的取样数不少于500个。
33、本发明还公开了一种基于敏感变量筛选的多光谱桃果实质地无损测定方法,采用漫反射模式获取待测桃果实阴阳两面与赤道交界处部位的光谱数据,然后将光谱数据输入前述获得的偏最小二乘回归预测模型中,获得预测的待测桃果实的质地参数,所述质地参数包括果实弹性fe、果皮硬度ph、果皮脆性pf、果肉组织硬度fp、果肉脆性ff、果肉紧实度fs、咀嚼性chu以及可溶性固形物ssc参数。
34、优选的,所述质地参数包括果皮硬度ph、果肉硬度fp、果肉紧实度fs、咀嚼性chu。
35、优选的,待测桃果实的光谱数据采用600nm~1040nm范围内的光谱数据。
36、有益效果:本发明构建了代表性强且结构合理的桃果实质地-光谱数据库,基于偏最小二乘法构建训练集和预测模型,提高了质地模型检测的稳定性、准确性和综合评价性,实现对果实质地的无损检测。并基于随机森林和bp神经网络方法构建训练集并验证预测模型。本发明可全面无损检测果实带皮硬度、果肉组织硬度、果实紧实度和咀嚼性的变化,更加精确的评判果实的质地特性和状态,预测果实的贮运特性和商品价值。
1.一种基于敏感变量筛选的多光谱桃果实质地无损测定模型的建立方法,包括以下步骤:
2.根据权利要求1所述的多光谱桃果实质地无损测定模型的建立方法,其特征在于:步骤4)的详细计算方法为:
3.根据权利要求1所述的多光谱桃果实质地无损测定模型的建立方法,其特征在于:还包括步骤5):采用随机森林模型对权利要求1获得的偏最小二乘回归预测模型进行验算,随机森林模型为其中,m表示随机森林中的决策树数量,表示每个决策树的预测结果,表示最终预测结果;详细计算方法如下:
4.根据权利要求1所述的多光谱桃果实质地无损测定模型的建立方法,其特征在于:还包括步骤5):采用bp神经网络对权利要求1获得的偏最小二乘回归预测模型进行验算,bp神经网络的构建具体为:通过构建一个四层的全连接神经网络来预测桃果实性状参数,该神经网络由输入层、两个全连接隐藏层和一个输出层构成,神经元的输出与输入的关系表示为:其中,是上一层的输出到第k隐藏层的权重,是第k层的第i个神经元的偏置,是第k层的第i个神经元的带权输入。
5.根据权利要求1-4中任一项所述的多光谱桃果实质地无损测定模型的建立方法,其特征在于:步骤2)中仅采用600nm~1040nm范围内的光谱数据。
6.根据权利要求5所述的多光谱桃果实质地无损测定模型的建立方法,其特征在于:步骤1)中同一种肉质类型的取样数不少于500个。
7.一种基于敏感变量筛选的多光谱桃果实质地无损测定方法,其特征在于:采用漫反射模式获取待测桃果实阴阳两面与赤道交界处部位的光谱数据,然后将光谱数据输入权利要求1得到的偏最小二乘回归预测模型中,获得预测的待测桃果实的质地参数,所述质地参数包括果实弹性fe、果皮硬度ph、果皮脆性pf、果肉组织硬度fp、果肉脆性ff、果肉紧实度fs、咀嚼性chu以及可溶性固形物ssc参数。
8.根据权利要求7所述的多光谱桃果实质地无损测定方法,其特征在于:所述质地参数包括果皮硬度ph、果肉硬度fp、果肉紧实度fs、咀嚼性chu。
9.根据权利要求7或8所述的多光谱桃果实质地无损测定方法,其特征在于:待测桃果实的光谱数据采用600nm~1040nm范围内的光谱数据。