一种基于x-射线荧光分析的农产品元素定量检测模型构建方法

xiaoxiao2020-10-23  11

一种基于x-射线荧光分析的农产品元素定量检测模型构建方法
【技术领域】
[0001] 本发明涉及一种X-射线荧光光谱分析技术,特别是涉及一种X-射线荧光光谱的 峰值法建模。
【背景技术】
[0002] 传统的能量色散型X-射线荧光光谱仪在建立统计模型时大都使用峰面积法。峰 面积法具有以下优点:不需准确知道样品的进样量,操作条件略为变动对试验结果的影响 相对较小,计算方便,适合对多种元素同时进行分析。
[0003] 曾国强等人基于模拟退火算法原理,建立一种新的寻峰模型算法,该算法利用模 拟退火寻找全局最优点的收敛特性,以Metropolis准则作为峰谷判断的基础,引入新的判 定标准和峰谷数组,同时从谱道址两端同时收敛,以收敛到同一最优解为终止条件。同时, 利用该算法与简单比较法、三阶导数法进行对比实验,结果证明该算法在X荧光光谱寻峰 中有较强能力,在实际生产中具有一定价值。刘合凡等人为解决X射线荧光测量过程中的 仪器刻度和校正难题,通过理论研宄并运用蒙特卡洛方法对X射线荧光仪进行建模,得到 了X射线探测器能谱响曲线。结果表明:模拟的X射线探测器能谱响应全谱与实测情况基 本一致,而主成份谱线则高度一致,特征峰半高宽相对误差均在5 %以内。方法为X射线荧 光测量的仪器刻度和校正提供重要的研宄信息,不仅为元素分析工作节省大量人力物力, 也为无标样X射线荧光分析提供了有力的理论支撑。方法也可用于X射线荧光分析过程中 的其他研宄领域。
[0004] 但在采用峰面积建模时,不同的元素在出峰位置上往往会出现重叠现象,且多数 仪器使用的软件在确定峰面积峰界的时候需要根据观察手动输入,因此容易造成较大误 差。对比X射线荧光光谱仪与电耦合等离子体发射光谱仪的数据发现,在测量一些含量较 低的元素,出现了较大的偏差,对比X射线荧光光谱仪与电耦合等离子体发射光谱仪测量 数据可以发现:用峰面积建立的模型的准确度相对较低,对含量值较小的元素产生的误差 较大。除此之外,现有X射线荧光光谱仪大多采用峰面积法建模,建模方法较为单一,选择 性较少。为此提出了用峰值法进行建模分析,以期为X射线荧光建模方法的多样性提供理 论基础。

【发明内容】

[0005] 本发明的目的在于提供一种基于X-射线荧光分析的农产品元素定量检测模型构 建方法,以实现对农产品元素含量进行准确快速地无损检测,且避免使用强酸造成污染。
[0006] 为了解决以上技术问题,本发明采用的具体技术方案如下:
[0007] -种基于X-射线荧光分析的农产品元素定量检测模型构建方法,其特征在于包 括以下步骤:
[0008] 步骤一,收集农产品样品得样品集,对得样品集进行粉碎、过80目筛、压片后,再 测量样品集的X射线荧光光谱谱图;
[0009] 步骤二,用电感耦合等离子体发射光谱仪测定样品集元素,得到样品集元素真值, 并与所述的X射线荧光光谱峰值进行关联;
[0010] 步骤三,对所述X射线荧光光谱谱图进行预处理、划分为校正集样品与验证集样 品并剔除异常样品;所述的预处理包括:微分处理、归一化、多元散射校正、中心化、标准正 态变量交换和光谱平滑,最终得到所述样品集的的X射线荧光光谱值;
[0011] 步骤四,通过主成分分析、偏最小二乘、人工神经网络,利用峰值法建立所述样品 集元素的真值与所述X射线荧光光谱值之间的校正模型;
[0012] 步骤五,通过验证集样品对所述校正模型的精度进行验证;通过所述的预处理及 所述的校正模型建立方式得到不同元素的建模方法及相关性分析,将预测相关系数最高的 模型作为农产品元素定量检测模型;
[0013] 所述元素为六1、卩、5、1(、〇&、]\111、卩6、附、(:11、211、?13中的任一种。
[0014] 所述的微分处理是对所述的X射线荧光光谱值求一阶导数和二阶导数;
[0015] 所述的归一化处理为对X射线荧光光谱值进行归一化,方法如下:设定数据集中 所有的数据向量长度相同,每个向量中所有元素的平方和相似,令:
[0017] 为使数据向量能归一化为N,将向量中每个元素乘以#/#,公式表示为:
[0019] 使向量为单位长度或单位面积,即归一化方法,使用该方法时向量的方差值为1, 即N取为1 ;
[0020] xik表示第i个样本的第k个测量数据,在数据矩阵中xik表示第i行第k列的数 据;
[0021] 所述中心化处理是从数据矩阵中的每个元素中减去该元素所在列的均值的运算, 如式⑶所示
[0023] yik表示第i个样本的第k个测量数据,在数据矩阵中yik表示第i行第k列的数 据;是n个样本的均值。
[0024] 1.根据权利要求1所述的一种基于X-射线荧光分析的农产品元素定量检测模型 构建方法,其特征在于:
[0025] 所述的标准正态变量变换计算公式如式(4)
[0027] Zi为第i个样品光谱的平均值;
[0028] k为波长点数,k= 1,2,…,m;
[0029] i为校正集样品数,i= 1,2,…,n。
[0030] 所述的光谱平滑计算公式如式(4)
[0031] 为,两者具有如下的关系:
[0033] k为被测样品数据点的序号,2m+l为滤波带宽的大小,m为滤波带宽的调节参数;
[0034] y*k为滤波值,yk为原始信号值。
[0035] 所述的人工神经网络中的人工神经元的输入和输出的关系如式(5)
[0037] ai为多个输入,i= 1,2......m;
[0038] Sj为单个输出;
[0039] 0」为阈值;
[0040] Wij为从神经元i到神经元j的连接权重因子;
[0041] f(X)为传递函数,或称激励函数。
[0042] 能量色散型重金属分析仪在建立统计模型时使用的峰面积法。峰面积法具有以下 优点:不需准确知道样品的进样量,操作条件略为变动对实验结果的影响相对较小,计算方 便,适合对多种元素同时进行分析。但由于不同的元素在出峰位置上往往会出现重叠现象, 且多数仪器使用的软件在确定峰面积峰界的时候需要根据观察手动输入,因此容易造成较 大误差。对比X-射线荧光光谱仪与电耦合等离子体发射光谱仪的数据发现,在测量一些含 量较低的元素,出现了较大的偏差。用峰面积建立的模型的准确度相对较低,尤其对含量较 低的元素产生的误差更大。除此之外,现有X-射线荧光光谱仪大多采用峰面积法建模,建 模方法较为单一,选择性较少。为此提出了用峰值法进行建模,以期为X-射线荧光建模方 法的多样性提供理论基础。
[0043] 1谱图预处理
[0044] 为了寻求建立更为准确的定量分析模型,对90个茶叶样品用电感耦合等离子体 发射光谱仪进行测定,得到了 90个茶叶样品的Al、P、S、K、Ca、Mn、Fe、Ni、Cu、Zn、Pb等11 种元素的真值。与提取的X-射线荧光的光谱值进行关联,以期得到预测效果更好的茶叶中 微量元素的X-射线荧光光谱的校正模型。
[0045] 光谱预处理对消除光谱中的噪声,部分消除或降低检测过程中的系统偏差,提高 X-射线荧光光谱信息的有效性有着至关重要的作用。研宄主要采用了微分处理、归一化、多 元散射校正、中心化、标准正态变量交换、光谱平滑等预处理方法对光谱进行了预处理,并 采用主成分分析及偏最小二乘的方法建立校正模型,并对预测集茶叶样品进行了预测及预 测精度分析,寻找出茶叶中各个待测元素的最佳光谱预处理方法。
[0046] 2样品集的划分与异常样品的剔除
[0047] 在用光谱数据进行建模时,异常样品的存在往往会对模型的预测精度产生较大的 影响。在进行样品集的划分和异常样品的剔除时,主要用的数据处理方法是主成分分析 (PCA)及偏最小二乘(PLS)。对茶叶的原始X-射线荧光光谱数据,采用江苏大学近红外319 课题组编写的NIRSAv4. 0数据处理系统进行分析,利用PCA或PLS,结合马氏距离识别出浓 度界外样本,适用于校正集和预测集样品。其中通过PCA方式划分的样本仅仅针对的是光 谱值,没有对化学值进行界外识别,而通过PLS方式划分的样本则是针对光谱值和化学值。
[0048] 3茶叶待测指标的校正模型建立方法分析
[0049] 茶叶建模分析主要采用了两种校正方法:主成分分析+人工神经网络(PCA+ANN)、 偏最小二乘+人工神经网络(PLS+ANN)。
[0050] 当神经元j有多个输入xji= 1,2, "'m)和单个输出y」时,输入和输出的关系可 表示为:
[0052] 其中叫为阈值,为从神经元i到神经元j的连接权重因子,f(x)为传递函数, 或称激励函数。传递函数f(x)可以选择线性函数,但通常选用非线性函数,常见的有:
[0053] (1)阶跃函数:
[0055] (2)Sigmoid(S型)函数:
[0057] 对于茶叶样品的建模,使用不同的预处理方法,经过反复试验,最终确定了相对较 佳的预处理方法,获得了较为准确的样品定标模型,并对预测集样品进行了预测和预测精 度分析。
[0058] 本发明具有有益效果。本发明通过采用峰值法进行建模分析,通过不同的预处理 及建模方式来建立校正模型,从而提高了模型精度,实现对农产品元素含量进行准确快速 地无损检测,且避免使用强酸造成污染。为重金属的快速无损检测提供理论依据。
【附图说明】
[0059] 图1是本发明的茶叶X射线荧光光谱图;
[0060] 图2是本发明的茶叶X射线荧光的一阶微分光谱图;
[0061]图3是本发明的茶叶X射线荧光的二阶微光图谱;
[0062] 图4是本发明的茶叶X射线荧光中心化后的光谱图;[0063] 图5是茶叶X射线荧光的中心化处理+ -阶微分处理后的光谱图;
[0064] 图6是茶叶X射线荧光的中心化处理+二阶微分处理后的光谱图。
【具体实施方式】
[0065] 为了寻求建立更为准确的定量分析模型,对90个茶叶样品用电感耦合等离子体 发射光谱仪进行测定,得到了 90个茶叶样品的Al、P、S、K、Ca、Mn、Fe、Ni、Cu、Zn、Pb等11 种元素的真值。
[0066] 茶叶的X-射线荧光的光谱图如图1所示,数据处理所用软件为江苏大学近红外 319课题组自主研发的NIRSAv4. 0数据处理系统以及matlab数据处理软件。
[0067] 光谱预处理对消除光谱中的噪声,部分消除或降低检测过程中的系统偏差,提高 X-射线荧光光谱信息的有效性有着至关重要的作用。研宄主要采用了微分处理、归一化、多 元散射校正、中心化、标准正态变量交换、光谱平滑等预处理方法对光谱进行了预处理,并 采用主成分分析及偏最小二乘的方法建立校正模型,并对预测集茶叶样品进行了预测及预 测精度分析,寻找出茶叶中各个待测元素的最佳光谱预处理方法。
[0068] 光谱平滑主要是为了消除随机误差以及仪器的噪声,其实质是除去数据中偏离较 小的部分,而保留其中偏离较大的部分。设滤波值为y*k,原始信号值为yk,两者具有如下的 关系:
[0070] 式中,k为被测样品数据点的序号,2m+l为滤波带宽的大小,m为滤波带宽的调节 参数。
[0071] 对光谱进行一阶微分处理能够消除光谱的平移误差,强化谱带特征,克服谱带重 叠,明显消除光谱的基线漂移,而对光谱的二阶微分处理,则能够消除光谱的旋转误差。茶 叶X-射线荧光光谱的一阶和二阶微分处理后的结果如图2,图3所示。
[0072] 中心化处理是为了改变数据与坐标轴的相对位置。若xik表示第i个样本的第k 个测量数据,在数据矩阵中xik表示第i行第k列的数据。中心化变换就是从数据矩阵中的 每个元素中减去该元素所在列的均值的运算:
[0073]
,其中巧是n个样本的均值。
[0074] 某一茶叶样品中心化处理后的结果如图4所示。
[0075] 中心化结合一阶微分或是二阶微分对光谱进行处理,通常会得到更多有用的相关 信息。同一样品先做中心化处理后作一阶微分和先做中心化处理后作二阶微分后的光谱图 结果如图5,图6所示。
[0076] 归一化处理的主要目的是消除光程的变化或者是样品浓度等变化对光谱值产生 的影响。其公式为:
[0078] 标准正态变量变换(standardnormalvariate,SNV)的主要作用是消除颗粒大 小、表面散色等对光谱的影响。
[0079] 在进行样品集的划分和异常样品的剔除时,主要用的数据处理方法是主成分分析 (PCA)及偏最小二乘(PLS)。对茶叶的原始X-射线荧光数据,采用江苏大学近红外319课 题组编写的NIRSAv4. 0数据处理系统进行分析,利用PCA或PLS,结合马氏距离识别出浓度 界外样本,适用于校正集和预测集样品。其中通过PCA方式划分的样本仅仅针对的是光谱 值,没有对化学值进行界外识别,而通过PLS方式划分的样本则是针对光谱值和化学值。通 过试验验证所有茶叶样品的X-射线荧光的光谱分布均无异常现象出现。
[0080] 采用电感耦合等离子体发射光谱仪所测定的Al、P、S、K、Ca、Mn、Fe、Ni、Cu、Zn、 Pb等元素的值,按校正集样品数占总样品数的60%的原则随机划分,其中校正集为54个样 品,预测集为36个样品。
[0081] 茶叶建模分析主要采用了两种校正方法:主成分分析+人工神经网络(PCA+ANN)、 偏最小二乘+人工神经网络(PLS+ANN)。
[0082] 当神经元j有多个输入xji= 1,2, "'m)和单个输出y」时,输入和输出的关系可 表示为:
[0084] 其中0』为阈值,Wij为从神经元i到神经元j的连接权重因子,f(x)为传递函数, 或称激励函数。传递函数f(x)可以选择线性函数,但通常选用非线性函数,常见的有: [0085] (3)阶跃函数:
[0087] (4)Sigmoid(S型)函数:
[0089] (5)高斯型函数:
[0091] 对于茶叶样品的建模,使用不同的预处理方法,经过反复试验,最终确定了相对较 佳的预处理方法,结果如表1所示,获得了较为准确的样品定标模型,并对预测集样品进行 了预测和预测精度分析,结果如表2所示。
[0092] 表1不同元素预处理方式
[0094]
[0095] 由表1可以看出,10种元素较佳的微分处理方式均为5点2阶微分处理(Cu除 外),Al、P、K在进行去趋势处理后建模效果要明显好于之前。10种微量及常量元素除Cu 外均用到了光谱平滑处理,其中Al、K、Fe、Ni、Zn用到的5点滑动滤波平滑(MAF),其余元素 用到的是采用Savitzky-Golay滤波器系数的多项式平滑滤波(SGF),均是先平滑之后再进 行微分。
[0096] 表2不同元素的建模方法及相关性分析

[0099] 由表2可以看出,所测11种元素,除Ni的预测相关性较差,只有0. 60外,其余10 种元素均取得了较好的预测效果,这可能与Ni元素的含量相对较低有关。建模方法方面, 除了Zn元素用到的是PCA+ANN之外,其余10种元素均用到的是PLS+ANN,可见在茶叶重金 属对的建模分析中,PLS+ANN所建模型的准确度要优于PCA+PLS,由表可以看出,茶叶样品 的预测均方根误差均在可接受范围内。因此用峰值法对茶叶样品进行建模具有较强的可行 性。
【主权项】
1. 一种基于X-射线荧光分析的农产品元素定量检测模型构建方法,其特征在于包括 以下步骤: 步骤一,收集农产品样品得样品集,对得样品集进行粉碎、过80目筛、压片后,再测量 样品集的X射线荧光光谱谱图; 步骤二,用电感耦合等离子体发射光谱仪测定样品集元素,得到样品集元素真值,并与 所述的X射线荧光光谱峰值进行关联; 步骤三,对所述X射线荧光光谱谱图进行预处理、划分为校正集样品与验证集样品并 剔除异常样品;所述的预处理包括:微分处理、归一化、多元散射校正、中心化、标准正态变 量交换和光谱平滑,最终得到所述样品集的的X射线荧光光谱值; 步骤四,通过主成分分析、偏最小二乘、人工神经网络,利用峰值法建立所述样品集元 素的真值与所述X射线荧光光谱值之间的校正模型; 步骤五,通过验证集样品对所述校正模型的精度进行验证;通过所述的预处理及所述 的校正模型建立方式得到不同元素的建模方法及相关性分析,将预测相关系数最高的模型 作为农产品元素定量检测模型; 所述元素为 Al、P、S、K、Ca、Mn、Fe、Ni、Cu、Zn、Pb 中的任一种。2. 根据权利要求1所述的一种基于X-射线荧光分析的农产品元素定量检测模型构建 方法,其特征在于: 所述的微分处理是对所述的X射线荧光光谱值求一阶导数和二阶导数; 所述的归一化处理为对X射线荧光光谱值进行归一化,方法如下:设定数据集中所有 的数据向量长度相同,每个向量中所有元素的平方和相似,令:(1) 为使数据向量能归一化为N,将向量中每个元素乘以TV/·^,公式表示为:C2) 使向量为单位长度或单位面积,即归一化方法,使用该方法时向量的方差值为1,即N 取为1 ; xik表示第i个样本的第k个测量数据,在数据矩阵中X ik表示第i行第k列的数据; 所述中心化处理是从数据矩阵中的每个元素中减去该元素所在列的均值的运算,如式 (3)所示 y? = yik - yk ⑶ yik表示第i个样本的第k个测量数据,在数据矩阵中y ik表示第i行第k列的数据; 是η个样本的均值。3. 根据权利要求1所述的一种基于X-射线荧光分析的农产品元素定量检测模型构建 方法,其特征在于: 所述的标准正态变量变换计算公式如式(4)(4) Zi为第i个样品光谱的平均值; k为波长点数,k = 1,2,…,m ; i为校正集样品数,i = 1,2,…,η。4. 根据权利要求1所述的一种基于X-射线荧光分析的农产品元素定量检测模型构建 方法,其特征在于: 所述的光谱平滑计算公式如式(4) 为,两者具有如下的关系:(5) k为被测样品数据点的序号,2m+l为滤波带宽的大小,m为滤波带宽的调节参数; y\为滤波值,yk为原始信号值。5. 根据权利要求1所述的一种基于X-射线荧光分析的农产品元素定量检测模型构建 方法,其特征在于: 所述的人工神经网络中的人工神经元的输入和输出的关系如式(5)(5) ai为多个输入,i = 1,2......m ; Sj为单个输出; Θ j为阈值; Rj为从神经元i到神经元j的连接权重因子; f (X)为传递函数,或称激励函数。
【专利摘要】本发明公开了一种基于X-射线荧光分析的农产品元素定量检测模型构建方法。首先对得到的样品谱图进行预处理,具体包括微分处理、归一化、多元散射校正(MSC)、中心化、标准正态变量交换(SNV)、光谱平滑等,得到标准谱图,然后通过主成分分析(PCA)及偏最小二乘(PLS)数据处理法进行样品集的划分与异常样品的剔除,得到校正集和预测集,最后通过主成分分析+人工神经网络(PCA+ANN)、偏最小二乘+人工神经网络(PLS+ANN)进行农产品待测指标的校正。本发明的峰值法建模可以克服常规峰面积建模时的重叠现象问题,提高样品定标模型的准确性。
【IPC分类】G01N23/223
【公开号】CN104897709
【申请号】CN201510330041
【发明人】李国权, 戚雪勇, 陆道礼, 陈斌, 邢为飞
【申请人】江苏大学
【公开日】2015年9月9日
【申请日】2015年6月15日

最新回复(0)