基于遗传优化算法的同步荧光光谱特征波长选择方法

xiaoxiao2020-7-22  3

基于遗传优化算法的同步荧光光谱特征波长选择方法
【专利摘要】本发明公开一种基于遗传优化算法的同步荧光光谱特征波长选择方法,包括如下步骤:(1)对同步荧光光谱进行导数预处理和去噪预处理;(2)应用遗传优化算法选择同步荧光光谱特征波长;(3)应用遗传优化算法优化支持向量回归(Supportvectorregression,SVR)模型核函数参数(c,g,p),进而建立基于遗传优化算法的SVR预测模型。本发明提出的方法,有益于肉类及蛋类食品中抗生素残留的预测模型精度和速度的提高,提供了一种快速、方便的肉类及蛋类食品中抗生素残留检测方法。
【专利说明】基于遗传优化算法的同步荧光光谱特征波长选择方法

【技术领域】
[0001] 本发明涉及一种同步荧光光谱特征波长选择方法,尤其涉及一种用于肉类(如鸭 肉、鸡肉、鹅肉、猪肉等)及蛋类(鸭蛋、鸡蛋、鹅蛋等)食品中抗生素残留的基于遗传优化算 法的同步荧光光谱特征波长选择方法。

【背景技术】
[0002] 目前关于肉类及蛋类食品中抗生素残留常用检测方法主要有高效液相色谱法、气 相色谱法等理化检测方法,酶联免疫检测法和微生物学方检测法等。虽然这些方法对肉类 及蛋类食品中抗生素残留检测可获得较好的检测精度,但需对样品进行复杂的前处理,操 作费时繁琐,不利于快速、简单、大批量检测。
[0003] 随着荧光光谱技术与化学计量学的发展,荧光光谱技术在食品品质检测中得到了 广泛的应用。同步荧光光谱法作为一种荧光光谱分析技术,具有简化光谱、窄化谱带、减小 散射光影响和光谱重叠等优点,也日益受到重视。而含有抗生素残留的肉类及蛋类食品的 荧光光谱比较复杂,影响因素较多,荧光峰的位置会发生波动,较难直接确定精确的抗生素 荧光特征峰值与肉类及蛋类食品中抗生素残留含量之间的定量对应关系。而应用全光谱建 立的预测模型因输入变量较多使得模型建立和预测时间较长,不利于快速检测。因此,有必 要从全光谱中提取有用的光谱特征波长,以提高模型的运行速度。
[0004] 遗传优化算法作为模仿自然界生物进化机制发展起来的一种具有高度并行、随机 和自适应的全局搜索方法,具有简单、鲁棒性好的优点,在光谱特征波长选择和模型参数优 化方面得到了广泛应用。同步荧光光谱特征波长的个数关系到模型的运行速度和效率,同 时支持向量回归(Support vector regression, SVR)预测模型中的参数设置关系到模型的 预测精度。因此,遗传优化算法的应用有益于剔除对建模无用的同步荧光光谱波长,提高预 测模型的精度与运算速度。
[0005]


【发明内容】

[0006] 本发明的目的在于克服现有技术的不足,适应现实需要,提供一种基于遗传优化 算法的同步荧光光谱特征波长选择方法,旨在提出一种肉类及蛋类食品中抗生素残留的基 于遗传优化算法的同步荧光光谱特征波长选择方法,并用本方法筛选出来的同步荧光光谱 特征波长建立基于遗传优化算法的SVR预测模型,以提高预测模型的精度与运算速度。
[0007] 为了实现本发明的目的,本采用的技术方案为: 一种基于遗传优化算法的同步荧光光谱特征波长选择方法,包括如下步骤: ⑴对同步荧光光谱进行导数预处理; ⑵对导数预处理后的同步荧光光谱进行去噪预处理; ⑶应用遗传优化算法选择同步荧光光谱特征波长; ⑷应用遗传优化算法优化支持向量回归模型的核函数参数(c,^/7),进而建立基于遗 传优化算法的支持向量回归预测模型; 所述步骤(1)采用一阶导数预处理或二阶导数预处理对同步荧光光谱进行导数预处 理。
[0008] 所述步骤(2)采用平滑处理、标准归一化(SNV)、多元散射校正法(MSC)、小波变换 中的一种对导数预处理后的同步荧光光谱进行去噪预处理。
[0009] 在进行步骤(3)之前还包括设置遗传优化算法的初始化参数。所述设置初始化参 数包括设置初始群体、变异概率Pm、交叉概率P。、循环次数,本次迭代终止次数的初始值; 所述交叉概率P。为参与基因交换的染色体个体占染色体总数的比例,所述交叉概率P。 的取值范围为0.4?0.99 ; 所述变异概率Pm为参与基因变异的染色体个体占染色体总数的比例;所述变异概率Pm 的取值范围为0.0001、. 1 ; 所述循环次数为遗传优化算法重复运行次数; 述本次迭代终止次数具体为在每一次遗传优化算法循环中,当遗传优化算法选择同步 荧光特征波长的迭代次数达到给定的最大迭代次数,则终止当次迭代,进行下一次循环搜 索,所述本次迭代终止次数的初始值小于最大迭代次数或本次迭代终止次数。
[0010] 在进行步骤(3)之前还包括基因编码;所述基因编码具体为.·设置二进制编码将 同步荧光光谱数据表示成遗传空间的基因型串结构数据,设置编码〇表示所对应的荧光光 谱波长未被选中,设置编码1表不所对应的突光光谱波长被选中; 所述步骤(3)包括如下步骤: ① 以步骤(3)选择出来的荧光波长组合作为偏最小二乘法的输入变量建立PLS模型, 并用交互验证均方根误差值构造遗传优化算法的适应度函数; ② 依次采用选择、交叉、变异3种遗传操作方式,以轮转法作为选择同步荧光光谱特征 波长的方法, ③ 通过上述步骤②循环选择来进一步缩小有用信息变量的范围,当均方根误差 (RMSECV)达到最小时,所对应的变量集合该次选择的结果。
[0011] 所述步骤(3)中结果以二进制码的形式输出,并按照波长由小到大排列,其中数值 〇表示所对应的荧光光谱波长未被选中,数值1表示所对应的荧光光谱波长被选中。
[0012] 所述步骤(4)为设定经步骤(3)选择出的同步荧光光谱特征波长作为支持向量回 归预测模型的输入,并采用遗传优化算法优化支持向量回归预测模型的核函数参数fc,& /7),将应用遗传优化算法获取核函数参数(c,A/7)值作为支持向量回归预测(SVR)模型建 模的核函数参数(C,A/7)值,建立支持向量回归预测(SVR)模型。
[0013] 所述遗传优化算法优化SVR模型的核函数参数(c,办/7)前需设置如下参数: 设置种群大小、最大迭代次数、参数C的变化范围、参数^的变化范围、参数/7的变化范 围的初始值;并设定线性、多项式、sigmoid、径向基函数(RBF)中的一种为核函数的类型, 设定e-SVR、n-SVR中一种为SVR模型的类型。
[0014] 本发明的有益效果在于: 本发明的基于遗传优化算法的同步荧光光谱特征波长选择方法有益于肉类及蛋类食 品中抗生素残留的预测模型精度与速度的提高,提供了一种快速、方便的肉类及蛋类食品 中抗生素残留检测方法。

【专利附图】

【附图说明】
[0015] 图1为本发明的流程示意图; 图2为激发波长选择频率直方示意图; 图3是选择的变量数与RMSECV值之间的关系图; 图4是遗传优化算法对SVR参数(c,& /7)优化的适应度曲线图。

【具体实施方式】
[0016] 下面结合附图和实施例对本发明进一步说明: 实施例1 : 一种基于遗传优化算法的同步荧光光谱特征波长选择方法,参见图1至图4, 本方法包括如下步骤: (1)先对同步荧光光谱进行导数预处理,使荧光背景峰与荧光目标峰尽量得到较好的 分离。导数预处理方法一般为一阶导数预处理和二阶导数预处理。
[0017] (2)由于原始光谱中可能包含一些样本背景、仪器和环境条件等因素产生的噪声, 而经过一阶导数处理后会放大这些噪声,因此有必要对一阶导数处理后的光谱进行去噪预 处理。去噪预处理方法采用平滑处理、标准归一化(SNV)、多元散射校正法(MSC)、小波变换 中的一种。
[0018] (3)经过预处理后同步荧光全光谱中可能包含一些冗余的波长,这些冗余的波长 不利于提高模型的预测精度与运行速度,因此有必要从全光谱(样本的光谱波长范围)中选 择出有用的光谱波长。对去噪预处理后的同步荧光光谱首先设置遗传优化算法的适应度函 数和初始化参数后,之后执行遗传优化算法从全光谱中选择出与抗生素残留有关的同步荧 光光谱特征波长。
[0019] 具体初始化参数设置项及说明如下: 设置初始群体、变异概率Pm、交叉概率P。、循环次数,本次迭代终止次数的初始值。
[0020] 交叉概率P。:基因交换过程中,指参与基因交换的染色体个体占染色体总数的比 例。取值范围为0.4?0.99。
[0021] 变异概率?111:基因变异过程中,指参与基因变异的染色体个体占染色体总数的比 例。取值范围为0.0001、. 1。
[0022] 循环次数:由于遗传优化算法的运行结果具有一定的随机性,为了增加结果的可 靠性和稳定性,重复多次运行遗传优化算法。循环次数即指这里的遗传优化算法重复运行 次数。
[0023] 本次迭代终止次数:在每一次遗传优化算法循环中,当遗传优化算法选择同步荧 光特征波长的迭代次数达到给定的最大迭代次数,则终止当次迭代,进行下一次循环搜索, 所述本次迭代终止次数的初始值小于最大迭代次数或本次迭代终止次数。
[0024] 同步荧光光谱特征波长选择结果的确定: 基因编码:用二进制编码将同步荧光光谱数据表示成遗传空间的基因型串结构数据, 编码0表不所对应的突光光谱波长未被选中,编码1表不所对应的突光光谱波长被选中。
[0025] 适应度函数:以本步骤(3)选择出来的同步荧光波长组合作为偏最小二乘法 (PLS)的输入变量来建立PLS模型,并用交互验证均方根误差(RMSECV)值构造遗传优化算 法的适应度函数。
[0026] 遗传操作:依次采用选择、交叉、变异3种操作方式,以轮转法作为选择方法。
[0027] 当RMSECV值达到最小时,这时所对应的变量集合即为该次选择的结果,通过循环 选择来进一步缩小有用信息变量的范围,当RMSECV不能再降低时,所选的变量组即最后结 果。
[0028] 同步荧光光谱特征波长选择结果以二进制码的形式输出,并按照波长由小到大排 列,数值〇表示所对应的荧光光谱波长未被选中,数值1表示所对应的荧光光谱波长被选 中。
[0029] (4)以步骤(3)选择出的同步荧光光谱特征波长作为SVR模型的输入,但SVR模型 预测性能的好坏依赖于核函数的参数优化,因此采用遗传优化算法优化SVR模型的核函数 参数(c,人采用遗传优化算法优化SVR模型的核函数参数(c,前需设置如下具体 参数: 设定种群大小、最大迭代次数、参数C的变化范围、参数^的变化范围、参数/7的变化范 围的初始值。
[0030] 设定线性、多项式、sigmoid、径向基函数(RBF)中的一种为核函数的类型,设定 e-SVR、n-SVR中一种为SVR模型的类型。
[0031] 将应用遗传优化算法获取核函数参数(c, A/?)的值作为SVR建模的核函数参数 (c,办/7)值,建立SVR预测模型。
[0032] 本方法建立基于遗传优化算法的SVR预测模型应用鸭蛋蛋清中庆大霉素含量的 同步荧光光谱特征波长选择如下。
[0033] 利用荧光分光光度计采集样本的同步荧光光谱,得到61个样本,其中,46个作为 校正集样本,15个作为预测集样本。光谱采集参数设置如下:在280?390 nm波长范围内、 波长差Λ λ为120 nm的条件下同步扫描,设置中等扫描速度、650 V的PMT探测器电压、 moving average平滑方式、激发和发射狭缝分别为5和2. 5 nm ;Emission filter参数设置为 360 ?1100 nm〇
[0034] 先对采集的同步荧光光谱进行一阶导数处理,并利用sym5小波的2层分解对一阶 导数同步荧光光谱进行去噪处理。
[0035] 设定遗传优化算法有关参数初始化值:初始群体为30,循环次数为8次,变异概率 Pm为〇. 01,交叉概率P。为〇. 5。以RMSECV值构造 GA算法的适应度函数,当迭代100次时 本次迭代终止。
[0036] 设置好适应度函数和初始化参数后,执行遗传优化算法选择同步荧光光谱特征波 长。图2给出了激发波长选择频率直方图,图中的水平线与直方图相交的区间为筛选出的 荧光激发波长。
[0037] 遗传优化算法总共选择出了 14个频率较高的荧光激发波长,它们分别为290. 0, 290. 9, 312. 0,313. 0, 314. 1,315. 0, 315. 9,317. 0,324. 0,325. 1,326. 0,339. 1,340. 1 和 357. 1 nm。选择的变量数与RMSECV值之间的关系如3图所示,当入选的变量数为14时, RMSECV为最小,其值为0. 9007。波长个数由全波长的111个压缩到了 14个,和全光谱相比 较,不仅使模型得到简化,而且能提高预测模型的运行速度,使之满足快速测定要求。
[0038] 基于遗传优化算法的SVR核函数参数(c,& /7)优化时的有关参数初始化值的设 定:种群大小为46,参数c的变化范围为[0,100],参数^的变化范围为[0,1000],参数/7的 变化范围为[0.01,1],核函数类型为RBF,SVR类型为e-SVR支持向量回归。
[0039] 设置好参数初始值后,执行遗传优化算法优化RBF核函数参数(c,办/7)。图4给 出了遗传优化算法对e-SVR核函数参数(c, A/7)优化的适应度曲线图,核函数参数(c, & /?)的优化结果为(21. 0362,0. 00095368,0. 0255)。
[0040] 以(21. 0362,0· 00095368,0· 0255)作为 e-SVR 建模的核函数参数(c,办/7)值,建 立e-SVR预测模型。
[0041] 应用建立的e-SVR预测模型对15个样本进行预测,得到预测集的决定系数(R2)和 均方根误差(RMSEP)分别为0. 983和1. 1494mg/L,说明该预测模型能满足鸭蛋蛋清中庆大 霉素含量快速测定要求。
[〇〇42] 本实施例公布的是较佳的实施例,但并不局限于此,本领域的普通技术人员,极易 根据上述实施例,领会本发明的精神,并做出不同的引申和变化,但只要不脱离本发明的精 神,都在本发明的保护范围内。
【权利要求】
1. 一种基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征在于,包括如下 步骤: (1) 对同步荧光光谱进行导数预处理; (2) 对导数预处理后的同步荧光光谱进行去噪预处理; (3) 应用遗传优化算法选择同步荧光光谱特征波长; (4) 应用遗传优化算法优化支持向量回归模型的核函数参数(c,g,p),进而建立基于 遗传优化算法的支持向量回归预测模型。
2. 如权利要求1所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述步骤(1)采用一阶导数预处理或二阶导数预处理对同步荧光光谱进行导数预处 理。
3. 如权利要求1所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述步骤(2)采用平滑处理、标准归一化、多元散射校正法、小波变换中的一种对导 数预处理后的同步荧光光普进行去噪预处理。
4. 如权利要求1所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,在进行步骤(3)之前还包括设置遗传优化算法的初始化参数。
5. 如权利要求4所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述设置初始化参数包括设置初始群体、变异概率P m、交叉概率P。、循环次数,本次迭 代终止次数的初始值; 所述交叉概率P。为参与基因交换的染色体个体占染色体总数的比例,所述交叉概率P。 的取值范围为0.4?0.99 ; 所述变异概率Pm为参与基因变异的染色体个体占染色体总数的比例;所述变异概率Pm 的取值范围为0.0001?〇. 1 ; 所述循环次数为遗传优化算法重复运行次数; 本次迭代终止次数具体为在每一次遗传优化算法循环中,当遗传优化算法选择同步荧 光特征波长的迭代次数达到给定的最大迭代次数,则终止当次迭代,进行下一次循环搜索, 所述本次迭代终止次数的初始值小于最大迭代次数或本次迭代终止次数。
6. 如权利要求5所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,在进行步骤(3)之前还包括基因编码; 所述基因编码具体为:设置二进制编码将同步荧光光谱数据表示成遗传空间的基因型 串结构数据,设置编码〇表示所对应的荧光光谱波长未被选中,设置编码1表示所对应的荧 光光谱波长被选中。
7. 如权利要求6所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述步骤(3)包括如下步骤: ① 以步骤(3)选择出来的荧光波长组合作为偏最小二乘法的输入变量建立PLS模型, 并用交互验证均方根误差值构造遗传优化算法的适应度函数; ② 依次采用选择、交叉、变异3种遗传操作方式,以轮转法作为选择同步荧光光谱特征 波长的方法; ③ 通过上述步骤②循环选择进一步缩小有用信息变量的范围,当均方根误差达到最小 时,所对应的变量集合该次选择的结果。
8. 如权利要求7所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述步骤(3)中结果以二进制码的形式输出,并按照波长由小到大排列,其中数值0 表示所对应的荧光光谱波长未被选中,数值1表示所对应的荧光光谱波长被选中。
9. 如权利要求1所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特征 在于,所述步骤(4)为:设定经步骤(3)选择出的同步荧光光谱特征波长作为支持向量回归 预测模型的输入,并采用遗传优化算法优化支持向量回归预测模型的核函数参数(c,g,p), 将应用遗传优化算法获取核函数参数(c,g,p)值作为支持向量回归预测建模的核函数参 数(c,g,p)值,进而建立支持向量回归预测预测模型。
10. 如权利要求9所述的基于遗传优化算法的同步荧光光谱特征波长选择方法,其特 征在于,所述遗传优化算法优化支持向量回归预测模型的核函数参数(c,g,P)前需设置如 下参数: 设置种群大小、最大迭代次数、参数c的变化范围、参数g的变化范围、参数P的变化范 围的初始值; 并设定线性、多项式、sigmoid、径向基函数(RBF)中的一种为核函数的类型; 设定e-SVR、n-SVR中一种为支持向量回归预测模型的类型。
【文档编号】G06N3/12GK104062274SQ201410174940
【公开日】2014年9月24日 申请日期:2014年4月29日 优先权日:2014年4月29日
【发明者】赵进辉, 刘木华, 袁海超 申请人:江西农业大学

最新回复(0)