一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法

xiaoxiao2021-3-4  143

一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法
【技术领域】
[0001] 本发明公开了一种农副产品含量的测定方法。具体设及到了一种基于近红外光谱 技术的棉巧棉酪含量的无损测定方法,采用近红外光谱技术和化学计量学多元校正技术对 整粒棉巧中棉酪含量进行无损测定。
【背景技术】
[0002] 棉巧是棉花的主要副产品,用途十分广泛,其产量约相当于棉纤维产量的1.5倍, 全球年产棉巧量可达2800-3000万吨,棉巧中富含大量的蛋白质(27.83-45.60% )和脂肪 (28.24-44.05% ),是潜在的蛋白质和食用油资源。中国是世界上最大的棉巧生广国,每年 可生产棉巧800万吨,可提取的棉巧油148万吨,棉巧蛋白140万吨。另外,棉巧蛋白中各氨基 酸含量组成合理,除蛋氨酸含量稍低外,其它巧巾必需氨基酸含量均丰富。棉巧中还富含多 种具有降血压、降血脂的不饱和脂肪酸。因此,棉巧是巨大的潜在营养资源,亟待开发。然 而,由于棉巧中存在色素腺体,其中含有对人畜有毒的棉酪及其衍生物,长期W来,大量棉 巧营养物质的综合利用被严重限制。因此,准确测定棉巧中棉酪含量对开发利用棉巧副产 品和培育棉花新品种具有重要的意义。
[0003] 目前测定棉副产品中的棉酪含量的方法主要有:分光光度法和高效液相色谱法 等。分光光度法测定棉酪含量时,所用化学试剂毒性较大、对目标物质的选择性不强,使与 棉酪具有相似化学结构的物质同时测定,使得测定结果偏高,从而限制了运种测定方法的 使用;高效液相色谱法,虽然W其测定准确性高、重现性好等优点,广泛应用于化学物质的 分离与测定中,但因其成本较高,操作繁琐,难W应用于大量样品的测定。近红外光谱(Near Infrared Spectroscopy,NIRS)分析技术是通过被分析物质中的含氨基团如〇-H、C-H、N-H、 S-H等在近红外区域表现有特征性的吸收峰,利用化学计量学的方法,对扫描的样品光谱和 物质含量信息进行一系列分析处理,最后完成该样品有关成分的定量分析。近年来,近红外 光谱技术发展迅速,在药物、农产品、生物医药和石油化工等众多领域得到了广泛的应用, 与其他分析技术相比,近红外光谱技术具有显著的优越性:操作简单,分析效率高;分析对 象范围广;可进行定性和定量分析;无损、绿色、环保、安全可靠。
[0004] 棉巧中的棉酪含量是影响棉巧综合利用的一个重要指标。按照常规测定棉酪含 量,既费时又费力,且需要大量有毒的化学试剂,费用昂贵而且污染环境,给棉巧营养评价 增加了难度。另外,通过传统化学方法剥壳、磨粉分析棉巧中棉酪含量,不可避免会消耗测 试材料,检测样本无法回收利用,限制其在棉巧营养品质改良中的应用。

【发明内容】

[0005] 本发明的目的是针对现有化学分析技术中存在的不足,提供了一种基于近红外光 谱技术的棉巧棉酪含量的无损测定方法。该方法采用近红外光谱和化学计量学多元校正方 法对棉巧中棉酪含量进行无损测定,既有效地克服传统化学方法的弊端,又不损耗育种过 程中宝贵的棉巧材料,为棉巧中棉酪含量的检测提供了一种无损、绿色、高效的分析方法, 具有便捷、准确、快速的优点。
[0006] 本发明采用的技术方案是:
[0007] 1)取不同年份、不同地区种植的多个品种的脱绒棉巧样本;
[0008] 2)利用近红外光谱仪采集脱绒棉巧样本的光谱;
[0009] 3)根据步骤2)中采集到的脱绒棉巧样本近红外光谱数据,进行光谱预处理,W消 除非目标因素的干扰,提高信噪比;
[0010] 4)通过高效液相色谱法化PLC)测得脱绒棉巧样本中的棉酪含量,再结合步骤3)中 预处理获得的近红外光谱数据,用偏最小二乘法(PLS)建立棉巧棉酪含量近红外校正模型;
[0011] 5)从中选择预测相关系数(R2)与剩余预测偏差(RPD)值最大且预测均方根误差 (RMSEP)和交叉验证均方根误差(RMSECV)值最小的模型作为最优棉巧棉酪含量近红外校正 模型;
[0012] 6)将待测棉巧样本采用步骤2)所述相同方法采集其近红外光谱数据,用上述步骤 所构建的最优近红外光谱校正模型检测待测脱绒棉巧样本,得到其棉酪含量。
[0013] 所述步骤2)利用近红外光谱仪采集脱绒棉巧样本的光谱具体为:将每份样品经四 次装样扫描后收集光谱数据,即每份样品收集到四份光谱数据,计算每份样品四次光谱数 据的平均光谱值;每次装样扫描均是在25 ± 0.5°C溫度条件下,用近红外光谱仪,在波数为 4000-10000cnfi近红外光谱范围内,每隔4cnfi采集反射强度(R),共计1501个光谱点,并重 复扫描64次后取平均值。
[0014] 所述每次装样扫描的上样量为5g左右,样品池为圆柱形,其直径为10cm,圆柱形高 度为1cm。
[0015] 所述步骤3)中的预处理采用Savitzky-Golay平滑法、变量标准化法、多元散射校 正法和一阶微分法的四种方法中的一种、两种和Ξ种的结合,具体是采用Savitzky-Golay 平滑法、变量标准化法、多元散射校正法、一阶微分法、变量标准化+-阶微分法、多元散射 校正+-阶微分法、一阶微分巧avitzky-Golay平滑+变量标准化法、一阶微分巧avitz的-Golay平滑+多元散射校正法、Savitzky-Golay平滑+变量标准化+-阶微分法和Savitzky-Golay平滑+多元散射校正+-阶微分法。
[0016]所述步骤6)的近红外光谱校正模型采用通过Savitzky-Golay平滑+变量标准化+ 一阶微分预处理方法获得的偏最小二乘法近红外光谱校正模型。
[0017] 所述步骤3)中的预处理方式具体是先采用Savitzky-Golay平滑方法消除光谱高 频随机误、提高信噪比,再采用变量标准化方法消除棉巧颗粒大小、表面散射W及光程变化 对光谱的影响,最后采用一阶微分法有效进行光谱基线偏移。
[0018] 本发明针对整粒棉巧近红外光谱包含大量噪音和无效信息运一特点,考察并比较 了十种光谱预处理方式对模型构建的影响,从中筛选出了最优的预处理方式,该预处理方 式对整粒棉巧中其他物质近红外建模提供参考。
[0019] 与现有技术相比,本发明的有益效果是:
[0020] 现有技术没有直接采用整粒棉巧进行处理获得棉酪含量的方式,其是因为在扫描 整粒棉巧近红外光谱过程中,棉巧的大小、形状和成熟度等不确定因素给光谱数据引入了 大量的噪音和背景信息;由于样品池中整粒棉巧间存在大量的间隙,给光谱数据带来了大 量的不相关信息。W上因素降低光谱信噪比,加大近红外模型构建的难度。而本发明构建的 模型应用于整粒棉巧试验样本,解决了上述整粒棉巧测定处理的技术问题,并且无须剥壳、 磨粉等费时费力的体力劳动,本发明能够方便、快捷、可回收地分析棉酪含量。
[0021] 另一方面,本发明利用BiicM NIR Flex-N500近红外光谱仪(瑞±步埼公司)采集 了棉巧的光谱图,研究了棉仁粉中棉酪含量的建模及应用方法,其光谱数据更加准确。本发 明利用BiicM NIR Flex-N500近红外光谱仪,与现有的近红外光谱仪相比其分辨率(4畑1一1) 更高,通过该光谱仪采集的光谱点数更多,能更好地采集获取棉仁粉样本在近红外光谱区 的光谱特征。
[0022] 本发明测定准确性很高,是一种无损、绿色、高效的测定方法,对于开发利用棉巧 副产品和棉巧品质育种具有极为重要意义。
【附图说明】
[0023] 图1是本发明方法中脱绒棉巧近红外光谱图。
[0024] 图2是本发明方法中脱绒棉巧最优预处理后近红外光谱图。
[0025] 图3是本发明方法中预测集样本棉酪含量化学值与近红外光谱预测值之间相关性 图。
【具体实施方式】
[0026] 下面结合附图和实施例对本发明做进一步说明。
[0027] 本发明的具体实施例如下:
[0028] 1)样本的选取:
[0029] 样本为2012、2013和2014年全国11个地区的脱绒棉巧,包括浙江杭州、安徽宪湖、 江苏盐城、湖南縷县等不同生态种植区的多个品种,共268个棉巧样本。
[0030] 2)样本光谱采集
[0031] 将脱绒棉巧装入样品池中,每个样本扫描四次,取光谱平均值。样本原始光谱图, 如图1所示。
[0032] 近红外光谱采集方法:室溫25 ± 0.5°C条件下,用近红外光谱仪,在波数为4000-lOOOOcnfi近红外光谱范围内,共计1501个光谱点,每隔4cnfi采集反射强度(R)。每装样在近 红外光谱仪内重复扫描64次,胆存于计算机中取平均值。为减小装样误差,每份样品经四次 装样、扫描并收集光谱数据,即每份样品收集到四份光谱数据,计算每份样品 的平均光谱。 每次装样量为5g左右,样品池为圆柱形,其直径为10cm,圆柱形局度为1cm。
[0033] 3)光谱数据预处理
[0034] 利用Savi tzky-Go lay平滑法、变量标准化法、多元散射校正法、一阶微分法、变量 标准化+-阶微分法、多元散射校正+-阶微分法、一阶微分巧avitzky-Golay平滑+变量标 准化法、一阶微分+Savitzky-Golay平滑+多元散射校正法、Savitzky-Golay平滑+变量标准 化+-阶微分法和Savitzky-Golay平滑+多元散射校正+-阶微分法分别对光谱数据进行预 处理。
[0035] 4)高效液相色谱法化PLC)测定各样本中的棉酪含量
[0036] 棉巧样本烘干、剥壳得到棉仁,用磨样机把棉仁磨成粉末,过80目筛,得到棉仁粉。
[0037] 用丙酬提取对应棉仁粉样本中的棉酪,经超声、离屯、、微孔滤膜过滤,册LC检测含 量;色谱条件为:色谱柱Cl8(250mm X 4.6mm,5um),流动相为甲醇:ο. 2%憐酸(体积比90:1 ο) 溶液,流速1. OmL/min,紫外检测波长238nm,进样量10化,柱溫25°C。结果得出,棉酪的回归 曲线为7=102.42义-85.055,护=0.9998,平均回收率在95.16-01.72%。使用此方法测定的 棉酪含量用百分含量表示。
[0038] 5)校正集和预测集样本的选取
[0039] 对于近红外建模而言,校正集和预测集样品必须都能够代表原始样本的数据分布 情况,且校正集的样本含量范围要包含预测集样本含量范围,使用Kennard-Stone算法将 268份样本进行分集,得到校正集样本218份,预测集样本50份,建立所述近红外模型,校正 集和预测集样本棉酪含量分布,如表1。
[0040] 表1校正集和预测集样本棉酪含量统计分析 Γ 00411
[0042] 从上表可W看出,校正集样本棉酪含量范围广,包含预测集样本棉酪含量范围,适 合近红外校正模型的构建。
[0043] 6)模型的建立与筛选
[0044] 对于218份的校正集样本,在全光谱范围构建化計莫型,分别考察十种不用光谱预 处理方法对化計莫型的影响,十种预处理方法分别为Savitzky-Golay平滑法、变量标准化 法、多元散射校正法、一阶微分法、变量标准化+-阶微分法、多元散射校正+-阶微分法、一 阶微分巧avitzky-Golay平滑+变量标准化法、一阶微分+Savitzky-Golay平滑+多元散射校 正法、Savitzk厂Golay平滑+变量标准化+-阶微分法和Savitzky-Golay平滑+多元散射校 正+-阶微分法。在得到的校正模型中,通过预测相关系数(R 2)、预测均方根误差(RMSEP)、 交叉验证均方根误差(RMSECV)和剩余预测偏差(RPD),筛选得到最优棉巧棉酪含量近红外 光谱校正模型。十种预处理方法建立的校正模型参考指标评价,见表2。
[0045] 表2十种预处理方法建立的化討莫型参数评价指标
[0046]
[0047] 表中:Conhol表示无预处理;SG表示Savitzky-Golay平滑;SNV表示变量标准化; MSC表示多元散射校正;1D表示一阶微分;RMSECV表示交叉验证均方根误差,其数值越小效 果越好;RMSEP表示预测均方根误差,其数值越小效果越好;R 2表示预测相关系数,其数值大 于0.9表示结果符合要求;RTO表示剩余预测偏差,其数值大于2.5表示模型的稳健性好。
[004引上表中可看出,最优棉巧棉酪含量近红外校正模型为经过Savitzky-Golay平滑+ 变量标准化+-阶微分预处理后的PLS模型,此模型R哺RPD值最大,且RMSEP和RMSECV值最 小。其预处理光谱图见图2,从图中可W看出大部分光谱数据接近于0,基本消除了重叠峰和 极限的影响,噪音信息同样也得到了消除。预测集样本棉酪含量化学值与近红外光谱预测 值之间相关性图,如图3所示,其中对角线表示最理想的预测结果(预测值=化学值),样本 点越接近对角线,说明模型的效果越好,反之亦然。
[0049] 7)收集待测棉巧,在相同条件下,采集待测棉巧近红外光谱图,运用最优光谱预处 理方法,用上述步骤所构建的最优近红外光谱校正模型检测待测棉巧,得到其棉酪含量。
[0050] 本发明利用近红外光谱仪,扫描得到棉巧的光谱图,通过不同预处理方法处理光 谱信息,进而得到测定棉巧中棉酪含量的近红外校正模型,具有无损、绿色、高效、准确的突 出特点,对于开发利用棉巧副产品和培育棉花新品种具有极为重要意义。
【主权项】
1. 一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法,其特征在于它的步骤如 下: 1) 取不同年份、不同地区种植的多个品种的脱绒棉籽样本; 2) 利用近红外光谱仪采集脱绒棉籽样本的光谱; 3) 根据步骤2)中采集到的脱绒棉籽样本近红外光谱数据,进行多种方法的光谱预处 理; 4) 通过高效液相色谱法(HPLC)测得脱绒棉籽样本中的棉酚含量,再结合步骤3)中各个 预处理方法获得的近红外光谱数据,分别用偏最小二乘法(PLS)建立棉籽棉酚含量近红外 校正模型; 5) 从中选择预测相关系数与剩余预测偏差值最大且预测均方根误差和交叉验证均方 根误差值最小的模型作为最优棉籽棉酚含量近红外校正模型; 6) 将待测棉籽样本采用步骤2)所述相同方法采集其近红外光谱数据,用上述步骤所构 建的最优近红外光谱校正模型检测待测脱绒棉籽样本,得到其棉酚含量。2. 根据权利要求1所述的一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法, 其特征在于:所述步骤2)利用近红外光谱仪采集脱绒棉籽样本的光谱具体为:将每份样品 经四次装样扫描后收集光谱数据,计算每份样品四次光谱数据的平均光谱值;每次装样扫 描均是在25±0.5°C温度条件下,用近红外光谱仪,在波数为4000-10000cm-1近红外光谱范 围内,每隔4CHT1采集反射强度,共计1501个光谱点,并重复扫描64次后取平均值。3. 根据权利要求2所述的一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法, 其特征在于:所述每次装样扫描的上样量为5g左右,样品池为圆柱形,其直径为10cm,圆柱 形高度为lcm〇4. 根据权利要求1所述的一种基于近红外光谱技术无损测定棉籽中棉酚含量的方法, 其特征在于:所述步骤3)中的预处理采用Savitzky-Golay平滑法、变量标准化法、多元散射 校正法和一阶微分法的四种方法中的一种、两种和三种的结合,具体是采用Savitzky-Golay平滑法、变量标准化法、多元散射校正法、一阶微分法、变量标准化+-阶微分法、多元 散射校正+-阶微分法、一阶微分+Savitzky-Golay平滑+变量标准化法、一阶微分+ Savitzky-Golay平滑+多元散射校正法、Savitzky-Golay平滑+变量标准化+-阶微分法和 Savitzky-Golay平滑+多元散射校正+-阶微分法。5. 根据权利要求1所述的一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法, 其特征在于:所述步骤3)中预处理具体采用Savitzky-Golay平滑+变量标准化+-阶微分预 处理的方法,具体是先通过Savitzky-Golay平滑方法消除光谱高频随机误差,再利用变量 标准化方法消除棉籽颗粒大小、表面散射和光程变化对光谱的影响,最后采用一阶微分法 进行光谱基线的偏移。6. 根据权利要求1所述的一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法, 其特征在于:所述步骤6)的近红外光谱校正模型采用通过Savitzky-Golay平滑+变量标准 化+-阶微分预处理方法获得的偏最小二乘法近红外光谱校正模型。
【专利摘要】本发明公开了一种基于近红外光谱技术的棉籽棉酚含量的无损测定方法。收集不同棉籽样本,利用近红外光谱仪采集棉籽样本的光谱,采用多种光谱预处理方法对近红外光谱数据进行预处理,利用高效液相色谱法精确测定样本棉酚含量,采用偏最小二乘法建立校正模型,以预测相关系数、剩余预测偏差、预测均方根误差和交叉验证均方根误差确定最优近红外光谱校正模型,用最优近红外光谱校正模型检测待测棉籽样本,得到其棉酚含量。本发明利用近红外光谱仪采集棉籽的光谱图,测定速度快,精度高,无需化学试剂,是一种无损、绿色、快捷分析棉籽中棉酚含量的方法,对于开发利用棉籽副产品和培育棉花新品种具有极为重要意义。
【IPC分类】G01N21/359, G01N21/3563
【公开号】CN105486662
【申请号】CN201610060091
【发明人】祝水金, 李 诚, 赵茹冰, 陈进红
【申请人】浙江大学
【公开日】2016年4月13日
【申请日】2016年1月28日

最新回复(0)