一种利用近红外光谱检测土壤的稳定碳同位素比值的方法
【技术领域】
[0001] 本发明设及生态学领域,具体地设及一种检测±壤的稳定碳同位素比值的方法。
【背景技术】
[0002] 稳定碳同位素比值(51?)分析方法可被用来表明±壤有机质的来源、研究±壤有 机质及其组分的分解程度与周转、重现C3/C4植被的变化历史,在±壤有机质研究和生态学 中正日益成为一个强有力的工具。
[0003] 测定±壤51化一般采用稳定同位素比例质谱法(IMS),其工作原理为:±壤通过高 溫燃烧,其中的有机碳被转变成气态C〇2;经色谱柱或吸附柱与其他气体分开后,在离子源 中被离子化;离子束经聚焦和加速后,进入质量分析器;在磁场作用下,离子流按一定的荷 质比(m/z)发生偏转,由于各种同位素的质量(m)不同,离子流偏转的程度也不一样;每种同 位素的离子束按自己的轨道到达离子接收器,经放大后记录每种同位素的离子流强度,ii 出同位素比值。稳定同位素比例质谱仪价格昂贵,需专人操作,测试周期长,相应的测试成 本也高。因此,同位素比质谱分析法(IRMS)测定±壤513(:有W下不足:1、仪器昂贵,测试成 本高;2、技术要求高、不易操作;3、测试周期长;4、不易推广。
[0004] 红外光谱技术在±壤分析中的应用兴起于上世纪八十年代。目前利用近红外光谱 (NIR)和中红外光谱(MIR)技术,结合化学计量学手段,已广泛用于±壤各种理化性质的分 析,结果令人满意。如:总碳含量、总氮含量、全憐含量、水分含量、±壤质地、钟化)、巧(Ga)、 铁(Fe)、儘(Μη)、儀(Mg)等金属的含量、微生物碳等。NIR、MIR光谱分析方法是一种间接分析 方法,需要先W参考方法对大量代表性±壤样品的理化特性进行测定,通过关联样品光谱 和其理化特性构建校正模型;然后运用校正模型预测未知±壤样品的组成和性质。因此,被 测的±壤样品要尽可能包括所预测±壤样品的类型和理化特性的范围,并对其每一组分的 理化特性进行准确测定。
[0005] 近红外(NIR)光谱区域是指波长在780~2500皿范围内的电磁波,其光谱信息来源 于分子内部振动的倍频与合频,并且主要反映分子中含氨基团(如C-H,N-H,0-H,S-H等)的 倍频与合频振动吸收。许多有机物在该光谱区域有特征性吸收,并且不同波段的吸收强度 与该物质的分子结构及浓度存在对应关系。中红外(MIR)光谱区域是波长在2500~25000nm 范围内的电磁波,物质在此范围的吸收峰为基频、倍频与合频吸收。不同化合物有其特异的 红外吸收光谱,其谱带的强度、位置、形状及数目均与化合物及其状态有关。MIR与NIR光谱 的区别在于,近红外光谱是物质分子内部振动的倍频与合频的吸收,不同组分和官能团的 谱带较易重叠且信息强度较弱,导致谱图解析相对困难,所建模型易受外界因素的影响,稳 定性差;而中红外光谱是分子内部振动的基频吸收,其信息强度较强,信息提取相对容易。
[0006] 漫反射是一种常用的近红外采集方法,其基本原理为:当光照射到疏松的固态样 品的表面时,除有一部分被样品表面立即反射出来(称为镜反射光)之外,其余的入射光在 样品表面产生漫发射,或在样品微粒之间無转反射逐渐衰减,或为穿入内层后再折回的散 射。运些接触样品微粒表面后被漫反射或散射出来的光具有吸收一衰减特性,运就是漫反 射产生光谱的基本原因。漫反射装置的作用就是最大强度地把运些漫射、散射出来的光能 收聚起来送入检测器,使得到具有良好信噪比的光谱信号。漫反射光谱技术是近20年来迅 速发展的一种检测方法,该方法操作简便、快速,能非破坏地对各种样品进行快速、精确的 分析,加之分析仪器的数字化和化学计量学方法的发展,运用化学计量学方法已能很好地 解决光谱信息的提取及背景干扰方面的影响,使得其在许多领域中发挥出重要作用,并取 得了较好的社会和经济效益。
[0007]无论是NIR还是MIR光谱,在采集到的光谱信息中,包含一些会对谱图信号产生干 扰的信息,从而影响模型的建立和预测,因此需要进行光谱预处理。常用的光谱预处理方法 有数据平滑、基线校正、中屯、化、多元散射校正、标准化、导数、傅立叶变换W及W上几种方 法的联合使用等。另外,谱图压缩及信息提取可提高分析信号中的有效信息率,其主要方法 有主成分分析(PCA)、小波分析、模拟退火算法(SAA)、遗传算法(GA)、移动窗口(MWPLS)等。 [000引NIR和MIR光谱分析的核屯、技术之一是在光谱信息和组分理化特性之间建立函数 关系,即建立校正模型。光谱回归分析常用的分析方法有:多元线性回归(MLR)、主成分回归 (PCR)、偏最小二乘法回归(PLSR)、人工神经网络(A顺)、支持向量机(SVM)等。MLR、PCR和 化SR多用于解决线性校正问题,A順和SVM多用于解决非线性校正问题。
[0009]目前还未见利用近红外(NIR)光谱检测±壤51化值的报道。
【发明内容】
[0010]有鉴于现有技术的上述缺陷,本发明提供了一种新的检现比壤5?值的方法,要解 决的技术问题是利用近红外(NIR)光谱快速检测±壤513(:值。
[0011] 为解决上述问题,本发明采取的技术方案是:一种利用近红外光谱检测±壤的稳 定碳同位素比值的方法,所述方法包括如下步骤:
[0012] 1)测得多个定标±壤样品的稳定碳同位素比值;
[0013] 2)采集定标±壤样品的近红外波段的漫反射谱图,得到原始谱图;
[0014] 3)将原始谱图进行平滑预处理,得到处理后谱图;
[0015] 4)采用偏最小二乘法建立定标±壤样品的处理后谱图与稳定碳同位素比值间的 定量关系模型;
[0016] 5)采集待测±壤样品的近红外波段的漫反射谱图,根据定量关系模型计算待测± 壤样品的稳定碳同位素比值。
[0017] 优选地,在所述步骤1)中,测得定标±壤样品的稳定碳同位素比值的方法为稳定 同位素比例质谱法。
[0018] 优选地,在所述步骤1)中,制备定标±壤样品的具体步骤包括:将±样除水后,磨 细,过60目筛。
[0019] 优选地,在所述步骤1)中,所述的多个定标±壤样品包括Oe和0曰层±壤的样品。
[0020] 优选地,在所述步骤3)中,将原始谱图进行平滑预处理的具体步骤包括:大气背景 抑制,吸光度转换,自动基线校正和Norris-阶导数滤波平滑处理。
[0021 ]优选地,在所述步骤4)中,建立定量关系模型的具体步骤包括:用SPXY法分别将光 谱信息和稳定碳同位素比值划分为校正集和验证集;采用偏最小二乘法,在校正集光谱信 息中提取主成分,并用20折交互验证法选取最佳主成分数,W校正集的光谱信息为自变量, w校正集稳定碳同位素比值为因变量,建立回归模型;并利用验证集检验回归模型的精度。 更优选地,校正集和验证集的样本数的比例为3:1。更优选地,所述的20折交互验证法的具 体步骤包括:将主成分数f依次从1取值到20,对于取定的一个主成分数,将校正集分成20个 子集,每个子集数据分别用于做一次验证,同时其他19个子集数据用于训练,交叉验证重复 20次,平均20次的结果,最终得到一个对应所述主成分数的交互验证均方根误差。更优选 地,用验证集检验校正模型的精度的具体步骤包括:用校正决定系数、交互验证均方根误差 和预测相关系数、预测均方根误差四个参数对校正模型进行评价。
[0022] 优选地,在所述步骤1)中,制备
待测±壤样品的具体步骤包括:将±样除水后,磨 细,过60目筛。
[0023] 本发明的有益效果为:1、本方法可W快速、准确、简便、低价的测定±壤513(:值。2、 操作简便,普及性强,应用范围广。3、适用于森林、农田、草地等各种生态系统。
[0024] W下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,W 充分地了解本发明的目的、特征和效果。
【附图说明】
[0025] 图1是本发明实施例1和2中样地平谷6个不同深度±壤的近红外吸收谱图。
[00%]图2是本发明实施例1中光谱模型(包含Oe和Oa)交互验证不同主成分数对应的 RMSECV值的示意图。
[0027]图3是本发明实施例1中光谱模型(包含Oe和Oa)预测值与真实值相关性的示意图。 [00%]图4是本发明实施例2中光谱模型(不包含Oe和Oa)交互验证不同主成分数对应的 RM沈CV值。
[0029] 图5是本发明实施例2中光谱模型(不包含Oe和Oa)预测值与真实值相关性的示意 图。
【具体实施方式】
[0030] 作为一种优选的【具体实施方式】,本发明所提供的利用近红外光谱快速检测±壤的 稳定碳同位素比值的方法包括如下步骤。
[0031] (1)备待检±样
[00创将矿质层±壤去杂、风干、粉碎,过60目筛,干燥器保存备用;将Oe和03层±壤(两 种不同程度的未完全分解的调落叶)于60°C烘4她W除尽水分,粉碎,过60目筛,干燥器保存 备用。共200个样品来自于屯个不同地区(平谷、洪崖山、白岸、皇藏略、信阳、黄山、云山)的 栓皮栋森林中不同深度(06、0曰、0-2、2-5、5-10、10-20(3111)的±壤样品。
[0033] 制样细节:森林±壤样品是形状不规则的固体颗粒,颗粒的大小、形状和均匀程度 都对光谱数据产生很大的影响;通过粉碎过筛,可获得较小±壤颗粒度、增加样品的均匀 度,尽可能减小颗粒散射效应对光谱采集造成的影响。
[0034] 本发明的两个创新点:一、深度,一般±壤测试都不会加入Oe和Oa层,但越来越多 的研究表明,Oe和Oa层因包含了大量的±壤有机质,也是森林±壤的重要组成部分;二、采 样区域,本发明采集的样品来自于一条缔度梯度上的5个省,从北到南相距1500公里,从北 部的暖溫带逐渐过渡到南部的亚热带。
[0035] (2)利用稳定同位素比例质谱法测得待检±样的5?值
[0036] (3)光谱采集
[0037] 在低径基石英玻璃上放置一个内径11mm的横截面为环形的不诱钢柱体,其对底部 射上来的白光无遮挡,将准确称取的200mg±样放置其内,再将一个重量为4g、直径也为 11mm的小瓶,轻轻放置在±样上,其可使样品厚度均一、有足够的装样深度、且不会压太紧 产生镜面反射。利用本发明自行设计并搭建的样品台,采集中红外波段的漫反射谱图,仪器 配置为:傅立叶变换红外光谱仪,附件为近红外积分球,白光光源,CaF2分束器,InGaAs检测 器;采集参数为:W金镜为背景,扫描范围10000-4000cm-i,分辨率4cnfi,扫描64次。
[0038] 关于采集装置的创新:一般大规模采集±样都有固定尺寸的自动进样装置,但其 会提高仪器价格和测试成本,且使用不够灵活。基于实用的角度,本发明自行设计并搭建了 ±壤样品漫反射的样品台,其目的主要是保持样品厚度均一、有足够的装样深度、且不会压 太紧产生镜面反射。
[0039] (4)数据预处理
[0040] 用仪器自带软件Omnic 8.2将原始谱图全部波段(即10000-4000(3111-1)进行大气背 景抑制,转成吸收光谱,再进行自动基线校正。将光谱数据导入软件matlab7.8后,用Norris (7,7,1)求导平滑法处理,括号中第一个7表示7点平滑,第二个7表示7点差分宽度,1表示一 阶导数。Norris求导平滑处理可W消除噪声,尽可能去除无关的信息变量。
[0041] ±壤样品近红外光谱的预处理,可W有效地减少系统偏差,噪声、颗粒度和波峰过 尖等的影响。在一些常见的光谱预处理方法中,基线校正主要是消除基线漂移;平滑处理主 要是消除噪声信息;导数处理(一阶求导或二阶求导)能有效消除基线偏移,减少峰与峰之 间的重叠,获取更多的有效信息;多元散射校正是为了消除固体颗粒大小、表面散射W及光 程变化对固体漫反射光谱的影响。
[0042] 不同种预处理方法的交叉使用对其相应的预测模型有不同的改进和影响,所W, 本文比较了 Norris-阶导数滤波平滑和Norris二阶导数滤波平滑的模型效果,也比较了加 多元散射校正和不加多元散射校正时Norris-阶导数滤波平滑的模型效果。
[0043] (5)采用偏最小二乘法建立±壤近红外光谱与51?值间的定量关系
[0044] 将±壤51化值也导入matlab软件中。用SPXY算法将试验样本按3:1的比例分别将光 谱信息和81?值划分为校正集和验证集,分别用于模型建立和验证。
[0045] 本发明关于样本集划分的创新点:建模时许多研究都围绕如何选取最佳的光谱预 处理方法,较少比较校正集和验证集的划分方法,但校正集和验证集样本的选择对光谱多 元分析校正至关重要。目前常用样本选择方法主要包括随机法(RS)和K-S化ennard-Stone) 法和SPXY(sample set partitioning based on joint x-y dis1:ance)法。随机法随机性 大,并不能保证所选出的样本有足够的代表性;K-S法将光谱差异大的样本选入校正集,其 余样本归入验证集,但是对于含量低或者浓度低的范围,样本之间光谱变化很小,往往选出 的样本也不具有代表性;SPXY算法是一种基于统计基础的样本集选择方法,用光谱-理化值 共生距离作为依据W保证最大程度表征样本分布,W提高模型稳定性。本发明基于Norris 一阶导数滤波平滑处理的光谱,比较了 SPXY法和K-S法所建模型的效果。
[0046] ①利用校正集中的单因变量(51?值)对多自变量(中红外光谱信息)进行偏最小二 乘(partial least squares method,化S)回归建模,其基本过程为:在光谱信息中提取主 成分tl(tl是光谱信息的线性组合),t 1应尽可能多地携带光谱数据中的变异信息,且tl和 81?值的相关程度能够达到最大。在第一个主成分tl被提取后,偏最小二乘回归实施光谱信 息对t 1的回归,如果回归方程已经达到满意的精度,则算法终止;否则,将利用光谱信息被 tl解释后的残余信息W及51?值被tl解释后的残余信息进行第二轮的主成分提取。如此往 复,直到能达到一个较满意的精度为止。若最终对光谱信息共提取了m个主成分tl,t2,…, tm,偏最小二乘回归将通过实施δ?化值对的回归,然后再表达成δ?化值关于原 变量(即光谱信息)的回归方程。
[0047]②在分析过程中,本发明用20折交互验证法选取最佳主成分数(即保证模型较好 精度所需的主成分的数量)。"20折法"的参数设置为:对某一主成分数f(依次从1取到20), 将校正集分成20组(一般是均分),一个单独的子样本被保留作为验证模型的数据,其他19 个样本用来训练。交互验证重复20次,每个子样本验证且只验证一次,平均20次的结果或者 使用其它结合方式,最终得到对应运一主成分数的交互验证均方根误差(RMSECV)dRMSECV 值越
小,说明模型的预测能力越好。一般使用RMSECV值对主成分数目作图的方法确立最佳 主成分数,RMSECV最低点对应的主成分数通常为最佳主成分数。
[004引③W校正集中的红外光谱作为自变量,通过偏最小二乘法提取尽可能多包含光谱 信息同时又与值紧密相关的一定数目的主成分(该数目由上述交互验证确定),WSUC 值为因变量,建立±壤中红外光谱与Si3C值间的校正模型。并将独立验证集的光谱信息代入 该模型计算Si 3C值,通过与验证集实测51?值比较,检验模型预测精度。
[0049]模型预测能力和稳定性由校正决定系数(R2)、交互验证均方根误差(RMSECV)和预 测相关系数(R)、预测均方根误差(MSEP)4个参数进行评价,好的模型应当具备两个系数高 和两个误差低的特点。此外,也可使用预测相对分析误差(Residual predictive deviation,RPD)对模型进行深入评价;当RPD值大于3时认为模型具有较好的预测能力,可 W进行指标的定量控制。模型建立好之后即可将未知、性质相似的±壤的红外信息代入该 模型中,计算出其51?值。
[0050]关于最佳主成分数的确定。并非按照传统方法选取RMSECV的最低点,而是逐一试 验,综合考虑4个参数(重点关注RMSEP值)。
[0051] 本发明采集栓皮栋森林±壤(来自不同地方和深度)的近红外光谱图,对原始数据 进行一系列预处理后,结合化学计量学中的PLSR,可准确、快速、简便、低成本地检测各种± 壤中的51化值。
[0052] 本发明的优点是:
[0053] (1)准确。校正决定系数R2和预测相关系数R均大于0.96,校正均方根误差和预测 均方根误差均小于1 .〇5,RPD大于3。
[0054] (2)快速。一个样品采集只需3min,一天可采集至少200张红外谱图,后续的数据处 理可在化内完成。
[0055] (3)操作简单。样品前处理简单,仪器操作简单。
[0056] (4)测试成本低。相比稳定同位素比例质谱仪,红外光谱仪价格便宜。
[0057] (5)普及性强,易于推广。仪器操作简单,价格相对便宜。
[005引(6)适用范围广,不仅可用于森林±壤的检测,也可用于农田、草原等其它生态系 统。
[0059] 实施例1包括Oe和Oa在内的±壤
[0060] (1)制备待检上样。将矿质层上壤去杂、风干、粉碎,过60目筛,干燥器保存备用;将 Oe和0曰层±壤于60°C烘4她W除尽水分,粉碎,过60目筛,干燥器保存备用。共199个样品来 自于屯个不同地区(平谷、洪崖山、白岸、皇藏略、信阳、黄山、云山)的栓皮栋森林中不同深 度(06、0曰、0-2、2-5、5-10、10-20畑1)的±壤样品,其中矿质层±壤139个,06和0曰层±壤共60 个。
[0061] 由表1采用多元散射校正预处理后光谱模型精度并未得到提高,证明样品制备得 较好,尽可能减小了颗粒散射效应对光谱采集造成的影响。
[0062] (2)利用稳定同位素比例质谱法测得待检±样的51化值。
[0063] (3)光谱采集。称取20〇111肖±样,置于11mm的横截面为环形的不诱钢柱体内,底部为 低径基石英玻璃,样品顶部压平。采集近红外波段的漫反射谱图,仪器配置为:傅立叶变换 红外光谱仪,附件为近红外积分球,白光光源,CaF2分束器,InGaAs检测器;采集参数为:W 金镜为背景,扫描范围10000-4000cm-i,分辨率4cm-i,扫描64次。W样地平谷为例,附图1显 示了 6个±壤深度的近红外谱图。
[0064] (4)数据预处理。用仪器自带软件Omnic 8.2将原始谱图全部波段(即10000-4000cnfi)进行大气背景抑制,转成吸收光谱,再进行自动基线校正。将199个样本的光谱数 据导入软件matlab?.8后,用Norris法进行7点平滑、一阶导数等处理。
[0065] 该实施例对±壤样品的近红外光谱尝试了 4种常见的预处理:① Norris-阶导数 滤波平滑+SPXY法划分校正集和验证集;②多元散射校正+Norris-阶导数滤波平滑+SPXY 法划分校正集和验证集;③Norris二阶导数滤波平滑+SPXY法划分校正集和验证集;④ Norris-阶导数滤波平滑+K-S法划分校正集和验证集,再应用偏最小二乘(PLS)法建立± 壤值的定量估测模型。结果(表1)显示,不同预处理方法对所建±壤51 3(:值估测模型的 预测精度有一定影响,W本专利所采用的预处理方法(Norris-阶导数滤波平滑+SPXY法划 分校正集和验证集)的光谱建模精度最高。
[0066] 表1本模型预处理方法与偏最小二乘模型常见处理方法预测±壤51化(包括Oe和 Oa)的精度比较
[0067]
[0068] (5)采用偏最小二乘法建立±壤近红外光谱与51化值间的定量关系。将对应的199 个±壤51化值也导入matlab软件中。用SPXY算法将试验样本按3:1的比例分别将光谱信息和 值划分为校正集和验证集,校正集含150个样本,验证集含49个样本。采用偏最小二乘 法,用20折交互验证法选取最佳主成分数为11,RMSECV值对主成分数目作图见附图2。在全 波谱范围内用训练集建立±壤近红外光谱与δ?化值间的回归模型,并将独立验证集的光谱 信息代入该模型计算值,通过与验证集实测值比较,检验模型预测精度。校正决定 系数(R 2)为0.9684,交互验证均方根误差(RMSECV)为0.9311;预测相关系数(R)为0.9631 (附图3),预测均方根误差(RMSEP)为0.5965。预测相对分析误差(RPD)为3.74。
[0069] 注意:由附图2可见,主成分数为12时,互验证均方根误差(RMSECV)最小,为 0.9276;但相应的预测相关系数(R)为0.9536、预测均方根误差(RMSEP)为0.6691。而本发明 经过主成分数从1到20的逐一试验,综合考虑选取11为最佳主成分数,它的RMSECV在所有主 成分中排名倒数第二,仅比12大,为0.9311;但相应的R为0.9631,在所有主成分中为最大, 而RMSEP为0.5965,在所有主成分中为最小。
[0070] 该结果表明,该方法适合于森林±壤不同深度(0e、0a、0-2cm、2-5cm、5-10cm、10-20cm)中5?值的检测,可在较短时间内快速检测±壤51 3(:值,而且能达到满意的检测精度。 同时,Norris-阶导数滤波平滑和SPXY法划分数据集等预处理方法W及在化S建模中如何 选取最佳主成分数都对利用近红外漫反射技术无损定量检测±壤81 3(:起重要作用。试验模 型中的近200个样本来自跨越两个气候带和五个省份的栓皮栋森林±壤,不同的气候条件 和±壤性质均会对光谱产生影响。但正是在运样的复杂条件下建立的模型才有更广的适用 范围,因此,基于偏最小二乘法的近红外光谱技术是适合±壤81 3(:检测的高效检测技术。
[0071] 实施例2不包括Oe和Oa在内的矿质层±壤
[0072] (1)制备待检上样。将矿质层上壤去杂、风干、粉碎,过60目筛,干燥器保存备用。共 139个样品来自于屯个不同地区(平谷、洪崖山、白岸、皇藏略、信阳、黄山、云山)的栓皮栋森 林中不同深度(0-2、2-5、5-10、10-20(3111)的矿质层±壤样品。
[0073] 由表2采用多元散射校正预处理后光
谱模型精度并未得到提高,证明样品制备得 较好,尽可能减小了颗粒散射效应对光谱采集造成的影响。
[0074] (2)利用稳定同位素比例质谱法测得待检±样的5?值。
[0075] (3)光谱采集。称取20〇111肖±样,置于11mm的横截面为环形的不诱钢柱体内,底部为 低径基石英玻璃,样品顶部压平。采集近红外波段的漫反射谱图,仪器配置为:傅立叶变换 红外光谱仪,附件为近红外积分球,白光光源,CaF2分束器,InGaAs检测器;采集参数为:W 金镜为背景,扫描范围10000-4000cm-i,分辨率4cm-i,扫描64次。W样地平谷为例,附图1显 示了 4个±壤深度的近红外谱图。
[0076] (4)数据预处理。用仪器自带软件Omnic 8.2将原始谱图全部波段(即10000-4000cnfi)进行大气背景抑制,转成吸收光谱,再进行自动基线校正。将139个样本的光谱数 据导入软件matlab?.8后,用Norris法进行7点平滑、一阶导数等处理。
[0077] 该实施例对±壤样品的近红外光谱尝试了 4种常见的预处理:① Norris-阶导数 滤波平滑+SPXY法划分校正集和验证集、②多元散射校正+Norris-阶导数滤波平滑+SPXY 法划分校正集和验证集、③Norris二阶导数滤波平滑+SPXY法划分校正集和验证集、④ Norris-阶导数滤波平滑+K-S法划分校正集和验证集,再应用偏最小二乘(PLS)法建立± 壤值的定量估测模型。结果(表2)显示,不同预处理方法对所建±壤51 3(:值估测模型的 预测精度有一定影响,W本专利所采用的预处理方法(Norris-阶导数滤波平滑+SPXY法划 分校正集和验证集)的光谱建模精度最高。
[0078] 表2本模型预处理方法与偏最小二乘模型常见处理方法预测±壤51化(不包括Oe 和Oa)的精度比较
[0079]
[0080] (5)采用偏最小二乘法建立±壤近红外光谱与δ?化值间的定量关系。将对应的139 个±壤51化值也导入matlab软件中。用SPXY算法将试验样本按3:1的比例分别将光谱信息和 81化值划分为校正集和验证集,校正集含105个样本,验证集含34个样本。采用偏最小二乘 法,用20折交互验证法选取最佳主成分数为12,RMSECV值对主成分数目作图见附图4。在全 波谱范围内用校正集建立±壤近红外光谱与δ?化值间的回归模型,并将独立验证集的光谱 信息代入该模型计算81化值,通过与验证集实测51化值比较,检验模型预测精度。校正决定 系数(R 2)为0.9866,交互验证均方根误差(RMSECV)为1.0213;预测相关系数(R)为0.9753 (附图5),预测均方根误差(RMSEP)为0.5705。预测相对分析误差(RPD)为4.38。
[0081 ] 该结果表明,该方法适合于不同深度(0-2畑1、2-5畑1、5-10畑1、10-20畑1)的森林±壤 中81?值的检测,可在较短时间内快速检测±壤51化值,而且能达到满意的检测精度。本发 明通过自制的样品台采集了近红外波段建模,取得了非常好的效果。同时,Norris-阶导数 滤波平滑和SPXY法划分数据集等预处理方法W及在化S建模中如何选取最佳主成分数都对 利用近红外漫反射技术无损定量检测±壤81 3(:起重要作用。试验模型中的139个样本来自跨 越两个气候带和五个省份的栓皮栋森林±壤,不同的气候条件和±壤性质均会对光谱产生 影响。但正是在运样的复杂条件下建立的模型才有更广的适用范围,因此,基于偏最小二乘 法的近红外光谱技术是适合±壤81 3(:检测的高效检测技术。
[0082] W上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无 需创造性劳动就可W根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术 人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可W得到的 技术方案,皆应在由权利要求书所确定的保护范围内。
【主权项】
1. 一种利用近红外光谱检测土壤的稳定碳同位素比值的方法,其特征在于,所述方法 包括如下步骤: 1) 测得多个定标土壤样品的稳定碳同位素比值; 2) 采集定标土壤样品的近红外波段的漫反射谱图,得到原始谱图; 3) 将原始谱图进行平滑预处理,得到处理后谱图; 4) 采用偏最小二乘法建立定标土壤样品的处理后谱图与稳定碳同位素比值间的定量 关系t吴型; 5) 采集待测土壤样品的近红外波段的漫反射谱图,根据定量关系模型计算待测土壤样 品的稳定碳同位素比值。2. 如权利要求1所述的方法,其特征在于,在所述步骤1)中,测得定标土壤样品的稳定 碳同位素比值的方法为稳定同位素比例质谱法。3. 如权利要求1所述的方法,其特征在于,在所述步骤1)中,制备定标土壤样品的具体 步骤包括:将土样除水后,磨细,过60目筛。4. 如权利要求1所述的方法,其特征在于,在所述步骤1)中,所述的多个定标土壤样品 包括Oe和Oa层土壤的样品。5. 如权利要求1所述的方法,其特征在于,在所述步骤3)中,将原始谱图进行平滑预处 理的具体步骤包括:大气背景抑制,吸光度转换,自动基线校正和Norris-阶导数滤波平滑 处理。6. 如权利要求1所述的方法,其特征在于,在所述步骤4)中,建立定量关系模型的具体 步骤包括:用SPXY法分别将光谱信息和稳定碳同位素比值划分为校正集和验证集;采用偏 最小二乘法,在校正集光谱信息中提取主成分,并用20折交互验证法选取最佳主成分数,以 校正集的光谱信息为自变量,以校正集稳定碳同位素比值为因变量,建立回归模型;并利用 验证集检验回归模型的精度。7. 如权利要求6所述的方法,其特征在于,校正集和验证集的样本数的比例为3:1。8. 如权利要求6所述的方法,其特征在于,所述的20折交互验证法的具体步骤包括:将 主成分数f依次从1取值到20,对于取定的一个主成分数,将校正集分成20个子集,每个子集 数据分别用于做一次验证,同时其他19个子集数据用于训练,交叉验证重复20次,平均20次 的结果,最终得到一个对应所述主成分数的交互验证均方根误差。9. 如权利要求6所述的方法,其特征在于,用验证集检验校正模型的精度的具体步骤包 括:用校正决定系数、交互验证均方根误差和预测相关系数、预测均方根误差四个参数对校 正模型进行评价。10. 如权利要求1所述的方法,其特征在于,在所述步骤1)中,制备待测土壤样品的具体 步骤包括:将土样除水后,磨细,过60目筛。
【专利摘要】本发明提供了一种利用近红外光谱检测土壤的稳定碳同位素比值的方法,所述方法包括如下步骤:1)测得多个定标土壤样品的稳定碳同位素比值;2)采集定标土壤样品的近红外波段的漫反射谱图,得到原始谱图;3)将原始谱图进行平滑预处理,得到处理后谱图;4)采用偏最小二乘法建立定标土壤样品的处理后谱图与稳定碳同位素比值间的定量关系模型;5)采集待测土壤样品的近红外波段的漫反射谱图,根据定量关系模型计算待测土壤样品的稳定碳同位素比值。本发明提供的方法可以利用近红外谱快速检测土壤稳定碳同位素比值。
【IPC分类】G01N21/3563, G01N21/359
【公开号】CN105486663
【申请号】CN201610113351
【发明人】喻文娟, 王瑞斌, 康宏樟, 刘星, 张莉, 刘玉敏, 吴玉森
【申请人】上海交通大学
【公开日】2016年4月13日
【申请日】2016年2月29日