发明内容
本发明的目的是:提供一种定量分析时间短,成本低,液体样本定量分析精度高的液态物质光谱基线校正定量分析方法。
本发明的目的是这样实现的:
一种液态物质光谱基线校正定量分析方法,步骤如下:
(1)数据采集:
A.选用红外光谱仪:选用美国美国赛默飞公司,型号:NEX-670x;德国布鲁克公司vertex70;日本岛津公司IRAffinity—1型中的任一种;
B.参数设置:波数:4000-650cm-1;分辨率:8cm-1;重复扫描次数16次;
C.测试无样本时的红外光谱:用重蒸馏水冲洗附件实验板上的锗化锌晶体;用99.7%乙醇擦拭干净;实验板置于800瓦烘干灯下;干燥、冷却;将试验板放置到红外光谱仪测试室,点击内置有测试软件的红外光谱仪的“collect sample”按钮,检测无样本时的红外光谱;
D.测试样本红外光谱:用一次性吸管吸取少量样本,均匀涂抹在锗化锌晶体上,将试验板放置在红外光谱仪的指定位置,点击内置有测试软件的红外光谱仪的“collect sample”按钮,进行检测;仪器软件将测到的背景噪声自动减去;
E.每个样本检测后,保存数据;
F.将试验板从仪器中取出,重复蒸馏水冲洗-无水乙醇擦拭-烘干-涂抹样本-测试步骤;
(2)光谱基线校正:
A.利用优化约束模型求出线性表示系数;
B.利用线性表示系数得到不含基线的光谱,实现对光谱的校正;
(3)建立模型:利用偏最小二乘将已知浓度的样本作为训练样本,得定量分析模型;
(4)定量分析:将未知浓度样本送入模型,计算后得到定量分析结果。
本发明的要点在于:
利用已知浓度的样本作为训练集,求取字典;利用优化约束模型求出线性表示系数;利用线性表示系数得到不含基线的光谱,实现对光谱的校正;选取校正后光谱作为定量分析模型的训练样本,利用偏最小二乘建立定量分析模型,实现对未知浓度的样本进行鉴定。
上述所述的将已知浓度的样本作为训练集需要首先用三次样条差值求出光滑曲线,定量分析模型实质是一组系数。
本发明的实施为以下步骤:
1.数据采集阶段:包括选用仪器;设置参数:波数:4000-650cm-1;分辨率:8cm-1;重复扫描次数16次。采集过程分为两步,第一步测试无样本时的光谱数据,这是背景噪声,需要从样本数据中减去。第二步放置样本进行测量。
一个样本检测完之后,保存数据。将试验板从仪器中取出,重复蒸馏水冲洗-无水乙醇擦拭-烘干-涂抹样本-测试几个步骤。在不更改实验参数的条件下,背景噪声的测量只需要在试验开始时检测一次即可。
2.光谱基线校正阶段,包括以下步骤:
(1)选择光谱信号S0上的极小值点;
(2)利用三次样条差值,将这些极小值点链接为光滑的曲线记为B;
(3)将原始光谱S0减去光滑的曲线B,得到的曲线记为S;
(4)利用得到的曲线S和B分别训练字典DS和DB;
(5)对于观测光谱Y求解以下优化模型:
(6)求得αS和αB,于是校正后的光谱为YC=DSαS;
其中γ
S和γ
B是正则化常数,α
S和α
B是线性表示系数,|| ||
2,|| ||
1分别为向量的2范数和1范数。对于长为n的向量X,
min表示求最小值。
3.建立定量模型:利用偏最小二乘(PLS)将已知浓度的样本作为训练样本,得到定量分析模型。
4.定量分析:将未知浓度样本送入模型,计算后得到定量分析结果。
本发明中:
三次样条差值:假设给定了数据,a=x0<x1<L<xn=b,构造一个函数s(x),满足:
s(x),s′(x),s″(x)在[a,b]上连续,s(x)的每一个子区间[xi-1,xi](i=1,2,L,n)上是不超过三次的多项式,即s(x)=a+bx+cx2+dx3,s(xi)=yi(i=1,2,L,n),其中′和″分别表示一阶和二阶导数。
令Mi=s″(xi),由于在区间[xi-1,xi]上,s″(x)是以此多项式,假设
Mi=s″(xi),Mi-1=s″(xi-1)
于是
x∈[x
i-1,x
i],连续积分两次,利用s(x
i)=y
i,s(x
i-1)=y
i-1可得:
x∈[xi-1,xi],hi=xi-xi-1,i=1,2,L,n
s'(xi)的连续性可得方程组:
μiMi-1+2Mi+λiMi+1=gi,(i=1,2,L,n-1)
其中:
假定s′(x0)=y0,s′(xn)=yn可得:
得到方程:
其中
根据已有的数据求出λ
i,μ
i,g
i由上述方程求出s″(x)在x
i上的值M
i,就可以求出s(x)在各个子区间上的表达式,即可得到光滑的曲线。
优化模型的求解:对于观测光谱Y求解以下优化模型:
求解过程是这样的:
(1)令γ=γS=γB,D=[DS,DB],α=[αS,αB]T,模型变为
(2)定义α+和α-分别表示向量α中的正值和负值,于是模型可以变形为:
s.t. α+≥0,α-≥0
其中1表示全1向量,T表示求转置。做变换令z=[α+;α-],c=γ1+[-DY;DY],
可以变为:
minQ(z)=cTz+zTBz s.t. z≥0
(4)根据梯度下降法,参数z更新规则为:其中z(k)表示第k次迭代时z的值,其中α(k)表示第k次迭代时α的值;
而α这样确定:
其中
偏最小二乘定量模型的建立:使用的鉴定模型是基于偏最小二乘(PLS)的定量模型。其基本原理是:
(1)假设有两个数据集E0,F0,要建立两者之间的回归模型,其原理是分别提取两者的主成分并,满足以下模型:
其中max表示求最大值,
分别表示求向量w
1,c
1的2范数,数据集E
0是校正之后的光谱数据,F
0是样本中物质的浓度
(2)拉格朗日算法:
于是:2λ1=2λ2=w′1E′0F0c1=<E0w1,F0c1>,记θ1=2λ1=2λ2=w′1E′0F0c1
E′0F0c1=θ1w1
F′0E0w1=θ1c1
(3)求w1和c1得到主成分:t1=E0w1,u1=F0c1,求E0,F0对t1,u1的回归方程:
E0=t1p′1+E1
F0=t1r1′+F1
(4)利用残差矩阵E1,F1分别取代E0,F0,求第二个轴w2,c2,得到第二个主成分t2,u2如此迭代下去,则:
E0=t1p′1+L+tAp′A,F0=t1r1′+L+tAr′A+FA
由于t1,L,tA可以表示为矩阵E0中列向量的线性组合,以上等式可以表示为关于的回归方程形式,即:k=1,2,L,q这样就完成了建模。
模型建立后,对于需要鉴定的光谱信号,利用光谱基线校正阶段叙述的校正方法进行校正,之后将校正后的光谱送入第三步建立好的模型,通过计算即可得到鉴定结果。
本发明与国内外现有同类技术相比,其创造性在于以下几点:
1.是一种新的基于优化模型求解的光谱定量分析算法;
2.能自动地实现光谱信号的基线校正;
3.不需要设置算法参数。
本发明与国内外现有技术的不同点在于:
1.是一种结合信号处理的定量分析方法;
2.利用字典DS和DB中向量的线性组合来逼近观测到的光谱Y。
本发明的优点是:
1.液态物质定量分析不需要复杂的样本预处理;
2.测试成本低,不需要高昂的测试费用;
3.测试速度快,适合在线检测;
4.定量分析结果准确,可靠。