基于小波变换的质谱基线校正算法研究

上一篇

下一篇

罗勇, 于佳佳, 周旭, 薛兵, 金永星, 唐朝阳. 基于小波变换的质谱基线校正算法研究[J]. 真空科学与技术学报, 2023, 43(12): 1064-1071. doi: 10.13922/j.cnki.cjvst.202308010
引用本文: 罗勇, 于佳佳, 周旭, 薛兵, 金永星, 唐朝阳. 基于小波变换的质谱基线校正算法研究[J]. 真空科学与技术学报, 2023, 43(12): 1064-1071. doi: 10.13922/j.cnki.cjvst.202308010
Yong LUO, Jiajia YU, Xu ZHOU, Bing XUE, Yongxing JIN, Chaoyang TANG. Baseline Correction Algorithm for Mass Spectrometry Based on Wavelet Transform[J]. zkkxyjsxb, 2023, 43(12): 1064-1071. doi: 10.13922/j.cnki.cjvst.202308010
Citation: Yong LUO, Jiajia YU, Xu ZHOU, Bing XUE, Yongxing JIN, Chaoyang TANG. Baseline Correction Algorithm for Mass Spectrometry Based on Wavelet Transform[J]. zkkxyjsxb, 2023, 43(12): 1064-1071. doi: 10.13922/j.cnki.cjvst.202308010

基于小波变换的质谱基线校正算法研究

    通讯作者: E-mail: 1355123148@qq.com
  • 中图分类号: O657.63

Baseline Correction Algorithm for Mass Spectrometry Based on Wavelet Transform

    Corresponding author: Yong LUO, 1355123148@qq.com
  • MSC: O657.63

  • 摘要: 质谱仪是广泛应用于生命科学、食品安全、环境监测、工业分析、国家安全等领域的精密测量仪器。数据处理是影响质谱分析结果的关键环节,为了降低质谱仪数据采集过程中基线漂移,文章提出了一种基于小波变换的质谱基线校正算法。首先对原始质谱信号多次进行单层小波分解,同时进行单层小波重构,计算得每层的信噪比并通过信噪比比对法获得降噪后的质谱信号。接着对该信号进行多次单层小波分解,得到每层小波细节和小波近似的频率,将两个频率相除得到比值,比较每层的比值大小并选择最大比值所在层作为小波分解的最佳层数,最后将小波分解最佳层数下的小波近似系数置零后进行小波重构,获得基线校正后的质谱信号。通过实验验证发现,该算法可准确得出小波分解的最佳层数,在大幅保留真实质谱信号的基础上去除低频质谱基线以及高频噪声的干扰,质谱基线校正充分,实际应用效果明显。
  • 加载中
  • 图 1  质谱仪硬件连接框图

    Figure 1.  Mass spectrometer hardware connection

    图 2  小波分解过程

    Figure 2.  Wavelet decomposition

    图 3  算法流程图

    Figure 3.  Algorithm flow

    图 4  基线校正结果(组1)。(a)多项式拟合法,(b)移动平均法,(c)小波包变换法,(d)本文算法

    Figure 4.  Baseline correction results (Group 1). (a) Polynomial fitting, (b) moving average, (c) wavelet packet transform, (d) algorithm in this article

    图 5  基线校正结果(组2)。(a)多项式拟合法,(b)移动平均法,(c)小波包变换法,(d)本文算法

    Figure 5.  Baseline correction results (Group 2). (a) Polynomial fitting, (b) moving average, (c) wavelet packet transform, (d) algorithm in this article

    图 6  基线校正结果(组3)。(a)多项式拟合法,(b)移动平均法,(c)小波包变换法,(d)本文算法

    Figure 6.  Baseline correction results (Group 3). (a) Polynomial fitting, (b) moving average, (c) wavelet packet transform, (d) algorithm in this article

    表 1  小波基函数属性

    Table 1.  Wavelet basis function properties

    HarrdbNsymNcoifN
    正交性
    双正交性
    紧支撑性
    支撑长度12N-12N-16N-1
    对称性对称不对称近似对称近似对称
    正则性
    消失矩1NN2N
    下载: 导出CSV

    表 2  各算法基线校正结果(组1)

    Table 2.  Baseline correction results of each algorithm (Group 1)

    S/N(增量)RMSEposV-max(增量)time/msspace/Mb
    原始信号856.67/32.083273//
    多项式拟合法1207.35(40.94%)20.8132.083127(−10.27%)1080.2
    移动平均法1613.12(88.30%)127.6232.042142(−34.56%)1690.3
    小波包变换法2424.95(183.07%)23.9432.083101(−5.26%)8800.8
    本文算法2200.44(156.86%)23.3132.083110(−4.98%)4010.5
    下载: 导出CSV

    表 3  各算法基线校正结果(组2)

    Table 3.  Baseline correction results of each algorithm (Group 2)

    S/N(增量)RMSEposV-max(增量)time/msspace/Mb
    原始信号901.12/17.364165//
    多项式拟合法1083.60(20.25%)42.1217.323776(−9.36%)2030.3
    移动平均法1063.32(18.0%)208.8217.522598(−37.62%)2180.4
    小波包变换法2189.72(143%)108.3717.363303(−20.69%)9970.9
    本文算法2582.07(186.54%)38.2717.364000(−3.96%)5040.6
    下载: 导出CSV

    表 4  各算法基线校正结果(组3)

    Table 4.  Baseline correction results of each algorithm (Group 3)

    S/N(增量)RMSEposV-max(增量)time/msspace/Mb
    原始信号856.67/17.962082//
    多项式拟合法1207.35(40.94%)20.8117.801888(−9.32%)910.4
    移动平均法1613.12(88.30%)127.6217.901299(−37.61%)1040.4
    小波包变换法2424.95(183.07%)23.9417.941651(−20.70%)7500.7
    本文算法2200.44(156.86%)23.3117.962010(−3.46%)3800.6
    下载: 导出CSV
  • [1] Xu Z, Wang Y. Mass spectrometer[M]. Beijing: China Machine Press, 1995徐贞林, 汪曣. 质谱仪器[M]. 北京: 机械工业出版社, 1995(in chinese
    [2] 克里斯蒂安·霍夫德·利兰, 特里格夫·阿尔莫伊, 比约恩-赫尔格·梅维克. 光谱多元校正中基线校正的最佳选择[J]. 应用光谱学, 2010, 64(9): 1007-1016(in chinese) Kristian H L, Trygve A, Bjørn-Helge M. Optimal choice of baseline correction for multivariate calibration of spectra[J]. Applied spectroscopy, 2010, 64(9):1007-1016
    [3] 莫尔哈克, 克里曼, 马图谢克, 等. 多维复合γ射线光谱的背景消除方法[J]. 物理研究中的核仪器与方法,1997,401(1):113−132(in chinese) Morháč M, Kliman J, Matoušek V, et al. Background elimination methods for multidimensional coincidence γ-ray spectra[J]. Nuclear Instruments & Methods in Physics Research,1997,401(1):113−132
    [4] 甘峰, 阮贵华, 莫金垣. 基于自动阈值的多项式拟合基线校正[J]. 化学计量与智能实验系统,2006,82(1-2):59−65(in chinese) Gan F, Ruan G, Mo J. Baseline correction by improved iterative polynomial fitting with automatic threshold[J]. Chemometrics & Intelligent Laboratory Systems,2006,82(1-2):59−65
    [5] 白柱俊, 派克艾伦, 沈爱国, 等. 一种基于线性规划的拉曼光谱背景消除方法[J]. 拉曼光谱,2011,42(11):1987−1993(in chinese) doi: 10.1002/jrs.2957 Baek S J, Park A, Shen A, et al. A background elimination method based on linear programming for raman spectra[J]. Journal of Raman Spectroscopy,2011,42(11):1987−1993 doi: 10.1002/jrs.2957
    [6] 史健婷, 王建才. 一种基于自适应滤波和小波的基线漂移校正的新型方法[J]. 信息技术研究,2018,11(3):119−134(in chinese) doi: 10.4018/JITR.2018070109 Shi J, Wang J. A new method of adaptive filtering and wavelet transform to filter baseline shift[J]. Journal of Information Technology Research,2018,11(3):119−134 doi: 10.4018/JITR.2018070109
    [7] 薛兵. 数字离子阱质谱仪及新型离子激发方法的研究[D]. 上海大学, 2016(in chinese) Xue B. Research on digital ion trap mass spectrometer and novel ion excitation methods[D]. Shanghai University, 2016
    [8] 李庆波, 徐玉坡, 李响,等. 一种改进的小波基线校正方法的研究[J]. 光电子·激光, 2009(5):4(in chinese) Li Q, Xu Y, Li X, et al. Research on an improved wavelet baseline correction method[J]. Photoelectron Laser, 2009(5): 4
    [9] 沈再阳​​​​​​. 精通MATLAB信号处理 [M]. 北京: 清华大学出版社, 2015(in chinese) Shen Z. Proficient in matlab signal processing[M]. Beijing: Tsinghua University Press, 2015
    [10] Feng A, Qiu J, Zheng Y, et al. Simulation analysis of mind evolutionary algorithm optimizing wavelet packet denoising[J]. Computer Simulation, 2020, 37(7):6冯安安, 岳建海, 郑义,等. 思维进化算法优化小波包去噪仿真分析[J]. 计算机仿真, 2020, 37(7):6(in chinese Feng A, Qiu J, Zheng Y, et al. Simulation analysis of mind evolutionary algorithm optimizing wavelet packet denoising[J]. Computer Simulation, 2020, 37(7):6冯安安, 岳建海, 郑义,等. 思维进化算法优化小波包去噪仿真分析[J]. 计算机仿真, 2020, 37(7):6(in chinese)
  • 加载中
图( 6) 表( 4)
计量
  • 文章访问数:  181
  • HTML全文浏览数:  181
  • PDF下载数:  1
  • 施引文献:  0
出版历程
  • 收稿日期:  2023-08-09
  • 刊出日期:  2023-12-31

基于小波变换的质谱基线校正算法研究

    通讯作者: E-mail: 1355123148@qq.com
  • 上海裕达实业有限公司 上海 200240

摘要: 质谱仪是广泛应用于生命科学、食品安全、环境监测、工业分析、国家安全等领域的精密测量仪器。数据处理是影响质谱分析结果的关键环节,为了降低质谱仪数据采集过程中基线漂移,文章提出了一种基于小波变换的质谱基线校正算法。首先对原始质谱信号多次进行单层小波分解,同时进行单层小波重构,计算得每层的信噪比并通过信噪比比对法获得降噪后的质谱信号。接着对该信号进行多次单层小波分解,得到每层小波细节和小波近似的频率,将两个频率相除得到比值,比较每层的比值大小并选择最大比值所在层作为小波分解的最佳层数,最后将小波分解最佳层数下的小波近似系数置零后进行小波重构,获得基线校正后的质谱信号。通过实验验证发现,该算法可准确得出小波分解的最佳层数,在大幅保留真实质谱信号的基础上去除低频质谱基线以及高频噪声的干扰,质谱基线校正充分,实际应用效果明显。

English Abstract

  • 质谱仪的原理是将被分析物离子化后,根据不同质荷比的离子碎片在质量分析器中的不同表现实现离子分离,进而测得不同离子数目最终得到质谱图。质谱仪具有定性定量分析能力强、检出限低的特性,近年来在各大领域应用越来越广,检测需求不断提升,同时对质谱仪的性能提出了更高的要求[1]。在实际应用场景中,仪器元器件老化、温漂、内部高频高压等电控模块干扰和质谱仪实际工作环境干扰等因素导致测得的质谱数据受基线漂移的影响,进而影响质谱分析结果的准确性和精确度。因此,基线校正是质谱仪数据处理中的关键部分,得到了越来越多的关注和研究。人们已经提出了大量基线校正方法来识别和降低基线干扰,传统基线校正算法主要包括多项式拟合法、移动平均法、小波变换法等[2]。许多学者在这些算法基础上提出了新的思路,Morháč等[3]提出了一种非线性迭代去除峰值方法,该方法计算速度快但只能处理简单的基线。Gan等[4]提出了一种具有自动阈值的迭代多项式拟合方法,但也存在与其他多项式拟合方法[5]类似的问题,当多项式的阶数选取不当时,基线校正效果并不理想。还有一些研究尝试采用小波包变换来拟合基线[6],但是由于小波分析中难以避免的小波基选择、分解层数选择、阈值及阈值函数选择等复杂问题,他们也无法将基线在小波变换域中与质谱真实信号准确分离。为此,本文提出一种可定量的小波分解最佳层数计算方法,基于此方法进行小波变换实现质谱信号基线校正。

    • 本文所用仪器为上海裕达实业有限公司研发的数字离子阱质谱仪ASV MS5201。该质谱仪主要由进样系统、离子源、聚焦传输系统、离子阱质量分析器、离子检测系统、仪器电控组件和数据分析系统等部分组成,真空系统由涡旋泵和分子泵组成。硬件连接框图如图1所示。

      其中,仪器电控组件由主控板、高频高压模块、偶极激发模块和直流放大模块等组成。主控板基于可编程逻辑阵列技术,用于精确的控制系统时序、提供电压信号以及与其他模块进行信息交互。高频高压模块为离子阱极片提供离子捕获波形,偶极激发模块将主控板产生的偶极激发信号和高频高压模块产生的高频高压波形进行耦合来驱动离子阱。直流放大模块输出的直流电压驱动透镜系统极片及离子阱的前端盖和后端盖。探测器产生的电流信号经过小信号放大板的滤波、电流-电压转换、放大后传输到主控板的高速AD采集模块[7],经上位机软件处理后得到质谱图。

      理想状态下,该质谱信号不含低频项。对此理想信号实施快速傅里叶变换,即可获得理想的质谱分析数据。然而实际应用中采集得到的质谱信号会难以避免的含有低频基线信号,导致得到的实际信号与理想信号偏差较大,迫切需要对现实质谱数据实施基线校正,从而得到理想质谱分析结果。

    • 小波变换是一种基于傅里叶变换的时频域信号分析工具。由于小波变换具有强大的多分辨率分析能力和有效去噪能力,常被用于处理质谱数据中的质谱信号和基线信号。某些条件下,将原始函数进行缩放或平移即可得到一个函数族:

      式中,$a$表示缩放变量,$b$表示平移变量,$\varphi (t)$表示小波基。

      若用${W_f}(m,n)$表示信号函数$f(t)$的离散小波变换,则有:

      式中,${a_0} > 1$$m \in Z$${b_0} \in R$$n \in Z$$m$$n$均为离散量。

    • 被分析信号的时频局部化分析过程中,它的频率窗和时间窗都能不断变化,具有较强的自适应性。图2为被分析信号X的小波分解完整过程。

      上图中当原始信号X执行一层小波分解时,可以得到cA1及cD1,分别表示小波近似值及小波细节值;继续将cA1分解到第二层时,可以得到cA2和cD2。经过若干层小波分解,可得到更多层的小波近似值及小波细节值。其中,小波近似值可代表信号X的低频部分,小波细节值代表信号X的高频部分。随着分解层数的增加,信号频率变得更低,小波近似值变得更小。然而由于离散信号的点数有限,小波分解最大层数N必须满足信号离散点数大于等于2N的条件。在质谱分析过程中,我们发现有用信号主要集中在高频区间,而干扰信号通常分布于低频部分,因此在处理时将所有低频部分的小波系数置零即可去除质谱信号中的基线干扰。

    • 小波变换中使用的小波基函数具有不唯一性,小波基的选择是小波分析的关键环节之一。以下为几种常见的小波基函数。

      (1)Harr小波

      Harr小波的定义如下:

      Harr小波是 Harr A提出的一个具有紧支撑的正交小波函数,同时也是最简单的一个函数[8]

      (2)Daubechies (dbN)小波

      Daubechies(dbN)小波函数是由Ingrid Daubechies在对尺度取2的整数幂条件下的小波变换深入研究提出的小波函数[9]。Daubechies小波可以简写为dbN,其中N为小波的阶数。dbN也具备紧支撑正交特性,但是,dbN(N≠1)不具备对称性的特征,也无显示表达式。

      (3)SymletA(symN)小波

      SymletA小波函数是db小波函数的一种改进,具有近似对称性、紧支撑性及双正交性。SymletA函数一般表示为symN,其中N=2,3,4,5,6,7,8[9]

      (4)Coiflet (coifN)小波系

      Coiflet小波基具有紧支撑正交特性,是由Daubechies构造的小波函数,函数有coifN (N=1, 2, 3, 4, 5)这一系列,Coiflet小波基比dbN小波基对称性更好,而且coifN与db3N、sym3N具有相同的支撑长度,与db2N、sym2N具有相同的消失矩数目[9]

      小波基函数的主要属性有正交性、紧支撑性、对称性、正则性及高阶消失矩等,上述四种小波基函数的属性如表1所示。

      实际小波分析中小波基的选择并没有固定的准则,通常按照被分析信号的特征以及小波基函数本身的属性来进行选取[10]。为了使分解后的能量更加集中,本文选择消失矩最大(2N)的coifN小波基作为本文小波变换的基函数。

    • 质谱信号小波分解过程中使用的分解层数是影响质谱基线校正效果的又一重要因素。若分解层数选取过大,将无法达到基线校正效果;若分解层数选取过小,将一并去除有用质谱信号,造成质谱信号失真,并且无法使用小波重构获取真实的质谱信息。以往分解层数大多是依据经验值而来,无法达到最佳的基线校正效果,由此本文提出了可准确计算最佳分解层数的方法,基于此层数进行小波分解与重构实现质谱基线校正。

    • 本文提出的基于小波变换的质谱基线校正算法流程如图3所示,主要步骤如下:

      步骤1:选用coifN小波基作为小波变换的基函数,对原始质谱信号S单层小波分解,重构小波近似值和小波细节值,计算重构质谱信号的信噪比记为SNR1

      步骤2:将原始质谱信号S小波分解至第二层,重构分解后得到的小波近似值和小波细节值,计算重构的质谱信号的信噪比记为SNR2。将SNR1SNR2进行比较,若SNR1SNR2大,则进入下一步骤,否则继续实施三层小波分解,求得重构信号信噪比SNR3,与SNR2进行比较,若SNR2SNR3大,则进入下一步骤,否则继续实施四层小波分解,直至进入下一步骤。

      步骤3:若第i次分解时发现最大信噪比SNRi,停止流程,i即为质谱信号小波最佳分解层数。然后对原始质谱信号S实施i层小波分解并重构,得到除噪后的质谱信号T

      步骤4:若质谱信号T的离散点数为m,则小波分解最大层数Nm间存在关系:$m \geqslant {2^N}$

      步骤5:将除噪后的质谱信号T完全分解,计算每层分解的小波近似值$c{A_n}(n = 1,2, \cdots N)$和小波细节值$c{D_n}(n = 1,2, \cdots N)$的能量。将两个频率之和$F{d_n}$作为小波细节频率,即:

      式中,$l{d_n}$代表$c{D_n}$的离散值数量,$l{a_n}$代表$c{A_n}$的离散值数量[8]

      步骤6:将上一步中小波细节和小波近似能量差值的绝对值$F{a_n}$作为小波近似频率,即:

      步骤8:对质谱信号T实施j层小波分解,将分解结果中的低频小波系数置零后进行小波重构,即可获得基线校正后的质谱信号M,至此算法流程完成。

      步骤8:对质谱信号T实施j层小波分解,将分解结果中的低频小波系数置零后进行小波重构,即可获得基线校正后的质谱信号M,至此算法流程完成。

      本算法实验验证采用ASV MS5201型数字离子阱质谱仪检测冻干机腔室中的水氧含量时得到的质谱图作为数据源。在不同的冻干机腔室中前后进行了三组实验分别计算出最佳分解层数为8、10、6,将去噪后的质谱信号小波分解后把小波近似系数置零,重构信号得到基线校正后的质谱信号。为了比较本文算法与常用基线校正算法的校正效果,基于C++实现了各基线校正算法,计算了基线校正后质谱信号的信噪比(S/N)、均方根误差(RMSE)、峰值位置(pos)、峰值大小(V-max)等参数作为基线校正效果、质谱图平滑性、保留信号特征等的评价指标,计算各算法运行耗时(time)、所需额外空间(space)作为算法实时性及时空间复杂度的评价指标,得到各组结果如表2-4所示,基线校正信号对比图如图4-6所示。

      表2-4图4-6可以看出,多项式拟合法计算速度最快、所需额外空间最小,但是峰型与原始信号区别不大,信噪比提高幅度最低,均方根误差最小,峰值位置基本不变,峰值大小降低不多,基线校正效果不明显;移动平均法计算速度较快、所需额外空间较小,得到较平滑的质谱信号,同时信噪比有了一定幅度提高,峰值位置基本不变,但是均方根误差最大,最高峰强大幅降低,峰型被明显削平,说明该算法会降低质谱分辨率,不宜单独使用该算法基线校正;小波包变换法信噪比提高幅度大,均方根误差较小,峰值位置基本不变,最高峰强降低幅度较小,能在去除基线干扰的同时保留质谱峰信号,但是该算法无法保证每次都能得到最优值,算法稳定性较差,所用时间、空间大;本文算法得到的处理结果表明该算法也能在很好地去除基线干扰的同时保留质谱峰信号,信噪比提高幅度最大,均方根误差最小,峰值位置保持不变,最高峰强降低幅度最小同时能兼顾所用时间、空间大小。三组实验结果较为一致,说明本算法稳定性好。综上所述,与常用的基线校正算法相比,本文提出的基线校正算法基线校正效果良好,能在很好地去除基线干扰的同时保留有用信号,又能兼顾稳定性及时空间复杂度,适合质谱仪的实际应用场景。

    • 质谱仪以其极低的检出限,超强的定性定量分析能力,近年来在各大领域应用越来越广。随着科技的不断发展,检测需求不断提升,它将发挥更加重要的作用。质谱数据处理是获取真实质谱信号的关键步骤,基线校正是其中的重要环节。本文提出了可定量计算小波分解最佳层数的方法,基于此方法进行小波变换以实现质谱信号基线校正。通过使用自研质谱仪进行实验验证,结果表明与其他常用质谱基线校正算法对比,本文提出的算法在基线校正效果上有明显优势,同时具有良好的稳定性和较低的时间、空间复杂度,充分说明了本算法基线校正的可行性。可以看出,本文提出的基于小波变换的基线校正算法具有一定的实际应用意义。

    参考文献 (10)

目录

/

返回文章
返回