基于不同神经网络的DLC薄膜综合性能预测的对比研究

上一篇

下一篇

陈志立, 梁帅, 李国浩, 赵执鹏, 刘宇泰, 杜广煜. 基于不同神经网络的DLC薄膜综合性能预测的对比研究[J]. 真空科学与技术学报, 2023, 43(8): 665-673. doi: 10.13922/j.cnki.cjvst.202212005
引用本文: 陈志立, 梁帅, 李国浩, 赵执鹏, 刘宇泰, 杜广煜. 基于不同神经网络的DLC薄膜综合性能预测的对比研究[J]. 真空科学与技术学报, 2023, 43(8): 665-673. doi: 10.13922/j.cnki.cjvst.202212005
Zhili CHEN, Shuai LIANG, Guohao LI, Zhipeng ZHAO, Yutai LIU, Guangyu DU. Comparative Study on Comprehensive Properties Prediction of DLC Thin Films Based on Different Neural Networks[J]. zkkxyjsxb, 2023, 43(8): 665-673. doi: 10.13922/j.cnki.cjvst.202212005
Citation: Zhili CHEN, Shuai LIANG, Guohao LI, Zhipeng ZHAO, Yutai LIU, Guangyu DU. Comparative Study on Comprehensive Properties Prediction of DLC Thin Films Based on Different Neural Networks[J]. zkkxyjsxb, 2023, 43(8): 665-673. doi: 10.13922/j.cnki.cjvst.202212005

基于不同神经网络的DLC薄膜综合性能预测的对比研究

    通讯作者: (024)83676945; E-mail: gydu@mail.neu.edu.cn
  • 中图分类号: TP183

Comparative Study on Comprehensive Properties Prediction of DLC Thin Films Based on Different Neural Networks

    Corresponding author: Guangyu DU, gydu@mail.neu.edu.cn
  • MSC: TP183

  • 摘要: 类金刚石(DLC)薄膜因其具备高硬度、高耐磨性等优良性质而被广泛应用于机械、航空航天等领域。但为满足不同行业应用的需求,DLC薄膜常常采用不同的制备方法及工艺参数以获得不同的特性,对不同工艺流程制备出的样品进行表征性能测试费时费力。为了解决这一问题,文章探索了不同人工神经网络在薄膜性能预测领域应用的可行性及适用性。将试验制备的DLC薄膜数据作为训练样本,以不同的工艺参数作为输入,对应工艺下制备的DLC薄膜各项性能作为输出,对BP、ELM、KELM三种神经网络进行训练。利用验证样本对训练好的三种模型进行验证,对比三种神经网络预测值与真实值的结果、相对误差、决定系数及均方误差,以性能最佳的网络模型为样本对薄膜各性能进行灵敏度分析。结果表明,KELM的预测精度与稳定性均优于BP与ELM神经网络,更适用于DLC薄膜的综合性能预测,且得到了各工艺参数对各性能指标的影响情况。
  • 加载中
  • 图 1  神经网络结构

    Figure 1.  Neural network structure

    图 2  不同神经网络模型的预测值与真实值(a)成膜速率;(b)硬度;(c)杨氏模量;(d)ID/IG;(e)结合力

    Figure 2.  Predicted and true values of different neural network models (a) growth rate; (b) hardness; (c) Young's modulus; (d) ID/IG; (e) combine force

    图 3  不同网络模型预测值与真实值的相对误差(a) BP net; (b) ELM net; (c) KELM net

    Figure 3.  Relative error between predicted and true values of different network models (a) BP net; (b) ELM net; (c) KELM net

    表 1  制备DLC薄膜样品的各工艺参数范围

    Table 1.  Range of process parameters for DLC film samples

    Process parametersRange
    Temperature200℃~260℃
    C2H2 flow rate220 ~400 mL/min
    Ar flow rate130 ~210 mL/min
    Current of electron gun10 ~70 A
    Bias voltage700 ~900 V
    Duty ratio25%~65%
    下载: 导出CSV

    表 2  不同类型网络训练后各项输出参数的决定系数

    Table 2.  Determining coefficients of different neural networks for various performances

    Net
    type
    Growth
    rate
    HardnessYoung
    modulus
    ID/IGCombine
    force
    BP0.470.480.410.860.61
    ELM0.680.540.360.680.81
    KELM0.890.980.930.880.99
    下载: 导出CSV

    表 3  不同类型网络训练后各项输出参数的均方误差

    Table 3.  Mean square error of different neural networks for various performances

    Net
    type
    Growth
    rate
    HardnessYoung
    modulus
    ID/IGCombine
    force
    BP37.101.51176.920.0466.63
    ELM19.433.29330.450.1052.20
    KELM7.670.7158.820.033.75
    下载: 导出CSV

    表 4  成膜速率灵敏度分析结果

    Table 4.  Sensitivity analysis results of growth rate

    SABias voltageDuty ratioC2H2 flow rateCurrent of electron gunTemperatureAr flow rate
    First-order0.10400.02100.34000.50100.0055-0.0522
    Global0.12000.01210.39600.5610-0.01160.0423
    下载: 导出CSV

    表 5  硬度灵敏度分析结果

    Table 5.  Sensitivity analysis results of hardness

    SABias voltageDuty ratioC2H2 flow rateCurrent of electron gunTemperatureAr flow rate
    First-order0.07630.06030.10200.57100.08480.1350
    Global0.17200.21300.20000.78700.05820.2050
    下载: 导出CSV

    表 6  杨氏模量灵敏度分析结果

    Table 6.  Sensitivity analysis results of Young's modulus

    SABias
    voltage
    Duty
    ratio
    C2H2
    flow rate
    Current of
    electron gun
    TemperatureAr
    flow rate
    First-order0.07550.08550.12000.53500.10400.1130
    Global0.19600.24600.24800.77100.10400.1230
    下载: 导出CSV

    表 7  ID/IG灵敏度分析结果

    Table 7.  Sensitivity analysis results of ID/IG

    SABias voltageDuty ratioC2H2 flow rateCurrent of electron gunTemperatureAr flow rate
    First-order0.17760.10400.14100.57730.22900.0976
    Global0.13800.29900.16450.62970.16900.1816
    下载: 导出CSV

    表 8  膜基结合力灵敏度分析结果

    Table 8.  Sensitivity analysis results of combine force

    SABias voltageDuty ratioC2H2 flow rateCurrent of electron gunTemperatureAr flow rate
    First-order0.07970.09770.55760.21450.00730.1026
    Global0.23410.17480.45520.26700.06180.0723
    下载: 导出CSV
  • [1] Jia dongxu,Liu xing,Sun gang,et al. Effect of substrate heating temperature on the structure and frictional wear properties of WC-DLC coatings[J]. Chinese Journal Vacuum Science and Technology,2022,42(05):364−370 (贾东旭,刘星,孙刚,等. 衬底加热温度对WC-DLC涂层结构和摩擦磨损性能的影响[J]. 真空科学与技术学报,2022,42(05):364−370(in chinese) Jia dongxu, Liu xing, Sun gang, et al. Effect of substrate heating temperature on the structure and frictional wear properties of WC-DLC coatings[J]. CHINESE JOURNAL VACUUM SCIENCE AND TECHNOLOGY, 2022, 42(05): 364-370
    [2] Wang L,Liu Y,Chen H,et al. Modification methods of diamond like carbon coating and the performance in machining applications: a review[J]. Coatings,2022,12(2):224 doi: 10.3390/coatings12020224
    [3] Park C,Choi S G,Park H,et al. Compensation effect of boron and nitrogen codoping on the hardness and electrical resistivity of diamond-like carbon films prepared by magnetron sputtering deposition[J]. Journal of Materials Research,2012,27(23):3027−3032 doi: 10.1557/jmr.2012.348
    [4] Jo Y J,Zhang T F,Son M J,et al. Synthesis and electrochemical properties of Ti-doped DLC films by a hybrid PVD/PECVD process[J]. Applied Surface Science,2018,433:1184−1191 doi: 10.1016/j.apsusc.2017.10.151
    [5] Ait-Hamouda K,Ababou A,Ouchabane M,et al. Study of optical properties of diamond-like carbon/porous silicon antireflective coating layers for multicrystalline silicon solar cell applications[J]. Vacuum,2007,81(11-12):1472−1475 doi: 10.1016/j.vacuum.2007.04.002
    [6] Love C A,Cook R B,Harvey T J,et al. Diamond like carbon coatings for potential application in biological implants—a review[J]. Tribology International,2013,63:141−150 doi: 10.1016/j.triboint.2012.09.006
    [7] Zhou Y,Chen Z,Hu Z,et al. Tribological performance of hydrogenated diamond-like carbon coating deposited on superelastic 60NiTi alloy for aviation self-lubricating spherical plain bearings[J]. Chinese Journal of Aeronautics,2022,35(12):309−320 doi: 10.1016/j.cja.2022.03.014
    [8] Kamada T,Sohma Y,Watanabe M,et al. Fabrication of diamond-like carbon films using pseudo-spark discharge plasma-enhanced chemical vapor deposition method[J]. Japanese Journal of Applied Physics,2014,53(6):68001−68006 doi: 10.7567/JJAP.53.068001
    [9] Chenrayan V,Manivannan C,Velappan S,et al. Experimental assessment on machinability performance of CNT and DLC coated HSS tools for hard turning[J]. Diamond and Related Materials,2021,119:108568 doi: 10.1016/j.diamond.2021.108568
    [10] Harigai T,Tamekuni K,Iijima Y,et al. Wear-resistive and electrically conductive nitrogen-containing DLC film consisting of ultra-thin multilayers prepared by using filtered arc deposition[J]. Japanese Journal of Applied Physics,2019,58(SE):D5
    [11] Suzuki A,Aiyama Y,Tokoro M,et al. Friction and wear characteristics of hydrogenated diamond-like carbon films formed on the roughened stainless steel surface[J]. Wear,2010,269(1-2):118−124 doi: 10.1016/j.wear.2010.03.013
    [12] Li dangjuan,Wang na,Wu shenjiang,et al. Stress state of DLC films under different process parameters[J]. Chinese Journal Vacuum Science and Technology,2020,40(05):421−426 (李党娟,王娜,吴慎将,等. 不同工艺参数下DLC薄膜的应力状态[J]. 真空科学与技术学报,2020,40(05):421−426(in chinese) doi: 10.13922/j.cnki.cjovst.2020.05.05 Li dangjuan, Wang na, Wu shenjiang, et al. Stress state of DLC films under different process parameters[J]. CHINESE JOURNAL VACUUM SCIENCE AND TECHNOLOGY, 2020, 40(05): 421-426 doi: 10.13922/j.cnki.cjovst.2020.05.05
    [13] Yang W J,Sekino T,Shim K B,et al. Microstructure and tribological properties of SiOx/DLC films grown by PECVD[J]. Surface and Coatings Technology,2005,194(1):128−135 doi: 10.1016/j.surfcoat.2004.05.023
    [14] Liu J Q,Li L J,Wei B,et al. Effect of sputtering pressure on the surface topography, structure, wettability and tribological performance of DLC films coated on rubber by magnetron sputtering[J]. Surface and Coatings Technology,2019,365:33−40 doi: 10.1016/j.surfcoat.2018.05.012
    [15] Caschera D,Cossari P,Federici F,et al. Influence of PECVD parameters on the properties of diamond-like carbon films[J]. Thin Solid Films,2011,519(12):4087−4091 doi: 10.1016/j.tsf.2011.01.197
    [16] Nakamura K,Ohashi H,Enta Y,et al. Effects of silicon doping on the chemical bonding states and properties of nitrogen-doped diamond-like carbon films by plasma-enhanced chemical vapor deposition[J]. Thin Solid Films,2021,736:138923 doi: 10.1016/j.tsf.2021.138923
    [17] Liu X,Tian S,Tao F,et al. A review of artificial neural networks in the constitutive modeling of composite materials[J]. Composites Part B:Engineering,2021,224:109152 doi: 10.1016/j.compositesb.2021.109152
    [18] Ding S,Li H,Su C,et al. Evolutionary artificial neural networks: a review[J]. Artificial Intelligence Review,2013,39(3):251−260 doi: 10.1007/s10462-011-9270-6
    [19] Ulas M,Altay O,Gurgenc T,et al. A new approach for prediction of the wear loss of PTA surface coatings using artificial neural network and basic, kernel-based, and weighted extreme learning machine[J]. Friction,2020,8(6):1102−1116 doi: 10.1007/s40544-017-0340-0
    [20] Ibrahim A O,Shamsuddin S M,Abraham A,et al. Adaptive memetic method of multi-objective genetic evolutionary algorithm for backpropagation neural network[J]. Neural Computing and Applications,2019,31(9):4945−4962 doi: 10.1007/s00521-018-03990-0
    [21] Hecht-Nielsen. Theory of the backpropagation neural network, 1989[C]. IEEE TAB Neural Network Committee, 1989
    [22] Siu S,Yang S,Lee C,et al. Improving the Back-Propagation Algorithm Using Evolutionary Strategy[J]. IEEE Transactions on Circuits and Systems II:Express Briefs,2007,54(2):171−175 doi: 10.1109/TCSII.2006.883226
    [23] Eshtay M,Faris H,Obeid N. Metaheuristic-based extreme learning machines: a review of design formulations and applications[J]. International Journal of Machine Learning and Cybernetics,2019,10(6):1543−1561 doi: 10.1007/s13042-018-0833-6
    [24] Cao J,Lin Z,Huang G. Self-Adaptive evolutionary extreme learning machine[J]. Neural Processing Letters,2012,36(3):285−305 doi: 10.1007/s11063-012-9236-y
    [25] Iosifidis A,Tefas A,Pitas I. DropELM: Fast neural network regularization with dropout and DropConnect[J]. Neurocomputing,2015,162:57−66 doi: 10.1016/j.neucom.2015.04.006
    [26] Shamshirband S,Mohammadi K,Chen H,et al. Daily global solar radiation prediction from air temperatures using kernel extreme learning machine: A case study for Iran[J]. Journal of Atmospheric and Solar-Terrestrial Physics,2015,134:109−117 doi: 10.1016/j.jastp.2015.09.014
    [27] Sakurahara T,Reihani S,Kee E,et al. Global importance measure methodology for integrated probabilistic risk assessment[J]. Proceedings of the Institution of Mechanical Engineers, Part O:Journal of Risk and Reliability,2020,234(2):377−396 doi: 10.1177/1748006X19879316
    [28] Borgonovo E,Plischke E. Sensitivity analysis: a review of recent advances[J]. European Journal of Operational Research,2016,248(3):869−887 doi: 10.1016/j.ejor.2015.06.032
  • 加载中
图( 3) 表( 8)
计量
  • 文章访问数:  65
  • HTML全文浏览数:  65
  • PDF下载数:  1
  • 施引文献:  0
出版历程
  • 收稿日期:  2022-12-02
  • 刊出日期:  2023-08-27

基于不同神经网络的DLC薄膜综合性能预测的对比研究

    通讯作者: (024)83676945; E-mail: gydu@mail.neu.edu.cn
  • 1. 东北大学机械工程与自动化学院 沈阳 110819
  • 2. 中国电子科技集团公司第五十五研究所 南京 210016

摘要: 类金刚石(DLC)薄膜因其具备高硬度、高耐磨性等优良性质而被广泛应用于机械、航空航天等领域。但为满足不同行业应用的需求,DLC薄膜常常采用不同的制备方法及工艺参数以获得不同的特性,对不同工艺流程制备出的样品进行表征性能测试费时费力。为了解决这一问题,文章探索了不同人工神经网络在薄膜性能预测领域应用的可行性及适用性。将试验制备的DLC薄膜数据作为训练样本,以不同的工艺参数作为输入,对应工艺下制备的DLC薄膜各项性能作为输出,对BP、ELM、KELM三种神经网络进行训练。利用验证样本对训练好的三种模型进行验证,对比三种神经网络预测值与真实值的结果、相对误差、决定系数及均方误差,以性能最佳的网络模型为样本对薄膜各性能进行灵敏度分析。结果表明,KELM的预测精度与稳定性均优于BP与ELM神经网络,更适用于DLC薄膜的综合性能预测,且得到了各工艺参数对各性能指标的影响情况。

English Abstract

  • 类金刚石(Diamond-like Carbon, DLC)薄膜是碳的一种亚稳定形态,由${s}{{p}}^{2}$${s}{{p}}^{3}$键结合而成,兼备金刚石与石墨的优良性质[1],在机械[2, 3]、电子[4, 5]、医疗[6]、航空航天[7]等领域被广泛应用。DLC薄膜的性质范围很宽,而不同的领域应用对DLC薄膜的性能有着不同的要求[8],例如:作为刀具涂层的DLC薄膜应具有高硬度、高耐磨性等特点[9];用于医疗行业的DLC薄膜具备良好的生物相容性与化学惰性更为重要[10];而DLC薄膜的低摩擦系数使其在航空航天领域备受关注[11, 12]

    等离子体增强化学气相沉积(PECVD)是制备DLC薄膜的主要方法之一[13],而制备时的工艺参数直接影响着DLC薄膜的内部结构,也决定着其薄膜的各项性能[14, 15]。用试验方法探索测试不同条件下制得DLC薄膜的性质特征会耗费大量的人力物力[16],而人工神经网络由于其较强的自学习能力可用于建立数据间的非线性函数映射模型,且占用计算资源较少[17],将人工神经网络应用于不同工艺制备薄膜各项性能的预测可能是解决上述问题的有效途径之一。

    文中将PECVD中常见的几个工艺参数(镀膜温度、基片负偏压及占空比、C2H2气流量、电子枪电流、Ar气流量)作为输入,将薄膜的各项性能(如硬度、成膜速率、杨氏模量、ID/IG值及膜基结合力)作为输出,训练BP、ELM、KELM三种神经网络,对比不同神经网络模型的预测值与真实值,最终以预测性能最佳的网络模型为样本对薄膜的各项性能进行敏感度分析。

    • 试验选用标准高速钢试片,使用纯度99.5%的异丙醇进行超声波清洗。制备样品前先对设备进行例行检查,清理转架、电子枪以及炉体内部等位置的杂质与灰尘。将炉体抽真空至10−2 Pa并加热至200℃进行烘烤除气,之后使用Ar+离子轰击基片表面30 min,去除基材表面污染物和氧化物,激发基片表面活性。刻蚀工艺完成后,将Cr原子向基体表面溅射沉积65 min,此粘结层用以提升DLC薄膜与基体之间的结合力,厚度约1 μm。最后使用热阴极辉光PECVD法制备DLC薄膜,在该工艺中,影响DLC薄膜性能的主要工艺参数有镀膜温度、基片负偏压及占空比、C2H2气流量、电子枪电流、Ar气流量,各工艺参数的范围如表1所示。在表中所示的范围内,选取工艺参数,共制备34组试验样品。

    • 用球磨仪测量DLC薄膜的厚度,测量时间设定为8 s,测量三次取平均值,以测得的厚度与镀膜时间的比值(即成膜速率)表征各工艺参数下设备的工作效率;用纳米压痕仪测量DLC薄膜的硬度和杨氏模量,定深压入20 nm进行测量;用Raman光谱仪对DLC薄膜进行Raman光谱分析,波长633 nm,光谱测量范围1000~2000 cm−1,采用Gauss方法分峰并得到ID/IG比值;用划痕仪与3D显微镜表征DLC薄膜的膜基结合力,划痕仪在压头滑动过程中施加载荷,划痕共9 mm,载荷由0 N至100 N线性增大,使用3D显微镜观察第一破裂点,并以起始点与第一破裂点距离量化膜基结合力的大小。

    • 人工神经网络(Artificial Neural Networks, ANN)是受到生物神经网络启发而建立的一种用于信息处理的模型[18]。一种简单的神经网络结构如图1所示,主要分为输入层、隐含层与输出层,${{x}}_{{i}}$为各输入节点,${{y}}_{{i}}$为各输出节点,${\mathrm{C}\mathrm{e}\mathrm{l}\mathrm{l}}_{{i}}$为各隐含层神经元。输入层与隐含层、隐含层与输出层之间由权值与阈值向量连接,输入量通过与权值和阈值矩阵的计算、隐含层神经元激活函数的处理等最终成为输出量。而不同的神经网络用不同的方法调整各层之间的权值与阈值矩阵以降低预测值与实际值的误差值大小。由于神经网络具备良好的自组织、自适应、与自学习能力,因而被广泛的被应用于预测、模式识别、自动控制等领域[19]

    • BP(Back Propagation)神经网络是一种多层前馈型神经网络,采用误差反向传播训练方法来提高网络准确率,是应用最广泛的神经网络模型之一[20]

      BP神经网络的训练包含工作信号正向传递与误差信号反向传递两个过程。正向传递过程中,每个节点xj的输出值由上一层所有节点xi的输出值、当前节点与上一层节点的权值wij、当前节点的阈值bj以及激活函数f共同决定,计算如式(1):

      而在反向传递过程中,将预测值dj与真实值yj的误差信号反向传递,通过梯度下降法更新权值与阈值,再用更新后的权值与阈值正向传递输入信号。BP神经网络经过多次迭代,反复修正权值与阈值,使得误差函数值达到一定范围之内,完成训练。误差函数值的计算如式(2):

      BP神经网络可以应用在多种领域,Robert Hecht-Nielsen证明了对于任何闭区间内的一个连续函数都可以用一个隐含层的BP神经网络来逼近,即万能逼近原理[21]。但BP神经网络也存在一些问题,例如训练速度慢、易陷入局部极小等[22]

    • 极限学习机(Extreme Learning Machine, ELM)是一种单隐含层前馈神经网络。和BP神经网络不同,ELM避免了复杂数学运算,不需要多次迭代反向传递误差,而是通过求解广义逆矩阵的方法更新权值阈值进而提高预测拟合性能[23]

      ELM网络训练分为两个阶段:随机特征映射和线性参数求解。在随机特征映射阶段,隐含层阶段参数(ωb)根据连续的概率分布随机生成,得到隐含层输出矩阵H。输出权值β为线性参数求解阶段需要求解的参数,将神经网络的输出Hβ与样本矩阵T的最小化平方差作为训练误差的评价指标,使其函数值最小的解即为训练的最优解,如式(3):

      根据数学公式推导,要使训练达到最佳效果,β值的解为:

      其中H+为矩阵H的广义逆矩阵,此时β值的求解即为求解矩阵H的广义逆矩阵问题。

      隐含层输出矩阵H的随机生成与训练样本个数与数目无关,因而和BP神经网络相比,ELM训练效率更高。

    • 由ELM网络输出权值的求解可知,需要计算隐含层输出矩阵H的广义逆矩阵H+,但由于ELM网络的隐含层输出矩阵H的生成是随机的,这就使得输出权值矩阵$ \mathrm{\beta } $的计算并不稳定[24]。为了改善这一问题,提出核极限学习机(Kelem Extreme Learning Machine, KELM)网络算法。

      在KELM中,用核函数矩阵Ω代替了ELM网络中生成的隐含层随机矩阵H。核函数矩阵Ω的计算式(5):

      引入正则化系数C、单位矩阵I,将核函数矩阵Ω代入输出权值矩阵$ \mathrm{\beta } $的求解中[25],此时$ \mathrm{\beta } $最优值的计算可用式(6)求解:

      由上式可以看出,KELM通过引入正则化系数C与核函数Ω将输出权值矩阵$ \mathrm{\beta } $的求解转变为矩阵内积的计算,避免了ELM网络训练时因随机分配隐含层权值阈值带来的不稳定性影响,提高了ELM的泛化性能[26]

    • 将偏压、占空比、乙炔气流量、电子枪电流、温度和氩气气流量作为输入层参数,成膜速率、硬度、杨氏模量、拉曼光谱ID/IG值及膜基结合力作为输出层参数,将所有试验数据分为训练集与验证集。从34组试验数据中随机选取5组作为验证集,余下29组试验数据作训练集。为了保证预测结果的质量,要对数据进行归一化处理,在将预测值与实际值进行对比时,预测值需要进行反归一化处理。

    • 设定$ \mathrm{B}\mathrm{P} $神经网络训练前的各项参数,设置目标最小误差为1.0×10−5,学习速率为$ 0.01 $,最大迭代次数为$ 1000 $次,激活函数采用$ \mathrm{S}\mathrm{i}\mathrm{g}\mathrm{m}\mathrm{o}\mathrm{i}\mathrm{d} $函数,如式(7):

      一般来说隐含层的节点数量对神经网络的预测精度有着一定影响,在这里隐含层节点数按经验公式选取,如式(8):

      式中,$ l $为隐含层节点数量;mn分别为输入层与输出层节点数;a为常数,一般取值为1~10之间。

      由经验公式、输入输出层节点数量以及多次尝试,最终确定隐含层节点数量为10。

    • 设定ELM神经网络训练前的参数,隐含层的激活函数选择Sigmoid函数,由于ELM无需多次迭代计算误差值,且权值阈值无需在训练过程中调整,因此在ELM神经网络中只需设置隐含层的神经元数量,和BP神经网络隐含层神经元数量选择的原则一致,最终确定隐含层节点数量为10。

    • 设定KELM神经网络训练前的参数,选择核矩阵函数为RBF径向基函数,设定核矩阵系数S为2,正则化系数C为25。

    • 灵敏度分析(Sensitivity analysis, SA)的目的在于明确未知映射模型中各项输入参量变化对输出结果的影响。全局灵敏度分析方法被广泛应用于非线性较高的模型分析中,本文中使用Sobol灵敏度分析方法通过一阶以及全局灵敏度数值大小分析各工艺参数对性能指标的影响程度[27]

      Sobol灵敏度分析方法采用方差对描述模型输入参数对输出结果的不确定性,可以将模型输出相应的方差Y归因于各个输入参数X以及各个输入变量之间的交叉效应[28],通过高维模型展开,如式(9):

      式中f0为常数,fiXi的函数,依此类推。当函数f平方可积、输入变量相互独立且展开式中所有项两两相互正交时,将公式分解的每一项进行定义:

      此时将展开式两边同时取方差可得:

      式中:Vi=V(E(Y|Xi)); Vij=V(E(Y|XiXj))−ViVj。其中,一阶偏方差Vi衡量了输入变量Xi对输出结果的单独影响大小,二阶偏方差Vij衡量输入变量XiXj对输出结果的共同影响大小。根据全方差公式,Xi对应的总偏方差VTi可以通过总方差减去Xi对应的一阶偏方差得到,即VTi=V(Y)-V(E(Y|Xi))。

      一阶灵敏度指数Si与全局灵敏度指数STi通过ViVTi的标准化得到,计算如式(12):

    • 在神经网络完成训练后,将5组试验数据中的6个工艺参数作为输入,得到不同神经网络模型的预测结果。图2为不同神经网络模型对成膜速率、硬度、杨氏模量、ID/IG、结合力的预测值与试验值对比图,由图2可以看出各神经网络对五个性能参数的预测情况。总的来说,BP神经网络与ELM神经网络对各项性能的预测在一些验证组上有着不错的准确率,但整体的预测性能并不稳定。

    • 计算全部预测值与真实值的相对误差,并取绝对值,如图3为BP、ELM、KELM三种神经网络对各项性能预测值与真实值的相对误差情况。从图中可以看出ELM神经网络的各项预测稳定性最差,对成膜速率、硬度、ID/IG预测的相对误差在2.4%~66.8%之间变化,对杨氏模量结合力预测的相对误差在2.8%~28.1%之间浮动。BP神经网络对薄膜生长速率的预测效果稳定性最差,其相对误差最高达到73.9%,对硬度、ID/IG、杨氏模量、结合力的预测结果相对误差在5.3%~27.9%之间浮动。KELM神经网络的各项预测稳定性是最好的,对成膜速率、硬度、杨氏模量、ID/IG、结合力预测的相对误差均在0.5%~25.7%之间浮动。从各组预测值与真实值的相对误差上来看,KELM的预测性能更佳。

    • 为了更好的评估训练后的神经网络,采用决定系数与均方误差对各网络的性能进行评估。决定系数也被称为拟合优度,常用于评价预测性能的优劣,决定系数越接近1,拟合程度越高,网络的性能越好。均方误差可以体现网络的拟合程度与稳定性,均方误差越小,网络预测结果越准确且越稳定。可以看出,决定系数的范围在0~1之间,用于评价预测性能时,不会受到预测值与真实值自身数量级大小的影响,可以用于比较同一神经网络对不同物理量的预测性能。但也由于其范围较小,当不同网络对同一物理量的预测性能相近时,计算出的决定系数值可能无限接近,难以进行预测性能差异的比较;与决定系数不同,使用均方误差对预测性能进行评价时,预测值与真实值自身的数量级越大,其对应的均方误差一般也越大,因此不能用于比较神经网络对不同物理量的预测性能。而均方误差的数值范围很大,即便不同网络对同一物理量的预测性能相近,也可以通过比较均方误差值的大小来评价不同网络预测性能的优劣。

      决定系数的计算如式(13):

      式中n为测试集样本个数,$ {{t}}_{\mathrm{s}\mathrm{i}\mathrm{m}} $$ {{t}}_{\mathrm{t}\mathrm{e}\mathrm{s}\mathrm{t}} $分别为根据测试集进行计算的神经网络预测值和验证集样本真值。

      分别计算三种神经网络对成膜速率、硬度、杨氏模量、ID/IG、结合力预测结果的决定系数与均方误差,表2表3为计算后的结果。对比之后可以看出,KELM对各性能预测的决定系数均为最高,均方误差均为最低。

    • 以各性能拟合效果最佳的KELM网络预测结果作为灵敏度分析样本,通过Matlab求解得到偏压、占空比、乙炔气流量、电子枪电流、温度和氩气气流量对各项性能的一阶灵敏度和全局灵敏度。成膜速率、硬度、杨氏模量、拉曼光谱、ID/IG值及膜基结合力的灵敏度分析结果如表4~8所示。

      由表可知,各工艺参数波动对各性能的影响程度大小关系为:成膜速率:S4>S3>S1>S2>S5>S6;硬度:S4>S6>S3>S5>S1>S2;杨氏模量:S4>S3>S6>S5>S2>S1ID/IGS4>S5>S1>S3>S2>S6;膜基结合力:S3>S4>S6>S2>S1>S5。其中S1为偏压,S2为偏压占空比,S3为乙炔气流量,S4为电子枪灯丝电流,S5为温度,S6为氩气气流量。

      综合上述的各项结果,即说明在DLC薄膜的综合性能预测上,BP、ELM、KELM三种神经网络中,KELM展现出了更好的拟合性能与稳定性。但也发现了一些问题,即便KELM网络模型的性能最佳,但其在部分验证组的预测结果相对误差最高仍达到了25%以上,训练样本少是导致部分验证组预测结果误差大的重要原因;而综合灵敏度分析结果可知,对于整个薄膜制备工艺映射模型,在设定的参数范围内,电子枪灯丝电流对薄膜的沉积速率及各方面力学性能影响最大;乙炔气流量的大小对膜基结合力及成膜速率有着重要影响;偏压、占空比及氩气气流量为影响薄膜各项性能的次要因素;温度在设定范围内,对ID/IG有着一定影响,而对其他各项性能的影响占比都较小,这可能是温度的设定范围较小所导致。

      在后续的工作中,仍需优化网络,通过增加实验数据量、增加隐含层层数、调整正则化系数取值、采用遗传等算法优化权值阈值等方式提高少样本预测准确度。

    • 文中以试验制备的DLC薄膜数据作为样本源,将PECVD制备中的重要工艺参数作为输入,将DLC薄膜的各项特征性质作为输出,训练神经网络。探索人工神经网络在薄膜综合性能预测领域应用的可行性,以及不同神经网络的适用性。研究结果表明,训练后的神经网络可以对DLC薄膜的性能进行预测,将各网络模型预测值与真实值的结果与相对误差、决定系数与均方误差进行对比,KELM神经网络的各项表现优于BP与ELM神经网络。在DLC薄膜的各项性能预测上,KELM神经网络具备更好的预测精度与稳定性。而各个工艺参数对DLC薄膜的各项性能影响占比各不相同,在本文给定的参数选取范围内,电子枪灯丝电流与乙炔气流量对DLC薄膜各项性能的影响占据主导作用,偏压、占空比及氩气气流量为次要影响因素,温度的影响占比最小。

    参考文献 (28)

目录

/

返回文章
返回