基于无监督学习方法的细胞膜内单分子扩散运动分析: 胆固醇对模型膜和活细胞膜流动性的不同影响

上一篇

下一篇

谭金鹏, 张婉婷, 徐成, 卢雪梅, 朱文圣, 杨恺, 元冰. 基于无监督学习方法的细胞膜内单分子扩散运动分析: 胆固醇对模型膜和活细胞膜流动性的不同影响[J]. 物理学报, 2024, 73(18): 188702-1. doi: 10.7498/aps.73.20240915
引用本文: 谭金鹏, 张婉婷, 徐成, 卢雪梅, 朱文圣, 杨恺, 元冰. 基于无监督学习方法的细胞膜内单分子扩散运动分析: 胆固醇对模型膜和活细胞膜流动性的不同影响[J]. 物理学报, 2024, 73(18): 188702-1. doi: 10.7498/aps.73.20240915
Jin-Peng Tan, Wan-Ting Zhang, Cheng Xu, Xue-Mei Lu, Wen-Sheng Zhu, Kai Yang, Bing Yuan. Analysis of single-molecule diffusion movement in cell membrance based on unsupervised learning methods: Different effects of cholesterol on flowability of model membrane and living cell membrane[J]. Acta Physica Sinica, 2024, 73(18): 188702-1. doi: 10.7498/aps.73.20240915
Citation: Jin-Peng Tan, Wan-Ting Zhang, Cheng Xu, Xue-Mei Lu, Wen-Sheng Zhu, Kai Yang, Bing Yuan. Analysis of single-molecule diffusion movement in cell membrance based on unsupervised learning methods: Different effects of cholesterol on flowability of model membrane and living cell membrane[J]. Acta Physica Sinica, 2024, 73(18): 188702-1. doi: 10.7498/aps.73.20240915

基于无监督学习方法的细胞膜内单分子扩散运动分析: 胆固醇对模型膜和活细胞膜流动性的不同影响

    作者简介: 谭金鹏: tanjp059@nenu.edu.cn; 张婉婷: 542921814@qq.com; 徐成: xucheng@sslab.org.cn .
    通讯作者: E-mail: yangkai@suda.edu.cn.;  E-mail: yuanbing@sslab.org.cn.
  • 中图分类号: 87.16.D-, 87.15.K-, 87.15.H-, 87.15.Vv

Analysis of single-molecule diffusion movement in cell membrance based on unsupervised learning methods: Different effects of cholesterol on flowability of model membrane and living cell membrane

    Corresponding authors: E-mail: yangkai@suda.edu.cn.;  E-mail: yuanbing@sslab.org.cn.
  • MSC: 87.16.D-, 87.15.K-, 87.15.H-, 87.15.Vv

  • 摘要: 单分子运动追踪是研究软物质体系尤其是生命体系动力学过程和分子相互作用的重要方法, 但如何理解生命体系中单分子运动行为的复杂性仍是一个巨大的挑战. 针对这一问题, 本工作提出了一种可对单分子轨迹进行高效识别和分类的、基于无监督学习的“两步归类法”: 首先利用熵约束最小二乘法对扩散轨迹的受限程度进行区分, 继而通过统计检验将非受限轨迹划分为亚扩散、正常扩散和超扩散等不同运动模式类型. 利用该方法, 本工作解析了DOPC模型细胞膜和活细胞膜内的单分子扩散运动特征, 揭示了胆固醇成分对二者的差异影响. 结果显示: 模型膜和活细胞膜均包含多种不同的扩散模式; 在DOPC模型膜体系中, 胆固醇成分会阻碍膜内的分子扩散运动, 且阻碍程度与胆固醇含量正相关; 在活细胞体系中, 分子运动速率显著低于模型膜体系, 并且, 胆固醇的去除会进一步减慢分子扩散速率. 本研究有助于从单分子运动角度深入理解生物分子运动行为的复杂性及其对体系环境的依赖性.
  • 加载中
  • 图 1  单分子扩散运动的不同模式 (a)模拟运动模型的MSD曲线, 即定向扩散(蓝色)、正常扩散(红色)、异常扩散(绿色)和受限扩散(黑色), 横坐标为滞后时间(lag time); (b)采用“两步归类法”对单分子轨迹进行识别和分类的步骤, 第一步区分受限扩散与非受限扩散, 第二步将非受限扩散进一步区分

    Figure 1.  Different modes of single-molecule diffusion. (a) Simulated mean square displacement (MSD) curves depicting directed diffusion (blue), normal diffusion (red), anomalous diffusion (green), and confined diffusion (black). (b) The “two-step classification method” employed to identify and classify single-molecule trajectories: the first step involves distinguishing between confined and unconfined diffusion, followed by further differentiation of unconfined diffusion in the second step.

    图 2  不同模型膜体系内单分子扩散运动分析, 即利用“两步归类法”将其分为受限扩散(Confined diffusion)、亚扩散(Sub-diffusion)、正常扩散(Normal diffusion)、超扩散(Super-diffusion) 4个子群, 分别计算其单分子轨迹的时间平均MSD并作出其分布. 轨迹数目见表1

    Figure 2.  Analysis of single lipid diffusion in various model membrane systems using the “two-step classification method”. Trajectories were categorized into four subgroups, namely confined diffusion, sub-diffusion, normal diffusion, and super-diffusion. The time-averaged MSD of individual trajectories was calculated to obtain the distribution. The number of trajectories is presented in Table 1.

    图 3  B16活细胞膜(MeβCD处理前或处理后)内单分子扩散运动分析, 即利用“两步归类法”将其分为受限扩散(Confined diffusion)、亚扩散(Sub-diffusion)、正常扩散(Normal diffusion) 3个子群, 分别计算其单分子轨迹的时间平均MSD并作出其分布, 轨迹数目见表2

    Figure 3.  Analysis of single-molecule diffusion in live cell membranes (before or after MeβCD treatment). This analysis employs a two-step classification method to divide the data into subgroups of confined diffusion, sub-diffusion, and normal diffusion. The time-averaged MSD is calculated for individual trajectories and its distribution is plotted. The number of trajectories analyzed is provided in Table 2.

    图 4  不同体系内DLα值分布, 包括纯DOPC膜(包含1324条轨迹)、DOPC∶Chol = 1∶1混合膜(2347条轨迹)、活细胞膜经MeβCD处理之前(1436条轨迹)和之后(784条轨迹), 其中插图中横坐标以对数形式显示

    Figure 4.  Distribution of DL and α values in different systems: pure DOPC membrane (1324 trajectories), DOPC∶Chol = 1∶1 mixed membrane (2347 trajectories), living cell membrane before MeβCD treatment (1436 trajectories), and after MeβCD treatment (784 trajectories). The horizontal coordinate is presented logarithmically in the inset.

    表 1  不同模型膜体系内单脂质分子轨迹分类及相应的系综扩散系数和异常指数数值, 其中轨迹长度为60帧

    Table 1.  Classification of single lipid trajectories in different model membrane systems and corresponding ensemble diffusion coefficient and anomaly index values. The trajectory length is 60 frames.

    Subgroup Control +MeβCD
    DOPC DOPC:CHOL
    = 4∶1
    DOPC:CHOL
    = 1∶1
    DOPC DOPC:CHOL
    = 4∶1
    DOPC:CHOL
    = 1∶1
    Trajectory
    number
    Confined 282 383 497 293 334 330
    Sub-diffusion 943 1143 1036 947 799 811
    Normal diffusion 318 294 290 305 200 207
    Super-diffusion 667 577 524 647 448 449
    Proportion/% Confined 12.76 15.98 21.18 13.37 18.75 18.36
    Sub-diffusion 42.67 47.68 44.14 43.20 44.86 45.13
    Normal diffusion 14.39 12.27 12.36 13.91 11.23 11.52
    Super-diffusion 30.18 24.07 22.33 29.52 25.15 24.99
    Diffusion coefficient
    DL/(μm2·s–1)
    Confined 0.045 0.032 0.029 0.064 0.034 0.061
    Sub-diffusion 1.086 0.582 0.308 0.805 0.784 0.717
    Normal diffusion 2.421 1.581 0.870 2.100 2.051 1.781
    Super-diffusion 4.149 3.211 1.444 3.908 3.650 3.381
    Anomaly
    index (α)
    Confined 0.116 0.094 0.068 0.207 0.099 0.171
    Sub-diffusion 0.709 0.629 0.512 0.629 0.635 0.614
    Normal diffusion 0.909 0.869 0.916 0.948 0.910 0.874
    Super-diffusion 1.133 1.103 1.178 1.141 1.132 1.132
    下载: 导出CSV

    表 2  经MeβCD去除胆固醇前后活细胞膜内单分子轨迹分类及相应的系综扩散系数和异常指数数值, 其中轨迹长度为20帧

    Table 2.  Classification of single-molecule trajectory in living cell membranes before and after cholesterol depletion by MeβCD, along with corresponding ensemble-averaged diffusion coefficient and anomaly index values. The trajectory length is 20 frames.

    Subgroup Control +MeβCD
    Trajectory
    number
    Confined 452 304
    Sub-diffusion 645 377
    Normal diffusion 339 103
    Proportion/% Confined 31.48 38.78
    Sub-diffusion 44.92 48.09
    Normal diffusion 23.61 13.14
    Diffusion coefficient
    DL/(μm2·s–1)
    Confined 0.017 0.011
    Sub-diffusion 0.069 0.040
    Normal diffusion 0.465 0.260
    Anomaly
    index (α)
    Confined 0.146 0.095
    Sub-diffusion 0.437 0.461
    Normal diffusion 0.983 0.861
    下载: 导出CSV
  • [1] Jacobson K, Liu P, Lagerholm B C 2019 Cell 177 806 doi: 10.1016/j.cell.2019.04.018
    [2] He W, Song H, Su Y, et al. 2016 Nat. Commun. 7 11701 doi: 10.1038/ncomms11701
    [3] Golan Y, Sherman E 2017 Nat. Commun. 8 15851 doi: 10.1038/ncomms15851
    [4] Subczynski W K, Pasenkiewicz-Gierula M, Widomska J, Mainali L, Raguz M 2017 Cell Biochem. Biophys. 75 369 doi: 10.1007/s12013-017-0792-7
    [5] van Meer G, Voelker D R, Feigenson G W 2008 Nat. Rev. Mol. Cell Biol. 9 112 doi: 10.1038/nrm2330
    [6] Liu Y, Zheng X, Guan D, Jiang X, Hu G 2022 ACS Nano 16 16054 doi: 10.1021/acsnano.2c04089
    [7] Lyman E 2021 Biophys. J. 120 1777 doi: 10.1016/j.bpj.2021.02.029
    [8] Zhang X, Barraza K M, Beauchamp J L 2018 P. Natl. Acad. Sci. USA 115 3255 doi: 10.1073/pnas.1722323115
    [9] Chakraborty S, Doktorova M, Molugu T R, et al. 2020 P. Natl. Acad. Sci. USA 117 21896 doi: 10.1073/pnas.2004807117
    [10] Pohnl M, Trollmann M F W, Bockmann R A 2023 Nat. Commun. 14 8038 doi: 10.1038/s41467-023-43892-x
    [11] Fernandez-Perez E J, Sepulveda F J, Peters C, et al. 2018 Front. Aging Neurosci. 10 226 doi: 10.3389/fnagi.2018.00226
    [12] Doole F T, Kumarage T, Ashkar R, Brown M F 2022 J. Membr. Biol. 255 385 doi: 10.1007/s00232-022-00263-9
    [13] Byfield F J, Aranda-Espinoza H, Romanenko V G, Rothblat G H, Levitan I 2004 Biophys. J. 87 3336 doi: 10.1529/biophysj.104.040634
    [14] Yang S T, Kreutzberger A J B, Lee J, Kiessling V, Tamm L K 2016 Chem. Phys. Lipids 199 136 doi: 10.1016/j.chemphyslip.2016.05.003
    [15] Norregaard K, Metzler R, Ritter C M, Berg-Sorensen K, Oddershede L B 2017 Chem. Rev. 117 4342 doi: 10.1021/acs.chemrev.6b00638
    [16] Ge F, Du Y, He Y 2022 ACS Nano 16 5325 doi: 10.1021/acsnano.2c00184
    [17] Chen P Y, Yue H, Zhai X B, Huang Z H, Ma G H, Wei W, Yan L T 2019 Sci. Adv. 5 eaaw3192 doi: 10.1126/sciadv.aaw3192
    [18] Jeon J H, Javanainen M, Martinez-Seara H, Metzler R, Vattulainen I 2016 Phys. Rev. X 6 021006 doi: 10.1103/PhysRevX.6.021006
    [19] Xu C, Yang K, Yuan B 2023 J. Phys. Chem. Lett. 14 854 doi: 10.1021/acs.jpclett.2c03467
    [20] Xu C, Ma W, Wang K, He K, Chen Z, Liu J, Yang K, Yuan B 2020 J. Phys. Chem. Lett. 11 4834 doi: 10.1021/acs.jpclett.0c01169
    [21] Pinholt H D, Bohr S S R, Iversen J F, Boomsma W, Hatzakis N S 2021 P. Natl. Acad. Sci. USA 118 e2104624118 doi: 10.1073/pnas.2104624118
    [22] Muñoz-Gil G, Garcia-March M A, Manzo C, Martín-Guerrero J D, Lewenstein M 2020 New J. Phys. 22 013010 doi: 10.1088/1367-2630/ab6065
    [23] Cherstvy A G, Thapa S, Wagner C E, Metzler R 2019 Soft Matter 15 2526 doi: 10.1039/C8SM02096E
    [24] Granik N, Weiss L E, Nehme E, Levin M, Chein M, Perlson E, Roichman Y, Shechtman Y 2019 Biophys. J. 117 185 doi: 10.1016/j.bpj.2019.06.015
    [25] Janczura J, Kowalek P, Loch-Olszewska H, Szwabinski J, Weron A 2020 Phys. Rev. E 102 032402 doi: 10.1103/PhysRevE.102.032402
    [26] Barkai E, Garini Y, Metzler R 2012 Phys. Today 65 29 doi: 10.1063/PT.3.1677
    [27] Krapf D, Metzler R 2019 Phys. Today 72 48 doi: 10.1063/PT.3.4294
    [28] Wu J F, Xu C, Ye Z F, Chen H B, Wang Y P, Yang K, Yuan B 2023 Small 19 2301713 doi: 10.1002/smll.202301713
    [29] Yamamoto E, Akimoto T, Kalli A C, Yasuoka K, Sansom M S P 2017 Sci. Adv. 3 e1601871 doi: 10.1126/sciadv.1601871
    [30] Feder T J, Brust-Mascher I, Slattery J P, Baird B, Webb W W 1996 Biophys. J. 70 2767 doi: 10.1016/S0006-3495(96)79846-6
    [31] Briane V, Kervrann C, Vimond M 2018 Phys. Rev. E 97 062121 doi: 10.1103/PhysRevE.97.062121
    [32] Lanoiselée Y, Sikora G, Grzesiek A, Grebenkov D S, Wylomanska A 2018 Phys. Rev. E 98 062139 doi: 10.1103/PhysRevE.98.062139
    [33] Sikora G, Teuerle M, Wylomanska A, Grebenkov D 2017 Phys. Rev. E 96 022132 doi: 10.1103/PhysRevE.96.022132
    [34] Saxton M J, Jacobson K 1997 Annu. Rev. Biophys. Biomol. Struct. 26 373 doi: 10.1146/annurev.biophys.26.1.373
    [35] Kusumi A, Sako Y, Yamamoto M 1993 Biophys. J. 65 2021 doi: 10.1016/S0006-3495(93)81253-0
    [36] Saxton M J 1993 Biophys. J. 64 1766 doi: 10.1016/S0006-3495(93)81548-0
    [37] Shannon C E 1948 Bell Syst. Tech. J. 27 379 doi: 10.1002/j.1538-7305.1948.tb01338.x
    [38] Wright S J, Tenny M J 2004 Siam J. Optim. 14 1074 doi: 10.1137/S1052623402413227
    [39] Raja M A Z, Ahmed U, Zameer A, Kiani A K, Chaudhary N I 2019 Neural. Comput. Appl. 31 447 doi: 10.1007/s00521-017-3019-3
    [40] Zhang Y, Yao F, Iu H H C, Fernando T, Wong K P 2013 J. Mod. Power Syst. Clean Energy 1 231 doi: 10.1007/s40565-013-0030-2
    [41] Weron A, Janczura J, Boryczka E, Sungkaworn T, Calebiro D 2019 Phys. Rev. E 99 042149 doi: 10.1103/PhysRevE.99.042149
    [42] Hubicka K, Janczura J 2020 Phys. Rev. E 101 022107 doi: 10.1103/PhysRevE.101.022107
    [43] Xu R, Zhang W T, Jin T, Tu W, Xu C, Wei Y, Han W, Yang K, Yuan B 2024 ACS Appl. Mater. Interfaces 16 6813 doi: 10.1021/acsami.3c16213
    [44] Li L, Ji J, Song F, Hu J 2023 J. Mol. Biol. 435 167787 doi: 10.1016/j.jmb.2022.167787
    [45] Li L, Hou R H, Shi X H, et al. 2024 Commun. Phys. 7 174 doi: 10.1038/s42005-024-01670-1
    [46] Gao J, Hou R, Li L, Hu J 2021 Front. Mol. Biosci. 8 811711 doi: 10.3389/fmolb.2021.811711
    [47] 陆越, 马建兵, 滕翠娟, 陆颖, 李明, 徐春华 2018 物理学报 67 088201 doi: 10.7498/aps.67.20180109 Lu Y, Ma J B, Teng C J, Lu Y, Li M, Xu C H 2018 Acta Phys. Sin. 67 088201 doi: 10.7498/aps.67.20180109
    [48] Gao J, Hou R, Hu W, et al. 2024 J. Phys. Chem. B 128 4735 doi: 10.1021/acs.jpcb.4c01019
  • 加载中
图( 5) 表( 2)
计量
  • 文章访问数:  556
  • HTML全文浏览数:  556
  • PDF下载数:  2
  • 施引文献:  0
出版历程
  • 收稿日期:  2024-07-02
  • 刊出日期:  2024-09-20

基于无监督学习方法的细胞膜内单分子扩散运动分析: 胆固醇对模型膜和活细胞膜流动性的不同影响

    通讯作者: E-mail: yangkai@suda.edu.cn.; 
    通讯作者: E-mail: yuanbing@sslab.org.cn.
    作者简介: 谭金鹏: tanjp059@nenu.edu.cn ; 张婉婷: 542921814@qq.com ; 徐成: xucheng@sslab.org.cn
  • 1. 东北师范大学数学与统计学院, 长春 130024
  • 2. 松山湖材料实验室, 东莞 523808
  • 3. 苏州大学物理科学与技术学院, 软凝聚态物理及交叉研究中心, 苏州 215006
  • 4. 苏州城市学院光学与电子信息学院, 苏州 215104
  • 5. 苏州大学, 前沿材料物理与器件省高校重点实验室, 苏州 215006

摘要: 单分子运动追踪是研究软物质体系尤其是生命体系动力学过程和分子相互作用的重要方法, 但如何理解生命体系中单分子运动行为的复杂性仍是一个巨大的挑战. 针对这一问题, 本工作提出了一种可对单分子轨迹进行高效识别和分类的、基于无监督学习的“两步归类法”: 首先利用熵约束最小二乘法对扩散轨迹的受限程度进行区分, 继而通过统计检验将非受限轨迹划分为亚扩散、正常扩散和超扩散等不同运动模式类型. 利用该方法, 本工作解析了DOPC模型细胞膜和活细胞膜内的单分子扩散运动特征, 揭示了胆固醇成分对二者的差异影响. 结果显示: 模型膜和活细胞膜均包含多种不同的扩散模式; 在DOPC模型膜体系中, 胆固醇成分会阻碍膜内的分子扩散运动, 且阻碍程度与胆固醇含量正相关; 在活细胞体系中, 分子运动速率显著低于模型膜体系, 并且, 胆固醇的去除会进一步减慢分子扩散速率. 本研究有助于从单分子运动角度深入理解生物分子运动行为的复杂性及其对体系环境的依赖性.

English Abstract

    • 细胞膜的流动性是其重要特征之一, 与许多基本生理过程密切相关, 包括细胞迁移、胞吞、胞吐、信号识别与传导以及细胞对外界刺激的响应等[1]. 膜的流动性受到细胞膜组分多样性和膜内环境拥挤性等因素的强烈影响, 并呈现出与功能相关的空间异质性(从分子水平上形成的脂筏到中尺度水平上形成的微区)以及时间动态特征[2,3]. 这些复杂多变的特点给常规生化研究方法带来困难[4]. 因此, 如何从分子层次上理解膜流动性仍然是目前相关研究面临的主要挑战[57].

      胆固醇(cholesterol, Chol)是调节细胞膜结构、流动性、渗透性、张力以及对外界刺激响应性的关键分子, 占哺乳细胞膜内脂质总量的约40%[8]. 从结构上看, 胆固醇会嵌入脂质膜并与磷脂共同组装, 并限制其酰基链构象灵活性[9]. 此外, 胆固醇与不同酰基链长度和饱和度的脂质之间相互作用的差别会导致形成具有特定组成、堆积密度和有序性的相态(如液体有序相Lo和液体无序相Ld等). 然而, 目前人们对于胆固醇对膜流动性的影响仍知之甚少[10,11], 部分研究结果存在广泛争议[7]. 由于活细胞膜的复杂性和现有研究方法的局限性, 关于胆固醇对膜性质影响的研究常使用由不饱和脂质1, 2-二油基-n-甘油–3-磷脂酰胆碱(DOPC)或饱和脂质双棕榈酰基磷脂酰胆碱(DPPC)和胆固醇所组成的模型膜来进行[5]; 但值得注意的是, 基于模型细胞膜与真实活细胞膜的研究结果之间可能存在差异[12,13]. 一种可能性是, 尽管胆固醇局部增强了不饱和及饱和脂质膜的曲率刚度, 但其却能促进液体有序(Lo)区域中的流动性和/或阻碍液体无序(Ld)相区域中物质扩散[10,14].

      单分子运动追踪技术(SMT)为监测细胞内尤其是细胞质膜界面处的动力学过程和分子相互作用提供了一种有效方法[15]. SMT已被广泛应用于多个生物过程的研究中, 包括外源颗粒(如病毒和mRNA)的内化、膜蛋白的激活以及跨膜信号传导(如配体诱导的受体内吞作用)等[16,17]. 目前, 单分子技术主要侧重于颗粒和膜蛋白的运动跟踪, 而对于细胞膜的关键组成部分——脂质的扩散行为则关注较少[18]. 实际上, 单分子运动追踪技术既专注于研究单个分子层面的信息, 又通过大量分子提供系综层面分析, 这为多尺度解析脂质分子运动特征及其变化提供了可能的有效途径[19,20].

      生物体系中的单分子运动行为极为复杂, 例如, 粒子在活细胞环境中会表现出正常扩散、异常扩散以及受限运动等多种运动模式. 因此, 如何准确识别粒子在复杂环境中的运动模式是当前单分子运动研究的一个重点. 近年来, 不同的机器学习方法被尝试用于单分子运动轨迹的识别, 如逻辑回归[21]、随机森林[22]、贝叶斯方法[23]、深度学习[24]等. 相较传统方法, 这些方法展示出更高的识别准确性, 但也存在一些局限. 例如, 以往的一些方法集中于监督学习方法, 通过对数据进行处理将单分子轨迹识别问题转化为分类问题. 然而真实数据的标注往往较为困难, 因此这类方法常基于计算模拟生成的训练数据集来进行模型训练, 然而模拟数据与实验数据的区别会导致模型可能存在着较大的局限性[25].

      本研究采用单脂质分子追踪技术, 探究了胆固醇对模型膜和活细胞膜流动性的差异影响. 特别是, 我们开发了一种基于无监督学习方法的分类机器学习模型, 能有效地对细胞膜内单分子扩散运动进行分类, 并针对不同类型的运动模式分别进行分析; 在此基础上, 研究了由DOPC和胆固醇组成的模型膜以及活细胞膜中的脂质分子运动特征, 发现去除胆固醇对这两种体系会产生不同的影响. 本研究为生物体系中单分子运动追踪技术提供了一种定量且有效的轨迹分类分析方法, 并从单分子运动角度阐明了胆固醇对不同成分膜流动性所带来的差异影响.

    • 分子扩散运动是分子间相互作用的一种表现形式; 细胞膜内脂质分子扩散行为的变化可反映出细胞膜成分、结构和性质的变化, 甚至是界面生物过程的演变. 人们在实验中广泛观察到分子在生物相关环境中的扩散运动与其在稀溶液中的情况发生偏离. 这通常归因于细胞和细胞膜的环境拥挤性和结构非均质性等因素的影响, 最明显体现为均方位移(MSD)随滞后时间(lag time)表现出次线性幂律增长规律、扩散系数(DL)显著降低、空间位移(displacement)非高斯分布性、以及存在非均匀扩散模式和静止粒子等[19,2628]. 目前人们已经提出了几种理论模型来解释这些现象, 如高斯模型、分数布朗运动模型(fBM)、连续时间随机行走模型(CTRW)、以及描述异质环境中阻碍运动的洛伦兹模型等[29]. 然而, 在不同体系中关于脂质分子扩散行为特征、胆固醇对其影响以及模型膜与真实细胞体系之间的差异性仍不清楚.

      目前, 粒子运动类型推断主要是基于均方位移(MSD)分析[30]:

      其中, $ {X}_{t} $表示粒子运动轨迹, $ {t}_{0} $表示轨迹起始时刻, $ {t}_{} $表示轨迹运动时间, $ \|\cdot \| $表示欧几里得范数, $ {E}_{} $表示随机变量的期望. 由于真实实验中分子运动轨迹数量有限, 通常会使用由单个轨迹计算出的时间平均均方位移(TAMSD)作为 MSD的估计:

      其中$ n $表示滞后项. 值得强调的是, 滞后项的选择会影响MSD的计算. 根据以前的研究结果[31,32], 我们将以不超过粒子轨迹长度一半($ N/2 $)作为滞后项的选择标准[33].

      根据Saxton和Jacobson[34]的研究结果, 不同扩散类型具有不同的MSD曲线形状(图1(a)), 其函数形式如下:

      这里$ D $表示粒子的扩散系数. $ \alpha $是表示异常扩散 指数: 当$ 0 < \alpha < 1 $时, 粒子表现为亚扩散(sub-diffusion); 当$ 1 < \alpha < 2 $时, 粒子表现为超扩散(super-diffusion); 当$ \alpha = 1 $时, 则为正常扩散(normal diffusion). $ v $表示粒子定向扩散时的速度. 方程(6)中$ {r}_{{\mathrm{c}}} $表示约束半径, 常数$ {A}_{1} $$ {A}_{2} $为约束形状参数. 如图1(a)所示, 不同扩散类型的MSD函数图像会呈现出独特的特征, 这为采用不同的函数族来识别扩散运动类型提供了依据. 本文主要讨论粒子在二维空间的运动. Kusumi等[35]和Saxton[36]的研究表明二维空间受限一般包括方形和圆形两种情况, 并给出了方程(6)在这两种情况下的精确级数解. 在后续的研究中, 我们使用圆形对二维受限区域进行刻画. 并且, 由于我们实验体系中不包含粒子的定向扩散, 因此在下面的分析中主要考虑正常扩散、异常扩散和受限扩散这3种运动模式.

    • 我们发展了一种“两步归类法”对单分子轨迹进行识别和分类(图1(b)). 与以往的方法不同的是, 这个方法是一种无监督学习方法, 能够在没有额外训练数据的情况下自动对大量单分子轨迹数据进行识别, 具有简单高效等特点. 此外, 该方法考虑了受限运动、正常扩散和异常扩散等多种粒子运动模式, 因而可对复杂粒子运动轨迹进行有效识别和分类, 并计算相应的扩散系数和异常指数. 简而言之, 我们首先建立了一个概率混合模型, 并通过熵约束最小二乘法来识别受限扩散和非受限扩散轨迹; 然后通过统计检验方法确定非受限轨迹的扩散类型(亚扩散、正常扩散、超扩散).

      假设粒子的运动轨迹为受限扩散的概率为$ {P}_{1} $, 非受限扩散概率为$ {P}_{2} $, 且$ {P}_{1}+{P}_{2}=1 $, 则粒子运动TAMSD可表示为

      因此, 当$ {P}_{1} > {P}_{2} $时, 轨迹以更大的概率属于受限扩散; 当$ {P}_{1} < {P}_{2} $时, 轨迹以更大的概率属于非受限扩散. 我们可通过熵约束最小二乘方法对参数进行估计:

      其中$ \lambda $为惩罚参数, $ \lambda \geqslant 0 $, 通过调整$ H\left(P\right) $的大小控制模型复杂度. $ {P}_{i} $表示概率, 求和为1. 在理想情况下, $ {P}_{i} $的取值只有一个为1, 其余为0, 表示此时的轨迹可被准确识别. 因此, 我们添加信息熵($ H\left(P\right) $)对模型进行约束, 具体形式为

      信息熵最早由Shannon[37]提出, 用来度量信息不确定性. 这里通过信息熵对概率$ P $进行惩罚, 以降低模型复杂度.

      由于方程(7)是非线性的, 因此(8)式的求解是一个非凸非线性优化问题. 序列二次规划算法(SQP)是求解约束非线性优化问题最有效的方法之一[38], 具有收敛性好、计算效率高、边界搜索能力强等优点. 因此, 我们使用SQP将原始非线性优化问题转换为多个简单二次规划子问题进行求解. 对于非凸问题求解, 可以使用启发式算法结合SQP, 如GA-SQP[39], PSO-SQP[40]. 但启发式算法的时间复杂度较高, 不利于处理大量粒子运动轨迹数据. 并且, 非凸问题求解容易受到初值选择的影响, 因此我们通过随机抽样方法产生多组不同的初值, 使用不同初值迭代求解得到多个局部最优解, 并从中选择使(8)式达到最小的解作为最终结果. 通过真实数据测试后发现200组初值即可在计算精度和时间之间达到较好平衡, 因此, 在后续处理中均设置初值组数为200.

      通过(8)式的求解可以区分出扩散轨迹的受限或非受限特征. 之后, 还需要对非受限轨迹中的正常扩散、亚扩散和超扩散等类型进行识别. 本文中识别是基于两种不同统计检验方法来进行, 它们的区别主要在于选择检验统计量不同.

      在不同类型扩散中, 异常指数$ \alpha $的取值范围不同, 因此可通过异常指数$ \alpha $直接对轨迹进行区分, 即设置一个任意截断参数$ c~(0 < c < 1) $:

      1)若$ \alpha < 1-c $, 则为亚扩散.

      2)若$ \alpha > 1+c $, 则为超扩散.

      3)若$ 1-c < \alpha < 1+c $, 则为正常扩散.

      截断参数$ c $一般根据经验来判断, 常见取值 范围为0.1—0.25, 但不同取值对分类结果影响较大[41,42]. 因此给定一个合理$ c $值是保证方法有效的关键. 对于异常指数$ \alpha $的估计, 一种最常用方法是对TAMSD进行对数变换, 建立线性模型,

      然后通过线性模型最小二乘估计得到关于$ \alpha $的估计值. 现有研究已证明在长轨迹下此方法是$ \alpha $的渐近无偏估计, 随着轨迹的增加方差趋于0; 即使对于单个(足够长的)轨迹, 这种方法也可准确估计异常指数[33]. 因此, 我们考虑基于线性模型检验的统计量给出$ c $取值:

      其中,

      $ \widehat{{\mathrm{log}}}\left({r}^{2}\left({t}_{i}\right)\right) $为TAMSD的预测值, 具体见文献[33]; $ {t}_{\delta /2}\left(n-2\right) $表示自由度为$ n-2 $$ t $分布, $ \delta /2 $设为$ 5{\text{%}} $. 当异常指数$ \alpha $$ 90{\text{%}} $置信区间包含1时, 则可以认为是正常扩散; 当置信区间上界小于1时, 则为亚扩散; 当置信区间的下界大于1时, 则为超扩散.

      第二种识别方法是基于Briane等[31]提出的检验统计量$ {T}_{N} $:

      其中, $ {t}_{0} $表示起点时刻, $ {t}_{N} $表示终点时刻, $ {D}_{N}= \underset{i=1, \dots , N}{{\mathrm{max}}}{\|{X}_{{t}_{i}}-{X}_{{t}_{0}}\|}_{2} $表示在给定时间段$ [{t}_{0}, {t}_{N}] $内粒子从起点移动的最大距离, $ {T}_{N} $可看作是关于$ {D}_{N} $的标准化. $ {\hat{\sigma }}_{N}^{2} $表示$ {\sigma }^{2} $的一致估计量, 如:

      其中$ \varDelta ={t}_{i}-{t}_{i-1} $, 表示单位位移时间. 对于自由扩散(布朗运动), $ {T}_{N} $分布不依赖于$ \sigma $. 当粒子运动受到阻碍, 运动过程停留在其初始位置附近, 表现为次扩散状态, 此时$ {T}_{N} $值较小; 当粒子远离其初始位置, 表现为超扩散状态. 例如粒子可以由分子马达驱动沿某个方向移动(超扩散), 此时对应的$ {T}_{N} $值较大. 因此, 可借助$ {T}_{N} $判断粒子的扩散状态. 在文献[31]中, Briane等分析了大样本下$ {T}_{N} $的渐近分布, 然而真实实验中轨迹长度往往有限, 例如我们在实验中观察到的轨迹长度一般不大于100, 此时使用渐近分布作为短轨迹样本的分位数近似可能是不够准确的[41]. 但是, $ {T}_{N} $及其分位数$ {q}_{N}\left(\delta /2\right) $的分布可以通过Monte Carlo模拟来近似[31,41]. 当$ {T}_{N} < {q}_{N}\left(\delta /2\right) $时, 运动轨迹为亚扩散, 当$ {T}_{N} > {q}_{N}(1- \delta /2) $时, 运动轨迹为超扩散, 其他则为正常扩散. 具体计算过程见补充材料(online)中算法S1和算法S2.

    • 模型膜制备 制备采用以下分子: 1, 2-二油基-sn-丙三基–3-磷脂酰胆碱(DOPC, Avanti公司)、头部基团以丽丝胺罗丹明标记的1, 2-二油基-sn-丙三基–3-磷脂酰乙醇胺(RhB-DOPE, Avanti公司)、胆固醇(Chol, Merk公司)、甲基-β-环糊精(MeβCD, Sigma公司).

      以传统的囊泡融合法制备平板支撑脂质双层膜, 其脂质成分分别为纯DOPC, DOPC与Chol摩尔比为4∶1, DOPC与Chol摩尔比为1∶1, 所有膜内以0.0001%比例(摩尔比)掺以RhB-DOPE; 之后, 将3种模型膜经5 mmol/L浓度MeβCD溶液(溶解在PBS中)在37 ℃孵育30 min后以PBS冲洗(在我们之前的工作中已经证明该方法能够有效去除模型膜和活细胞内的胆固醇却不会导致膜的破坏或细胞毒性)[43]. 由此获得6种模型膜体系.

      活细胞样品制备及单分子追踪 小鼠黑色素瘤细胞(B16)来自中国科学院典型培养物保藏委员会细胞库(CACC). 细胞培养于DMEM培养基(Gibco, Thermo Fisher)中, 添加胎牛血清(FBS, 10% (体积分数), Gibco)和青霉素/链霉素(1% (体积分数), Gibco). 将细胞经5 mmol/L浓度MeβCD溶液(溶解于无血清DMEM培养基)在37 ℃孵育30 min后以PBS冲洗来去除胆固醇, 之后培养于用无血清培养基中. 在单分子实验前, 将细胞以CellMaskTM 荧光分子(Thermo; 以5×10–5 mg/mL浓度溶解于PBS)孵育30 min后以PBS冲洗, 之后立刻置于TIRFM下观察. 在基于模型膜的参照实验中, CellMaskTM 荧光分子与RhB-DOPE荧光脂质表现出相似的单分子扩散运动行为(补充材料图S1 (online)).

      单脂质分子追踪 将模型膜及活细胞样品置于全内反射荧光显微镜(TIRFM, Olympus IX71配以100×全内反射专用油镜)下观察, 以EMCCD(Andor DU-897U)采集单分子荧光信号. RhB荧光团的激发使用532 nm激光器(Coherent, 200 mW, 60%功率), 采集使用EM BP 585/40 nm. CellMaskTM的激发使用647 nm激光器, 采集使用EM BP 706/95 nm. 视频采集频率为每秒50帧, 成像尺寸为41 μm × 82 μm, 分辨率为160 nm, 每个视频包含300帧. 截取60帧(模型膜)或20帧(活细胞膜)长度的轨迹进行分析.

    • 采集3种成分模型膜(纯DOPC, DOPC:Chol = 4∶1, DOPC:Chol = 1∶1)及其经MeβCD去除胆固醇后共6个体系模型膜内的单脂质扩散运动轨迹. 在所有体系中, 脂质轨迹皆显示出显著的异质性, 这可体现在轨迹回转半径(Rg)的巨大差异上(补充材料图S2 (online)). 基于前文阐述的“两步归类法”对各体系内单脂质分子扩散轨迹进行识别和分类, 将其分为受限扩散(confined diffusion)、亚扩散(sub-diffusion)、正常扩散(normal diffusion)、超扩散(super-diffusion) 4种类型, 并由此将轨迹分为4个子群(表1, 典型曲线显示于补充材料图S3 (online)). 分别计算不同体系不同子群内单分子轨迹的系综平均MSD, 并进一步计算系综扩散系数(DL)和异常指数(α)(表1); 同时, 计算单分子轨迹的时间平均MSD以及对应的单分子扩散系数(补充材料图S3 (online)), 并展示其分布(图2).

      由分类及计算结果可知, 6个模型膜体系内皆同时包含4种扩散运动类型, 且亚扩散类型轨迹所占比例最高, 约45%±2%. 随膜内胆固醇含量增大(由0增至20%, 50%), 受限运动和亚扩散分子比例增多(由55%增至65%; 尤其是受限运动分子, 由13%增至21%); 同时, 正常扩散和超扩散运动分子比例降低(由45%降至35%). 更显著的是, 胆固醇增加会导致各子群的系综扩散系数显著降低(除受限扩散持续保持低值), 尽管其异常指数并没有明显差异. 这一规律同时体现在系综扩散系数(表1)及单分子扩散系数概率分布(图2)中. 进一步地, 后者表明该变化是由于快速运动分子的速率减慢(如图2(c)中峰A的下移)和慢速运动分子的数目增多(如图2(c)中峰B的升高)这两个因素同时导致的(典型曲线见补充材料图S3 (online)). 总之, 上述结果表明胆固醇阻碍了DOPC模型膜内脂质分子扩散, 使得所有分子运动速率变慢, 更造成10%的分子由正常扩散或超扩散模式转为亚扩散甚至受限模式.

      有趣的是, 经MeβCD去除胆固醇之后的3个模型膜体系, 它们在4个子群中皆表现出相似的分子数目比例、系综扩散系数和异常指数, 并与纯DOPC膜情况接近, 例如其正常扩散子群的扩散系数约为(2.0±0.1) μm2/s; 这一点在单分子扩散系数分布(图2绿色分布)和系综MSD曲线(补充材料图S4 (online)蓝色箭头)中也得到了验证. 这意味着MeβCD去除胆固醇能够将DOPC/Chol混合膜内的脂质分子扩散运动恢复至纯DOPC膜的水平.

      值得注意的是, 活细胞膜内的单分子扩散运动呈现出与模型膜不同的特征. 由于活细胞膜内复杂拥挤的环境降低了脂质分子发生超扩散运动的可能性, 所以我们将分子轨迹分为受限运动、亚扩散和正常扩散3个子群(表2图3). 结果显示, 所有分子运动普遍较慢, 其中亚扩散分子比例最高, 约占45%; 受限运动分子比例约为31%, 远高于模型膜内13%—22%的水平; 正常扩散分子仅占24%. 同时, 亚扩散和正常扩散分子的系综扩散系数分别为0.07 μm2/s和0.47 μm2/s, 均远低于模型膜对应的数值. 更有趣的是, MeβCD去除胆固醇进一步降低了活细胞膜内的分子扩散(补充材料图S5 (online)). 这一方面体现在受限分子比例增大(由31%到39%)和正常扩散分子比例降低(由24%至13%); 另一方面体现在3个子集内系综扩散系数普遍减小(例如正常扩散分子的扩散系数由0.47 μm2/s降至0.26 μm2/s); 单分子扩散系数概率分布图(图3)及位移概率分布图(补充材料图S6 (online))显示, 这一变化是由于大量分子运动速率普遍降低(如图3(c)中橙色箭头)和慢速运动分子比例增大(如图3(c)中峰A、峰B的升高; 图S6中蓝色箭头)共同导致的. 总之, 活细胞膜内单分子扩散运动比DOPC/Chol模型膜内慢得多, 存在着更多的受限分子, 且去除胆固醇会进一步阻碍膜内单分子运动. 考虑到MeβCD处理主要去除细胞膜脂筏内的胆固醇, 该现象可能是由于脂筏结构破坏后释放出的大量饱和脂质和膜蛋白阻碍膜内单分子扩散运动而导致的.

      为了更直观比较模型膜与活细胞膜内单分子扩散运动的差异, 我们绘制了模型膜(以纯DOPC和DOPC∶Chol = 1∶1混合膜为例)和活细胞膜(MeβCD去除胆固醇之前及之后)内单分子扩散系数及异常指数的二维分布图(图4)、以及包括位移(displacement)参数的三维分布图(见补充材料模型膜和活细胞膜内单分子运动轨迹的扩散系数、异常指数、位移的三维分布视频(online)). 由图4可以观察到4个体系的DL值分布呈现出明显的差异: 纯DOPC膜的DL分布明显高于DOPC∶Chol = 1∶1混合膜、以及活细胞膜和去除胆固醇后的活细 胞膜; 同时, 它们都包含大量受限(静止)分子. 相较之下, 4个体系的α值分布并无显著差别, 皆处于一个较大范围. 补充材料中的三维分布视频(online)进一步显示出位移(即分子运动速率)呈现与DL类似的规律. 这些结果意味着, 在不同膜体系之间, 尽管单分子扩散运动速率存在较大差异, 但它们都是多种运动模式的混合, 都会涉及复杂的分子间相互作用.

    • 针对细胞膜内单脂质分子扩散运动的复杂模式, 本文提出了一种无监督学习的“两步归类法”, 用于识别和分类单分子轨迹, 并将轨迹划分为受限扩散(confined diffusion)、亚扩散(sub-diffusion)、正常扩散(normal diffusion)以及超扩散(super-diffusion)等不同运动模式. 利用该方法, 实现了对不同运动模式下分子轨迹子群的独立分析, 并研究了DOPC/Chol组成的模型细胞膜和活细胞膜中单分子扩散运动行为特征以及胆固醇成分的影响. 结果显示, 即使是单一成分的纯DOPC模型膜, 其单脂质分子扩散运动也会呈现出不同的模式, 反映出膜体系内复杂的分子间相互作用; 此外, 胆固醇的加入会降低脂质分子的扩散速率, 增大受限分子和亚扩散分子的比例, 且影响程度与胆固醇的比例正相关. 相较而言, 活细胞膜内分子的扩散速率更慢、受限分子和亚扩散分子比例更高; 并且, MeβCD处理和去除胆固醇会进一步降低膜内分子扩散速率. 特别是, “两步归类法”为区分单分子运动轨迹提供了一种高效、定量的准确方法, 且不受运动模式种类的限制; 但不足之处在于, 该方法以单条轨迹为基元开展分析, 忽视了单条轨迹内不同时间阶段运动模式的可能差异. 单分子(单粒子)追踪技术在时间和空间的多尺度上提供了待测系统的动态变化信息, 在生物及传统软物质研究领域具备独特优势和广阔应用前景. 本工作聚焦于模型及活细胞膜内的脂质分子运动, 然而, 该技术在膜蛋白激活和凝聚、蛋白质与细胞膜的相互作用、外源粒子入侵细胞等过程以及单细胞运动分析等研究中也有着重要应用[4447]. 目前的单分子追踪主要关注分子在二维平面(如细胞膜内)的运动, 这得益于较慢的分子扩散速率(比在细胞质中慢约100倍)、有限的Z方向上分子运动以及高选择性全内反射照明来降低背景噪声. 然而事实上, 分子的跨膜运动以及膜曲率变化等也是备受关注的生物过程[48]. 总的来说, 本工作发展了区分单分子运动模式的方法, 并基于此揭示了DOPC模型膜和活细胞膜内不同的单脂分子运动特征、以及胆固醇成分对两个体系的差异影响.

    参考文献 (48)

目录

/

返回文章
返回