细胞的状态和功能通过基因表达的时空调控实现[1],但现有的转录组测序技术不能同时具有时间和空间分辨率[2-13]。建立具有时间、空间和单细胞分辨率的转录组测序技术,对于研究基因转录和转录后调控具有重要意义。应用TEMPOmap,系统探究了RNA的生成、转运和降解速率,在亚细胞水平揭示了RNA的动力学图谱。
研究人员利用修饰碱基5-乙炔尿苷(5-Ethynyl Uridine,5-EU)标记新生成的RNA,然后设计含有基因特异条形码的探针,利用一个三元探针策略实现含有5-EU标记RNA的特异性原位扩增和测序,建立具有时间、空间和单细胞分辨率的转录组测序技术TEMPOmap(图1)。
图1. TEMPOmap流程概述:代谢标记新生成RNA,基于三元探针策略对标记RNA特异性原位扩增并测序
(图源:Ren. et al., Nature methods, 2023)
研究人员应用TEMPOmap,在HeLa 细胞对选取的991个靶向基因进行原位检测。利用TEMPOmap测序结果的时间和空间分辨率,研究人员计算了靶向转录本在RNA生命周期的四个关键动力学常数:合成(synthesis, α)、降解(degradation, β)、核外输出(nuclear export, λ)和胞质内转运(cytoplasmic translocation,γ),来量化转录和转录后RNA不同阶段的动力学过程。其中,为了系统地评估每个RNA分子在 3D 空间随时间的相对位置变化,研究人员提出了相对距离比(distance-ratio, DR)的概念,通过跟踪DR随时间的变化来计算胞质转运速率(图2)。
图2. RNA动力学参数的估计动态模型
(图源:Ren. et al., Nature methods, 2023)
为了探究RNA的空间动力学是否与基因功能存在对应关系,研究人员利用每个基因的动力学参数对靶向基因进行聚类分析。结果揭示了五个具有不同RNA的空间动力学图谱的基因簇(gene clusters),同时这些基因簇在时间上也有不同的表达特征和亚细胞分布。基因功能(gene ontology, GO)分析表明,这五个基因簇与不同的生物学功能相关联。进一步分析Cluster 4 中的基因表达,发现大多数基因(125个中的109个)在细胞周期G1期具有负的细胞质转运值,并且这些基因与膜结合蛋白相关。作者认为这些编码膜蛋白的RNA可能也在动态水平上受到调控,在细胞周期的基础上,在时空进行定位控制。作者由此提出两种可能的RNA转运机制:一种是通过主动的RNA运输到内质网,另一种通过细胞周边非内质网锚定的RNA的局部降解。作者提出的模型从时空两个角度提供了更全面的膜蛋白质在RNA水平上的动态调控图谱(图3)。
图3. Cluster 4 基因在 G1 期间进行反向 mRNA 转运(γ)的两种可能机制:定向RNA转运和局部RNA降解
(图源:Ren. et al., Nature methods, 2023)
最后,研究人员利用TEMPOmap研究了另外两种异质性细胞类型中mRNA的时空动态,并计算上述的四个动力学常数,定量评估了所有这些细胞类型中时间和空间上的RNA动力学模式。在hiPSC-CMs(human induced pluripotent stem cells-derived cardiomyocytes)测序结果中(图4),研究人员观察到,与合成(α)、降解(β)和核外转运(λ)相比,胞质转移(γ)通常在心肌细胞(cardiomyocytes, CMs)和心脏成纤维细胞(cardiac fibroblasts)之间具有更高的差异性,这可能与这两种细胞类型的不同细胞形态有关。细胞类型标记基因散布在不同的动力学基因簇中,但它们在相应的细胞类型中的合成速度和核外转运速度更快,降解速度更慢。这表明RNA的动力学调节会优先表达具有重要功能的基因,并将不需要基因的遗漏转录本(leaky transcripts)清除。
图4. a, 图示hiPSC-CMs具有混合的心肌细胞(cardiomyocytes)和心脏成纤维细胞(cardiac fibroblasts)。b,热图显示了hiPSC-CMs中两种细胞类型利用动力学参数进行基因聚类
(图源:Ren. et al., Nature methods, 2023)
在原代皮肤细胞(primary skin cells) 的测序结果中,基因的聚类分析也显示了不同细胞类型内每个基因簇一致的RNA动力学图谱,反映了动力学参数是RNA的内在特性(图5)。基因簇的GO分析显示,具有高降解和低核外转运速率的转录本富集于胞质蛋白;具有中等降解和细胞质转运的基因富含于跨膜蛋白和免疫相关蛋白质;具有较低降解和适度转位的基因富含于核糖体和细胞结构。这些结果表明,细胞使用多步组合来调控功能上不同的RNA,这塑造了基因簇在时间上的表达水平。即不同功能的RNA在其生命周期内被动态地“塑造”着。
图5. a, 原代人类皮肤细胞(黑色素细胞、角质形成细胞和成纤维细胞)的分离示意图。b,热图显示皮肤细胞中不同细胞类型中使用动力学参数的基因聚类结果。c,每个基因簇的功能富集分析
(图源:Ren. et al., Nature methods, 2023)
综上所述,研究人员建立了具有时间、空间和单细胞分辨率的时空转录组测序技术TEMPOmap,为精准研究RNA时空调控和发现新的基因表达调控机制提供了工具。将TEMPOmap应用于多种细胞系,绘制了亚细胞水平的RNA动力学图谱,并揭示了RNA动力学参数和细胞类型以及细胞周期之间的联系。在后续研究中,TEMPOmap可以与高通量单细胞功能基因组学技术(例如CRISPR筛选)相结合,以确定影响RNA生命周期动力学图谱的关键分子因素。另外,这种时空转录组学模式也可用于阐明各种生命现象的分子机制,包括发育、模式形成、学习、记忆、生物钟以及疾病的发病和进展。