细菌通过水平基因转移(horizontal gene transfer, HGT)获取新的DNA,如果转移的DNA被保留在受体细胞中,则受体细胞的生理和活性可能会被转移的DNA中编码的基因显著改变[1,2]。这一过程有助于细菌的基因组多样性,使其快速适应不断变化的环境条件并提供竞争优势,同时也促进了细菌病原体中致病性基因岛和抗生素抗性基因的传播[3,4],由此引起的抗菌素耐药性导致的公共卫生挑战被广泛关注。因此,了解HGT机制有助于解释细菌进化,对于控制病原体和抗生素耐药性也至关重要。
细菌的HGT途径主要为由质粒/转座子介导的接合,噬菌体介导的转导和转化,而转化需要受体菌建立感受态使其能够吸收胞外DNA[5]。该课题组之前的研究发现了在枯草芽胞杆菌(Bacillus subtilis)中一种高频的细胞间基因转移的现象,有趣的是,这个过程要求受体菌建立感受态,但是几乎完全抵抗DNase的处理,并且似乎需要在供体和受体细胞之间紧密接近(close proximity),这种供体细胞和受体细胞之间存在协调过程的现象被称为细胞间自然转化(cell-to-cell natural transformation, CTCNT)[6]。CTCNT采用活的供体细胞充当转化体系中的DNA来源,其转化频率相较于枯草芽胞杆菌的二步法转化或者外源游离DNA做为转化DNA来源的自然转化(DNA-to-cell natural transformation, DTCNT),在单个或者多个筛选标记下都具有明显优势,但是,目前尚不清楚CTCNT高转化频率背后的机制。该研究报道了在枯草芽胞杆菌CTCNT通过增加转移事件的数量和促进大型连续基因组区域的转移来促进枯草芽胞杆菌的HGT,并指出了活细胞作为转化DNA的来源在自然环境中的潜力。

图1 枯草芽胞杆菌CTCNT-C多个遗传标记的共转化
(图源:Liping Deng et al., Nucleic Acids Research, 2023)
为了确定CTCNT-C高效率的潜在机制,使用全基因组测序(whole genome sequencing,WGS)来确定CTCNT-C获得的转化子中转移的DNA片段的长度和重组事件的数量。供体菌和受体菌的基因组上均匀分布了70909个单核苷酸多态性(single nucleotide polymorphism, SNP),这些SNP提供了遗传标记的高密度图谱,平均密度约为每56 bp中含有1个,最终通过比较转化子中连续的SNP来确定供体特异性片段。
当只有trpC作为单个筛选标记时,通过CTCNT-C得到的转化子中trpC侧翼的连续DNA片段最长达246.4 kb,而DTCNT-C的只有17.01 kb(图2)。这些结果证实了CTCNT-C促进连续的大DNA片段的转移,与前面的遗传学实验的结果相一致。除了选择的trpC位点外,CTCNT-C还促进了大量未选择的DNA片段的转移,每个CTCNT-C转化子都额外还有4-30次的转化事件,而DTCNT-C转化子绝大多数小于5次。这些数据表明,枯草芽胞杆菌CTCNT-C过程的重组菌株中,重组事件非常频繁的发生在所选标记以外的位置,这也证实了多次转化是遗传标记共同遗传的主要机制。
图2 CTCNT-C和DTCNT-C在单个筛选标记下转移的DNA片段
(图源:Liping Deng et al., Nucleic Acids Research, 2023)
在12个CTCNT-C的转化子中测序数据中可以看出供体特异性SNPs遍布在基因组(图2A),假设转化片段DNA重叠部分仅计算一次,则转移区域的总长度达到2.07 Mb,占供体基因组的51.58%。这表明大约一半的供体基因组可以被转化。为了探究枯草芽胞杆菌CTCNT-C中HGT事件的最大数量和获得的基因组区域的最大长度,对于同时选择多个标记物的重组子进行WGS分析。与单个筛选标记结果类似,转化子中除了被选中的多个筛选区域被回补外,在所选标记物以外的染色体位置的重组事件普遍存在(图3)。每个重组体平均发生了40次转化事件,最多的进行了66次整合,最大转移片段高达346.93 kb。每个转化子获得的供体DNA的总长度显著增加,从0.7到1.5 Mb不等,其中一个重组菌的基因组上36.52%的区域(1539.4 kb)被来自供体菌株的同源序列所取代。相比之下,平均只有280 kb 的供体DNA片段镶嵌在单个trpC筛选下的重组菌株染色体上。另外,连续的长DNA片段附近有许多小片段,有些可能是当初被细胞质切割成小片段的,如果将这些小片段聚类成重组束,平均转化片段长度则增加了1.3倍。综上所述,与DTCNT-C相比,CTCNT-C促进了更大规模的基因组替换,特别是当同时选择多个标记时。
图3 多个筛选标记下CTCNT-C转移的DNA片段
(图源:Liping Deng et al., Nucleic Acids Research, 2023)