13659630032
 
新闻资讯

AG尊龙凯时科研 MOL BIOL EV(IF:16)生态位适应过程中的正选择导致细菌染色体基因顺序的大规模和不可逆的重排


更新时间:2024-02-02 11:26      点击次数:

  AG尊龙凯时科研 MOL BIOL EVOL(IF:16)生态位适应过程中的正选择导致细菌染色体基因顺序的大规模和不可逆的重排

  虽然遗传漂变可能导致基因顺序的重排,但另一种假说认为,基因顺序的重排是由生态位适应(SNAP)过程中的正选择驱动的。

  对细菌基因组的分析表明,虽然不同物种有许多共同的基因,但它们在染色体上的线性顺序通常是不保守的。虽然遗传漂变可能导致基因顺序的重排,但另一种假说认为,基因顺序的重排是由生态位适应(SNAP)过程中的正选择驱动的。本研究首次为SNAP假说提供了实验支持。我们进化了沙门氏菌(Salmonella)以适应苹果酸作为唯一碳源的生长,并遵循进化轨迹。对新环境生长的最初适应涉及1.66 Mb的重复,相当于沙门氏菌染色体的三分之一。选择这种重复是为了增加参与苹果酸摄取的单个基因dctA的拷贝数。持续的选择导致重复区域的重复基因快速丢失或突变。在2000代之后,初始重复基因只有31%保持完整,沙门氏菌染色体内的基因顺序发生了显著且不可逆的改变。这些结果验证了SNAP假说的预测,并表明在生态位适应过程中的选择可以成为染色体基因顺序重排的强大驱动力。

  译名:生态位适应过程中的正选择导致细菌染色体基因顺序的大规模和不可逆的重排

  肠杆菌目(Enterobacteriales)发生在大约5亿年前(Mya),是-变形菌纲(Gammaproteobacteria)中最近分化的一个目。该目的近缘物种可以在染色体上显示几乎相同的基因线 Mya的鼠伤寒沙门氏菌(S. Typhimurium)和大肠杆菌的染色体基因顺序差异主要在于两个物种之间倒位的563 kb长片段上(图1C)。比较在肠杆菌目(约300-500 Mya)进化早期分化的鼠伤寒沙门氏菌和10个奇异变形杆菌(Proteus mirabilis)的染色体,表明这种基因顺序的保守性并没有在细菌目中保持(图1C)。在分化超过500 Mya的物种之间观察到的任何长期基因顺序保守性都归因于操纵子的存在。人们通常认为染色体基因顺序的改变是遗传漂变的结果。遗传漂变模型假设细菌染色体的线性组织受到弱选择的影响,并受到倒位、转座、删除和水平基因转移等重排事件的影响。随着时间的推移,大量的连续重排事件可能会改变染色体上基因的线性顺序。

  我们最近提出了一种可能有助于快速染色体重组的额外机制。SNAP假说提出基因顺序重排可能来自生态位适应期间的正选择。SNAP假说提出了细菌在进入一个新的生长环境时可能经历的进化轨迹(图1A和B)。首先,通过增加营养转运蛋白基因的表达,选择可以提供选择性优势的染色体区域的复制。这个初始的基因组快速扩增阶段之后是一个减少阶段。在此阶段,重复基因将被丢失,以减少重复拷贝中不需要的基因(由于资源浪费或干扰正常生理机能)造成的健康劣势。基因的失活将随机发生在每个重复拷贝中,这最终将导致重复区域内基因线A和B)。

  图1 SNAP假说。(A)SNAP模型示意图概述。选择重复的基因以深蓝色显示,重复区域末端两侧的同源区域用蓝色矩形表示,红十字表示被删除基因的拷贝。(B)SNAP模型各阶段重复大小的变化。浅蓝域表示Mte+,2000G分离株沿SNAP轨迹的进展(31%的重复残留)。(C)鼠伤寒沙门氏菌(NC_003197)与大肠杆菌(NC_000913)和奇异变形杆菌(NC_010554)的全基因组比对(每段大小为5 kb)。每条黑线下方显示的同源区域相对于鼠伤寒沙门氏菌是倒位的。

  SNAP假说预测的进化轨迹可以分为四个连续阶段:重复、选择、失活和固定(图1A和B)。固定阶段标志着一个不可逆转的点,在这个点上,唯一可行的前进道路是逐步灭活重复基因,这将最终导致细菌染色体上基因顺序的改变。为了通过实验验证SNAP假说,我们定义了五个需要实现的具体预测:(i)在新生态位的生长过程中经常出现大量染色体重复;(ii)由于少量重复基因的拷贝数增加,为新生态位中的细菌提供了选择性益处;(iii)生态位内的持续进化导致某些重复基因(包括必需基因)的个别拷贝失活;(iv)重复区域内突变的积累将防止重复的分离。(v)突变将随机分布在重复区域的两个拷贝之间。

  在非致死的选择性环境中,发生细菌染色体大小片段的重复是很常见的。利用新碳源的能力已被证明是在新的环境生态位中建立种群的潜在关键事件。因此,我们使用以苹果酸作为唯一碳源的基本培养基来模拟新的生长环境。苹果酸是野生型沙门氏菌(Salmonella)的低碳源,它只能在最小苹果酸琼脂上形成很小的菌落(48 h后直径约1 mm)(图2A),并且在最小的苹果酸液体培养基中生长24 h后,光密度几乎没有增加(图2F)。先前的研究表明,当将沙门氏菌置于最小苹果酸琼脂上时,可以检测到大菌落变体。遗传图谱表明,在大菌落变体中存在大量的染色体重复,但从未对这些分离株进行全基因组测序。我们在最小苹果酸琼脂上重复选择沙门氏菌,发现大菌落变体(称为Mte+)出现的频率为4×10-4。分离出两个独立的Mte+菌落并对其进行全基因组测序。序列分析表明,两个分离株的染色体中都含有一个相同的1.66 Mb串联重复,两侧是重复的ccmABCDEFGH操纵子,该操纵子编码细胞色素c型生物发生蛋白(图2B)。ccm操纵子提供了一个6.3 kb的序列同源区域,这解释了19个Mte+菌落被选择的高频率。这些数据表明,在新的生长环境中,可以迅速选择高达细菌染色体三分之一的重复。其中一个已测序的Mte+分离株用于进一步的进化实验。

  图2 Mte+重复的选择与分析。(A)最小苹果酸平板上野生型(WT)和Mte+菌落的比较AG尊龙凯时。(B) Mte+分离株的标准化读取深度覆盖。指出了在重复区域内参与苹果酸利用的6个基因的位置。(C)重复区域中包含的6个苹果酸利用基因的蛋白质功能示意图。(D)删除参与苹果酸利用的单个基因,并选择Mte+菌落。对携带yhiT、meaB和STM3081缺失的Mte+菌落的读取深度分析如下图所示。

  Mte+菌株的重复包含1529个基因,其中6个与苹果酸利用有关。这些基因编码两种C4-二羧酸转运蛋白(DctA和YhiT)、三种苹果酸脱氢酶(MaeB、Mdh和STM3081),以及调节dctA表达的转录调节因子Crp(图2B和C)。我们使用两种不同的方法测试了这六个基因中哪一个是选择重复的主要驱动力。首先,我们需要知道这六个基因中哪一个对Mte+重复的选择是必需的。为此,我们构建了一组5个具有单基因缺失的菌株(不包括对生长至关重要的crp),并在最小苹果酸平板上选择大菌落变体。正如预期的那样,缺失dctA或mdh的细菌不能在以苹果酸作为单一碳源的环境下生长。对于其余三个分离株(maeB、STM3081和yhiT),可以选择含有Mte+重复的大菌落变体(图2D)。因此,只有三个基因(crp、dctA和mdh)对于Mte+重复的选择是必需的。接下来,我们确定任何单个基因的重复是否足以解释Mte+菌株在最小苹果酸培养基中适应性的增加。构建了6个具有单基因重复的菌株,并测量了它们在最小苹果酸培养基中的生长速率(图2E和F)。野生型沙门氏菌在生长24 h后光密度几乎没有增加。在6个携带maeB、mdh、STM3081和yihT重复的菌株中,仍有4个菌株无法以苹果酸作为碳源生长,而携带crp重复的菌株仅略微升高(图2F和补充图S1,补充材料在线)。与之形成鲜明对比的是,dctA的重复显著改善了菌株的生长特性,导致指数倍增时间接近于携带Mte+重复的菌株的指数倍增时间(Mte+:1065 min,dctAdup:1393 min)和生长24 h后难以区分的光密度(Mte+:OD600nm0.570.01,dctAdup:OD600nm0.550.07)(图2F)。由于crp是dctA表达的调节因子,因此在crp重复菌株中观察到的生长改善很可能也是dctA表达增加的结果。综上,这些数据表明,dctA的重复是必要的,足以解释Mte+菌株生长特性的改善,并且单个基因的重复可以成为选择染色体上1.66 Mb重复的驱动力。

  我们的实验表明,增加单个基因(dctA)表达的选择压力会迅速导致染色体的大部分重复。SNAP假说预测,新生态位内的持续进化将导致未被选择的重复基因失活,并最终导致染色体重复段内的基因顺序重排(图1B和C)。另一种可能性是最终会出现增加dctA表达的突变(如在dctA启动子区域内),从而减轻对Mte+重复的选择。在这种情况下,重复可以在不改变染色体内基因顺序的情况下分离。

  为了测试这两种可能性,我们通过连续传代在最小苹果酸培养基中进化出五个独立的Mte+菌株谱系(图3A)。经过500代进化后,将培养物接种到最小苹果酸平板上,从每个谱系中分离出单个菌落并进行全基因组测序。序列分析表明,所有的分离株都没有完全丢失Mte+重复,而是在重复区域内分离出了一个大片段。5个分离株中有4个分离株在两个同源转座子基因(tnpA-3和tnpA-5)之间分离出约1 Mb的含有977个基因的大片段(图S2,在线个分离株因yfdZ和yheS基因的非同源重组而丢失了包含1023个基因的1.1 Mb序列。该分离株还在原始重复区域之外的基因yedI和nfo之间获得了额外的23 kb重复(图3B,图S2,在线补充材料)。每个菌株在重复区域外都获得了一个突变,但在重复区域内没有(在线)。这些结果与SNAP假说一致,并表明至少在短期内,不会选择足以将dctA基因表达提高到所需水平的突变。为了测试这一观察结果是否长期正确,我们决定通过灭活细菌错配修复系统来加快进化速度,从而提高突变率。我们删除了5个分离株中的mutL基因,这5个分离株在最小苹果酸培养基中的突变率增加了300倍以上(图3D),并继续进化实验。在额外的500代生长后,我们将培养物铺板并分离出每个谱系的单个菌落。全基因组序列分析显示,原始Mte+重复的残余在所有5个分离株中保持稳定(图S3,在线补充材料)。突变也开始在重复区域内积累,5个分离株都携带3-8个突变(表S1和S2,在线补充材料)。最有趣的是,一个谱系(Mte+,1000G)在这些基因的两个拷贝之一中获得了两个必需基因glySQ357*和nrdBI147T的突变(图3C)。GlyS是甘氨酸-tRNA连接酶的β亚基。Q357*无义突变截断了该蛋白,导致C端丢失332个氨基酸,其中包括反密码子结合结构域。因此,在该分离株中观察到的8个突变中至少有一个突变使SNAP假说预测的重复基因的拷贝失活。其他7个突变是氨基酸取代,可能会降低相应蛋白质的活性(表S1,在线代突变率加速的世代),所有谱系都按照SNAP假说预测的进化轨迹进化。我们对携带glyS失活突变的菌株(称为Mte+,1000G)特别感兴趣。SNAP预测,必需基因的失活突变是永久固定原始重复的关键基石。我们将进化努力集中在携带glyS突变的Mte+,1000G分离株上,并进化了10个谱系,再进化500代,之后我们从每个谱系分离单个菌落用于全基因组测序。和以前一样,Mte+重复的残余仍然存在于所有10个分离株中(图3B,图S4,补充材料在线),并且每个菌株在重复区域内获得了3-16个额外的突变(表S1和S2,补充材料在线)。基因失活突变(定义为无义突变和24个移码突变)的数量增加到每个菌株多达4个突变。一个菌株(Mte+,1000G)在必需基因folC P360fs内获得了25个额外的失活突变。FolC是二氢叶酸合成酶,突变去除了C端最后62个氨基酸。虽然该区域不包含已知的基本结构域,但这种大小的截断预计会降低蛋白质的功能。

  我们得出结论,在新的生态位内的进化导致重复基因(包括必需基因)的逐步删除和失活,正如SNAP假说所预测的那样。经过1500代的进化,Mte+,1000G中完整重复基因的数量已从1529个基因减少到495个基因,相当于减少了68%(图3E)。

  图3 Mte+分离株的长期进化。(A)进化实验的示意图。(B)沿进化轨迹的四个菌株的读取深度和突变分析。基因编码序列中的非同义突变由黑线(非必需基因)和红线(必需基因)表示。(C)重复区域中的突变分析示例(显示了26%的reads)。共有核苷酸和氨基酸序列显示在上方(glyS野生型reads)和下方(glySK138*reads)。(D)野生型和mutL沙门氏菌在最小苹果酸培养基中的突变率。(E)概述了沿进化轨迹的菌株中Mte+重复区域内的重复基因数量。(F)沿进化轨迹的四个菌株的重复稳定性分析。线表示三个生物学重复的平均值。Mte+,1500G和Mte+,2000G分离株均完全稳定。(G)沙门氏菌(上)与Mte+,2000G分离株(下)之间野生型基因的基因顺序比较。仅显示重复区域内具有突变/删除等位基因的基因。基因线性顺序的变化用灰色三角形表示。

  到目前为止的进化实验都是在大种群规模的液体培养中进行的(Mte+,1000G菌株的种群规模约为1.5×1011cfu)。这些条件对进化中的细胞施加了一种持续的竞争状态,并将进化轨迹限制在最适合的细胞上。在系统中引入遗传漂变是否可以通过减轻对最佳适应度的要求来增加重复区域内基因的损失率。为了解决这个问题,我们在最小苹果酸琼脂平板上进化了10个Mte+,1000G谱系。单菌落的连续重复划线代的进化,每个谱系的最终菌落都进行了全基因组测序。结果表明,增加遗传漂变的可能性使重复区域内的突变累积率增加了55%(Mann-Whitney检验,95%置信水平,p= 0.035)。因此,平均累积突变数从1000-1500代的6.4个/谱系增加到1500-2000代的9.9个/谱系(表S1和S2,在线补充材料)。其中一个谱系(Mte+,2000G)在染色体的重复区域内共携带28个突变,其中9个被预测为基因失活突变。在该菌株中,野生型重复基因的总数从1529个基因减少到478个基因(减少了69%)。

  本研究的数据表明(i)适应新生态位内的生长可以选择大的染色体重复,并且(ii)新生态位内的持续进化导致重复基因的丢失。SNAP假说的下一个预测是,即使在没有初始选择压力的情况下,重复区域内突变的积累也会导致重复的固定。每一个额外的突变都有能力限制分离重复的潜在可能性,因为这种分离可能导致染色体缺失必需基因。一旦在重复区域内积累了临界数量的突变,任何有效的分离都将变得不可能。此时,丢失剩余重复基因的唯一途径是逐步失活/删除。为了测试这个预测是否正确,我们选择了一组四个直接相关的菌株,它们代表进化实验进化轨迹的每个步骤(Mte+、Mte+,500G、Mte+,1000G、Mte+,1500G和Mte+,2000G)并测量了富培养基中重复的稳定性(图3f)。重复在未进化的分离株(Mte+)中迅速丢失,每代丢失率为24.2%。相比之下,与SNAP假说的预测一致的是,重复随着每个额外的进化周期变得越来越稳定。经过1500代的进化,重复完全稳定,在富培养基中的生长过程中没有观察到可行的分离(图3F,表1)。

  这些数据证实了SNAP假说的预测,即重复区域内突变的积累将导致一个不可逆转的点,在这个点上重复的分离变得不可行。在这一点上,进化轨迹被锁定,这不可避免地导致细菌染色体内基因顺序的重排。我们的数据表明,这一点可以在1500代生长中达到,这意味着即使是相对短暂地适应新的生长环境也可能导致细菌染色体内基因顺序的重排。

  SNAP假说做出的最后一个预测是,突变将随机分布在重复的两个拷贝之间。从理论上讲,所有的突变都可能发生在重复的同一拷贝中,这不会导致基因顺序的重排。不幸的是,本研究中用于识别重复和突变的短读长测序并没有揭示突变位于哪些拷贝中。为了解决这一局限性,我们选择了三个进化菌株:Mte+,500G来确定初始大片段缺失的位置,Mte+,1500G和Mte+,2000G来确定点突变的位置。我们在这些菌株的重复区域内引入选择性缺失,然后进行全基因组测序,以确定哪些突变随着缺失而丢失,哪些突变仍然保留(图4)。这种方法使我们能够识别每个获得性突变的位置(表2)。我们发现初始大片段缺失和12个突变发生在左侧拷贝中,而16个突变发生在重复的右侧拷贝中(基于沙门氏菌染色体的线性顺序)。这些结果表明,突变确实随机出现在重复区域的两个拷贝中,并表明在最小苹果酸培养基中进化的沙门氏菌菌株的基因顺序在2000代后已经发生显著改变(图3G)。

  图4 鉴定进化分离株中大片段缺失和突变的位置。(A)Mte+,500G分离株的染色体被分为五个部分(A-E)并设计了2个缺失(L和R),以确定C部分的位置AG尊龙凯时。灰色十字表示由于缺少必需基因而不能存活的染色体结构。虚线框显示了两个转化实验获得的菌落数量。(B-G)旨在识别突变位置的缺失示意图(左)和转化后Mte+,1500G(B-E)或Mte+,2000G(F-G)分离株的读取深度覆盖分析(右)。黑色虚线表示最初重复部分的位置,绿色星号表示用于定位所选突变的序列。

  细菌基因组中低水平的基因顺序保守性已得到充分证实。连续的染色体倒位是基因顺序可以重排的一种机制,实际上,倒位已被认为是许多细菌物种中的一种组织变异,有时显示与反向重复序列之间的重组有关,例如核糖体RNA操纵子或包括原噬菌体在内的可移动遗传元件。然而,在何种程度上观察到细菌染色体上基因顺序的长期进化缺失是由于重叠倒位的连续影响,这仍然是一个悬而未决的问题。在许多情况下,重叠倒位预期不会给受影响的菌株带来任何直接的选择优势。我们提出了一种机制,可以在适应新的环境生态位的过程中利用正选择的力量来驱动染色体快速重排:SNAP假说,涉及携带基因的染色体片段的重复,在这些基因片段中,增加的拷贝数提供了适应性优势,随后每个重复拷贝的随机基因丢失过程导致基因顺序重排(图1)。虽然SNAP假说是对细菌基因组重排的一个有吸引力的解释,但它从未得到实验验证。在本研究中,我们以鼠伤寒沙门氏菌为模型,测试了SNAP假说的关键预测。我们发现,适应新环境的正选择导致细菌染色体基因顺序的快速和不可逆的重排。

  在进化过程中,随着生物、化学和物理环境的变化,细菌会频繁地承受适应新的生长条件的压力,比如温度、pH值、氧气水平、可用碳源、抗菌化合物和金属以及不断变化的生物环境带来的新的机遇和挑战。根据进化论,新物种的产生与遗传隔离和对这些新环境生态位的适应密切相关。SNAP的进化适应将导致基因顺序的快速重排,这是这一过程不可避免的副产物。SNAP将有助于通过减少通过水平基因转移(例如接合或转化)获得重组DNA片段的可能性AG尊龙凯时,将新适应的种群与其最近的祖先进行遗传隔离。重要的是,这种适应和基因重排的过程可以起源于单个创始细胞,不需要大规模种群或获得性稀有突变,整个过程由正选择和一系列高频事件快速驱动。

 

Copyright© 2022-2024 AG 尊龙凯时 - 人生就是搏! 版权所有HTML地图 XML地图   TEL: 13659630032

地址:亳州市全策街396号      邮箱:bubbling@163.com

赣ICP备19013813号