Un projet de génome de Yersinia pestis de victimes de la Peste Noire

La Peste Noire de 1347-1351, causée par la bactérie Yersinia pestis2,3, fournit l’un des meilleurs exemples historiques d’une infection émergente à dissémination rapide et à mortalité élevée, revendiquant une proportion estimée de 30 à 50% de la population européenne en seulement cinq ans4. Les écarts dans les tendances épidémiologiques entre la maladie médiévale et les infections modernes de Y. pestis ont déclenché une controverse sur l’agent étiologique de la pandémie5,6., Bien que d’anciennes recherches sur L’ADN aient fortement impliqué Y. pestis2, 3 dans l’ancienne pandémie, les changements génétiques de la bactérie peuvent être en partie responsables des différences dans la manifestation et la gravité de la maladie. Pour comprendre l’évolution de l’organisme, il est nécessaire de caractériser les changements génétiques impliqués dans sa transformation d’un agent pathogène sylvatique à un agent capable d’une infection humaine pandémique à l’échelle de la Peste Noire, et de déterminer sa relation avec les souches actuellement en circulation., Ici, nous commençons cette discussion en présentant le premier projet de séquence du génome de l’ancien agent pathogène.

Y. pestis est un descendant récemment évolué du bacille Yersinia pseudotuberculosis7, qui au cours de son évolution a acquis deux plasmides supplémentaires (pMT1 et pPCP1) qui lui fournissent des mécanismes spécialisés pour infiltrer les hôtes mammifères. Pour étudier les changements évolutifs potentiels dans l’un de ces plasmides, nous avons rapporté le criblage de 46 dents et 53 os de la collection East Smithfield de Londres, Angleterre pour la présence du Y., ppcp1 spécifique à pestis (réf. 3). Les données historiques indiquent que le cimetière D’East Smithfield a été établi à la fin de 1348 ou au début de 1349 spécifiquement pour l’inhumation des victimes de la peste Noire8 (figures supplémentaires 1 et 2), ce qui rend la collection bien adaptée aux recherches génétiques de L’Ancien Y. pestis. Les données de séquence D’ADN pour cinq dents obtenues par capture moléculaire du pPCP1 spécifique de Y. pestis ont révélé un motif de dommages C à T caractéristique de L’ADN ancien endogène authentique 9, et l’assemblage des lectures Illumina regroupées a permis la reconstruction de 98,68% des 9.,Plasmide à 6 kilobases avec une couverture au moins double3.

pour évaluer la pertinence des méthodes basées sur la capture pour reconstruire le génome ancien complet, de multiples extraits D’ADN provenant à la fois des racines et des couronnes provenant de quatre des cinq dents qui ont donné la couverture pPCP1 la plus élevée3 ont été utilisés pour l’enrichissement par matrice (Agilent) et le séquençage L’élimination des molécules dupliquées et le filtrage subséquent ont produit un total de 2 366 647 lectures chromosomiques de haute qualité (Tableau supplémentaire 1a, b) avec une longueur moyenne de 55 fragments.,53 paires de base (fig. 4), ce qui est typique pour L’ADN ancien. Les estimations de couverture ont donné une moyenne de 28,2 lectures par site pour le chromosome, et 35,2 et 31,2 pour les plasmides pCD1 et pMT1, respectivement (Fig. 1a, c, d et tableau supplémentaire 1b, c). La couverture était prévisible pour pPCP1 (fig. 1e) car les sondes spécifiques à ce plasmide n’étaient pas incluses sur les réseaux. Couverture corrélée à la teneur en GC (fig. 6), une tendance précédemment observée pour les données de séquence à haut débit11., La couverture sur chaque moitié du chromosome était inégale en raison des différences de profondeur de séquençage entre les deux réseaux, avec 36,46 et 22,41 lectures moyennes par site pour les réseaux 1 et 2, respectivement. Bien qu’une plus grande profondeur ait contribué à augmenter le nombre moyen de lectures par site, elle n’a pas augmenté la couverture globale, les deux réseaux couvrant 93,48% des régions ciblées avec une couverture minimale d’un facteur (tableau supplémentaire 1b)., Cela indique que notre procédure de capture a réussi à récupérer des molécules de modèle de toutes les régions génomiques accessibles via cette méthode, et que le séquençage plus approfondi n’entraînerait pas de données supplémentaires pour les régions de modèle CO92 non couvertes dans notre ensemble de données.

Figure 1: diagrammes de couverture pour les régions génomiques séquencées.

l’architecture du génome est connue pour varier considérablement parmi les souches existantes de Y. pestis12. Pour extrapoler l’ordre des gènes dans notre génome ancien, nous avons analysé la cartographie des lectures à la référence CO92 pour tous les extraits provenant d’un seul individu qui a donné la couverture la plus élevée (individu 8291). Malgré la longueur de lecture courte de nos séquences anciennes et la nature très répétitive du génome de Y. pestis, 2 221 contigs correspondant au CO92 ont été extraits, soit un total de 4 367 867 bp., Pour identifier les régions potentielles du génome ancien qui sont architecturalement distinctes du CO92, toutes les lectures non cartographiées à la référence CO92 ont été à leur tour considérées pour la construction de contig. Après filtrage pour une longueur minimale de 500 pb, il restait 2 134 contigs comprenant 4 013 009 PB, dont 30 959 provenaient de lectures non mappées. La recherche par explosion conventionnelle interrogée sur le génome CO92 a identifié des correspondances pour 2 105 contigs. Des preuves d’architecture altérée ont été identifiées dans 10 contigs (tableau supplémentaire 2). Un exemple d’une telle variante structurelle est illustré à la Fig., 2, où l’assemblage guidé par référence incorporant des lectures non mappées pour enjamber le point d’arrêt valide sa reconstruction. Cette orientation génétique spécifique ne se retrouve que chez les souches de Y. pseudotuberculosis et de Y. pestis Mictrotus 91001, Angola, Pestoides F et B42003004, qui sont ancestrales à toutes les souches de Y. pestis couramment associées aux infections humaines (souches de la branche 1 et de la branche 213,14). De plus, des divergences dans la disposition de cette région dans les souches modernes de Y. pestis de la branche 1 et de la branche 2 indiquent que des réarrangements se sont produits comme des événements distincts sur différentes lignées.,

Figure 2: alignement des contigs reconstruits cartographiés par rapport aux génomes CO92 et Microtus.

Les différences D’un seul nucléotide entre notre génome ancien et la référence CO92 ne comportaient étonnamment que 97 positions chromosomiques, et 2 et 4 positions dans les plasmides pCD1 et pMT1, respectivement (tableau supplémentaire 3), indiquant une conservation génétique étroite dans cet organisme au cours des 660 dernières années. Vingt-sept de ces postes N’étaient pas signalés dans une analyse précédente de y existant., diversité pestis14 (tableaux supplémentaires 3 et 4). La comparaison de notre génome ancien avec son ancêtre Y. pseudotuberculosis a révélé que la séquence médiévale contenait le nucléotide ancestral pour les 97 positions, indiquant qu’il ne possède aucune position dérivée absente chez les autres souches de Y. pestis. Deux différences chromosomales3 précédemment rapportées n’étaient pas présentes dans nos données de séquence génomique, ce qui suggère qu’elles proviennent probablement de cytosines désaminées qui auraient été éliminées dans l’étude actuelle par traitement uracile-ADN-glycosylase avant la capture du réseau.,

pour placer notre génome ancien dans un contexte phylogénétique, nous avons caractérisé les 1 694 positions phylogénétiquement informatives précédemment identifiées14 (tableau supplémentaire 4), et comparé celles de notre organisme ancien aux données agrégées d’appel de base pour 17 génomes de Y. pestis accessibles au public et l’ancestral Y. pseudotuberculosis. Si l’on considère séparément les séquences de trois des quatre victimes, il n’y a que deux substitutions de la racine de toutes les souches existantes de Y. pestis pathogènes pour L’homme (fig. 3a), et ils montrent une relation plus étroite avec la branche 1 Y., pestis que vers la branche 2; cependant, l’une des quatre victimes (individu 6330) a été infectée par une souche qui contenait trois positions dérivées supplémentaires observées dans tous les autres génomes de la branche 114. Cela suggère la présence de plusieurs souches dans la pandémie de London 1348-1350 ou des changements microévolutionnaires s’accumulant dans une souche, ce qui est connu pour se produire dans les épidémies de maladie15. Soutien supplémentaire pour Y., la microévolution de pestis est indiquée par la présence de plusieurs positions variantes pour lesquelles les données de séquence d’un individu montrent deux nucléotides différents à des fréquences comparables (tableau supplémentaire 5). La Position 2896636, par exemple, est une position polymorphe connue dans les populations existantes de Y. pestis14, et cette position montre l’état dérivé fixe chez un individu (6330) et l’état polymorphe dans un autre (individu 8291) à une couverture minimale quintuple (fig. supplémentaire. 7). Cela fournit un exemple remarquable de microévolution capturée lors d’une pandémie historique., Les positions de variance restantes sont inchangées dans les 18 génomes existants de Yersinia, elles peuvent donc être uniques à l’ancien organisme et présentent donc un intérêt supplémentaire. Un échantillonnage supplémentaire de génomes anciens aidera à déterminer la fréquence de ces mutations dans les souches de Y. pestis en co-circulation, et clarifiera l’émergence de souches de la branche 2 qui ne sont pas encore signalées dans les échantillons anciens.

Figure 3: placement phylogénétique et contexte historique de la souche East Smithfield.,

des topologies arborescentes cohérentes ont été produites en utilisant plusieurs méthodes de construction et tous les nœuds principaux ont été pris en charge par des valeurs de probabilité postérieure (pp) de >0.96 et des valeurs>90 (fig. 3b et autres fig. 8 et 9). Les arbres placent la séquence East Smithfield près du nœud ancestral de toutes les souches existantes de Y. pestis pathogènes humains (seulement deux différences en 1 694 positions) et à la base de la branche 1 (fig. 3b)., Une date sûre pour le Site East Smithfield de 1348-1350 nous a permis d’attribuer un étalonnage de pointe à la séquence ancienne et ainsi dater l’Heure de divergence des génomes modernes et du génome East Smithfield en utilisant une approche bayésienne. Les estimations temporelles indiquent que tous les Y., les pestis couramment associés à l’infection humaine partageaient un ancêtre commun il y a entre 668 et 729 ans (ad 1282-1343, densité de probabilité la plus élevée de 95%, HPD), englobant un intervalle de temps beaucoup plus petit que les estimations récemment publiées14 et indiquant en outre que tous les isolats de branche 1 et de branche 2 actuellement en circulation ont émergé au 3b), pouvant provenir d’une source D’Asie orientale comme cela a été suggéré antérieurement14., Cela implique que la peste médiévale a été le principal événement historique qui a introduit les populations humaines à l’ancêtre de toutes les souches pathogènes connues de Y. pestis. Cela remet en question l « étiologie de la peste du sixième au huitième siècle de Justinien, communément supposé avoir résulté du même agent pathogène: nos estimations temporelles impliquent que la pandémie a été causée soit par une variante de Y. pestis qui est distincte de toutes les souches actuellement en circulation couramment associées aux infections humaines, ou c » était une autre maladie.

Bien que notre approche de l’utilisation d’un existant Y., le modèle de référence pestis pour la conception des appâts a empêché notre capacité à identifier les régions génomiques qui pourraient avoir été présentes dans l « organisme ancien et ont ensuite été perdues dans le CO92, les comparaisons génomiques de notre séquence ancienne par rapport à ses outgroups les plus proches peuvent donner de précieuses informations sur l » évolution de Y. pestis. La souche Microtus 91001 est la branche 1 et la branche 2 les plus proches qui ont été confirmées non pathogènes pour les humains16, par conséquent les changements génétiques peuvent représenter des contributions à l’adaptation de l’agent pathogène à un hôte humain., Les comparaisons avec ce groupe externe ont révélé 113 changements (tableau supplémentaire 6a, b), dont beaucoup se trouvent dans des gènes affectant des fonctions associées à la virulence comme la formation de biofilm (hmsT), l’acquisition de fer (iucD) ou l’adaptation à l’environnement intracellulaire (phoP). De même, bien que son potentiel de virulence chez L’homme n’ait pas encore été confirmé à notre connaissance, Y. pestis B42003004 isolé d’une population de marmottes Chinoises17 a été identifié comme la souche la plus proche du nœud ancestral de tous les Y., pestis généralement associée à la peste humaine, et peut donc fournir des informations clés concernant l’évolution de l’organisme. La comparaison du génome complet avec la séquence D’East Smithfield n’a révélé que huit différences de nucléotides simples (tableau supplémentaire 6c), dont six entraînent des changements non synonymes (tableau supplémentaire 6d). Bien que ces différences n’affectent probablement pas la virulence, l’influence de la perte de gènes, du gain de gènes ou des réarrangements génétiques, qui sont tous bien documentés chez Y. pestis12,18, est encore indéterminée., En termes évolutifs plus récents, des différences d’un seul nucléotide dans plusieurs gènes associés à la pathogénicité connus ont été trouvées entre notre génome ancien et la séquence de référence CO92 (tableau supplémentaire 3), ce qui pourrait représenter d’autres adaptations aux hôtes humains.,

grâce à un enrichissement par capture D’ADN couplé à un séquençage ciblé de L’ADN à haut débit, nous avons reconstruit un projet de génome pour ce qui est sans doute l’agent pathogène humain le plus dévastateur de l’histoire, et révélé que la peste médiévale du XIVe siècle était probablement responsable de son introduction et de sa Cela indique que l’agent pathogène impliqué dans la Peste Noire a des parents proches au XXIe siècle qui sont à la fois endémiques et émergents19., L’introduction de nouveaux pathogènes dans les populations est souvent associée à une augmentation de l’incidence et de la gravité de la maladie20 et bien que les mécanismes régissant ce phénomène soient complexes21, les données génétiques provenant de maladies infectieuses anciennes apporteront des contributions inestimables à notre compréhension de la coévolution hôte–pathogène. La Peste Noire est un exemple marquant d’une infection émergente, parcourant l’Europe et causant la mort d’environ 30 millions de personnes en seulement 5 ans, ce qui est beaucoup plus rapide que les taux contemporains d’infection par la peste bubonique ou pneumonique22 et de dissémination7,8., Quoi qu’il en soit, bien qu’aucune souche existante de Y. pestis ne possède le même profil génétique que notre ancien organisme, nos données suggèrent que peu de changements dans les gènes associés à la virulence connus se sont accumulés au cours des 660 années d’évolution de l’organisme en tant qu’agent pathogène humain, ce qui suggère en outre que sa virulence accrue perçue dans l’histoire23 pourrait ne pas être due à de nouvelles mutations à point fixe détectables par l’approche analytique décrite ici., Dans notre résolution actuelle, nous posons que les changements moléculaires dans les agents pathogènes ne sont qu’une composante d’une constellation de facteurs contribuant à modifier la prévalence et la gravité des maladies infectieuses, où la génétique de la population hôte 24, le climat25, les dynamiques vectorielles 26, les conditions sociales27 et les interactions synergiques avec les maladies concomitantes28 devraient être au premier plan dans les discussions sur la sensibilité de la population aux maladies infectieuses et les relations hôte–pathogène par rapport aux infections à Y. pestis.

Laisser un commentaire Annuler la réponse