La Morte Nera di 1347-1351, causata dal batterio Yersinia pestis2,3, fornisce uno dei migliori esempi storici di infezioni emergenti con la diffusione rapida e alta mortalità, sostenendo stima che il 30-50% della popolazione Europea in soli cinque anni period4. Le discrepanze nelle tendenze epidemiologiche tra la malattia medievale e le moderne infezioni da Y. pestis hanno acceso polemiche sull’agente eziologico della pandemica5, 6., Sebbene le antiche indagini sul DNA abbiano fortemente implicato Y. pestis2,3 nell’antica pandemia, i cambiamenti genetici nel batterio possono essere parzialmente responsabili delle differenze nella manifestazione e gravità della malattia. Per comprendere l’evoluzione dell’organismo è necessario caratterizzare i cambiamenti genetici coinvolti nella sua trasformazione da un agente patogeno silvatico a uno capace di infezione umana pandemica sulla scala della Morte nera e determinare la sua relazione con i ceppi attualmente circolanti., Qui iniziamo questa discussione presentando la prima bozza di sequenza genomica dell’antico patogeno.
Y. pestis è un discendente recentemente evoluto del bacillo Yersinia pseudotuberculosis7, che nel corso della sua evoluzione ha acquisito due plasmidi aggiuntivi (pMT1 e pPCP1) che gli forniscono meccanismi specializzati per infiltrare gli ospiti dei mammiferi. Per studiare i potenziali cambiamenti evolutivi in uno di questi plasmidi, abbiamo riportato sullo screening di 46 denti e 53 ossa dalla East Smithfield collection di Londra, Inghilterra per la presenza della Y., pestis-specifica pPCP1 (ref. 3). I dati storici indicano che l’East Smithfield burial ground è stato istituito alla fine del 1348 o all’inizio del 1349 appositamente per la sepoltura delle vittime della peste nera8 (fichi supplementari 1 e 2), rendendo la collezione adatta per le indagini genetiche dell’antica Y. pestis. I dati della sequenza del DNA per cinque denti ottenuti tramite cattura molecolare del pPCP1 specifico per Y. pestis hanno rivelato un modello di danno da C a T caratteristico dell’autentico DNA9 endogeno antico, e l’assemblaggio delle letture illuminate ha permesso la ricostruzione del 98,68% del 9.,plasmide 6-kilobase con una copertura minima di due volte3.
Per valutare l’idoneità dei metodi basati sulla cattura per ricostruire il genoma antico completo, gli estratti multipli del DNA sia dalle radici che dalle corone che derivano da quattro dei cinque denti che hanno prodotto il più alto coverage3 pPCP1 sono stati usati per l’arricchimento basato a matrice (Agilent) ed il sequenziamento ad alto rendimento successivo sulla piattaforma Illumina gai10. La rimozione di molecole duplicate e il successivo filtraggio hanno prodotto un totale di 2.366.647 letture cromosomiche di alta qualità (Tabella supplementare 1a, b) con una lunghezza media del frammento di 55.,53 coppie di basi (Fig. 4), che è tipico per il DNA antico. Le stime di copertura hanno prodotto una media di 28,2 letture per sito per il cromosoma e 35,2 e 31,2 per i plasmidi pCD1 e pMT1, rispettivamente (Fig. 1a, c, d e Tabella supplementare 1b, c). La copertura era prevedibilmente bassa per pPCP1 (Fig. 1e) perché le sonde specifiche per questo plasmide non sono state incluse negli array. Copertura correlata al contenuto di GC (Fig. 6), una tendenza precedentemente osservata per i dati di sequenza ad alto throughput 11., La copertura su ciascuna metà del cromosoma era irregolare a causa delle differenze nella profondità di sequenziamento tra i due array, con 36,46 e 22,41 letture medie per sito per array 1 e array 2, rispettivamente. Sebbene una maggiore profondità abbia contribuito a un maggior numero di letture medie per sito, non ha aumentato la copertura complessiva, con entrambi gli array che coprono il 93,48% delle regioni interessate ad una copertura minima di una volta (tabella supplementare 1b)., Ciò indica che la nostra procedura di acquisizione ha recuperato con successo molecole modello da tutte le regioni genomiche accessibili tramite questo metodo e che un sequenziamento più profondo non produrrebbe dati aggiuntivi per le regioni modello CO92 non coperte dal nostro set di dati.
Figura 1: grafici di copertura per le regioni genomiche sequenziate.
a, c–e, trame di copertura per il cromosoma (a) e i plasmidi pMT1 (c), pCD1 (d) e pPCP (e). Copertura in blu, contenuto GC in verde., Le linee di scala indicano 10-, 20-, 30-, 40- e 50 volte la copertura e 10%, 20%, 30%, 40% e 50% di contenuto GC. Per i plasmidi, il rosso corrisponde alle regioni codificanti, il giallo agli elementi mobili. Cromosoma mostra copertura mediana per gene. I plasmidi mostrano ogni sito tracciato. Le distribuzioni di copertura per i plasmidi sono mostrate in Fig. 5. b, Le distribuzioni mostrano una copertura cromosomica dell’array 1 (blu) e dell’array 2 (rosso), indicando che il sequenziamento più profondo aumenta il numero di letture per sito, ma non influenza sostanzialmente la copertura complessiva.,
PowerPoint slide
L’architettura del genoma è nota per variare ampiamente tra i ceppi Y. pestis esistenti 12. Per estrapolare l’ordine genico nel nostro antico genoma, abbiamo analizzato la mappatura delle letture al riferimento CO92 per tutti gli estratti derivanti da un singolo individuo che ha prodotto la copertura più alta (individuo 8291). Nonostante la breve durata di lettura delle nostre sequenze antiche e la natura altamente ripetitiva del genoma di Y. pestis, sono stati estratti 2.221 contigs corrispondenti a CO92, per un totale di 4.367.867 bp., Per identificare potenziali regioni dell’antico genoma che sono architettonicamente distinte da CO92, tutte le letture non mappate al riferimento CO92 sono state a loro volta considerate per la costruzione di contig. Dopo il filtraggio per una lunghezza minima di 500 bp, sono rimasti 2.134 contigui comprendenti 4.013.009 bp, di cui 30.959 derivanti da letture non mappate. Ricerca BLAST convenzionale interrogato contro il genoma CO92 identificato partite per 2.105 contig. La prova di architettura alterata è stata identificata in 10 contig (Tabella supplementare 2). Un esempio di tale variante strutturale è mostrato in Fig., 2, dove l’assemblaggio guidato dal riferimento che incorpora letture non mappate per coprire il punto di interruzione convalida la sua ricostruzione. Questo orientamento genetico specifico si trova solo nei ceppi Y. pseudotuberculosis e Y. pestis Mictrotus 91001, Angola, Pestoides F e B42003004, che sono ancestrali a tutti i Y. pestis comunemente associati a infezioni umane (ceppi di ramo 1 e ramo 213,14). Inoltre, le discrepanze nella disposizione di questa regione nel ramo 1 e nel ramo 2 dei moderni ceppi di Y. pestis indicano che i riarrangiamenti si sono verificati come eventi separati su diversi lignaggi.,
Figura 2: Allineamento dei contig ricostruiti mappati rispetto ai genomi CO92 e Microtus.
Le letture mappate nelle posizioni A (blu) e B (verde) sono distanti 231 kb nel genoma CO92 linearizzato. Sequenza adiacente è alta copertura anche se solo 18× e 20× è mostrato a causa di vincoli di spazio (nero) per A e B, rispettivamente. La variante strutturale è stata assemblata utilizzando letture che non hanno mappato a CO92 (rosso)., La sua posizione è mostrata sul cromosoma linearizzato Microtus 91001 dove le mappe contig 9,096 bp con identità 100%.
diapositiva di PowerPoint
a Singolo nucleotide differenze tra il nostro antico genoma e l’CO92 di riferimento sorprendentemente consisteva di soli 97 posizioni cromosomiche, 2 e 4 posizioni in pCD1 e pMT1 plasmidi, rispettivamente (Tabella Supplementare 3), che indica stretto conservazione genetica in questo organismo nel corso dell’ultimo 660 anni. Ventisette di queste posizioni non sono state dichiarate in una precedente analisi di Y esistenti., pestis diversity14 (Tabelle supplementari 3 e 4). Il confronto del nostro genoma antico con il suo antenato Y. pseudotuberculosis ha rivelato che la sequenza medievale conteneva il nucleotide ancestrale per tutte le 97 posizioni, indicando che non possiede posizioni derivate assenti in altri ceppi di Y. pestis. Due differenze cromosomiche precedentemente segnalate3 non erano presenti nei nostri dati sulla sequenza genomica, suggerendo che probabilmente derivavano da citosine deaminate che sarebbero state rimosse nell’indagine corrente tramite il trattamento con uracile-DNA-glicosilasi prima della cattura dell’array.,
Per posizionare il nostro antico genoma in un contesto filogenetico, abbiamo caratterizzato tutte le 1.694 posizioni precedentemente identificate filogeneticamente14 (Tabella supplementare 4) e confrontato quelle del nostro antico organismo con i dati di chiamata di base aggregata per 17 genomi Y. pestis disponibili pubblicamente e l’ancestrale Y. pseudotuberculosis. Se considerate separatamente, le sequenze di tre delle quattro vittime cadono solo due sostituzioni dalla radice di tutti i ceppi di Y. pestis patogeni umani esistenti (Fig. 3a), e mostrano una relazione più stretta con il ramo 1 E., pestis rispetto al ramo 2; tuttavia, una delle quattro vittime (individuo 6330) è stata infettata da un ceppo che conteneva tre posizioni derivate aggiuntive viste in tutti gli altri geni del ramo 114. Ciò suggerisce la presenza di più ceppi nella pandemia di Londra del 1348-1350 o cambiamenti microevolutivi che si verificano in un ceppo, che è noto per verificarsi in focolai di malattia15. Supporto aggiuntivo per Y., la microevoluzione pestis è indicata dalla presenza di diverse posizioni varianti per le quali i dati di sequenza di un individuo mostrano due diversi nucleotidi a frequenze comparabili (Tabella supplementare 5). La posizione 2896636, ad esempio, è una posizione polimorfica nota nelle popolazioni esistenti di Y. pestis14, e questa posizione mostra lo stato derivato fisso in un individuo (6330) e lo stato polimorfico in un altro (individuo 8291) con una copertura minima di cinque volte (Fig. 7). Questo fornisce un notevole esempio di microevoluzione catturato durante una pandemia storica., Le restanti posizioni di varianza sono invariate nei 18 genomi Yersinia esistenti, quindi possono essere unici per l’organismo antico e sono, quindi, di ulteriore interesse. Ulteriori campionamenti di genomi antichi aiuteranno a determinare la frequenza di queste mutazioni nei ceppi di Y. pestis co-circolanti e chiariranno l’emergere di ceppi di ramo 2 che non sono ancora stati dichiarati in campioni antichi.
Figura 3: Posizionamento filogenetico e contesto storico per il ceppo East Smithfield.,
a, rete mediana di antichi e moderni Y. pestis basata su 1.694 posizioni varianti nei genomi moderni14. Cerchi colorati rappresentano diversi cladi come definito in ref. 13. I cerchi grigi rappresentano nodi ipotetici. b, Albero filogenetico utilizzando 1.694 posizioni variabili. Gli intervalli di tempo di divergenza sono mostrati in anni civili, con il supporto bootstrap che unisce il vicino (corsivo blu) e la probabilità posteriore bayesiana (blu). La casella grigia indica ceppi patogeni umani noti., A, NZ ACNQ01000; Nepal516, NC 008149; KIM10, NC 004088; B, NZ AAYT01000; C, NZ ABAT01000; D, NZ ACNS01000; E, NZ AAYS01000; F, NZ AAOS02000; CO92, NC 003143; G, NZ ABCD01000; H, NZ AAYV01000; I, NC 014029; J, NZ AAYR01000; Antiqua, NC 008150. c, Geographical origin of genome sequences used in a and b. d, Geographical spread of the Black Death from infection routes reported in ref. 4.,
diapositiva di PowerPoint
Coerente topologia ad albero sono stati prodotti utilizzando diversi metodi di costruzione e tutti i principali nodi sono stati supportati dalla probabilità posteriore (pp) i valori di >0,96 e bootstrap valori >90 (Fig. 3b e fichi supplementari 8 e 9). Gli alberi collocano la sequenza di East Smithfield vicino al nodo ancestrale di tutti i ceppi patogeni umani Y. pestis esistenti (solo due differenze in 1.694 posizioni) e alla base del ramo 1 (Fig. 3 ter)., Una data sicura per il sito di East Smithfield del 1348-1350 ci ha permesso di assegnare una calibrazione della punta alla sequenza antica e quindi datare il tempo di divergenza dei genomi moderni e del genoma di East Smithfield usando un approccio bayesiano. Stime temporali indicano che tutti Y., pestis comunemente associato con infezione umana condiviso un antenato comune a volte tra 668 e 729 anni fa (ad 1282-1343, 95% più alta densità di probabilità, HPD), che comprende un intervallo di tempo molto più piccolo di stime recentemente pubblicate14 e inoltre indicando che tutti attualmente circolanti ramo 1 e ramo 2 isolati emerse durante il XIII secolo al più presto (Fig. 3b), potenzialmente provenienti da una fonte dell’Asia orientale, come è stato precedentemente suggerito14., Ciò implica che la peste medievale fu il principale evento storico che introdusse le popolazioni umane all’antenato di tutti i ceppi patogeni noti di Y. pestis. Questo mette in discussione ulteriormente l “eziologia del sesto all” ottavo secolo Peste di Giustiniano, popolarmente assunto per essere il risultato dello stesso agente patogeno: le nostre stime temporali implicano che la pandemia è stata causata da un Y. variante pestis che è distinto da tutti i ceppi attualmente circolanti comunemente associati con infezioni umane, o era un ” altra malattia del tutto.
Anche se il nostro approccio di utilizzare un Y esistente., pestis modello di riferimento per la progettazione esca precluso la nostra capacità di identificare le regioni genomiche che potrebbero essere stati presenti nell ” antico organismo e sono stati successivamente persi in CO92, confronti genomici della nostra antica sequenza contro i suoi outgroup più vicini possono produrre preziose intuizioni Y. evoluzione pestis. Il ceppo Microtus 91001 è il ramo 1 più vicino e il ramo 2 relativo confermato di non essere patogeno per l’umano16, quindi i cambiamenti genetici possono rappresentare contributi all’adattamento del patogeno a un ospite umano., I confronti con questo outgroup hanno rivelato 113 cambiamenti (Tabella supplementare 6a, b), molti dei quali si trovano in geni che influenzano le funzioni associate alla virulenza come la formazione di biofilm (hmsT), l’acquisizione di ferro (iucD) o l’adattamento all’ambiente intracellulare (phoP). Allo stesso modo, sebbene il suo potenziale di virulenza negli esseri umani non sia ancora stato confermato a nostra conoscenza, Y. pestis B42003004 isolato da una popolazione di marmotte cinesi17 è stato identificato come il ceppo più vicino al nodo ancestrale di tutti Y., pestis comunemente associato con la peste umana, e quindi può fornire informazioni chiave per quanto riguarda l’evoluzione dell’organismo. Il confronto completo del genoma con la sequenza di East Smithfield ha rivelato solo otto differenze a singolo nucleotide (Tabella supplementare 6c), sei delle quali portano a cambiamenti non sinonimi (Tabella supplementare 6d). Sebbene queste differenze probabilmente non influenzino la virulenza, l’influenza della perdita genica, del guadagno genico o dei riarrangiamenti genetici, tutti ben documentati in Y. pestis12,18, è ancora indeterminata., In termini evolutivi più recenti, sono state trovate differenze a singolo nucleotide in diversi geni associati alla patogenicità noti tra il nostro antico genoma e la sequenza di riferimento CO92 (Tabella supplementare 3), che possono rappresentare ulteriori adattamenti agli ospiti umani.,
Attraverso l’arricchimento mediante cattura del DNA accoppiato con un sequenziamento mirato del DNA ad alto rendimento, abbiamo ricostruito un progetto di genoma per quello che è probabilmente il patogeno umano più devastante della storia e ha rivelato che la peste medievale del XIV secolo era probabilmente responsabile della sua introduzione e distribuzione diffusa nelle popolazioni umane. Ciò indica che il patogeno implicato nella Peste nera ha parenti stretti nel ventunesimo secolo che sono sia endemici che emergenti19., L’introduzione di nuovi agenti patogeni nelle popolazioni è spesso associata ad un aumento dell’incidenza e della gravità della malattia20 e sebbene i meccanismi che governano questo fenomeno siano complessi21, i dati genetici provenienti da antiche malattie infettive forniranno un contributo inestimabile alla nostra comprensione della coevoluzione ospite–patogeno. La peste nera è un esempio fondamentale di un’infezione emergente, che viaggia in tutta Europa e che provoca la morte di circa 30 milioni di persone in soli 5 anni, il che è molto più rapido dei tassi contemporanei di infezione da peste bubbonica o pneumonica22 e di disseminazione7,8., Indipendentemente da ciò, sebbene nessun ceppo Y. pestis esistente possieda lo stesso profilo genetico del nostro antico organismo, i nostri dati suggeriscono che pochi cambiamenti nei geni noti associati alla virulenza sono maturati nei 660 anni di evoluzione dell’organismo come patogeno umano, suggerendo inoltre che la sua maggiore virulenza percepita nella storia23 potrebbe non essere dovuta a nuove mutazioni a punto fisso rilevabili tramite l’approccio analitico descritto qui., Al nostro attuale livello di risoluzione, si ipotizza che i cambiamenti molecolari in agenti patogeni sono solo una parte di una costellazione di fattori che contribuiscono al cambiamento di malattie infettive prevalenza e la gravità, dove genetica dell’ospite population24, climate25, vettoriali dynamics26, sociale conditions27 e interazioni sinergiche con concomitante diseases28 dovrebbe essere il primo a discussioni di popolazione suscettibilità alle malattie infettive e ospite–patogeno relazioni con riferimento a Y. pestis infezioni.