Czarna Śmierć z lat 1347-1351, spowodowana bakterią Yersinia pestis2,3, stanowi jeden z najlepszych historycznych przykładów pojawiającej się infekcji o szybkim rozprzestrzenianiu się i wysokiej śmiertelności, według szacunków 30-50% populacji europejskiej w ciągu zaledwie pięciu lat4. Rozbieżności w tendencjach epidemiologicznych między średniowieczną chorobą a współczesnymi zakażeniami Y. pestis wywołały kontrowersje związane z czynnikiem etiologicznym pandemii 5,6., Chociaż starożytne badania DNA silnie uwikłały Y. pestis2,3 w starożytną pandemię, zmiany genetyczne bakterii mogą być częściowo odpowiedzialne za różnice w objawach choroby i nasileniu. Aby zrozumieć ewolucję organizmu, należy scharakteryzować zmiany genetyczne związane z jego przemianą z patogenu sylvatic w patogen zdolny do pandemicznej infekcji człowieka w skali czarnej śmierci oraz określić jego związek z obecnie krążącymi szczepami., Tutaj zaczynamy tę dyskusję od przedstawienia pierwszego projektu sekwencji genomu starożytnego patogenu.
Y. pestis jest niedawno wyewoluowanym potomkiem żyjącego w glebie bacillus Yersinia pseudotuberculosis7, który w trakcie swojej ewolucji nabył dwa dodatkowe plazmidy (pMT1 i pPCP1), które zapewniają mu wyspecjalizowane mechanizmy infiltracji gospodarzy ssaków. Aby zbadać potencjalne zmiany ewolucyjne w jednym z tych plazmidów, zgłosiliśmy na przesiewanie 46 zębów i 53 kości Z East Smithfield collection w Londynie, Anglia na obecność Y., pestis-specific pPCP1 (ref. 3). Dane historyczne wskazują, że Cmentarzysko East Smithfield zostało założone pod koniec 1348 lub na początku 1349 roku specjalnie dla pochówków ofiar czarnej Śmierci8 (dodatkowe Rys. 1 i 2), dzięki czemu kolekcja dobrze nadaje się do badań genetycznych starożytnego Y. pestis. Dane sekwencji DNA dla pięciu zębów uzyskane poprzez molekularne wychwytywanie pełnego pPCP1 specyficznego dla Y. pestis ujawniły wzór uszkodzenia C do T charakterystyczny dla autentycznego endogennego starożytnego DNA9, a montaż połączonych odczytów Illumina pozwolił na rekonstrukcję 98,68% z 9.,Plazmid 6-kilobazy o co najmniej podwójnym pokryciu 3.
aby ocenić przydatność metod opartych na wychwytywaniu do rekonstrukcji całego starożytnego genomu, wiele ekstraktów DNA z korzeni i Koron pochodzących z czterech z pięciu zębów, które dały najwyższy stopień pokrycia ppcp13, wykorzystano do wzbogacania opartego na tablicach (Agilent) i późniejszego sekwencjonowania o wysokiej przepustowości na platformie Illumina GAII10. Usunięcie duplikatów cząsteczek i późniejsze filtrowanie dało łącznie 2 366 647 wysokiej jakości odczytów chromosomalnych (tabela uzupełniająca 1a, b) o średniej długości fragmentu 55.,53 pary bazowe (rys. uzupełniający 4), co jest typowe dla starożytnego DNA. Szacunki pokrycia przyniosły średnio 28,2 odczytów na miejsce dla chromosomu i 35,2 i 31,2 dla plazmidów pCD1 i pMT1, odpowiednio (ryc. 1a, c, d i tabela uzupełniająca 1B, c). Zasięg był przewidywalnie niski dla pPCP1 (rys. 1e) ponieważ sondy specyficzne dla tego plazmidu nie zostały uwzględnione na tablicach. Pokrycie skorelowane z zawartością GC (dodatkowe rys. 6), trend wcześniej obserwowany dla danych o wysokiej przepustowości sekwencji11., Zasięg na każdej połowie chromosomu był nierównomierny ze względu na różnice w głębokości sekwencjonowania między dwiema tablicami, z średnią odczytów na miejsce odpowiednio 36,46 i 22,41 dla tablicy 1 i tablicy 2. Chociaż większa głębokość przyczyniła się do większej średniej liczby odczytów na obiekt, nie zwiększyła ogólnego zasięgu, przy czym obie tablice pokrywały 93,48% docelowych regionów przy co najmniej jednokrotnym zasięgu (tabela uzupełniająca 1b)., Oznacza to, że nasza procedura przechwytywania pomyślnie odzyskała cząsteczki szablonów ze wszystkich regionów genomowych dostępnych za pomocą tej metody i że głębsze sekwencjonowanie nie spowodowałoby dodatkowych danych dla regionów szablonów CO92 nieobjętych naszym zestawem danych.
Aby ekstrapolować kolejność genów w naszym starożytnym genomie, przeanalizowaliśmy mapowanie odczytów do odniesienia CO92 dla wszystkich ekstraktów pochodzących od pojedynczego osobnika, który uzyskał najwyższy zasięg (osobnik 8291). Pomimo krótkiej długości odczytu naszych starożytnych sekwencji i wysoce powtarzalnej natury genomu Y. pestis, wyodrębniono 2221 contigs pasujących do CO92, w tym łącznie 4 367 867 bp., Aby zidentyfikować potencjalne regiony starożytnego genomu, które są architektonicznie odmienne od CO92, wszystkie odczyty nie odwzorowujące odniesienia do co92 były z kolei brane pod uwagę dla konstrukcji contiga. Po przefiltrowaniu przez minimum 500 bp pozostało 2 134 contigów, w tym 4 013 009 bp, z czego 30 959 pochodziło z niezmapowanych odczytów. Konwencjonalne przeszukiwanie wybuchów zapytało o Genom CO92 zidentyfikowane dopasowania dla 2,105 contigs. Dowody na zmianę architektury zostały zidentyfikowane w 10 contigs (dodatkowa Tabela 2). Przykład takiego wariantu konstrukcyjnego pokazany jest na Rys., 2, gdzie zespół prowadzony przez odniesienie zawierający nieoznaczone odczyty w celu rozciągnięcia punktu przerwania potwierdza jego rekonstrukcję. Ta specyficzna orientacja genetyczna występuje tylko w szczepach Y. pseudotuberculosis i Y. pestis Mictrotus 91001, Angola, Pestoides F i B42003004, które są przodkami wszystkich Y. pestis powszechnie związanych z infekcjami ludzkimi (strains 1 i branch 213,14). Ponadto rozbieżności w ułożeniu tego regionu w oddziałach 1 i oddziałach 2 współczesnych szczepów Y. pestis wskazują, że zmiany miały miejsce jako osobne wydarzenia na różnych liniach.,
Jednonukleotydowe różnice między naszym starożytnym genomem i CO92 reference zaskakująco składały się tylko z 97 pozycji chromosomalnych oraz 2 i 4 pozycji odpowiednio w plazmidach pCD1 i pMT1 (dodatkowa Tabela 3), co wskazuje na ścisłą ochronę genetyczną w tym organizmie w ciągu ostatnich 660 lat. Dwadzieścia siedem z tych pozycji nie zostało zgłoszonych w poprzedniej analizie istniejącego Y., pestis diversity14 (tabele uzupełniające 3 i 4). Porównanie naszego starożytnego genomu do jego przodka Y. pseudotuberculosis wykazało, że średniowieczna Sekwencja zawierała przodkowy nukleotyd dla wszystkich 97 pozycji, co wskazuje, że nie posiada on żadnych pochodnych pozycji nieobecnych w innych szczepach Y. pestis. Dwie wcześniej zgłoszone różnice chromosomowe3 nie były obecne w naszych danych dotyczących sekwencji genomowej, co sugeruje, że prawdopodobnie pochodzą one z deaminowanych cytozyn, które zostały usunięte w obecnym badaniu za pomocą leczenia uracylem-DNA-glikozylazą przed przechwyceniem tablicy.,
aby umieścić nasz starożytny Genom w kontekście filogenetycznym, scharakteryzowaliśmy wszystkie 1694 wcześniej zidentyfikowane filogenetycznie pozycje informacyjne14 (tabela uzupełniająca 4) i porównaliśmy te z naszego starożytnego organizmu z zagregowanymi danymi bazowymi dla 17 publicznie dostępnych genomów Y. pestis i przodków Y. pseudotuberculosis. Rozważając oddzielnie, sekwencje trzech z czterech ofiar składają się tylko z dwóch podstawień z korzenia wszystkich istniejących ludzkich patogennych szczepów Y. pestis (rys. 3a) i wykazują bliższy związek z gałęzią 1 Y., pestis niż do oddziału 2; jednak jedna z czterech ofiar (osobnik 6330) została zarażona szczepem, który zawierał trzy dodatkowe pozycje pochodne widziane we wszystkich pozostałych genach oddziału 14. Sugeruje to obecność wielu szczepów podczas pandemii w Londynie w latach 1348-1350 lub mikroewolucyjne zmiany zachodzące w jednym szczepie, o których wiadomo, że występują w czasie epidemii chorobowej15. Dodatkowe wsparcie dla Y., mikroewolucja pestis wskazuje na obecność kilku pozycji wariantowych, dla których dane sekwencyjne od jednego osobnika pokazują dwa różne nukleotydy o porównywalnych częstotliwościach (tabela uzupełniająca 5). Pozycja 2896636, na przykład, jest znaną pozycją polimorficzną w istniejących populacjach Y. pestis14, a pozycja ta pokazuje stały stan Pochodny w jednym osobniku (6330) i stan polimorficzny w innym (osobnik 8291) przy minimalnym pięciokrotnym pokryciu (dodatkowa rys. 7). Stanowi to niezwykły przykład mikroewolucji uchwyconej podczas historycznej pandemii., Pozostałe pozycje wariancji są niezmienione w 18 istniejących genomach Yersinia, dlatego mogą być unikalne dla starożytnego organizmu i dlatego są przedmiotem dalszego zainteresowania. Dodatkowe próbkowanie starożytnych genomów pomoże w określeniu częstotliwości tych mutacji we współbieżnych szczepach Y. pestis i wyjaśni pojawienie się szczepów gałęzi 2, które nie są jeszcze zgłoszone w starożytnych próbkach.