O Preto a Morte de 1347-1351, causada pela bactéria Yersinia pestis2,3, fornece um dos melhores exemplos históricos de uma emergente infecção, com a rápida disseminação e alta mortalidade, alegando uma estimativa de 30% a 50% da população Europeia em apenas cinco anos period4. Discrepâncias nas tendências epidemiológicas entre a doença medieval e as infecções modernas da Y. pestis desencadearam controvérsia sobre o Agent etiológico da pandemia 5,6., Embora investigações antigas de DNA tenham fortemente implicado Y. pestis2, 3 na pandemia antiga, as alterações genéticas na bactéria podem ser parcialmente responsáveis por diferenças na manifestação e gravidade da doença. Para compreender a evolução do organismo é necessário caracterizar as mudanças genéticas envolvidas em sua transformação de um patógeno sylvático para um capaz de infecção humana pandêmica na escala da Peste Negra, e determinar a sua relação com estirpes atualmente circulantes., Aqui começamos esta discussão apresentando a primeira sequência de rascunhos do genoma do patógeno antigo.
Y. pestis é um descendente recentemente evoluído do bacillus Yersinia pseudotuberculosis7, que no decurso da sua evolução adquiriu dois plasmídeos adicionais (pMT1 e pPCP1) que lhe fornecem mecanismos especializados para infiltrar hospedeiros de mamíferos. Para investigar potenciais mudanças evolutivas em um desses plasmídeos, relatamos a triagem de 46 dentes e 53 ossos da coleção East Smithfield de Londres, Inglaterra, para a presença do Y., ppcp1 específico da pestis (ref. 3). Dados históricos indicam que o cemitério de East Smithfield foi estabelecido no final de 1348 ou início de 1349 especificamente para o enterro de vítimas da Morte Negra (figos 1 e 2 suplementares), tornando a coleção bem adequada para investigações genéticas da antiga Y. pestis. Os dados da sequência de ADN para cinco dentes obtidos através da captura molecular do Ppcp1 específico de Y. pestis revelou um padrão de danos C A T característico do antigo dna9 endógeno autêntico, e a montagem do conjunto Illumina reads permitiu a reconstrução de 98,68% dos 9.,Plasmídeo de 6 quilobase com um mínimo de duas coberturas3.
para avaliar a adequação dos métodos de captura para a reconstrução do genoma antigo completo, vários extratos de DNA de ambas as raízes e coroas decorrentes de quatro dos cinco dentes que renderam a mais alta cobertura ppcp13 foram usados para enriquecimento array-based (Agilent) e subsequente sequenciação de alto rendimento na plataforma Illumina GAII10. A remoção de moléculas duplicadas e subsequente filtragem produziu um total de 2 366 647 leituras cromossómicas de alta qualidade (Tabela complementar 1a, b) com um comprimento médio de fragmento de 55.,53 pares de bases (Fig. suplementar. 4), que é típico para o DNA antigo. As estimativas de cobertura produziram uma média de 28,2 leituras por local para o cromossoma, e 35,2 e 31,2 para os plasmídeos pCD1 e pMT1, respectivamente (Fig. Quadro 1-A, c, d e Quadro 1-B, c). A cobertura era previsivelmente baixa para a pPCP1 (Fig. 1e) porque sondas específicas a este plasmídeo não foram incluídas nos arrays. Cobertura correlacionada com o conteúdo GC (figura suplementar. 6), uma tendência anteriormente observada para dados de sequência de alta capacidade11., A cobertura em cada metade do cromossomo foi desigual devido a diferenças na profundidade de sequenciamento entre as duas matrizes, com leitura média de 36,46 e 22,41 por local para matriz 1 e matriz 2, respectivamente. Embora uma maior profundidade tenha contribuído para uma maior média de leituras por site, não aumentou a cobertura geral, com ambas as matrizes cobrindo 93,48% das regiões visadas com um mínimo de cobertura onefold (quadro suplementar 1b)., Isto indica que o nosso procedimento de captura recuperou com sucesso moléculas modelo de todas as regiões genômicas acessíveis através deste método, e que sequenciamento mais profundo não resultaria em dados adicionais para as regiões template CO92 não cobertas em nosso conjunto de dados.
a arquitectura do genoma é conhecida por variar amplamente entre os estreitos existentes da Y. pestis12. Para extrapolar a ordem dos genes no nosso genoma antigo, analisámos o mapeamento da referência CO92 para todos os extractos provenientes de um único indivíduo que apresentou a maior cobertura (indivíduo 8291). Apesar do comprimento de Leitura curta das nossas sequências antigas e da natureza altamente repetitiva do genoma da Y. pestis, foram extraídos 2.221 contigs correspondentes à CO92, compreendendo um total de 4.367.867 bp., Para identificar potenciais regiões do genoma antigo que são arquitetonicamente distintas de CO92, todas as leituras que não mapeiam a referência CO92 foram, por sua vez, consideradas para a construção contig. Após filtragem para um comprimento mínimo de 500 bp, 2,134 contigs permaneceram compreendendo 4,013,009 bp, dos quais 30,959 derivaram de leituras não mapeadas. A pesquisa de explosão convencional pesquisou contra o genoma CO92 fósforos identificados para 2.105 contigs. As provas de uma arquitectura alterada foram identificadas em 10 contigs (quadro complementar 2). Um exemplo de tal variante estrutural é mostrado na Fig., 2, onde a montagem guiada por referência incorporando leitura não mapeada para abranger o ponto de paragem valida sua reconstrução. Este genético específico orientação é encontrado apenas em Y. pseudotuberculosis e Y. pestis cepas Mictrotus 91001, Angola, Pestoides F e B42003004, que são ancestrais de todas as Y. pestis é comumente associada com infecções humanas (ramo 1 e seção 2 strains13,14). Além disso, discrepâncias no arranjo desta região nos ramos 1 e 2 estirpes modernas de Y. pestis indicam que os rearranjos ocorreram como eventos separados em diferentes linhagens.,