de Ontdekking van SmacCas9
Voor het wijzigen van de voorouderlijke 5\(^{\prime}\)-NGG-3\(^{\prime}\) PAM specificiteit van SpyCas9, de vroege en recente rapporten hebben gebruikt directed evolution (bijvoorbeeld, “VQR”, “EQR”, “VRER”, en “NRNH” varianten) of rationeel ontwerp geïnformeerd door crystal structuur (bijvoorbeeld, “QQR”, “NG” en “NR” varianten)17,18,19,20,21,22. Deze rapporten richtten zich op de PAM-contacterende arginine residuen R1333 en R1335 die de functie opheffen wanneer uitsluitend gemuteerd., Terwijl deze studies compenserende mutaties identificeerden die resulteerden in veranderde PAM specificiteit, behielden de Cas9 varianten die zij produceerden een guanine voorkeur in ten minste één positie van de PAM sequentie voor gerapporteerde in vivo bewerking. Gelijktijdige rapporten hebben gebruikt evolutionaire informatie te meer ontspannen de canonieke 5\(^{\prime}\)-NNGRRT-3\(^{\prime}\) PAM specificiteit van Staphylococcus aureus Cas9 (SaCas9) of om te ontdekken alternatief 5\(^{\prime}\)-NNNNCC-3\(^{\prime}\) PAM-specificiteit van de canonieke 5\(^{\prime}\)-NNNNGHTT-3\(^{\prime}\) PAM van Neisseria meningitidis Cas923,24., De nucleasen uit beide nieuwe rapporten geven echter nog steeds de voorkeur aan GC-inhoud in ten minste één positie van de PAM-sequentie. We streefden ernaar om dergelijke GC-content vereisten op te heffen via een aangepaste Bioinformatica-gedreven workflow die bestaande PAM diversiteit in de Streptococcus genus25 mineert. Met behulp van deze strategie, we homed in op SmacCas9 als het hebben van het potentieel om veranderde niet-GC PAM specificiteit dragen bij het uitlijnen 115 orthologs van Spycas9 van UniProt (beperkt tot degenen met meer dan een 70% paarsgewijs BLOSSOM62 score)., Uit de uitlijning vonden we dat SmacCas9 een van de twee naaste homologen was, samen met een Streptococcus mutans B112SM-een Cas9 (SmutCas9), die glutaminen bezat op beide posities die uitgelijnd waren met de anders zeer geconserveerde PAM-contacterende arginines (Fig. 1a-b; aanvullende Fig. 2 bis). Van arginineresiduen is bekend dat ze guanines sterk prefereren in het aminozuur-base interactielandschap, zoals blijkt uit de 5\(^{\prime}\)-NGG-3\(^{\prime}\) specificiteit van SpyCas9. Glutamineresiduen daarentegen binden zich bij voorkeur aan adenines, door interactie met de groef edge26., We veronderstelden dus dat SmacCas9 van nature de noodzakelijke compenserende mutaties mede had ontwikkeld om nieuwe adenine-rijke PAM-herkenning te verkrijgen. Een kleine steekproef van 13 spacers uit de CRISPR-array van het corresponderende genoom verhinderde ons om vol vertrouwen de SMACCAS9 PAM in silico af te leiden., Niettemin werd de mogelijkheid voor SmacCas9 die minder GC-inhoud in zijn PAM nodig had ondersteund door sequentie gelijkenissen met de” QQR ” variant die 5\(^{\prime}\)-NAAG-3\(^{\prime}\) specificiteit27 heeft, in aanvulling op de AT-rijke veronderstelde consensus PAM voor phage-Origin spacers in CRISPR arrays geassocieerd met zeer homologe SmutCas9, die werden geïdentificeerd met behulp van onze eerder beschreven Spamalot pijplijn en consistent met eerdere voorspellingen (Fig. 1c; aanvullende Fig. 2B; aanvullende Fig. 3) 25,28.
Engineering en PAM karakterisatie van SpyMac
We gingen door met het empirisch bepalen van de PAM voorkeuren van verschillende Streptococcus orthologs die één of beide van de kritische PAM-contacten veranderen. Gebaseerd op aangetoonde voorbeelden van het PAM-interactiedomein (PID) en guide RNA (gRNA) met kruiscompatibiliteit tussen Cas9-orthologen die nauw verwant en actief zijn, construeerden we nieuwe varianten door rationeel het PI-gebied van katalytisch “dode” SpyCas9 (dSpyCas9) uit te wisselen met die van de geselecteerde orthologen (aanvullende Fig., 2A-B) 29,30. Geassembleerde varianten, waaronder dSpyMacCas9 (hierna aangeduid als dSpyMac), werden afzonderlijk omgezet in E. coli cellen, samen met guide RNA afgeleid van S. pyogenes en een 8-mer PAM bibliotheek van uniforme base representatie in de PAM-SCANR genetische circuit, vastgesteld door Leenay et al.31. De kring upregulates een groene fluorescente proteã ne (GFP) verslaggever in verhouding tot PAM-bindende sterkte. Daarom verzamelden wij de GFP-positieve celpopulaties door cytometry stroom (aanvullende Fig., 4) en Sanger sequenced ze rond de site van de PAM om positie-wise basis voorkeuren in een overeenkomstige variant PAM erkenning te bepalen. dSpyMac, meer nog dan dSpyMutCas9, genereerde een spoorprofiel dat het meest consistent was met guanine-onafhankelijke PAM-herkenning, samen met een dominante specificiteit voor adeninedinucleotiden (Fig. 2a; aanvullende Fig. 2C).
vervolgens hebben we nuclease-actieve enzymen gezuiverd om het DNA-doelherkenningspotentieel en de uniciteit van SpyMac verder te onderzoeken. (Aanvullende Fig. 5A) 27,32. We incubeerden individueel de ribonucleoproteïne complexe enzymen (samengesteld uit Cas9 + crRNA + tracrRNA) met dubbelstrengs doelsubstraten van alle 5\(^{\prime}\)/3\(^{\priem}\) – naburige basiscombinaties bij een adenine dinucleotide PAM (5\(^{\prime}\)-NAAN-3\(^{\prime}\); Fig. 2b)., Een korte spijsvertering van 16 minuten wees op zowel wild-type SmacCas9 als de hybride SpyMac die naast 5\(^{\prime}\)-NAAN-3\(^{\prime}\) motieven splijt die breder en gelijkmatiger zijn dan de eerder gerapporteerde QQR-variant. SpyMac onderscheidde zich verder met snelle DNA-snijsnelheden die lijken op de snelle verteerkinetiek van SpyCas9 (Fig. 2c-d) 33. We liepen reacties die verschillende crrna spacer lengtes en tracrRNA sequentie gebruikt, aangezien de laatste enigszins verschilt tussen de genomen van S. macacae en S. pyogenes (aanvullende Fig. 5B-E)., Geen van deze twee parameters compenseerde voor de langzamere splitsing tarief van SmacCas9, maar wij merkten marginale verbetering in de activiteit van de wild-type vorm met zijn inheemse tracrRNA, die met de interface van De Gids-Cas9 interactie die meestal buiten het PI domein.
Genoombewerking met iSpyMac
vervolgens beoordeelden we de tolerantie van iSpyMac voor niet-overeenkomende sequenties, door gebruik te maken van sgRNAs die dubbele of enkele mismatches bevatten aan een vaste protospacer binnen het AAVS-gen, met een 5\(^{\prime}\) – GAAG-3\(^{\prime}\) PAM-sequentie. iSpyMac toonde bewerkingsmogelijkheden op doelen met enkele mismatches binnen het PAM-proximale segment van de sgRNA., Om deze veronderstelde off-target neiging te verminderen, introduceerden we de r691a mutatie, die eerder werd geà soleerd via bacteriële selectie voor SpyCas9 om een hoge on-target activiteit te behouden terwijl het verminderen van off-target editing35. Onze high-fidelity variant, HiFi-iSpyMac, toonde bijna verwaarloosbare activiteit op mismatched opeenvolgingen, in vergelijking met het originele enzym, met minimaal verlies van op-doelactiviteit (Fig. 3b).,
ten slotte selecteerden we een venster van vier nucleotiden in de VEGFA locus in een sequentiecontext zodat elke andere CRISPR endonuclease met gerapporteerd gebruik voor base editing hun base editing met een cytidine deaminase-gefuseerd enzym niet zou toestaan36. Dienovereenkomstig, wij cotransfected hek293t cellen met een nickasevorm van iSpyMac uit de eerder gerapporteerde be3 architectuur voor cytosine basis het uitgeven wordt afgeleid (iSpyMac-BE3) en het plasmide sgrna richten een PAM stroomafwaarts van de geselecteerde nucleotiden 5., We gemeten effectieve base het uitgeven niveaus in geoogste cellen, die meer dan 20% cytosine aan thymine omzetting op deze posities via NGS analyse tentoongesteld (Fig. 3c).