Per modificare l’ancestrale 5\(^{\prime}\)-NGG-3\(^{\prime}\) PAM specificità di SpyCas9, primi e i rapporti recenti hanno impiegato diretta evoluzione (ad esempio, “VQR”, “EQR”, “VRER”, e “NRNH” varianti) o progettazione razionale informato dalla struttura cristallina (ad esempio, “QQR”, “NG”, e “NR” varianti)17,18,19,20,21,22. Questi rapporti si sono concentrati sui residui di arginina a contatto con PAM R1333 e R1335 che aboliscono la funzione quando sono mutati esclusivamente., Mentre tali studi hanno identificato mutazioni compensatorie con conseguente specificità alterata di PAM, le varianti Cas9 che hanno prodotto hanno mantenuto una preferenza di guanina in almeno una posizione della sequenza PAM per la modifica riportata in vivo. Concorrente rapporti hanno utilizzato evolutivo informazioni per rilassarsi ulteriormente la canonica 5\(^{\prime}\)-NNGRRT-3\(^{\prime}\) PAM specificità di Staphylococcus aureus Cas9 (SaCas9) o per scoprire alternativa 5\(^{\prime}\)-NNNNCC-3\(^{\prime}\) PAM specificità per i canonici 5\(^{\prime}\)-NNNNGHTT-3\(^{\prime}\) PAM di Neisseria meningitidis Cas923,24., Le nucleasi di entrambi questi nuovi rapporti, tuttavia, preferiscono ancora il contenuto di GC in almeno una posizione della sequenza PAM. Abbiamo cercato di eliminare tali prerequisiti di contenuto GC tramite un flusso di lavoro personalizzato basato sulla bioinformatica che estrae la diversità PAM esistente nel genere streptococcus25. Usando questa strategia, abbiamo introdotto SmacCas9 come avente il potenziale per sopportare una specificità PAM non GC alterata allineando 115 ortologhi di SpyCas9 da UniProt (limitato a quelli con maggiore di un punteggio 70% a coppie BLOSSOM62)., Dall’allineamento abbiamo scoperto che SmacCas9 era uno dei due omologhi vicini, insieme a uno Streptococcus mutans B112SM-A Cas9 (SmutCas9), che possedeva glutammine in entrambe le posizioni allineate alle arginine a contatto con PAM altrimenti altamente conservate (Fig. 1a-b; Fig. supplementare 2 BIS). I residui di arginina sono noti per preferire fortemente le guanine nel panorama dell’interazione amminoacido-base, come evidenziato dalla specificità 5\(^{\prime}\)-NGG-3\(^{\prime}\) di SpyCas9. I residui di glutammina, d’altra parte, si legano preferenzialmente alle adenine, attraverso l’interazione con il bordo della scanalatura maggiore26., Abbiamo quindi ipotizzato che SmacCas9 avesse naturalmente coevoluto le mutazioni compensative necessarie per ottenere un nuovo riconoscimento PAM ricco di adenina. Una piccola dimensione del campione di 13 distanziatori dalla matrice CRISPR del suo genoma corrispondente ci ha impedito di dedurre con sicurezza il PAM SmacCas9 in silico., Tuttavia, la possibilità per SmacCas9 richiedendo un minor contenuto di GC nella sua PAM è stato supportato da somiglianze di sequenza per il “QQR”, variante che ha 5\(^{\prime}\)-NAAG-3\(^{\prime}\) specificity27, oltre ai ricchi putativo consenso PAM per fago originari distanziali in CRISPR matrici associate altamente omologhe SmutCas9, che sono stati identificati con l’aiuto dei nostri precedentemente descritte SPAMALOT pipeline e coerente con le precedenti previsioni (Fig. 1c; Fig. supplementare 2B; Fig. supplementare 3) 25,28.
Ingegneria e caratterizzazione PAM di SpyMac
Abbiamo proceduto a determinare empiricamente le preferenze PAM di diversi ortologi streptococcici che modificano uno o entrambi i contatti PAM critici. Sulla base di esempi dimostrati di dominio di interazione PAM (PID) e RNA guida (gRNA) con compatibilità incrociata tra ortologhi Cas9 strettamente correlati e attivi, abbiamo costruito nuove varianti scambiando razionalmente la regione PI di SpyCas9 (dSpyCas9) cataliticamente “morto” con quelli degli ortologhi selezionati (Fig., 2 BIS-B) 29,30. Le varianti assemblate, tra cui dSpyMacCas9 (qui indicato come dSpyMac), sono state cotrasformate separatamente in cellule di E. coli, insieme all’RNA guida derivato da S. pyogenes e una libreria PAM 8-mer di rappresentazione uniforme della base nel circuito genetico PAM-SCANR, stabilito da Leenay et al.31. Il circuito upregulates una proteina fluorescente verde (GFP) reporter in proporzione alla forza PAM-vincolante. Pertanto, abbiamo raccolto le popolazioni cellulari GFP-positive mediante citometria a flusso (Fig., 4) e Sanger li ha sequenziati attorno al sito del PAM per determinare le preferenze di base in base alla posizione nel riconoscimento PAM di una variante corrispondente. dSpyMac, più di dSpyMutCas9, ha generato un profilo di traccia che era più coerente con il riconoscimento PAM indipendente dalla guanina, insieme a una specificità dominante per l’adenina dinucleotide (Fig. 2a; Fig. supplementare 2 QUATER).