découverte de SmacCas9
pour modifier la spécificité ancestrale 5\(^{\prime}\)-NGG-3\(^{\prime}\) PAM de SpyCas9, des rapports précoces et récents ont utilisé une évolution dirigée (par exemple, « VQR”, « EQR”, « VRER”, et variantes « NRNH”) ou conception rationnelle informée par la structure cristalline (par exemple, variantes « QQR”, « NG” et « NR”) 17,18,19,20,21,22. Ces rapports se sont concentrés sur les résidus d’arginine en contact avec PAM R1333 et R1335 qui abolissent la fonction lorsqu’ils sont exclusivement mutés., Bien que ces études aient identifié des mutations compensatoires entraînant une modification de la spécificité PAM, les variants Cas9 qu’elles ont produits ont maintenu une préférence pour la guanine dans au moins une position de la séquence PAM pour l’édition in vivo rapportée. Des rapports concurrents ont utilisé des informations évolutives pour détendre davantage la spécificité canonique 5\(^{\prime}\)-NNGRRT-3\(^{\prime}\) PAM de Staphylococcus aureus Cas9 (SaCas9) ou pour découvrir une alternative 5\(^{\prime}\)-nnnncc-3\(^{\prime}\) PAM à la spécificité canonique 5\(^{\prime}\)-NNNNGHTT-3\(^{\prime}\) PAM de Neisseria meningitidis cas923,24., Les nucléases de ces deux nouveaux rapports, cependant, préfèrent toujours la teneur en GC dans au moins une position de la séquence PAM. Nous avons cherché à lever ces conditions préalables au contenu GC via un flux de travail personnalisé axé sur la bioinformatique qui exploite la diversité PAM existante dans le genre Streptococcus 25. En utilisant cette stratégie, nous avons identifié SmacCas9 comme ayant le potentiel de supporter une spécificité PAM non GC modifiée lors de l’alignement de 115 orthologues de SpyCas9 à partir d’UniProt (limité à ceux ayant un score blossom62 supérieur à 70% par paire)., De l’alignement, nous avons trouvé SmacCas9 était l’un des deux homologues proches, avec un Streptococcus mutans B112SM-a Cas9 (SmutCas9), possédant des glutamines aux deux positions alignées sur les arginines en contact avec PAM autrement hautement conservées (Fig. 1A-b; fig. supplémentaire. 2A). Les résidus d’Arginine sont connus pour préférer fortement les guanines dans le paysage d’interaction acides aminés-bases, comme en témoigne la spécificité 5\(^{\prime}\)-NGG-3\(^{\prime}\) de SpyCas9. Les résidus de Glutamine, d’autre part, se lient préférentiellement aux adénines, par interaction avec le bord de rainure majeur26., Nous avons donc émis l’hypothèse que SmacCas9 avait naturellement coévolué les mutations compensatoires nécessaires pour obtenir une nouvelle reconnaissance PAM riche en adénine. Une petite taille d’échantillon de 13 espaceurs du réseau CRISPR de son génome correspondant nous a empêchés d’inférer en toute confiance le PAM SmacCas9 in silico., Néanmoins, la possibilité pour SmacCas9 nécessitant moins de contenu en GC dans son PAM a été corroborée par des similitudes de séquence avec la variante” QQR » qui a 5\(^{\prime}\)-NAAG-3\(^{\prime}\) specificity27, en plus du PAM de consensus putatif AT-rich pour les espaceurs d’origine phage dans les réseaux CRISPR associés à SmutCas9 hautement homologue, qui ont été identifiés à l’aide de notre pipeline SPAMALOT décrit précédemment et compatibles avec les prédictions précédentes (Fig. 1C; fig. supplémentaire. 2b; fig. supplémentaire. 3) 25,28.
ingénierie et caractérisation PAM de SpyMac
Nous avons procédé à la détermination empirique des préférences PAM de plusieurs orthologues streptococciques qui modifient un ou les deux contacts PAM critiques. Sur la base d’exemples démontrés du domaine D’interaction PAM (PID) et de L’ARN guide (gRNA) ayant une compatibilité croisée entre des orthologues Cas9 étroitement liés et actifs, nous avons construit de nouvelles variantes en échangeant rationnellement la région PI de SpyCas9 « mort” catalytiquement (dSpyCas9) avec ceux des orthologues sélectionnés (fig. supplémentaire., 2A-B) 29,30. Des variants assemblés, y compris dSpyMacCas9 (ici appelé dspymac), ont été cotransformés séparément en cellules D’E. coli, avec de L’ARN guide dérivé de S. pyogenes et une bibliothèque PAM 8-mer de représentation de base uniforme dans le circuit génétique PAM-SCANR, établie par Leenay et al.31. Le circuit régule à la hausse un rapporteur de protéine fluorescente verte (GFP) proportionnellement à la force de liaison au PAM. Par conséquent, nous avons collecté les populations de cellules GFP-positives par cytométrie en flux(fig., 4) et Sanger les a séquencés autour du site du PAM pour déterminer les préférences de base en termes de position dans la reconnaissance PAM d’une variante correspondante. dSpyMac, plus que dSpyMutCas9, a généré un profil de trace qui était le plus compatible avec la reconnaissance PAM indépendante de la guanine, ainsi qu’une spécificité dominante pour les adénine dinucléotides (Fig. 2a; fig. supplémentaire. 2C).
ensuite, nous avons purifié des enzymes nucléases actives pour continuer à sonder le potentiel de reconnaissance de la cible D’ADN et l’unicité de SpyMac. (Complémentaire Fig. 5 bis) 27,32. Nous avons incubé individuellement les enzymes complexes ribonucléoprotéiques (composées de Cas9 + crRNA + tracrRNA ) avec des substrats cibles double brin de tous les 5\(^{\prime}\)/3\(^{\prime}\) – combinaisons de bases voisines à un adénine dinucléotide PAM (5\(^{\prime}\) – NAAN-3\(^{\prime}\); Fig. 2b)., Une brève digestion de 16 min a indiqué que le SmacCas9 de type sauvage et le SpyMac hybride étaient clivés adjacents aux motifs 5\(^{\prime}\)-NAAN-3\(^{\prime}\) plus largement et uniformément que la variante QQR rapportée précédemment. SpyMac s’est encore distingué avec des taux de coupe rapide de L’ADN qui ressemblent à la cinétique de digestion rapide de SpyCas9 (Fig. 2c-d) 33. Nous avons exécuté des réactions qui utilisaient des longueurs d’espacement variables de l’arnrcr et la séquence de l’arnrcr, car cette dernière diffère légèrement entre les génomes de S. macacae et de S. pyogenes (fig. 5B-E)., Aucun de ces deux paramètres n’a compensé le taux de clivage plus lent de SmacCas9, mais nous avons remarqué une amélioration marginale de l’activité de la forme de type sauvage avec son tracrRNA natif, qui se comporte avec l’interface de l’interaction guide-Cas9 étant principalement en dehors du domaine PI.
édition Génome avec iSpyMac
ensuite, nous avons évalué la tolérance d’iSpyMac à des séquences non appariées, en utilisant des sgRNAs hébergeant des incompatibilités doubles ou simples avec un protospacer fixe dans le gène AAVS, possédant une séquence PAM 5\(^{\prime}\)-GAAG-3\(^{\prime}\). iSpyMac a démontré des capacités d’édition sur des cibles avec des discordances simples dans le segment PAM-proximal du sgRNA., Pour atténuer cette propension supposée hors cible, nous avons introduit la mutation R691A, qui était auparavant isolée par sélection bactérienne pour SpyCas9 afin de maintenir une activité élevée sur cible tout en réduisant l’édition hors cible35. Notre variante haute fidélité, HiFi-iSpyMac, a montré une activité presque négligeable sur les séquences incompatibles, par rapport à l’enzyme d’origine, avec une perte minimale d’activité sur cible (Fig. 3b).,
enfin, nous avons sélectionné une fenêtre de quatre nucléotides dans le locus VEGFA dans un contexte de séquence tel que toute autre endonucléase CRISPR dont l’utilisation pour l’édition de base est rapportée ne permettrait pas leur édition de base avec une enzyme fusionnée à la cytidine désaminase 36. En conséquence, nous avons cotransféré des cellules HEK293T avec une forme nickase d’iSpyMac dérivée de L’architecture BE3 précédemment rapportée pour l’édition de la base cytosine (iSpyMac-BE3) et le plasmide sgRNA ciblant une PAM en aval des nucléotides sélectionnés5., Nous avons mesuré les niveaux d’édition de base efficaces dans les cellules récoltées, qui présentaient une conversion de plus de 20% de la cytosine en thymine à ces positions via l’analyse NGS (Fig. 3c).