to modify the ancestral 5\(^{\prime}\)-NGG-3\(^{\prime}\) Pam specificity of SpyCas9, early and recent reports have employed directed evolution (E.G., «VQR», «EQR», «VRER», and variantes «Nrnh») o diseño racional informado por la estructura cristalina (por ejemplo, variantes «Qqr», «ng» y «nr») 17,18,19,20,21,22. Estos informes se centraron en los residuos de arginina en contacto con PAM R1333 y R1335 que suprimen la función cuando están mutados exclusivamente., Si bien esos estudios identificaron mutaciones compensatorias que resultaron en una especificidad PAM alterada, las variantes Cas9 que produjeron mantuvieron una preferencia por la guanina en al menos una posición de la secuencia PAM para la edición in vivo reportada. Los informes concurrentes han utilizado información evolutiva para relajar aún más la especificidad Pam canónica 5\(^{\prime}\)-NNGRRT-3\(^{\prime}\) de Staphylococcus aureus Cas9 (SaCas9) o para descubrir la especificidad Pam alternativa 5\(^{\prime}\)-NNNNCC-3\(^{\prime}\) a la especificidad Pam canónica 5\(^{\prime}\)-NNNNGHTT-3\(^{\prime}\) de Neisseria meningitidis cas923,24., Las nucleasas de estos dos nuevos informes, sin embargo, todavía prefieren el contenido de GC en al menos una posición de la secuencia PAM. Nuestro objetivo era elevar tales requisitos previos de contenido de GC a través de un flujo de trabajo personalizado impulsado por la bioinformática que explota la diversidad Pam existente en el Streptococcus genus25. Usando esta estrategia, nos centramos en SmacCas9 como que tiene el potencial de tener una especificidad PAM no GC alterada al alinear 115 ortólogos de SpyCas9 de UniProt (limitado a aquellos con una puntuación de blossom62 superior al 70%)., A partir de la alineación encontramos que SmacCas9 era uno de los dos homólogos cercanos, junto con un Streptococcus mutans B112sm-a Cas9 (SmutCas9), que poseía glutaminas en ambas posiciones alineadas con las argininas de contacto Pam altamente conservadas (Fig. 1a-b; suplemento Fig. 2A). Se sabe que los residuos de arginina prefieren fuertemente las guaninas en el paisaje de interacción aminoácido-base, como lo demuestra la especificidad 5\(^{\prime}\)-NGG-3\(^{\prime}\) de SpyCas9. Los residuos de glutamina, por otro lado, se unen preferentemente a las adeninas, a través de la interacción con el borde del surco mayor26., Por lo tanto, planteamos la hipótesis de que SmacCas9 había coevolucionado naturalmente las mutaciones compensatorias necesarias para obtener un nuevo reconocimiento de Pam rico en adenina. Un pequeño tamaño de muestra de 13 espaciadores de la matriz CRISPR de su genoma correspondiente nos impidió inferir con confianza el SmacCas9 Pam in silico., Sin embargo, la posibilidad de que SmacCas9 requiera menos contenido de GC en su PAM fue apoyada por similitudes de secuencia con la variante «QQR» que tiene 5\(^{\prime}\)-NAAG-3\(^{\prime}\) specificy27, además del supuesto consenso de AT-rich PAM para espaciadores de origen de fagos en arrays CRISPR asociados con SmutCas9 altamente homólogos9, que fueron identificados con la ayuda de nuestra canalización SPAMALOT descrita anteriormente y consistentes con predicciones anteriores (Fig. 1C; suplemento Fig. 2b; suplemento Fig. 3) 25,28.
ingeniería y caracterización PAM de SpyMac
se procedió a determinar empíricamente las preferencias PAM de varios ortólogos de estreptococos que cambian uno o ambos de los contactos Pam críticos. Con base en ejemplos demostrados del dominio de interacción PAM (PID) y del ARN guía (gRNA) que tienen compatibilidad cruzada entre ortólogos Cas9 que están estrechamente relacionados y activos, construimos nuevas variantes mediante el intercambio racional de la región PI de SpyCas9 (dSpyCas9) catalíticamente «muertos» con los de los ortólogos seleccionados (suplemento Fig., 2A–B) 29,30. Las variantes ensambladas, incluyendo dSpyMacCas9 (aquí referido como dSpyMac), se cotransformaron por separado en células de E. coli, junto con el ARN guía derivado de S. pyogenes y una biblioteca PAM de 8 mer de representación base uniforme en el circuito genético PAM-SCANR, establecido por Leenay et al.31. El circuito regula un reportero de proteína fluorescente verde (GFP) en proporción a la fuerza de unión a PAM. Por lo tanto, recolectamos las poblaciones celulares GFP positivas por citometría de flujo (suplemento Fig., 4) y Sanger los secuenció alrededor del sitio de la PAM para determinar las preferencias de la base en función de la posición en el reconocimiento PAM de una variante correspondiente. dSpyMac, más que dSpyMutCas9, generó un perfil de trazas que fue más consistente con el reconocimiento de Pam independiente de la guanina, junto con una especificidad dominante para dinucleótidos de adenina (Fig. 2a; suplemento Fig. 2C).