55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
(azul), directamente aguas arriba de una unidad adyacente protoespaciadora 5'-NGG (PAM; magenta) requisito y Cas9 media una doble rotura de cadena (DRC) ~3 pb aguas arriba de la PAM (triángulo rojo).(blue), directly upstream of an adjacent 5'-NGG proto-spacer unit (PAM; magenta) requirement and Cas9 mediates a double chain break (DRC) ~ 3 bp upstream of the PAM (red triangle).
La Figura 2A-F muestra un sistema CRISPR ejemplar, un posible mecanismo de acción, una adaptación de ejemplo para la expresión en células eucariotas y los resultados de los ensayos que evalúan la localización nuclear y la actividad de CRISPR.Figure 2A-F shows an exemplary CRISPR system, a possible mechanism of action, an example adaptation for expression in eukaryotic cells and the results of tests evaluating nuclear localization and CRISPR activity.
La Figura 3 muestra una casete de expresión ejemplar para expresión de elementos del sistema CRISPR en células eucariotas, estructuras previstas de secuencias guía de ejemplo y actividad del sistema CRISPR cuando se mide en células eucariotas y procariotas.Figure 3 shows an exemplary expression cassette for expression of elements of the CRISPR system in eukaryotic cells, envisaged structures of example guide sequences and activity of the CRISPR system when measured in eukaryotic and prokaryotic cells.
La Figura 4A-D muestra los resultados de una evaluación de especificidad de SpCas9 para un objetivo de ejemplo.Figure 4A-D shows the results of a SpCas9 specificity assessment for an example objective.
La Figura 5A-G muestra un sistema vector ejemplar y los resultados para su uso en dirigir recombinación homóloga en células eucariotas.Figure 5A-G shows an exemplary vector system and the results for use in directing homologous recombination in eukaryotic cells.
La Figura 6 proporciona una tabla de secuencias protoespaciadoras y resume los resultados de eficacia de modificación para objetivos protoespaciadores diseñados basándose en sistemas CRISPR de S. pyogenes y S. thermophilus ejemplares con las correspondientes PAM contra sitios en genomas humanos y de ratón. Se transinfectaron células con Cas9 y pre-ARNcr/ARNtracr o ARN quimérico y se analizaron 72 horas después de transinfección. Se calculan los porcentajes de inserciones o supresiones basándose en los resultados de la prueba Surveyor de estirpes celulares indicadas (N=3 para todos los objetivos protoespaciadores, los errores son E. E. M.,Figure 6 provides a table of proto-spacer sequences and summarizes the modification efficacy results for proto-spacer targets designed based on exemplary S. pyogenes and S. thermophilus CRISPR systems with corresponding PAMs against sites in human and mouse genomes. Cells were transinfected with Cas9 and pre-cRNA / RNAcrcr or chimeric RNA and analyzed 72 hours after transfection. The percentages of insertions or deletions are calculated based on the results of the Surveyor test of indicated cell lines (N = 3 for all proto-spacer objectives, the errors are E. E. M.,
N. D. indica no detectable usando la prueba Surveyor yN. D. indicates not detectable using the Surveyor test and
N. E. indica no ensayado en este estudio).N. E. indicates not tested in this study).
La Figura 7A-C muestra una comparación de diferentes transcritos de ARNtracr para fijar como objetivo genes mediados por Cas9.Figure 7A-C shows a comparison of different RNAcrcr transcripts to target genes mediated by Cas9.
La Figura 8 muestra un esquema de una prueba de nucleasa surveyor para detección de microinserciones y microsupresiones inducidas por doble rotura de cadena.Figure 8 shows a scheme of a surveyor nuclease test for detection of microinserrations and microsuppressions induced by double chain breakage.
La Figura 9A-B muestra vectores de expresión bicistrónicos ejemplares para expresión de elementos del sistema CRISPR en células eucariotas.Figure 9A-B shows exemplary bicistronic expression vectors for expression of elements of the CRISPR system in eukaryotic cells.
La Figura 10 muestra un ensayo de interferencia de transformación de plásmidos bacterianos, casetes de expresión y plásmidos usados en el mismo y eficacias de transformación de células usadas en el mismo.Figure 10 shows an interference assay for transformation of bacterial plasmids, expression cassettes and plasmids used therein and cell transformation efficiencies used therein.
La Figura 11A-C muestra histogramas de distancias entre PAM del sitio 1 SF370 de S. pyogenes (NGG) (Figura 10A) y PAM del sitio 2 de LMD9 de S. thermophilus (NNAGAAW) (Figura 10B) en el genoma humano y las distancias para cada PAM por cromosoma (Chr) (Figura 10C).Figure 11A-C shows histograms of distances between PAM of site SF370 of S. pyogenes (NGG) (Figure 10A) and PAM of site 2 of LMD9 of S. thermophilus (NNAGAAW) (Figure 10B) in the human genome and distances for each MAP per chromosome (Chr) (Figure 10C).
La Figura 12A-C muestra un sistema CRISPR ejemplar, una adaptación de ejemplo para expresión en células eucariotas y los resultados de ensayos que evalúan la actividad CRISPR.Figure 12A-C shows an exemplary CRISPR system, an example adaptation for expression in eukaryotic cells and the results of tests evaluating CRISPR activity.
La Figura 13A-C muestra manipulaciones ejemplares de un sistema CRISPR para fijar como objetivo sitios genómicos en células de mamífero.Figure 13A-C shows exemplary manipulations of a CRISPR system to target genomic sites in mammalian cells.
La Figura 14A-B muestra los resultados de un análisis por el método Northern de tratamiento de ARNcr en células de mamífero.Figure 14A-B shows the results of an analysis by the Northern method of treatment of cRNA in mammalian cells.
La Figura 15 muestra una selección ejemplar de protoespaciadores en los sitios PVALB humano y Th de ratón.Figure 15 shows an exemplary selection of proto-spacers in the human and Th mouse PVALB sites.
La Figura 16 muestra protoespaciador de ejemplo y los correspondientes objetivos de secuencia PAM del sistema CRISPR de S. thermophilus en el sitio EMX1 humano.Figure 16 shows an example proto-spacer and the corresponding PAM sequence targets of the S. thermophilus CRISPR system at the human EMX1 site.
La Figura 17 muestra una tabla de secuencias para cebadores y sondas usados para pruebas Surveyor, RFLP, secuenciación genómica y método de Northern.Figure 17 shows a sequence table for primers and probes used for Surveyor, RFLP, genomic sequencing and Northern method tests.
La Figura 18A-C muestra manipulación ejemplar de un sistema CRISPR con ARN quiméricos y los resultados de pruebas SURVEYOR para actividad del sistema en células eucariotas.Figure 18A-C shows exemplary manipulation of a CRISPR system with chimeric RNA and the results of SURVEYOR tests for system activity in eukaryotic cells.
La Figura 19A-B muestra una representación gráfica de los resultados de pruebas SURVEYOR para actividad del sistema CRISPR en células eucariotas.Figure 19A-B shows a graphical representation of SURVEYOR test results for CRISPR system activity in eukaryotic cells.
La Figura 20 muestra una visualización ejemplar de algunos sitios objetivo de Cas9 de S. pyogenes en el genoma humano usando el buscador de genomas UCSC.Figure 20 shows an exemplary visualization of some S. pyogenes Cas9 target sites in the human genome using the UCSC genome finder.
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
La Figura 21 muestra estructuras secundarias previstas para ARN quiméricos ejemplares que comprenden una secuencia guía, secuencia de emparejamiento tracr y secuencia tracr.Figure 21 shows secondary structures envisioned for exemplary chimeric RNAs comprising a guide sequence, tracr pairing sequence and tracr sequence.
La Figura 22 muestra vectores de expresión bicistrónicos ejemplares para expresión de elementos del sistema CRISPR en células eucariotas.Figure 22 shows exemplary bicistronic expression vectors for expression of elements of the CRISPR system in eukaryotic cells.
La Figura 23 muestra que la actividad de la nucleasa Cas9 frente a objetivos endógenos puede explotarse para edición de genomas. (a) Concepto de edición de genomas usando el sistema CRISPR. La construcción que fija como objetivo CRISPR dirigió la escisión de un sitio cromosómico y se cotransformó con una plantilla de edición que se recombinó con el objetivo para evitar la escisión. Los transformados resistentes a la kanamicina que sobrevivieron al ataque de CRISPR contenían modificaciones introducidas por la plantilla de edición. ARN de CRISPR trans-activante, tracr; gen de resistencia a la kanamicina, aphA-3. (b) Transformación de ADN crR6M en células R68.232,5 sin plantilla de edición, srtA natural R6 o las plantillas de edición de R6370,1. La recombinación de srtA R6 o R6370,1 evitó la escisión por Cas9. Se calculó la eficacia de transformación como unidades formadoras de colonias (ufc) por µg de ADN de crR6M; se muestran los valores medios con desviaciones estándar de al menos tres experimentos independientes. Se realizó análisis PCR sobre 8 clones en cada transformación. “No.” indica el sitio srtA no editado de la cepa R68232,5; “Ed.” muestra la plantilla de edición. Los objetivos R68232,5 y R6370,1 se distinguen por restricción con EaeI.Figure 23 shows that the activity of the Cas9 nuclease against endogenous targets can be exploited for genome editing. (a) Concept of genome editing using the CRISPR system. The construction that sets CRISPR as objective directed the excision of a chromosomal site and was co-transformed with an editing template that was recombined with the objective to avoid excision. Kanamycin-resistant transformations that survived the CRISPR attack contained modifications introduced by the editing template. Trans-activating CRISPR RNA, tracr; Kanamycin resistance gene, aphA-3. (b) Transformation of crR6M DNA into R68.232.5 cells without editing template, natural R6 srtA or R6370.1 editing templates. Recombination of srtA R6 or R6370.1 prevented excision by Cas9. The transformation efficiency was calculated as colony forming units (cfu) per µg of crR6M DNA; Mean values with standard deviations of at least three independent experiments are shown. PCR analysis was performed on 8 clones in each transformation. "No." indicates the unedited srtA site of strain R68232.5; "Ed." Shows the editing template. Objectives R68232.5 and R6370.1 are distinguished by restriction with EaeI.
La Figura 24 muestra análisis de PAM y secuencias de siembra que eliminan la escisión de Cas9. (a) Se transformaron los productos PCR con secuencias PAM aleatoriadas o secuencias de siembra aleatoriadas en células crR6. Estas células expresaron Cas9 cargado con un ARNcr que fijó como objetivo una región cromosómica de células R68232,5 (resaltado en rosa) que está ausente a partir del genoma R6. Más de 2x105 transformados resistentes al cloranfenicol, soportando PAM o secuencias de siembra inactivas, se combinaron para multiplicación y secuenciación intensa de la región fijada como objetivo. (b) Proporción relativa de número de lecturas después de la transformación de las construcciones PAM aleatorias en células crR6 (comparado con el número de lecturas en transformados R6). Se muestra la abundancia relativa para cada secuencia PAM de 3 nucleótidos. Se muestran secuencias seriamente infrarrepresentadas (NGG) en rojo; una parcialmente infrarrepresentada en naranja (NAG)Figure 24 shows PAM analysis and seeding sequences that eliminate excision of Cas9. (a) PCR products were transformed with randomized PAM sequences or randomized sowing sequences in crR6 cells. These cells expressed Cas9 loaded with an cRNA that targeted a chromosomal region of R68232.5 cells (highlighted in pink) that is absent from the R6 genome. More than 2x105 chloramphenicol resistant transformants, supporting PAM or inactive seeding sequences, were combined for intense multiplication and sequencing of the target region. (b) Relative proportion of number of readings after transformation of random PAM constructs into crR6 cells (compared to the number of readings in R6 transforms). The relative abundance for each PAM sequence of 3 nucleotides is shown. Seriously underrepresented (NGG) sequences are shown in red; one partially underrepresented in orange (NAG)
(c) Proporción relativa de número de lecturas después de transformación de las construcciones de secuencias de siembra aleatorias en células crR6 (comparado con el número de lecturas en transformados de R6). Se muestra la abundancia relativa de cada nucleótido para cada posición de los primeros 20 nucleótidos de la secuencia protoespaciadora. La abundancia alta indica ausencia de escisión por Cas9, es decir, una mutación que inactiva CRISPR. La línea gris muestra el nivel de la secuencia TN. La línea de puntos representa el nivel por encima del cual una mutación interrumpe significativamente la escisión (Véase la sección “Analysis of deep sequencing data” en el Ejemplo 5)).(c) Relative proportion of number of readings after transformation of random sowing sequence constructs in crR6 cells (compared to the number of readings in R6 transforms). The relative abundance of each nucleotide for each position of the first 20 nucleotides of the proto-spacer sequence is shown. High abundance indicates absence of excision by Cas9, that is, a mutation that inactivates CRISPR. The gray line shows the level of the TN sequence. The dotted line represents the level above which a mutation significantly interrupts the excision (See the section "Analysis of deep sequencing data" in Example 5)).
La Figura 25 muestra la introducción de mutaciones únicas y múltiples usando el sistema CRISPR en S. pneumoniae, (a) Secuencias de nucleótidos y aminoácidos de bgaA tipo natural y editado (nucleótidos verdes; restos de aminoácidos subrayados). Se muestra el protoespaciador, PAM y sitios de restricción. (b) Eficacia de transformación de células transformadas con construcciones fijadoras de objetivo en presencia de una plantilla o control de edición. (c) Análisis PCR para 8 transformados de cada experimento de edición seguido por digestión con BtgZI (R→A) y TseI (NE→AA). La supresión de bgaA se reveló como un producto PCR más pequeño. (d) Prueba de Miller para medir la actividad de la β-galactosidasa de cepas TN y editadas. (e) Para una doble supresión de una sola etapa, la construcción fijadora de objetivo contenía dos espaciadores (en este caso emparejando srtA y bgaA) y se cotransformó con dos plantillas de edición diferentes (f) Análisis PCR para 8 transformados para detectar supresiones en los sitios srtA y bgaA. Los transformados 6/8 contenían supresiones de los dos genes.Figure 25 shows the introduction of single and multiple mutations using the CRISPR system in S. pneumoniae, (a) Nucleotide and amino acid sequences of wild-type and edited bgaA (green nucleotides; underlined amino acid residues). Proto-spacer, PAM and restriction sites are shown. (b) Transformation efficiency of transformed cells with target fixing constructs in the presence of a template or editing control. (c) PCR analysis for 8 transformations of each editing experiment followed by digestion with BtgZI (R → A) and TseI (NE → AA). BgaA suppression was revealed as a smaller PCR product. (d) Miller test to measure the β-galactosidase activity of TN and edited strains. (e) For a double suppression of a single stage, the target fixing construction contained two spacers (in this case matching srtA and bgaA) and was co-transformed with two different editing templates (f) PCR analysis for 8 transformed to detect deletions in the srtA and bgaA sites. Transforms 6/8 contained deletions of the two genes.
La Figura 26 proporciona mecanismos que subrayan la edición usando el sistema CRISPR. (a) Se introdujo un codón de terminación en el gen de resistencia a eritromicina ermAM para generar cepa JEN53. Se puede restaurar la secuencia natural fijando como objetivo el codón de terminación con la construcción CRISPR::ermAM(terminación) y usando la secuencia natural ermAM como una plantilla de edición. (b) Secuencias ermAM mutantes y de tipo natural. (c) Fracción de ufc (ermR) resistente a eritromicina calculada a partir de las ufc totales o resistentes a kanamicina (kanR). (d) Fracción de células totales que adquieren tanto la construcción CRISPR como la plantilla de edición. La cotransformación de la construcción que fija como objetivo CRISPR produjo más transformados (ensayo t, p=0,011). En todos los casos los valores muestran la media ± d. e. para tres experimentos independientes.Figure 26 provides mechanisms that underline editing using the CRISPR system. (a) A termination codon was introduced into the ermAM erythromycin resistance gene to generate strain JEN53. The natural sequence can be restored by targeting the termination codon with the CRISPR :: ermAM (termination) construct and using the ermAM natural sequence as an editing template. (b) Mutant and wild-type ermAM sequences. (c) Fraction of erythromycin-resistant cfu (ermR) calculated from total or kanamycin-resistant cfu (kanR). (d) Fraction of total cells that acquire both the CRISPR construction and the editing template. The cotransformation of the construction that sets CRISPR as its objective produced more transformations (t-test, p = 0.011). In all cases the values show the mean ± d. and. for three independent experiments.
La Figura 27 ilustra edición de genomas con el sistema CRISPR en E. coli. (a) Un plásmido resistente a kanamicina que soporta la matriz CRISPR (pCRISPR) que fija como objetivo el gen para editar puede transformarse en la cepa de recombinación de HME63 que contiene un plásmido resistente a cloranfenicol que alberga cas9 y tracr (pCas9), junto con un oligonucleótido que especifica la mutación. (b) Se introdujo una mutación de K42T que confería resistencia a la estreptomicina en el gen rpsL (c) Fracción de ufc resistentes a estreptomicina (strepR) calculada a partir de ufc totales o resistentes a kanamicina (kanR). (d) Fracción de células totales que adquieren tanto el plásmido pCRISPR como el oligonucleótido de edición. La cotransformación del plásmido que fija como objetivoFigure 27 illustrates genome editing with the CRISPR system in E. coli. (a) A kanamycin-resistant plasmid that supports the CRISPR matrix (pCRISPR) that targets the gene for editing can be transformed into the recombination strain of HME63 containing a chloramphenicol-resistant plasmid that houses cas9 and tracr (pCas9), together with an oligonucleotide that specifies the mutation. (b) A K42T mutation was introduced that conferred streptomycin resistance in the rpsL gene (c) Streptomycin-resistant cfu fraction (strepR) calculated from total or kanamycin-resistant cfu (kanR). (d) Fraction of total cells that acquire both the plasmid pCRISPR and the editing oligonucleotide. The cotransformation of the plasmid that targets
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
pCRISPR produjo más transformados (ensayo t, p=0,004). En todos los casos los valores mostraron la media ± d. e. para tres experimentos independientes.pCRISPR produced more transformants (t-test, p = 0.004). In all cases the values showed the mean ± d. and. for three independent experiments.
La Figura 28 ilustra que la transformación de ADN genómico de crR6 conduce a la edición del sitio fijado como objetivo (a) El elemento IS1167 deR6 de S. pneumoniae fue reemplazado por el sitio CRISPR01 de SF370 de S. pyogenes para generar cepa crR6. Este sitio codifica la nucleasa Cas9, una matriz CRISPR con seis espaciadores, el ARNtracr que se requiere para biogénesis de ARNcr y Cas1, Cas2 y Csn2, proteínas no necesarias para fijación como objetivo. La cepa crR6M contiene un sistema CRISPR funcional mínimo sin cas1, cas2 y csn2. El gen aphA-3 codifica resistencia a kanamicina. Se fusionaron protoespaciadores de los bacteriófagos de estreptococos φ8232,5 y φ370,1 a un gen de resistencia a cloranfenicol (cat) y se integraron en el gen srtA de cepa R6 para generar las cepas R68232,5 y R6370,1. (b) Panel izquierdo: Transformación de ADN genómico crR6 y crR6M en R68232,5 y R6370,1. Como un control de competencia celular también se transformó un gen resistente a estreptomicina. Panel derecho: Análisis PCR de 8 transformados R68232,5 con ADN genómico crR6. Se usaron cebadores que multiplican el sitio srtA por PCR. 7/8 colonias genotipadas reemplazaron el sitio srtA R68232,5 por el sitio TN del ADN genómico de crR6.Figure 28 illustrates that the transformation of genomic DNA of crR6 leads to the edition of the target site (a). The IS1167 element of S. pneumoniae R6 was replaced by the site CRISPR01 of SF370 of S. pyogenes to generate strain crR6. This site encodes the Cas9 nuclease, a CRISPR matrix with six spacers, the RNAcrcr that is required for cDNA and Cas1, Cas2 and Csn2 biogenesis, proteins not necessary for target fixation. The crR6M strain contains a minimum functional CRISPR system without cas1, cas2 and csn2. The aphA-3 gene encodes kanamycin resistance. Proto-spacers of the φ8232.5 and φ370.1 streptococcus bacteriophages were fused to a chloramphenicol (cat) resistance gene and integrated into the srtA gene of strain R6 to generate strains R68232.5 and R6370.1. (b) Left panel: Transformation of crR6 and crR6M genomic DNA into R68232.5 and R6370.1. As a control of cellular competence, a streptomycin resistant gene was also transformed. Right panel: PCR analysis of 8 R68232.5 transformed with crR6 genomic DNA. Primers that multiply the srtA site by PCR were used. 7/8 genotyped colonies replaced the srtA site R68232.5 with the TN site of the genomic DNA of crR6.
La Figura 29 proporciona cromatogramas de secuencias de ADN de células editadas obtenidas en este estudio. En todos los casos, se indica el protoespaciador natural y mutante y secuencias PAM (o su complemento inverso). Cuando es relevante, se proporciona la secuencia de aminoácidos codificada por el protoespaciador. Para cada experimento de edición, se secuenciaron todas las cepas para las que el análisis PCR y de restricción corroboró la introducción de la modificación deseada. Se muestra un cromatograma representativo. (a) Cromatograma para la introducción de una mutación PAM en el objetivo R68232,5 (Figura 23d). (b) Cromatogramas para la introducción de las mutaciones R>A y NE>AA en β-galactosidasa (bgaA) (Figura 25c). (c) Cromatograma para la introducción de una supresión de 6.664 pb en ORF (marco de lectura abierta, por sus siglas en inglés) de bgaA (Figuras 25c y 25f). La línea de puntos indica los límites de la supresión. (d) Cromatograma para la introducción de una supresión de 729 pb en ORF de srtA (Figura 25f). La línea de puntos indica los límites de la supresión. (e) Cromatogramas para la generación de un codón de terminación prematuro en ermAM (Figura 33). (f) Edición de rpsL en E. coli (Figura 27).Figure 29 provides chromatograms of edited cell DNA sequences obtained in this study. In all cases, the natural and mutant proto-spacer and PAM sequences (or their reverse complement) are indicated. When relevant, the amino acid sequence encoded by the proto-spacer is provided. For each editing experiment, all strains for which the PCR and restriction analysis corroborated the introduction of the desired modification were sequenced. A representative chromatogram is shown. (a) Chromatogram for the introduction of a PAM mutation in objective R68232.5 (Figure 23d). (b) Chromatograms for the introduction of R> A and NE> AA mutations in β-galactosidase (bgaA) (Figure 25c). (c) Chromatogram for the introduction of a 6,664 bp suppression in bgaA ORF (open reading frame) (Figures 25c and 25f). The dotted line indicates the limits of the deletion. (d) Chromatogram for the introduction of a 729 bp suppression in srtA ORF (Figure 25f). The dotted line indicates the limits of the deletion. (e) Chromatograms for the generation of a codon of premature termination in ermAM (Figure 33). (f) Edition of rpsL in E. coli (Figure 27).
La Figura 30 ilustra inmunidad de CRISPR contra objetivos de S. pneumoniae aleatorios conteniendo diferentes PAM. (a) Posición de los 10 objetivos aleatorios en el genoma R6 de S. pneumoniae. Los objetivos elegidos presentan diferentes PAM y están en ambas cadenas. (b) Se clonaron los espaciadores correspondientes a los objetivos en una matriz de CRISPR mínima en plásmido pLZ12 y se transformaron en cepa crR6Rc, que suministra la maquinaria de tratamiento y fijación como objetivo en trans. (c) Eficacia de transformación de los diferentes plásmidos en cepa R6 y crR6Rc. No se recuperaron colonias para la transformación de pDB99-108 (T1-T10) en crR6Rc. La línea de puntos representa el límite de detección de la prueba.Figure 30 illustrates CRISPR immunity against random S. pneumoniae targets containing different PAMs. (a) Position of the 10 randomized targets in the R6 genome of S. pneumoniae. The chosen objectives have different MAPs and are in both chains. (b) The spacers corresponding to the targets were cloned into a minimum CRISPR matrix in plasmid pLZ12 and transformed into strain crR6Rc, which supplies the treatment and fixation machinery as a target in trans. (c) Transformation efficiency of the different plasmids in strain R6 and crR6Rc. No colonies were recovered for the transformation of pDB99-108 (T1-T10) into crR6Rc. The dotted line represents the limit of detection of the test.
La Figura 31 proporciona un esquema general para editar genoma fijado como objetivo. Para facilitar la edición de genoma fijado como objetivo, se logró además que crR6M contuviera ARNtracr, Cas9 y sólo una repetición de la matriz CRISPR seguido por marcador de resistencia a kanamicina (aphA-3), generando cepa crR6Rk. Se usa ADN de esta cepa como una plantilla para PCR con cebadores diseñados para introducir un nuevo espaciador (recuadro verde designado con N). Las PCR izquierda y derecha se reúnen usando el método de Gibson para crear la construcción fijadora de objetivo. Después se transforman las construcciones tanto fijadora de objetivo como de edición en cepa crR6Rc, que es una cepa equivalente a crR6Rk, pero presenta el marcador de resistencia a kanamicina reemplazado por un marcador de resistencia a cloranfenicol (cat). Aproximadamente el 90% de los transformados resistentes a kanamicina contienen la mutación deseada.Figure 31 provides a general scheme for editing target genome. To facilitate the editing of the target genome, it was also achieved that crR6M contained ARNtracr, Cas9 and only one repetition of the CRISPR matrix followed by a kanamycin resistance marker (aphA-3), generating strain crR6Rk. DNA from this strain is used as a template for PCR with primers designed to introduce a new spacer (green box designated with N). The left and right PCR are assembled using the Gibson method to create the target fixer construction. The target-fixing and editing constructs are then transformed into the crR6Rc strain, which is a strain equivalent to crR6Rk, but has the kanamycin resistance marker replaced by a chloramphenicol resistance marker (cat). Approximately 90% of kanamycin resistant transformants contain the desired mutation.
La Figura 32 ilustra la distribución de distancias entre las PAM. NGG y CCN que se consideran que son PAM válidas. Se muestran los datos para el genoma R6 de S. pneumoniae, así como para una secuencia aleatoria de la misma longitud y con el mismo contenido en GC (39,7%). La línea de puntos representa la distancia promedio (12) entre las PAM en el genoma R6.Figure 32 illustrates the distribution of distances between PAMs. NGG and CCN that are considered to be valid PAM. Data for the R6 genome of S. pneumoniae are shown, as well as for a random sequence of the same length and with the same GC content (39.7%). The dotted line represents the average distance (12) between the PAMs in the R6 genome.
La Figura 33 ilustra edición mediada por CRISPR del sitio ermAM usando ADN genómico como construcción fijadora de objetivo. Para usar ADN genómico como construcción fijadora de objetivo es necesario evitar autoinmunidad de CRISPR y, por lo tanto, se debe usar un espaciador contra una secuencia no presente en el cromosoma (en este caso el gen de resistencia a eritromicina ermAM). (a) Secuencias de nucleótidos y aminoácidos del gen ermAM natural y mutado (letras rojas). Se muestra el protoespaciador y las secuencias PAM. (b) Un esquema para la edición mediada por CRISPR del sitio ermAM usando ADN genómico. Una construcción que soporta un espaciador que fija como objetivo ermAM (recuadro azul) se prepara por PCR y ensamblaje de Gibson y se transforma en cepa crR6Rc, que genera cepa JEN37. Después se usó el ADN genómico de JEN37 como una construcción fijadora de objetivo y se cotransformó con la plantilla de edición en JEN38, una cepa en la que el gen srtA fue reemplazado por una copia natural de ermAM. Los transformados resistentes a kanamicina contienen el genotipo editado (JEN43). (c)Número de células resistentes a kanamicina obtenidas después de co-transformación de plantillas de fijación como objetivo y de edición o control. En presencia de la plantilla de control se obtuvieron 5,4×103 ufc/ml y 4,3×105 ufc/ml cuando se usó la plantilla de edición. Esta diferencia indica una eficacia de edición de aproximadamente 99%Figure 33 illustrates CRISPR mediated edition of the ermAM site using genomic DNA as a target fixation construct. To use genomic DNA as a target-fixing construct, it is necessary to avoid autoimmunity of CRISPR and, therefore, a spacer must be used against a sequence not present in the chromosome (in this case the ermromycin resistance gene ermAM). (a) Nucleotide and amino acid sequences of the natural and mutated ermAM gene (red letters). The proto-spacer and PAM sequences are shown. (b) A scheme for the CRISPR mediated edition of the ermAM site using genomic DNA. A construction that supports a spacer that sets the target ermAM (blue box) is prepared by Gibson PCR and assembly and transformed into strain crR6Rc, which generates strain JEN37. The JEN37 genomic DNA was then used as a target-fixing construct and co-transformed with the editing template in JEN38, a strain in which the srtA gene was replaced by a natural copy of ermAM. Kanamycin resistant transformants contain the edited genotype (JEN43). (c) Number of kanamycin resistant cells obtained after co-transformation of fixation templates as a target and for editing or control. In the presence of the control template 5.4 × 103 cfu / ml and 4.3 × 105 cfu / ml were obtained when the editing template was used. This difference indicates an editing efficiency of approximately 99%
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
reparación en la forma de un plásmido u oligodesoxinucleótidos monocatenarios (ODNss) para potenciar la ruta de reparación dirigida por homología (HDR, por sus siglas en inglés), que permite alta fidelidad y edición precisa.repair in the form of a single stranded plasmid or oligodeoxynucleotide (ODNss) to enhance the homology-directed repair path (HDR), which allows high fidelity and precise editing.
La Figura 60 muestra la cronología y resumen de los experimentos. Las etapas para diseño de reactivo, construcción, validación y expansión de estirpes celulares. Los ARNsg de costumbre (barras azul claro) para cada objetivo, así como cebadores de genotipado, se diseñan in silico vía nuestra herramienta de diseño on-line (disponible en el sitio web genome-engineering.org/tools). Los vectores de expresión ARNsg se clonaron después en un plásmido que contenía Cas9 (PX330) y se verificó por secuenciación de ADN. Los plásmidos completos (los pCRISPR) y las plantillas de reparación opcionales para facilitar la reparación dirigida por homología, se transinfectan después a células y se prueba su capacidad para mediar la escisión fijada como objetivo. Finalmente, las células transinfectadas pueden expandirse de manera clonal para obtener estirpes celulares isogénicas con mutaciones definidas.Figure 60 shows the chronology and summary of the experiments. The stages for reagent design, construction, validation and expansion of cell lines. The usual ARNsg (light blue bars) for each objective, as well as genotyping primers, are designed in silico via our online design tool (available on the genome-engineering.org/tools website). The rRNA expression vectors were then cloned into a plasmid containing Cas9 (PX330) and verified by DNA sequencing. Complete plasmids (pCRISPR) and optional repair templates to facilitate homology-directed repair are then transinfected into cells and their ability to mediate target cleavage is tested. Finally, the transinfected cells can be clonally expanded to obtain isogenic cell lines with defined mutations.
La Figura 61A-C muestra selección de objetivo y preparación de reactivo. (a) Para Cas9 de S. pyogene, los objetivos de 20 pb (resaltado en azul) deben ir seguidos por 5'-NGG, que puede tener lugar en cualquier cadena en ADN genómico. Se recomienda usar la herramienta on-line descrita en este protocolo para ayudar a la selección de objetivo (www.genome-engineering.org/tools). (b) Esquema para cotransinfección de plásmido de expresión de Cas9 (PX165) y casete de expresión de ARNsg conducida por U6 multiplicada por PCR. Usar una plantilla de PCR que contenga activador de U6 y un cebador directo fijado (U6 Dir), puede agregarse ADN codificador de ARNsg sobre el cebador inverso de U6 (U6 Inv) y sintetizarse como un oligo ADN extendido (Oligo ultrámeros de IDT). Obsérvese que la secuencia guía (de N azul) en U6 Inv es el complemento inverso de la secuencia objetivo flanqueadora de 5'-NGG. (c) Esquema para clonación sin marca de las oligo secuencias guía en un plásmido que contiene andamio Cas9 y ARNsg (PX330). Los oligos guía (de N azul) contienen salientes para ligadura en el par de sitios de BbsI en PS330, igualándose las orientaciones de las cadenas superior y del fondo a aquéllas del objetivo genómico (es decir, oligo superior es la secuencia de 20 pb que precede 5'-NGG en ADN genómico). La digestión de PX330 con BbsI permite el reemplazo de los sitios de restricción de tipo IIs (trazado azul) con inserción directa de oligos hibridados. Cabe señalar que se puso una G extra antes de la primera base de la secuencia guía. Los solicitantes han encontrado que una G extra delante de la secuencia guía no afecta negativamente a la eficacia de la fijación como objetivo. En los casos en los que la secuencia guía de 20 nucleótidos de elección no empieza con guanina, la guanina extra asegurará que el ARNsg se transcriba de manera eficaz por el activador de U6, que prefiere una guanina en la primera base de la transcripción.Figure 61A-C shows target selection and reagent preparation. (a) For Cas9 of S. pyogene, the 20 bp targets (highlighted in blue) must be followed by 5'-NGG, which can take place in any genomic DNA strand. It is recommended to use the online tool described in this protocol to help target selection (www.genome-engineering.org/tools). (b) Scheme for cotransfection of Cas9 expression plasmid (PX165) and RNAs expression cassette driven by U6 multiplied by PCR. Using a PCR template containing a U6 activator and a fixed direct primer (U6 Dir), DNA encoding RNAsg can be added onto the reverse primer of U6 (U6 Inv) and synthesized as an extended DNA oligo (Oligo IDT ulcers). Note that the guide sequence (of blue N) in U6 Inv is the inverse complement of the 5'-NGG flanking target sequence. (c) Scheme for unlabeled cloning of the oligo guide sequences in a plasmid containing Cas9 scaffold and siRNA (PX330). The guide oligos (of blue N) contain ligation projections in the pair of BbsI sites on PS330, the orientations of the upper and bottom chains being equal to those of the genomic target (i.e., superior oligo is the 20 bp sequence precedes 5'-NGG in genomic DNA). The digestion of PX330 with BbsI allows the replacement of type IIs restriction sites (blue tracing) with direct insertion of hybridized oligos. It should be noted that an extra G was placed before the first base of the guide sequence. Applicants have found that an extra G in front of the guide sequence does not adversely affect the effectiveness of the target fixation. In cases where the guiding sequence of 20 nucleotides of choice does not start with guanine, the extra guanine will ensure that the siRNA is efficiently transcribed by the U6 activator, which prefers a guanine at the first base of the transcript.
La Figura 62A-D muestra los resultados anticipados para NHEJ múltiplex. (a) Esquema de la prueba SURVEYOR usada para determinar el porcentaje de inserciones o supresiones. Primero, se multiplica por PCR ADN genómico de la población heterogénea de células fijadas como objetivo de Cas9. Se vuelven a hibridar después lentamente los amplicones para generar los heterodúplex. Se escinden los heterodúplex hibridados de nuevo mediante nucleasa SURVEYOR, mientras se dejan intactos los homodúplex. Se calcula la eficacia de escisión mediada por Cas9 (% indel) basándose en la fracción de ADN escindido, cuando se determina por intensidad integrada de bandas de gel.Figure 62A-D shows the anticipated results for multiplex NHEJ. (a) SURVEYOR test scheme used to determine the percentage of insertions or deletions. First, genomic DNA from the heterogeneous population of fixed cells targeted by Cas9 is multiplied by PCR. The amplicons are then slowly hybridized again to generate heteroduplexes. Hybridized heteroduxes are cleaved again by SURVEYOR nuclease, while homoduplexes are left intact. The efficiency of Cas9-mediated cleavage (% indel) is calculated based on the fraction of DNA cleaved, when determined by integrated intensity of gel bands.
La Figura 63A-C muestra la aplicación de ssODN (del inglés, oligodesoxirribonucleótido de cadena sencilla) y vector de fijación como objetivo para mediar la RH con mutante tanto natural como nickasa de Cas9 en células HEK293FT y HUES9 con eficacias que oscilan de 1,0-27%.Figure 63A-C shows the application of ssODN (English, single chain oligodeoxyribonucleotide) and fixation vector as a target to mediate HR with both natural mutant and Cas9 nickase in HEK293FT and HUES9 cells with efficiencies ranging from 1.0 -27%
La Figura 64 muestra un esquema de un método basado en PCR para fijar como objetivo CRISPR de manera rápida y eficaz en células de mamífero. Un plásmido que contiene el activador U6 de polimerasa III de ARN humano se multiplica por PCR usando un cebador directo específico de U6 y un cebador inverso que soporta el complementoFigure 64 shows a scheme of a PCR-based method for quickly and efficiently targeting CRISPR in mammalian cells. A plasmid containing the human RNA polymerase III activator U6 is multiplied by PCR using a direct specific U6 primer and a reverse primer that supports complement
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
inverso de parte del cebador U6, el andamio ARNsg(+85) con secuencia guía y nucleótidos 7 T para terminación transcripcional. Se purifica el producto PCR resultante y se suministra conjuntamente con un plásmido que soporta Cas9 conducido por el activador CBh.Inverse of part of the U6 primer, the scaffold RNAsg (+85) with guide sequence and 7 T nucleotides for transcriptional termination. The resulting PCR product is purified and supplied together with a plasmid that supports Cas9 driven by the CBh activator.
La Figura 65 muestra estuche de detección de mutación SURVEYOR de resultados transgenómicos para cada ARNg y respectivos controles. Un resultado SURVEYOR positivo es una banda grande que corresponde al PCR genómico y dos bandas más pequeñas que son el producto de la nucleasa SURVEYOR que haga una rotura de doble cadena en el sitio de una mutación. Se validó cada ARNg en la estirpe celular de ratón, Neuro-N2a, por cotransinfección transitoria liposomal con hSpCas9. 72 horas postransinfección se purificó ADN genómico usando ADN QuickExtract de Epicentre. Se realizó PCR para multiplicar el sitio de interés.Figure 65 shows SURVEYOR mutation detection kit of transgenomic results for each mRNA and respective controls. A positive SURVEYOR result is a large band that corresponds to genomic PCR and two smaller bands that are the product of the SURVEYOR nuclease that causes a double-strand break at the site of a mutation. Each rRNA was validated in the mouse cell line, Neuro-N2a, by transient liposomal co-transfection with hSpCas9. 72 hours post-infection genomic DNA was purified using Epicenter QuickExtract DNA. PCR was performed to multiply the site of interest.
La Figura 66 muestra los resultados Surveyor para 38 crías vivas (rutas 1-38) 1 cría muerta (ruta 39) y 1 cría natural para comparación (ruta 40). Se inyectó ARNg Chd8.2 a las crías 1-19 y ARNg Chd8.3 a las crías 20-38. De las 38 crías vivas, 13 fueron positivas para una mutación. Una cría muerta también tuvo una mutación. No se detectó mutación en la muestra natural. La secuenciación PCR genómica fue consistente con los hallazgos de la prueba SURVEYOR.Figure 66 shows the Surveyor results for 38 live offspring (routes 1-38) 1 dead offspring (route 39) and 1 natural offspring for comparison (route 40). Chd8.2 siRNA was injected to offspring 1-19 and Chdg.3.3 siRNAs were fed to offspring 20-38. Of the 38 live offspring, 13 were positive for a mutation. A dead baby also had a mutation. No mutation was detected in the natural sample. Genomic PCR sequencing was consistent with the findings of the SURVEYOR test.
La Figura 67 muestra un diseño de diferentes construcciones de NLS Cas9. Todos los Cas9 fueron la versión de codón optimizado humano de Sp Cas9. Las secuencias NLS se ligaron al gen cas9 en cualquier N-terminal o Cterminal. Todas las variantes de Cas9 con diferentes diseños NLS se clonaron en un vector de esqueleto que conteniendo eso es conducido por un activador de EF1a. En el mismo vector hay un sitio EMX1 humano que fija como objetivo ARN quimérico conducido por activador U6, formando un sistema de dos componentes.Figure 67 shows a design of different constructions of NLS Cas9. All Cas9 were the human optimized codon version of Sp Cas9. The NLS sequences were linked to the cas9 gene in any N-terminal or Cterminal. All variants of Cas9 with different NLS designs were cloned into a skeleton vector containing that is driven by an EF1a activator. In the same vector there is a human EMX1 site that targets chimeric RNA driven by activator U6, forming a two component system.
La Figura 68 muestra la eficacia de la escisión genómica inducida por variantes de Cas9 que soportan diferentes diseños NLS. El porcentaje indica la porción de ADN genómico de EMX1 humano que se escindió por cada construcción. Todos los experimentos son de 3 replicados biológicos. n = 3, el error indica E.E.M.Figure 68 shows the efficacy of genomic excision induced by Cas9 variants that support different NLS designs. The percentage indicates the portion of human EMX1 genomic DNA that was cleaved by each construct. All experiments are of 3 biological replicates. n = 3, the error indicates E.E.M.
La Figura 69A muestra un diseño del CRISPR-TF (factor de transcripción) con actividad de activación transcripcional. Se expresa el ARN quimérico por el activador U6, mientras una versión de doble mutante, de codón optimizado humano de la proteína Cas9 (hSpCas9m), ligada de manera operable a NLS triple y un dominio funcional VP64 se expresa por un activador de EF1a. Las dobles mutaciones, D10A y H840A, hacen a la proteína cas9 incapaz de introducir escisión pero mantiene su capacidad para fijar como objetivo ADN cuando se guía por el ARN quimérico.Figure 69A shows a design of the CRISPR-TF (transcription factor) with transcriptional activation activity. The chimeric RNA is expressed by the U6 activator, while a double mutant, human optimized codon version of the Cas9 protein (hSpCas9m), operably linked to triple NLS and a VP64 functional domain is expressed by an EF1a activator. The double mutations, D10A and H840A, make the cas9 protein unable to introduce cleavage but maintains its ability to target DNA when guided by the chimeric RNA.
La Figura 69B muestra la activación de la transcripción del gen SOX2 humano con sistema CRISPR-TF (ARN quimérico y la proteína de fusión Cas9-NLS-VP64). Se transinfectaron células 293FT con plásmidos que soportaban dos componentes: (1) diferentes ARN quiméricos conducidos por U6 que fijan como objetivo secuencias de 20 pb enFigure 69B shows the activation of transcription of the human SOX2 gene with CRISPR-TF system (chimeric RNA and the Cas9-NLS-VP64 fusion protein). 293FT cells were transinfected with plasmids that supported two components: (1) different U6-driven chimeric RNAs that target 20 bp sequences in
o alrededor del sitio genómico SOX2 humano y (2) proteína de fusión hSpCas9m (doble mutante)-NLS-VP64 conducida por EF1a. 96 horas postransinfección, se recogieron las células 293FT y se midió el nivel de activación por la inducción de expresión de ARNm usando una prueba qRT-PCR (del inglés, reacción en cadena de la polimerasa con transcriptasa inversa). Se normalizan todos los niveles de expresión contra el grupo de control (barra gris), que representa los resultados de células transinfectadas con el plásmido de esqueleto de CRISPR-TF sin ARN quimérico. Las sondas de qRT-PCR usadas para detectar el ARNm de SOX2 es la prueba de expresión de genes humanos Taqman (Life Technologies). Todos los experimentos representan datos de 3 replicados biológicos, n=3, las barras de error muestran E.E.M.or around the human SOX2 genomic site and (2) hSpCas9m (double mutant) -NLS-VP64 fusion protein driven by EF1a. 96 hours post-infection, 293FT cells were collected and the level of activation was measured by induction of mRNA expression using a qRT-PCR test (in English, polymerase chain reaction with reverse transcriptase). All levels of expression are normalized against the control group (gray bar), which represents the results of cells transinfected with the CRISPR-TF skeleton plasmid without chimeric RNA. The qRT-PCR probes used to detect the SOX2 mRNA is the Taqman human gene expression test (Life Technologies). All experiments represent data from 3 biological replicates, n = 3, the error bars show E.E.M.
La Figura 70 representa la optimización de la arquitectura NLS para SpCas9.Figure 70 represents the optimization of the NLS architecture for SpCas9.
La Figura 71 muestra una representación gráfica de QQ para las secuencias NGGNN.Figure 71 shows a graphical representation of QQ for the NGGNN sequences.
La Figura 72 muestra un histograma de la densidad de datos con distribución normal fijada (línea negra) y 0,99 de cuantil (línea de puntos).Figure 72 shows a histogram of data density with fixed normal distribution (black line) and 0.99 quantile (dotted line).
La Figura 73A-C muestra represión guiada por ARN de expresión de bgaA por ARNdg::cas9**. a. La proteína Cas9 se une al ARNtracr y al precursor de ARN de CRISPR que se trata por RNAseIII para formar el ARNcr. El ARNcr dirige la unión de Cas9 al activador de bgaA y reprime la transcripción. b. Se representan los objetivos usados para dirigir Cas9** al activador de bgaA. El codón putativo -35, -10 así como el codón de partida bgaA están en negrita. c. La actividad de la betagalactosidasa cuando se mide por la prueba de Miller en ausencia de fijación como objetivo y para los cuatro objetivos diferentes.Figure 73A-C shows repression guided by bgaA expression RNA by dRNA :: cas9 **. to. The Cas9 protein binds to the RNAcrcr and the CRISPR RNA precursor which is treated by RNAseIII to form the cRNA. The ARNcr directs the binding of Cas9 to the bgaA activator and represses the transcription. b. The objectives used to direct Cas9 ** to the bgaA activator are represented. The putative codon -35, -10 as well as the starting codon bgaA are in bold. C. The activity of betagalactosidase when measured by the Miller test in the absence of fixation as an objective and for the four different objectives.
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
La Figura 74A-E muestra caracterización de represión mediada por Cas9**. a. El gen gfpmut2 y su activador, incluyendo las señales -35 y -10 se representan junto con la posición de los diferentes sitios objetivo usados en el estudio. b. Fluorescencia relativa en la fijación como objetivo de la cadena codificadora. c. Fluorescencia relativa en la fijación como objetivo de la cadena no codificadora. d. Método de Northern con sondas B477 y B478 sobre ARN extraído de T5, T10, B10 o una cepa de control sin un objetivo. e. Efecto de un número creciente de mutaciones en el extremo 5' del ARNcr de B1, T5 y B10.Figure 74A-E shows characterization of repression mediated by Cas9 **. to. The gfpmut2 gene and its activator, including the -35 and -10 signals are represented along with the position of the different target sites used in the study. b. Relative fluorescence in the fixation as objective of the coding chain. C. Relative fluorescence in the fixation as an objective of the non-coding chain. d. Northern method with probes B477 and B478 on RNA extracted from T5, T10, B10 or a control strain without a target. and. Effect of an increasing number of mutations at the 5 'end of the bRNA of B1, T5 and B10.
Las figuras en la presente memoria son sólo para fines ilustrativos y no están necesariamente dibujadas a escala.The figures herein are for illustrative purposes only and are not necessarily drawn to scale.
Descripción detallada de la invenciónDetailed description of the invention
Los términos "polinucleótido", "nucleótido", "secuencia de nucleótidos", "ácido nucleico" y "oligonucleótido" se usan de forma intercambiable. Se refieren a una forma polimérica de nucleótidos de cualquier longitud, desoxirribonucleótidos o ribonucleótidos o análogos de los mismos. Los polinucleótidos pueden tener cualquier estructura tridimensional y pueden realizar cualquier función, conocida o desconocida. Los siguientes no son ejemplos limitantes de los polinucleótidos: regiones codificadoras o no codificadoras de un gen o fragmento de gen, sitios (sitio) definidos a partir de análisis de unión, exones, intrones, ARN mensajero (ARNm), ARN de transferencia, ARN ribosómico, ARN de interferencia corta (ARNic), ARN de horquilla corta (ARNhc), micro-ARN (ARNmi), ribozimas y ADNc, polinucleótidos recombinantes, polinucleótidos ramificados, plásmidos, vectores, ADN aislado de cualquier secuencia, ARN aislado de cualquier secuencia, sondas de ácidos nucleicos y cebadores. Un polinucleótido puede comprender uno o más nucleótidos modificados, tales como nucleótidos metilados y análogos de nucleótidos. Si hay, se pueden impartir modificaciones a la estructura del nucleótido antes o después del ensamblado del polímero. La secuencia de nucleótidos puede ser interrumpida por componentes no nucleótidos. Un polinucleótido puede ser modificado además después de polimerización, tal como por conjugación con un componente etiquetado.The terms "polynucleotide", "nucleotide", "nucleotide sequence", "nucleic acid" and "oligonucleotide" are used interchangeably. They refer to a polymeric form of nucleotides of any length, deoxyribonucleotides or ribonucleotides or analogs thereof. The polynucleotides can have any three-dimensional structure and can perform any function, known or unknown. The following are not limiting examples of polynucleotides: coding or non-coding regions of a gene or gene fragment, sites (site) defined from binding analysis, exons, introns, messenger RNA (mRNA), transfer RNA, RNA ribosomal, short interference RNA (siRNA), short hairpin RNA (hRNA), micro-RNA (mRNA), ribozymes and cDNA, recombinant polynucleotides, branched polynucleotides, plasmids, vectors, DNA isolated from any sequence, RNA isolated from any sequence , nucleic acid probes and primers. A polynucleotide may comprise one or more modified nucleotides, such as methylated nucleotides and nucleotide analogs. If there are, modifications can be made to the nucleotide structure before or after polymer assembly. The nucleotide sequence can be interrupted by non-nucleotide components. A polynucleotide can be further modified after polymerization, such as by conjugation with a labeled component.
En aspectos de la invención, los términos "ARN quimérico", "ARN guía quimérico", "ARN guía", "ARN guía único" y "ARN guía sintético" se usan de forma intercambiable y se refieren a la secuencia de polinucleótidos que comprende la secuencia guía, la secuencia tracr y la secuencia de emparejamiento tracr. El término "secuencia guía" se refiere a la secuencia de aproximadamente 20 pb dentro del ARN guía que especifica el sitio objetivo y se puede usar de manera intercambiable con los términos "guía" o "espaciador". El término "secuencia de emparejamiento tracr" también se puede usar de forma intercambiable con el término "repetición o repeticiones directas".In aspects of the invention, the terms "chimeric RNA", "chimeric guide RNA", "guide RNA", "single guide RNA" and "synthetic guide RNA" are used interchangeably and refer to the polynucleotide sequence comprising the guide sequence, the tracr sequence and the tracr pairing sequence. The term "guide sequence" refers to the sequence of approximately 20 bp within the guide RNA that specifies the target site and can be used interchangeably with the terms "guide" or "spacer." The term "tracr pairing sequence" can also be used interchangeably with the term "repetition or direct repetitions".
Como se usa en la presente memoria el término "natural" es un término de la técnica entendido por los expertos y significa la forma típica de un organismo, cepa, gen o característica como se encuentra en la naturaleza como se distingue de formas mutantes o variantes.As used herein the term "natural" is a term of the art understood by experts and means the typical form of an organism, strain, gene or characteristic as found in nature as distinguished from mutant or variant forms. .
Como se usa en la presente memoria, el término "variante" se debería considerar que significa la exhibición de cualidades que presentan un patrón que se desvía de lo que ocurre en la naturaleza.As used herein, the term "variant" should be considered to mean the display of qualities that exhibit a pattern that deviates from what occurs in nature.
Los términos "que no se encuentra en la naturaleza" o "logrado" se usan de forma intercambiable e indican la implicación de la mano del hombre. Los términos, cuando se refieren a moléculas de ácido nucleico o polipéptidos significan que la molécula de ácido nucleico o el polipéptido está al menos sustancialmente exento de al menos otro componente con el que se asocian de manera natural en la naturaleza y como se encuentran en la naturaleza.The terms "not found in nature" or "achieved" are used interchangeably and indicate the involvement of the hand of man. The terms, when referring to nucleic acid molecules or polypeptides mean that the nucleic acid molecule or polypeptide is at least substantially free of at least one other component with which they are naturally associated in nature and as found in the nature.
"Complementariedad" se refiere a la capacidad de un ácido nucleico para formar el enlace o enlaces de hidrógeno con otra secuencia de ácidos nucleicos por emparejamiento de bases de Watson-Crick tradicional u otros tipos no tradicionales. Un porcentaje de complementariedad indica el porcentaje de restos en una molécula de ácido nucleico que puede formar enlaces de hidrógeno (por ej., emparejamiento de bases de Watson-Crick) con una segunda secuencia de ácidos nucleicos (por ej., 5, 6, 7, 8, 9, 10 de un total de 10 siendo complementariedad del 50%, 60%, 70%, 80%, 90% y 100%). "Perfectamente complementario" significa que todos los restos contiguos de una secuencia de ácidos nucleicos formarán enlace de hidrógeno con el mismo número de restos contiguos en una segunda secuencia de ácidos nucleicos. "Sustancialmente complementario" como se usa en la presente memoria se refiere a un grado de complementariedad que es al menos 60%, 65%, 70%, 75%, 80%, 85%, 90%%, 95%, 97%, 98%, 99% o 100% por una región de 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 o más nucleótidos o se refiere a dos ácidos nucleicos que se hibridan en condiciones rigurosas."Complementarity" refers to the ability of a nucleic acid to form the hydrogen bond or bonds with another nucleic acid sequence by traditional Watson-Crick base pairing or other non-traditional types. A percentage of complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds (e.g., Watson-Crick base pairing) with a second nucleic acid sequence (e.g., 5, 6, 7, 8, 9, 10 of a total of 10 being a complementarity of 50%, 60%, 70%, 80%, 90% and 100%). "Perfectly complementary" means that all contiguous residues of a nucleic acid sequence will form hydrogen bond with the same number of contiguous residues in a second nucleic acid sequence. "Substantially complementary" as used herein refers to a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90 %%, 95%, 97%, 98%, 99% or 100% for a region of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 or more nucleotides or refers to two nucleic acids that hybridize under stringent conditions.
Como se usa en la presente memoria, "condiciones rigurosas" para hibridación se refiere a las condiciones en las cuales un ácido nucleico que tiene complementariedad a una secuencia objetivo se hibrida predominantemente con la secuencia objetivo y sustancialmente no se hibrida a las secuencias no objetivo. Las condiciones rigurosas son en general dependientes de la secuencia y varían dependiendo de una serie de factores. En general, cuanto más larga la secuencia, mayor la temperatura a la que se hibrida de manera específica la secuencia a su secuencia objetivo. Se describen con detalle ejemplos no limitantes de condiciones rigurosas en Tijssen (1.993), Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Segundo Capítulo "Overview ofAs used herein, "stringent conditions" for hybridization refers to the conditions in which a nucleic acid that has complementarity to an objective sequence predominantly hybridizes with the objective sequence and substantially does not hybridize to the non-objective sequences. Rigorous conditions are generally sequence dependent and vary depending on a number of factors. In general, the longer the sequence, the higher the temperature at which the sequence specifically hybridizes to its target sequence. Non-limiting examples of stringent conditions are described in detail in Tijssen (1993), Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization With Nucleic Acid Probes Part I, Second Chapter "Overview of
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
Varios aspectos de la invención se refieren a sistemas vector que comprenden uno o más vectores o vectores como tales. Se pueden diseñar vectores para expresión de transcritos CRISPR (por ejemplo, transcritos de ácidos nucleicos, proteínas o enzimas) en células procariotas o eucariotas. Por ejemplo, se pueden expresar transcritos de CRISPR en células bacterianas tales como Escherichia coli, células de insecto (usando vectores de expresión de baculovirus), células de levaduras o células de mamíferos. Las células huésped adecuadas se discuten además en Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego; Calif. (1.990). Alternativamente, el vector de expresión recombinante se puede transcribir y traducir in vitro, por ejemplo, usando secuencias reguladoras de activador T7 y polimerasa T7.Several aspects of the invention relate to vector systems comprising one or more vectors or vectors as such. Vectors can be designed for expression of CRISPR transcripts (eg, nucleic acid, protein or enzyme transcripts) in prokaryotic or eukaryotic cells. For example, CRISPR transcripts can be expressed in bacterial cells such as Escherichia coli, insect cells (using baculovirus expression vectors), yeast cells or mammalian cells. Suitable host cells are further discussed in Goeddel, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego; Calif. (1,990). Alternatively, the recombinant expression vector can be transcribed and translated in vitro, for example, using T7 activator and T7 polymerase regulatory sequences.
Se pueden introducir vectores y propagar en una procariota. En algunas realizaciones, se usa una procariota para multiplicar copias de un vector que se tiene que introducir en una célula eucariota o como un vector intermedio en la producción de un vector que se tiene que introducir en una célula eucariota (por ej., multiplicando un plásmido como parte de un sistema de empaquetamiento de vector vírico). En algunas realizaciones, se usa una procariota para multiplicar copias de un vector y expresar uno o más ácidos nucleicos, tal como para proporcionar una fuente de unaVectors can be introduced and propagated in a prokaryotic. In some embodiments, a prokaryotic is used to multiply copies of a vector that has to be introduced into a eukaryotic cell or as an intermediate vector in the production of a vector that has to be introduced into a eukaryotic cell (e.g., by multiplying a plasmid as part of a viral vector packaging system). In some embodiments, a prokaryotic is used to multiply copies of a vector and express one or more nucleic acids, such as to provide a source of a
Ejemplos de vectores de expresión de E. coli no de fusión, inducibles, adecuados, incluyen pTrc (Amrann et al.,Examples of suitable inducible, inducible, E. coli expression vectors include pTrc (Amrann et al.,
(1.988) Gene 69: 301-315) y pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1.990) 60-89).(1988) Gene 69: 301-315) and pET 11d (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89).
En algunas realizaciones, un vector es un vector de expresión de levadura. Ejemplos de vectores para expresión en levadura Saccharomyces cerivisae incluyen pYepSec1 (Baldari, et al., 1.987. EMBO J. 6: 229-234), pMFa (Kuijan y Herskowitz, 1.982. Cell 30: 933-943), pJRY88 (Schultz et al., 1.987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.) y picZ (InVitrogen Corp, San Diego, Calif.).In some embodiments, a vector is a yeast expression vector. Examples of vectors for expression in yeast Saccharomyces cerivisae include pYepSec1 (Baldari, et al., 1987. EMBO J. 6: 229-234), pMFa (Kuijan and Herskowitz, 1982. Cell 30: 933-943), pJRY88 (Schultz et al., 1987. Gene 54: 113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.) and picZ (InVitrogen Corp, San Diego, Calif.).
En algunas realizaciones, un vector conduce la expresión de proteínas en células de insecto usando vectores de expresión de baculovirus. Los vectores baculovirus disponibles para expresión de proteínas en células de insecto cultivadas (por ej., células SF9) incluyen la serie pAc (Smith, et al., 1.983. Mol. Cell. Biol. 3: 2.156-2.165) y la serie pVL (Lucklow y Summers, 1.989. Virology 170: 31-39).In some embodiments, a vector conducts protein expression in insect cells using baculovirus expression vectors. Baculovirus vectors available for protein expression in cultured insect cells (e.g., SF9 cells) include the pAc series (Smith, et al., 1983. Mol. Cell. Biol. 3: 2,156-2,165) and the pVL series (Lucklow and Summers, 1989. Virology 170: 31-39).
En algunas realizaciones, un vector es capaz de conducir la expresión de una o más secuencias en células de mamífero usando un vector de expresión de mamífero. Ejemplos de vectores de expresión de mamífero incluyen pCDM8 (Seed, 1.987. Nature 329: 840) y pMT2PC (Kaufman, et al., 1.987. EMBO J. 6: 187-195). Cuando se usa en células de mamífero, las funciones de control del vector de expresión se proporcionan típicamente por uno o más elementos reguladores. Por ejemplo, los activadores usados comúnmente proceden de polioma, adenovirus 2, citomegalovirus, virus 40 de simio y otros descritos en la presente memoria y conocidos en la técnica. Para otros sistemas de expresión adecuados para células tanto procariotas como eucariotas véanse, por ejemplo, los Capítulos 16 y 17 de Sambrook, et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2ª ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1.989.In some embodiments, a vector is capable of conducting the expression of one or more sequences in mammalian cells using a mammalian expression vector. Examples of mammalian expression vectors include pCDM8 (Seed, 1987, Nature 329: 840) and pMT2PC (Kaufman, et al., 1987. EMBO J. 6: 187-195). When used in mammalian cells, control functions of the expression vector are typically provided by one or more regulatory elements. For example, commonly used activators come from polyoma, adenovirus 2, cytomegalovirus, simian virus 40 and others described herein and known in the art. For other expression systems suitable for both prokaryotic and eukaryotic cells see, for example, Chapters 16 and 17 of Sambrook, et al., MOLECULAR CLONING: A MANUAL LABORATORY. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N. Y., 1989.
En algunas realizaciones, el vector de expresión de mamíferos recombinante es capaz de dirigir la expresión del ácido nucleico preferentemente en un tipo de célula particular (por ejemplo, se usan elementos reguladores específicos del tejido para expresar el ácido nucleico). Los elementos reguladores específicos del tejido son conocidos en la técnica. Ejemplos no limitantes de activadores específicos del tejido adecuados incluyen el activador de albúmina (específico del hígado; Pinkert, et al., 1.987. Genes Dev. 1: 268-277), activadores específicos linfoides (Calame y Eaton, 1.988. Adv. Immunol. 43: 235-275), en particular activadores de receptores de células T (Winoto y Baltimore, 1.989. EMBO J. 8: 729-733) e inmunoglobulinas (Baneiji, et al., 1.983. Cell 33: 729-740; Queen y Baltimore, 1.983. Cell 33: 741-748), activadores específicos de las neuronas (por ej., el activador de neurofilamentos; Byrne y Ruddle, 1.989. Proc. Natl. Acad Sci. USA 86: 5.473-5.477), activadores específicos del páncreas (Edlund, et al., 1.985. Science 230: 912-916) y activadores específicos de las glándulas mamarias (por ej., activador de suero de leche; Patente de EE.UU. Nº 4. 873. 316 y Publicación de la Solicitud de Patente Europea NºIn some embodiments, the recombinant mammalian expression vector is capable of directing the expression of the nucleic acid preferably in a particular cell type (for example, tissue-specific regulatory elements are used to express the nucleic acid). Fabric specific regulatory elements are known in the art. Non-limiting examples of suitable tissue-specific activators include the albumin activator (liver-specific; Pinkert, et al., 1987. Genes Dev. 1: 268-277), specific lymphoid activators (Calame and Eaton, 1988. Adv. Immunol 43: 235-275), in particular T cell receptor activators (Winoto and Baltimore, 1989, EMBO J. 8: 729-733) and immunoglobulins (Baneiji, et al., 1983. Cell 33: 729-740; Queen and Baltimore, 1983, Cell 33: 741-748), neuron-specific activators (e.g., neurofilament activator; Byrne and Ruddle, 1989. Proc. Natl. Acad Sci. USA 86: 5,473-5,477), specific activators of the pancreas (Edlund, et al., 1985. Science 230: 912-916) and specific activators of the mammary glands (eg, whey activator; US Patent No. 4,873,192 and Publication of European Patent Application No.
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
6060
264.166). También se incluyen activadores regulados por el desarrollo, por ej., los activadores de hox de murina (Kessel y Gruss, 1.990. Science 249: 374-379) y el activador de α-fetoproteína (Campes y Tilghman, 1.989. Genes Dev. 3: 537-546).264,166). Also included are developmentally regulated activators, eg, murine hox activators (Kessel and Gruss, 1990. Science 249: 374-379) and the α-fetoprotein activator (Campes and Tilghman, 1989. Genes Dev. 3: 537-546).
En algunas realizaciones, un elemento regulador se une de manera operable a uno o más elementos de un sistema CRISPR a fin de conducir la expresión de uno o más elementos del sistema CRISPR. En general, las CRISPR (Repeticiones Palindrómicas Cortas Agrupadas y Regularmente Interespaciadas, por sus siglas en inglés), también conocidas como las SPIDR (Repeticiones Directas Intercaladas Separadas, por sus siglas en inglés), constituyen una familia de sitios de ADN que son normalmente específicos para una especie bacteriana particular. El sitio de CRISPR comprende una clase distinta de repeticiones de secuencias cortas intercaladas (las SSR, por sus siglas en inglés) que se reconocieron en E. coli (Ishino et al., J. Bacteriol., 169: 5.429-5.433 [1.987] y Nakata et al., J. Bacteriol., 171: 3.553-3.556 [1.989]) y genes asociados. Las SSR intercaladas similares han sido identificadas en Haloferax mediterranei, Streptococcus pyogenes, Anabaena y Mycobacterium tuberculosis (Véase, Groenen et al., Mol. Microbiol., 10: 1.057-1.065 [1.993]; Hoe et al., Emerg. Infect. Dis., 5: 254-263 [1.999]; Masepohl et al., Biochim. Biophys. Acta 1.307: 26-30 [1.996] y Mojica et al., Mol. Microbiol., 17: 85-93 [1.995]). El sitio de CRISPR difiere típicamente de las otras SSR por la estructura de las repeticiones, que se han denominado repeticiones espaciadas regularmente cortas (las SRSR, por sus siglas en inglés) (Janssen et al. OMICS J. Integ. Biol., 6: 23-33 [2.002] y Mojica et al., Mol. Microbiol., 36: 244-246 [2.000]). En general, las repeticiones son elementos cortos que tienen lugar en agrupaciones que están regularmente espaciadas por secuencias de intervención únicas con una longitud sustancialmente constante (Mojica et al., [2.000], supra). Aunque las secuencias de repeticiones se conservan mucho entre cepas, el número de repeticiones intercaladas y las secuencias de las regiones espaciadoras difieren típicamente de cepa a cepa (van Embden et al., J. Bacteriol., 182: 2.393-2.401 [2.000]). Se ha identificado el sitio de CRISPR en más de 40 procariotas (Véase por ej., Jansen et al., Mol. Microbiol., 43: 1.565-1.575 [2.002] y Mojica et al., [2.005]) incluyendo, pero no limitado a Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus. Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylococcus, Clostridium, Thermoanaerobacter, Mycoplasma, Fusobacterium, Azarcus, Chromobacterium, Neisseria, Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella. Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pastaurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema y Thermotoga.In some embodiments, a regulatory element is operably linked to one or more elements of a CRISPR system in order to drive the expression of one or more elements of the CRISPR system. In general, CRISPR (Short Palindromic Repeats Grouped and Regularly Interspaced, for its acronym in English), also known as the SPIDR (Separate Direct Interleaved Repeats, for its acronym in English), constitute a family of DNA sites that are normally specific for a particular bacterial species. The CRISPR site comprises a distinct class of intercalated short sequence repeats (the SSRs) that were recognized in E. coli (Ishino et al., J. Bacteriol., 169: 5.429-5.433 [1987] and Nakata et al., J. Bacteriol., 171: 3,553-3,556 [1,989]) and associated genes. Similar interleaved SSRs have been identified in Haloferax mediterranei, Streptococcus pyogenes, Anabaena and Mycobacterium tuberculosis (See, Groenen et al., Mol. Microbiol., 10: 1,057-1,065 [1,993]; Hoe et al., Emerg. Infect. Dis ., 5: 254-263 [1999]; Masepohl et al., Biochim. Biophys. Acta 1,307: 26-30 [1,996] and Mojica et al., Mol. Microbiol., 17: 85-93 [1,995]). The CRISPR site typically differs from the other SSRs by the structure of the repetitions, which have been called regularly short spaced repetitions (the SRSRs) (Janssen et al. OMICS J. Integ. Biol., 6: 23-33 [2,002] and Mojica et al., Mol. Microbiol., 36: 244-246 [2,000]). In general, repetitions are short elements that occur in clusters that are regularly spaced by unique intervention sequences with a substantially constant length (Mojica et al., [2,000], supra). Although the repetition sequences are highly conserved among strains, the number of interleaved repetitions and the sequences of the spacer regions typically differ from strain to strain (van Embden et al., J. Bacteriol., 182: 2,393-2,401 [2,000]) . The CRISPR site has been identified in more than 40 prokaryotes (See, e.g., Jansen et al., Mol. Microbiol., 43: 1,565-1,575 [2,002] and Mojica et al., [2,005]) including, but not limited to Aeropyrum, Pyrobaculum, Sulfolobus, Archaeoglobus. Halocarcula, Methanobacterium, Methanococcus, Methanosarcina, Methanopyrus, Pyrococcus, Picrophilus, Thermoplasma, Corynebacterium, Mycobacterium, Streptomyces, Aquifex, Porphyromonas, Chlorobium, Thermus, Bacillus, Listeria, Staphylobacterium, Staphylobacterium, Staphylobacterium, Staphylobacterium Nitrosomonas, Desulfovibrio, Geobacter, Myxococcus, Campylobacter, Wolinella. Acinetobacter, Erwinia, Escherichia, Legionella, Methylococcus, Pastaurella, Photobacterium, Salmonella, Xanthomonas, Yersinia, Treponema and Thermotoga.
En general, "sistema CRISPR" se refiere colectivamente a transcritos y otros elementos implicados en la expresión de o dirigidos a la actividad de genes asociados a CRISPR ("Cas"), incluyendo secuencias que codifican un gen Cas, una secuencia tracr (CRISPR trans-activante) (por ej., ARNtracr o un ARNtracr parcial activo), una secuencia de emparejamiento tracr (incluyendo una "repetición directa" y una repetición directa parcial tratada por ARNtracr en el contexto de un sistema CRISPR endógeno), una secuencia guía (también referida como un "espaciador" en el contexto de un sistema CRISPR endógeno) u otras secuencias y transcritos de un sitio CRISPR. En algunas realizaciones, uno o más elementos de un sistema CRISPR proceden de un sistema CRISPR tipo I, tipo II o tipo III. En algunas realizaciones, uno o más elementos de un sistema CRISPR proceden de un organismo particular que comprende un sistema CRISPR endógeno, tal como Streptococcus pyogenes. En general, un sistema CRISPR se caracteriza por elementos que activan la formación de un complejo CRISPR en el sitio de una secuencia objetivo (también referido como un protoespaciador en el contexto de un sistema CRISPR endógeno). En el contexto de formación de un complejo CRISPR, "secuencia objetivo" se refiere a una secuencia para la que se diseña una secuencia guía que presente complementariedad, donde la hibridación entre una secuencia objetivo y una secuencia guía active la formación de un complejo CRISPR. No se requiere necesariamente complementariedad completa, siempre que haya suficiente complementariedad para producir hibridación y activar la formación de un complejo CRISPR. Una secuencia objetivo puede comprender cualquier polinucleótido, tal como polinucleótidos de ADN o ARN. En algunas realizaciones, se sitúa una secuencia objetivo en el núcleo o citoplasma de una célula. En algunas realizaciones, la secuencia objetivo puede estar dentro de un organelo de una célula eucariota, por ejemplo, mitocondria o cloroplasto. Una secuencia o plantilla que se puede usar para recombinación en el sitio fijado como objetivo que comprende las secuencias objetivo se refiere como una “plantilla de edición” o “polinucleótido de edición” o “secuencia de edición”. En aspectos de la invención, un polinucleótido de plantilla exógeno se puede referir como una plantilla de edición. En un aspecto de la invención la recombinación es recombinación homóloga.In general, "CRISPR system" collectively refers to transcripts and other elements involved in the expression of or directed to the activity of genes associated with CRISPR ("Cas"), including sequences encoding a Cas gene, a tracr sequence (CRISPR trans -activating) (eg, ARNtracr or an active partial ARNtracr), a tracr pairing sequence (including a "direct repeat" and a partial direct repeat treated by RNAtracr in the context of an endogenous CRISPR system), a guiding sequence ( also referred to as a "spacer" in the context of an endogenous CRISPR system) or other sequences and transcripts of a CRISPR site. In some embodiments, one or more elements of a CRISPR system come from a CRISPR type I, type II or type III system. In some embodiments, one or more elements of a CRISPR system come from a particular organism comprising an endogenous CRISPR system, such as Streptococcus pyogenes. In general, a CRISPR system is characterized by elements that activate the formation of a CRISPR complex at the site of an objective sequence (also referred to as a proto-spacer in the context of an endogenous CRISPR system). In the context of the formation of a CRISPR complex, "objective sequence" refers to a sequence for which a guide sequence is designed that exhibits complementarity, where hybridization between an objective sequence and a guide sequence activates the formation of a CRISPR complex. Complete complementarity is not necessarily required, provided there is sufficient complementarity to produce hybridization and activate the formation of a CRISPR complex. An objective sequence may comprise any polynucleotide, such as DNA or RNA polynucleotides. In some embodiments, an objective sequence is located in the nucleus or cytoplasm of a cell. In some embodiments, the target sequence may be within an organelle of a eukaryotic cell, for example, mitochondria or chloroplast. A sequence or template that can be used for recombination at the target site comprising the target sequences is referred to as an "editing template" or "editing polynucleotide" or "editing sequence." In aspects of the invention, an exogenous template polynucleotide can be referred to as an editing template. In one aspect of the invention recombination is homologous recombination.
Típicamente, en el contexto de un sistema CRISPR endógeno, la formación de un complejo CRISPR (que comprende una secuencia guía hibridada a una secuencia objetivo y complejada con una o más proteínas Cas) da como resultado la escisión de una o más cadenas en o cerca de (por ej., dentro de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50Typically, in the context of an endogenous CRISPR system, the formation of a CRISPR complex (comprising a guide sequence hybridized to an objective sequence and complexed with one or more Cas proteins) results in the cleavage of one or more chains at or near of (e.g., within 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 50
o más pares de bases de) la secuencia objetivo. Sin desear estar limitados por la teoría, la secuencia tracr, que puede comprender o constar de toda o una porción de una secuencia tracr natural (por ej., aproximadamente o más de aproximadamente 20, 26, 32, 45, 48, 54, 63, 67, 85 o más nucleótidos de una secuencia tracr natural), también puede formar parte de un complejo CRISPR, tal como por hibridación a lo largo de al menos una porción de la secuencia tracr a toda o una porción de una secuencia de emparejamiento tracr que esté ligada de manera operable a la secuencia guía. En algunas realizaciones, la secuencia tracr presenta suficiente complementariedad a una secuencia de emparejamiento tracr para hibridar y participar en la formación de un complejo CRISPR. Como con laor more base pairs of) the target sequence. Without wishing to be limited by theory, the tracr sequence, which may comprise or consist of all or a portion of a natural tracr sequence (e.g., about or more than about 20, 26, 32, 45, 48, 54, 63 , 67, 85 or more nucleotides of a natural tracr sequence), may also be part of a CRISPR complex, such as by hybridization along at least a portion of the tracr sequence to all or a portion of a tracr pairing sequence that is operably linked to the guide sequence. In some embodiments, the tracr sequence has sufficient complementarity to a tracr pairing sequence to hybridize and participate in the formation of a CRISPR complex. As with the
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
6060
mutagénico. Una única nickasa (Cas9-D10A con un único ARNsg) es incapaz de inducir NHEJ y crear inserciones o supresiones (las indel) pero los Solicitantes han demostrado que la nickasa doble (Cas9-D10A y dos ARNsg fijados como objetivo a diferentes cadenas en la misma posición) lo puede hacer en células madre embrionarias humanas (las hESC, por sus siglas en inglés). La eficacia es aproximadamente 50% de nucleasa (es decir, Cas9 regular sin mutación D10) en las hESC.mutagenic A single nickasa (Cas9-D10A with a single ARNsg) is unable to induce NHEJ and create insertions or deletions (the indel) but Applicants have demonstrated that the double nickasa (Cas9-D10A and two ARNsg target different chains in the same position) you can do it in human embryonic stem cells (the hESC). The efficacy is approximately 50% nuclease (ie, regular Cas9 without D10 mutation) in hESC.
Como un ejemplo más, dos o más dominios catalíticos de Cas9 (RuvC I, RuvC II y RuvC III) pueden mutar para producir un Cas9 mutado que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, una mutación de D10A se combina con una o más de las mutaciones H840A, N854A o N863A para producir una enzima Cas9 que carece sustancialmente de toda actividad de escisión de ADN. En algunas realizaciones, se considera que una enzima CRISPR carece sustancialmente de toda actividad de escisión de ADN cuando la actividad de escisión de ADN de la enzima mutada es menor que aproximadamente 25%, 10%, 5%, 1%, 0,1%, 0,01% o menor con respecto a su forma no mutada. Pueden ser útiles otras mutaciones; en el caso de que la Cas9 u otra enzima CRISPR sea de una especie distinta de S. pyogenes, se pueden realizar mutaciones en los correspondientes aminoácidos para conseguir efectos similares.As a further example, two or more catalytic domains of Cas9 (RuvC I, RuvC II and RuvC III) may mutate to produce a mutated Cas9 that substantially lacks all DNA cleavage activity. In some embodiments, a D10A mutation is combined with one or more of the H840A, N854A or N863A mutations to produce a Cas9 enzyme that substantially lacks all DNA cleavage activity. In some embodiments, a CRISPR enzyme is considered to be substantially devoid of all DNA cleavage activity when the DNA cleavage activity of the mutated enzyme is less than about 25%, 10%, 5%, 1%, 0.1% , 0.01% or less with respect to its non-mutated form. Other mutations may be useful; in the event that Cas9 or another CRISPR enzyme is from a species other than S. pyogenes, mutations can be made in the corresponding amino acids to achieve similar effects.
En algunas realizaciones, una secuencia codificadora de enzimas que codifica una enzima CRISPR es codón optimizada para expresión en células particulares, tales como células eucariotas. Las células eucariotas pueden ser aquéllas de, o procedentes de, un organismo particular, tal como un mamífero, incluyendo, pero no limitado a, ser humano, ratón, rata, conejo, perro o primate no ser humano. En general, optimización de codón se refiere a un procedimiento para modificar una secuencia de ácidos nucleicos para mejorar la expresión en las células huésped de interés reemplazando al menos un codón (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más codones) de la secuencia natural con codones que se usan más frecuentemente o lo más frecuentemente en los genes de esa célula huésped al tiempo que se mantiene la secuencia de aminoácidos natural. Diversas especies presentan sesgo particular para ciertos codones de un aminoácido particular. El sesgo de codones (diferencias en el uso de codones entre organismos) con frecuencia se correlaciona con la eficacia de traducción de ARN mensajero (ARNm), que se cree a su vez que depende de, entre otras cosas, las propiedades de los codones que se están traduciendo y la disponibilidad de moléculas de ARN de transferencia (ARNt) particulares. La predominancia de los ARNt seleccionados en una célula es en general un reflejo de los codones usados lo más frecuentemente en síntesis de péptidos. De acuerdo con esto, se pueden adaptar los genes para expresión óptima de los genes en un organismo determinado basándose en optimización de codones. Las tablas de utilización de codones están fácilmente disponibles, por ejemplo, en la “Base de Datos de Uso de Codones” y estas tablas se pueden adaptar de una serie de maneras. Véase Nakamura Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2.000). También están disponibles algoritmos de ordenador para codones optimizando una secuencia particular para expresión en una célula huésped particular, también están disponibles tales como Gene Forge (Aptagen; Jacobus, PA). En algunas realizaciones, unoIn some embodiments, an enzyme coding sequence encoding a CRISPR enzyme is codon optimized for expression in particular cells, such as eukaryotic cells. Eukaryotic cells may be those of, or from, a particular organism, such as a mammal, including, but not limited to, human, mouse, rat, rabbit, dog or primate not to be human. In general, codon optimization refers to a method for modifying a nucleic acid sequence to improve expression in host cells of interest by replacing at least one codon (e.g., about or more than about 1, 2, 3, 4 , 5, 10, 15, 20, 25, 50 or more codons) of the natural sequence with codons that are used most frequently or most frequently in the genes of that host cell while maintaining the natural amino acid sequence. Various species have particular bias for certain codons of a particular amino acid. Codon bias (differences in the use of codons between organisms) is often correlated with the translation efficiency of messenger RNA (mRNA), which in turn is believed to depend on, among other things, the properties of codons that are being translated and the availability of particular transfer RNA molecules (tRNAs). The predominance of selected tRNAs in a cell is in general a reflection of the codons most frequently used in peptide synthesis. Accordingly, genes can be adapted for optimal expression of genes in a given organism based on codon optimization. Codon usage tables are readily available, for example, in the "Codon Use Database" and these tables can be adapted in a number of ways. See Nakamura Y., et al. "Codon usage tabulated from the international DNA sequence databases: status for the year 2000" Nucl. Acids Res. 28: 292 (2,000). Computer algorithms for codons are also available optimizing a particular sequence for expression in a particular host cell, also available as Gene Forge (Aptagen; Jacobus, PA). In some embodiments, one
o más codones (por ej., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 o más o todos los codones) en una secuencia codificando una enzima CRISPR corresponden al codón usado lo más frecuentemente para un aminoácido particular.or more codons (e.g., 1, 2, 3, 4, 5, 10, 15, 20, 25, 50 or more or all codons) in a sequence encoding a CRISPR enzyme correspond to the codon most frequently used for a particular amino acid
En algunas realizaciones, un vector codifica una enzima CRISPR que comprende una o más secuencias de localización nuclear (las NLS, por sus siglas en inglés), tales como aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS. En algunas realizaciones, la enzima CRISPR comprende aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del amino terminal, aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más NLS en o cerca del carboxi terminal o una combinación de éstos (por ejemplo, una o más NLS en el amino terminal y una o más NLS en el carboxi terminal). Cuando está presente más de una NLS, cada una se puede seleccionar independientemente de las otras, de manera que puede estar presente una sola NLS en más de una copia y/o junto con otra u otras NLS más presentes en una o más copias. En una realización preferida de la descripción, la enzima CRISPR comprende a lo sumo 6 NLS. En algunas realizaciones, se considera una NLS cerca del N-o C-terminal cuando el aminoácido más cercano de la NLS está dentro de aproximadamente 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 o más aminoácidos a lo largo de la cadena polipeptídica del N o C-terminal. Típicamente, una NLS consta de una o más secuencias cortas de lisinas o argininas cargadas positivamente expuestas en la superficie de la proteína, pero se conocen otros tipos de NLS. Ejemplos no limitantes de las NLS incluyen una secuencia de NLS procedente de: la NLS del antígeno T grande del virus SV40, que tiene la secuencia de aminoácidos PKKKRKV; la NLS de nucleoplasmina (por ej., la NLS bipartita de nucleoplasmina con la secuencia KRPAATKKAGQAKKKK); la NLS de c-myc que tiene la secuencia de aminoácidos PAAKRVKLD o RQRRNELKRSP; la NLS M9 del hRNPA1 que tiene la secuencia NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; la secuencia RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV del dominio IBB de importina-alfa; las secuencias VSRKRPRP y PPKKARED de la proteína T de mioma; la secuencia POPKKKPL de p53 humano; la secuencia SALIKKKKKMAP de c-abl IV de ratón; las secuencias DRLRR y PKQKKRK del virus de la influenza NS1; la secuencia RKLKKKIKKL del antígeno delta del virus de la Hepatitis; la secuencia REKKKFLKRR de la proteína Mx1 del ratón; la secuencia KRKGDEVDGVDEVAKKKSKK de la poli(ADP-ribosa) polimerasa humana y la secuencia RKCLQAGMNLEARKTKK del glucocorticoide de receptores de hormonas esteroideas (humano).In some embodiments, a vector encodes a CRISPR enzyme that comprises one or more nuclear localization sequences (the NLS), such as about or more than about 1, 2, 3, 4, 5, 6, 7 , 8, 9, 10 or more NLS. In some embodiments, the CRISPR enzyme comprises about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the amino terminal, about or more than about 1.2. , 3, 4, 5, 6, 7, 8, 9, 10 or more NLS at or near the carboxy terminal or a combination of these (for example, one or more NLS in the amino terminal and one or more NLS in the carboxy terminal). When more than one NLS is present, each can be selected independently of the others, so that a single NLS can be present in more than one copy and / or together with another or other NLS more present in one or more copies. In a preferred embodiment of the description, the CRISPR enzyme comprises at most 6 NLS. In some embodiments, an NLS near the Non-C-terminal is considered when the closest amino acid in the NLS is within about 1, 2, 3, 4, 5, 10, 15, 20, 25, 30, 40, 50 or more amino acids along the N or C-terminal polypeptide chain. Typically, an NLS consists of one or more short sequences of positively charged lysines or arginines exposed on the surface of the protein, but other types of NLS are known. Non-limiting examples of the NLS include a sequence of NLS from: the NLS of the large T antigen of the SV40 virus, which has the amino acid sequence PKKKRKV; the nucleoplasmin NLS (eg, the bipartite nucleoplasmin NLS with the sequence KRPAATKKAGQAKKKK); c-myc NLS having the amino acid sequence PAAKRVKLD or RQRRNELKRSP; the NLS M9 of hRNPA1 having the sequence NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY; the RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV sequence of the import-alpha IBB domain; the VSRKRPRP and PPKKARED sequences of the myoma T protein; the POPKKKPL sequence of human p53; the SALIKKKKKMAP sequence of mouse c-abl IV; the DRLRR and PKQKKRK sequences of the NS1 influenza virus; the RKLKKKIKKL sequence of the Hepatitis virus delta antigen; the REKKKFLKRR sequence of the mouse Mx1 protein; the KRKGDEVDGVDEVAKKKSKK sequence of the human poly (ADP-ribose) polymerase and the RKCLQAGMNLEARKTKK sequence of the glucocorticoid steroid hormone receptor (human).
55
1010
15fifteen
20twenty
2525
3030
3535
4040
En algunas realizaciones, se selecciona una secuencia guía para reducir el grado de estructura secundaria dentro de la secuencia guía. La estructura secundaria se puede determinar por cualquier algoritmo de plegamiento de polinucleótidos adecuado. Algunos programas se basan en calcular la energía libre mínima de Gibbs. Un ejemplo de uno de tales algoritmos es mFold, como se describe por Zuker y Stiegler (Nucleic Acids Res. 9 (1.981), 133-148). Otro algoritmo de plegamiento de ejemplo es el RNAfold webserver online, desarrollado en el Instituto para Química Teórica de la Universidad de Viena, usando el algoritmo de predicción de estructura centroide (véase por ej., A. R. Gruber et al., 2.008, Cell 106 (1): 23-24 y PA Carr y GM Church, 2.009, Nature Biotechnology 27 (12): 1.151-62).In some embodiments, a guide sequence is selected to reduce the degree of secondary structure within the guide sequence. The secondary structure can be determined by any suitable polynucleotide folding algorithm. Some programs are based on calculating the minimum free energy of Gibbs. An example of one such algorithm is mFold, as described by Zuker and Stiegler (Nucleic Acids Res. 9 (1981), 133-148). Another example folding algorithm is the RNAfold webserver online, developed at the Institute for Theoretical Chemistry of the University of Vienna, using the prediction algorithm of centroid structure (see e.g., AR Gruber et al., 2008, Cell 106 ( 1): 23-24 and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1151-62).
En general, una secuencia de emparejamiento tracr incluye cualquier secuencia que presente suficiente complementariedad con una secuencia tracr para activar uno o más de: (1) escisión de una secuencia guía flanqueada por secuencias de emparejamiento tracr en una célula que contiene la correspondiente secuencia tracr yIn general, a tracr pairing sequence includes any sequence that has sufficient complementarity with a tracr sequence to activate one or more of: (1) cleavage of a guide sequence flanked by tracr pairing sequences in a cell containing the corresponding tracr sequence and
(2) formación de un complejo CRISPR en una secuencia objetivo, en la que el complejo CRISPR comprende la secuencia de emparejamiento tracr hibridada a la secuencia tracr. En general, el grado de complementariedad es con referencia al alineamiento óptimo de la secuencia de emparejamiento tracr y la secuencia tracr, junto con la longitud del acortador de las dos secuencias. El alineamiento óptimo se puede determinar por cualquier algoritmo de alineamiento adecuado y puede justificar además estructuras secundarias, tal como autocomplementareidad dentro de cualquiera, la secuencia tracr o la secuencia de emparejamiento tracr. En algunas realizaciones, el grado de complementariedad entre la secuencia tracr y la secuencia de emparejamiento tracr junto con la longitud del acortador de las dos cuando se alinean de manera óptima es aproximadamente o más de aproximadamente 25%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95%, 97,5%, 99% o mayor. Las ilustraciones de ejemplo de alineación óptima entre una secuencia tracr y una secuencia de emparejamiento tracr se proporcionan en las Figuras 12B y 13B. En algunas realizaciones, la secuencia tracr es aproximadamente o más de aproximadamente 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40, 50 o más nucleótidos de longitud. En algunas realizaciones, la secuencia tracr y secuencia de emparejamiento tracr están contenidas dentro de un transcripto único, de manera que la hibridación entre las dos produce un transcripto con una estructura secundaria, tal como una horquilla. Las secuencias formadoras de bucle preferidas para uso en estructuras de horquilla tienen cuatro nucleótidos de longitud y lo más preferiblemente tienen la secuencia GAAA. Sin embargo, se pueden usar secuencias de bucle más largas o más cortas, como se pueden usar secuencias alternativas. Las secuencias incluyen preferiblemente un triplete nucleótido (por ejemplo, AAA) y un nucleótido adicional (por ejemplo, C o G). Ejemplos de secuencias formadoras de bucle incluyen CAAA y AAAG. En una realización de la descripción, el transcripto o secuencia de polinucleótidos transcrita presenta al menos dos o más horquillas. En realizaciones preferidas, el transcripto presenta dos, tres, cuatro o cinco horquillas. En una realización más de la descripción, el transcripto presenta a lo sumo cinco horquillas. En algunas realizaciones, el transcripto único incluye además una secuencia de terminación de la transcripción; preferiblemente esta es una secuencia poliT, por ejemplo, seis nucleótidos T. Una ilustración de ejemplo de dicha estructura de horquilla se proporciona en la porción inferior de la Figura 13B, donde la porción de la secuencia 5' del "N" final y aguas arriba del bucle corresponde a la secuencia de emparejamiento tracr y la porción de la secuencia 3' del bucle corresponde a la secuencia tracr. Ejemplos no limitantes adicionales de polinucleótidos únicos que comprenden una secuencia guía, una secuencia de emparejamiento tracr y una secuencia tracr son como sigue (enumerados 5' a 3'), donde "N" representa una base de una secuencia guía, el primer bloque de letras de la caja inferior representan la secuencia de emparejamiento tracr y el segundo bloque de letras de la caja inferior representa la secuencia tracr y la secuencia poli-T final representa el terminador de la transcripción: (1)(2) formation of a CRISPR complex in an objective sequence, in which the CRISPR complex comprises the tracr pairing sequence hybridized to the tracr sequence. In general, the degree of complementarity is with reference to the optimal alignment of the tracr pairing sequence and the tracr sequence, together with the shortening length of the two sequences. The optimal alignment can be determined by any suitable alignment algorithm and can also justify secondary structures, such as autocomplementarity within either the tracr sequence or the tracr pairing sequence. In some embodiments, the degree of complementarity between the tracr sequence and the tracr pairing sequence together with the length of the shortening of the two when aligned optimally is approximately or more than about 25%, 30%, 40%, 50% , 60%, 70%, 80%, 90%, 95%, 97.5%, 99% or greater. Example illustrations of optimal alignment between a tracr sequence and a tracr pairing sequence are provided in Figures 12B and 13B. In some embodiments, the tracr sequence is about or more than about 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 40 , 50 or more nucleotides in length. In some embodiments, the tracr sequence and tracr pairing sequence are contained within a single transcript, so that hybridization between the two produces a transcript with a secondary structure, such as a hairpin. Preferred loop-forming sequences for use in hairpin structures are four nucleotides in length and most preferably have the GAAA sequence. However, longer or shorter loop sequences can be used, as alternative sequences can be used. The sequences preferably include a nucleotide triplet (for example, AAA) and an additional nucleotide (for example, C or G). Examples of loop-forming sequences include CAAA and AAAG. In one embodiment of the description, the transcript or transcript polynucleotide sequence has at least two or more hairpins. In preferred embodiments, the transcript has two, three, four or five hairpins. In one more embodiment of the description, the transcript presents at most five forks. In some embodiments, the single transcript also includes a transcription termination sequence; preferably this is a polyT sequence, for example, six T nucleotides. An example illustration of said hairpin structure is provided in the lower portion of Figure 13B, where the portion of the 5 'sequence of the final and upstream "N" of the loop corresponds to the tracr pairing sequence and the portion of the 3 'sequence of the loop corresponds to the tracr sequence. Additional non-limiting examples of single polynucleotides comprising a guide sequence, a tracr pairing sequence and a tracr sequence are as follows (listed 5 'to 3'), where "N" represents a base of a guide sequence, the first block of Lower box letters represent the tracr pairing sequence and the second block of letters in the lower box represents the tracr sequence and the final poly-T sequence represents the transcription terminator: (1)
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
En algunas realizaciones, las secuencias (1) a (3) se usan junto con Cas9 de CRISPR1 de S. thermophilus. En algunas realizaciones, las secuencias (4) a (6) se usan junto con Cas9 de S. pyogenes. En algunas realizaciones, la secuencia tracr es un transcrito separado de un transcrito que comprende la secuencia de emparejamiento tracr (tal como se ilustra en la porción superior de la Figura 13B).In some embodiments, sequences (1) to (3) are used in conjunction with Cas9 of CRISPR1 from S. thermophilus. In some embodiments, sequences (4) to (6) are used together with Cas9 of S. pyogenes. In some embodiments, the tracr sequence is a separate transcript of a transcript comprising the tracr pairing sequence (as illustrated in the upper portion of Figure 13B).
En algunas realizaciones, también se proporciona una plantilla de recombinación. Una plantilla de recombinación puede ser un componente de otro vector como se describe en la presente memoria, contenido en un vector separado o proporcionado como un polinucleótido separado. En algunas realizaciones, se diseña una plantilla de recombinación para servir como una plantilla en recombinación homóloga, tal como dentro de o cerca de una secuencia objetivo nickeada o escindida por una enzima CRISPR como parte de un complejo CRISPR. Un polinucleótido de plantilla puede ser de cualquier longitud adecuada, tal como aproximadamente o más aproximadamente 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1.000 o más nucleótidos de longitud. En algunas realizaciones, el polinucleótido de plantilla es complementario a una porción de un polinucleótido que comprende la secuencia objetivo. Cuando se alinea de manera óptima, un polinucleótido de plantilla puede solaparse con uno o más nucleótidos de una secuencia objetivo (por ej., aproximadamente o más de aproximadamente 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 o más nucleótidos). En algunas realizaciones, cuando una secuencia de plantilla y un polinucleótido que comprende una secuencia de plantilla se alinean de manera óptima, el nucleótido más cercano del polinucleótido de plantilla está dentro de aproximadamente 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1.000, 5.000, 10.000 o más nucleótidos de la secuencia objetivo.In some embodiments, a recombination template is also provided. A recombination template can be a component of another vector as described herein, contained in a separate vector or provided as a separate polynucleotide. In some embodiments, a recombination template is designed to serve as a homologous recombination template, such as within or near a target sequence nickeated or cleaved by a CRISPR enzyme as part of a CRISPR complex. A template polynucleotide can be of any suitable length, such as about or more or about 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1,000 or more nucleotides in length. In some embodiments, the template polynucleotide is complementary to a portion of a polynucleotide comprising the target sequence. When optimally aligned, a template polynucleotide can overlap with one or more nucleotides of a target sequence (e.g., about or more than about 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 60, 70, 80, 90, 100 or more nucleotides). In some embodiments, when a template sequence and a polynucleotide comprising a template sequence are optimally aligned, the closest nucleotide of the template polynucleotide is within about 1, 5, 10, 15, 20, 25, 50, 75, 100, 200, 300, 400, 500, 1,000, 5,000, 10,000 or more nucleotides of the target sequence.
En algunas realizaciones, la enzima CRISPR es parte de una proteína de fusión que comprende uno o más dominios de proteína heteróloga (por ej., aproximadamente o más de aproximadamente 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 o más dominios además de la enzima CRISPR). Una proteína de fusión de enzima CRISPR puede comprender cualquier secuencia de proteínas adicional y opcionalmente una secuencia ligadora entre dos dominios cualesquiera. Ejemplos de dominios de proteínas que se pueden condensar a una enzima CRISPR incluyen, sin limitación, etiquetas de epítopos, secuencias de genes informadores y dominios de proteínas con una o más de las siguientes actividades: actividad de metilasa, actividad de desmetilasa, actividad de activación de la transcripción, actividad de represión de la transcripción, actividad del factor de liberación de la transcripción, actividad de modificación de histona, actividad de escisión de ARN y actividad de unión de ácidos nucleicos. Ejemplos no limitantes de etiquetas de epítopos incluyen etiquetas de histidina (His), etiquetas V5, etiquetas FLAG, etiquetas de hemaglutinina de la influenza (HA), etiquetas Myc, etiquetas VSV-G y etiquetas de tioredoxina (Trx). Los ejemplos de genes informadores incluyen, pero no se limitan a, glutationa-S-transferasa (GST), peroxidasa de rábano (HRP, por sus siglas en inglés), cloramfenicol acetiltransferasa (CAT, por sus siglas en inglés) beta-galactosidasa, betaglucuronidasa, luciferasa, proteína fluorescente verde (PFV), HcRed, DsRed, proteína fluorescente cian (PFC) proteína fluorescente amarilla (PFAm) y proteínas autofluorescentes incluyendo proteína fluorescente azul (PFA). Una enzima CRISPR se puede condensar a una secuencia de genes que codifique una proteína o un fragmento de una proteína que una moléculas de ADN o una otras moléculas celulares, incluyendo pero no limitándose a (por sus siglas en inglés), proteína de unión de maltosa (MBP), etiqueta S, fusiones de dominios de unión de ADN Lex A (DBD), fusiones de dominios de unión de ADN GAL4 y fusiones de proteínas BP16 de virus del herpes simple (HSV). Los dominios adicionales que pueden formar parte de una proteína de fusión que comprende una enzima CRISPR se describen en la patente de EE.UU. 20110059502. En algunas realizaciones, se usa una enzima CRISPR etiquetada para identificar la posición de una secuencia objetivo.In some embodiments, the CRISPR enzyme is part of a fusion protein comprising one or more heterologous protein domains (e.g., about or more than about 1, 2, 3, 4, 5, 6, 7, 8, 9 , 10 or more domains in addition to the enzyme CRISPR). A CRISPR enzyme fusion protein may comprise any additional protein sequence and optionally a linker sequence between any two domains. Examples of protein domains that can be condensed to a CRISPR enzyme include, without limitation, epitope tags, reporter gene sequences and protein domains with one or more of the following activities: methylase activity, demethylase activity, activation activity of transcription, transcription repression activity, transcription release factor activity, histone modification activity, RNA cleavage activity and nucleic acid binding activity. Non-limiting examples of epitope tags include histidine tags (His), V5 tags, FLAG tags, influenza hemagglutinin tags (HA), Myc tags, VSV-G tags and thioredoxin tags (Trx). Examples of reporter genes include, but are not limited to, glutathione-S-transferase (GST), horseradish peroxidase (HRP), chloramphenicol acetyltransferase (CAT) beta-galactosidase, betaglucuronidase, luciferase, green fluorescent protein (PFV), HcRed, DsRed, cyan fluorescent protein (PFC) yellow fluorescent protein (PFAm) and autofluorescent proteins including blue fluorescent protein (PFA). A CRISPR enzyme can be condensed to a gene sequence that encodes a protein or a fragment of a protein that a DNA molecule or other cell molecules, including but not limited to (maltose binding protein) (MBP), S-tag, Lex A DNA binding domain fusions (DBD), GAL4 DNA binding domain fusions and BP16 protein fusions of herpes simplex virus (HSV). Additional domains that may be part of a fusion protein comprising a CRISPR enzyme are described in US Pat. 20110059502. In some embodiments, a labeled CRISPR enzyme is used to identify the position of an objective sequence.
En algunos aspectos, la descripción proporciona métodos que comprenden suministrar uno o más polinucleótidos, tales como o uno o más vectores como se describe en la presente memoria, uno o más transcritos de los mismos y/o una o proteínas transcritas de allí, a una célula huésped. En algunos aspectos, la descripción proporciona además células producidas por tales métodos y organismos (tales como animales, plantas u hongos) que comprenden o son producidos de tales células. En algunas realizaciones, se suministra una enzima CRISPR junto con (y opcionalmente complejada con) una secuencia guía a una célula. Se pueden usar métodos de transferencia de genes con base vírica y no vírica convencionales para introducir ácidos nucleicos en células de mamífero o tejidos objetivo. Se pueden usar dichos métodos para administrar componentes que codifican ácidos nucleicos de unIn some aspects, the description provides methods comprising delivering one or more polynucleotides, such as or one or more vectors as described herein, one or more transcripts thereof and / or one or proteins transcribed therein, to a host cell In some aspects, the description further provides cells produced by such methods and organisms (such as animals, plants or fungi) that comprise or are produced from such cells. In some embodiments, a CRISPR enzyme is supplied together with (and optionally complexed with) a guide sequence to a cell. Conventional viral and non-viral based gene transfer methods can be used to introduce nucleic acids into mammalian cells or target tissues. Such methods can be used to administer components encoding nucleic acids of a
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
5555
polinucleótido de manera que dicha unión dé como resultado expresión aumentada o disminuida de dicho polinucleótido; en el que el complejo CRISPR comprende una enzima CRISPR complejada con una secuencia guía hibridada a una secuencia fijada como objetivo dentro de dicho polinucleótido, en el que dicha secuencia guía está ligada a una secuencia de emparejamiento tracr que a su vez hibrida a una secuencia tracr.polynucleotide so that said binding results in increased or decreased expression of said polynucleotide; wherein the CRISPR complex comprises a CRISPR enzyme complexed with a guide sequence hybridized to a target target sequence within said polynucleotide, wherein said guide sequence is linked to a tracr pairing sequence that in turn hybridizes to a tracr sequence .
Con los recientes avances en la genómica de cultivos, la capacidad para usar sistemas CRISPR-Cas para realizar edición y manipulación de genes eficaz y de coste eficaz permitirá la rápida selección y la comparación de manipulaciones genéticas únicas y multiplexadas para transformar dichos genomas para producción mejorada y cebos mejorados. Con respecto a esto se hace referencia a las Patentes y publicaciones de EE.UU.: Patente de EE.UU. Nº 6.603.061 -Agrobacterium-Mediated Plant Transformation Method; la Patente de EE.UU. Nº 7.868.149 -Plant Genome Sequences and Uses Thereof y la Patente de EE.UU. 2009/0100536 -Transgenic Plants with Enhanced Agronomic Traits, Morrell et al "Crop genomics: advances and applications" Nat Inv Genet. 29 de diciembre de 2.011; 13 (2): 85-96. En una realización ventajosa de la invención, el sistema CRISPR/Cas9 se usa para lograr microalgas (Ejemplo 15). De acuerdo con esto, la referencia en la presente memoria a células de animales puede aplicarse también, mutatis mutandis, a células de plantas a menos que sea evidente de otro modo.With recent advances in crop genomics, the ability to use CRISPR-Cas systems to perform efficient and cost-effective gene editing and manipulation will allow rapid selection and comparison of unique and multiplexed genetic manipulations to transform such genomes for improved production. and improved baits. In this regard, reference is made to US Patents and Publications: US Pat. No. 6,603,061 -Agrobacterium-Mediated Plant Transformation Method; U.S. Patent No. 7,868,149 -Plant Genome Sequences and Uses Thereof and US Pat. 2009/0100536 -Transgenic Plants with Enhanced Agronomic Traits, Morrell et al "Crop genomics: advances and applications" Nat Inv Genet. December 29, 2011; 13 (2): 85-96. In an advantageous embodiment of the invention, the CRISPR / Cas9 system is used to achieve microalgae (Example 15). Accordingly, the reference herein to animal cells can also be applied, mutatis mutandis, to plant cells unless it is evident otherwise.
En un aspecto, la descripción proporciona métodos para modificar un polinucleótido objetivo en una célula eucariota, que puede ser in vivo, ex vivo o in vitro. En algunas realizaciones, el método comprende muestrear una célula o población de células de un animal humano o no humano o planta (incluyendo microalgas) y modificar la célula o células. Puede tener lugar cultivo en cualquier fase ex vivo. La célula o las células pueden ser introducidas de nuevo incluso en el animal no humano o planta (incluyendo microalgas).In one aspect, the description provides methods for modifying a target polynucleotide in a eukaryotic cell, which can be in vivo, ex vivo or in vitro. In some embodiments, the method comprises sampling a cell or population of cells from a human or non-human animal or plant (including microalgae) and modifying the cell or cells. Cultivation can take place in any ex vivo phase. The cell or cells can be reintroduced even into the non-human animal or plant (including microalgae).
En las plantas, los patógenos son con frecuencia específicos del huésped. Por ejemplo, Fusarium oxysporum f. sp. lycopersici produce marchitamiento del tomate pero ataca sólo al tomate y F. oxysporum f. dianthii Puccinia graminisIn plants, pathogens are often host specific. For example, Fusarium oxysporum f. sp. lycopersici produces tomato wilting but attacks only tomato and F. oxysporum f. Puccinia graminis dianthii
f. sp. tritici ataca sólo al trigo. Las plantas tienen defensas existentes e inducidas para resistir a la mayoría de los patógenos. Las mutaciones y los casos de recombinación a través de generaciones de plantas conducen a variabilidad genética que da lugar a susceptibilidad, especialmente ya que los patógenos se reproducen con más frecuencia que las plantas. En las plantas puede haber resistencia al no huésped, por ej., el huésped y el patógeno son incompatibles. También puede haber Resistencia Horizontal, por ej., resistencia parcial frente a todas las razas de un patógeno, controlado típicamente por muchos genes y Resistencia Vertical, por ej., resistencia completa a algunas razas de un patógeno pero no a otras razas, controlado típicamente por unos genes. En un nivel de Gen por Gen, las plantas y los patógenos evolucionan juntos y los cambios genéticos en uno equilibran los cambios en otro. De acuerdo con eso, usando Variabilidad Natural, los criadores combinan genes lo más útiles para Rendimiento, Calidad, Uniformidad, Dureza, Resistencia. Las fuentes de genes de resistencia incluyen Variedades naturales o extrañas, Variedades Heirloom, Mutaciones relativas a plantas silvestres e inducidas, por ej., tratando material vegetal con agentes mutagénicos. Usando la presente descripción, se les proporciona a los criadores de plantas una nueva herramienta para inducir mutaciones. De acuerdo con esto, un experto en la materia puede analizar el genoma de fuentes de genes de resistencia y en Variedades con características o rasgos deseados se emplea la presente descripción para inducir la elevación de genes de resistencia con más precisión que los agentes mutagénicos previos y por lo tanto se aceleran y mejoran los programas de cultivo de plantas.F. sp. Tritici attacks only wheat. Plants have existing and induced defenses to resist most pathogens. Mutations and recombination cases across generations of plants lead to genetic variability that results in susceptibility, especially since pathogens reproduce more frequently than plants. In plants there may be resistance to the non-host, eg, the host and the pathogen are incompatible. There may also be Horizontal Resistance, e.g., partial resistance against all races of a pathogen, typically controlled by many genes and Vertical Resistance, e.g., complete resistance to some races of a pathogen but not other races, typically controlled For some genes. At one level of Gen by Gen, plants and pathogens evolve together and genetic changes in one balance the changes in another. Accordingly, using Natural Variability, breeders combine genes most useful for Performance, Quality, Uniformity, Hardness, Resistance. Sources of resistance genes include natural or foreign varieties, Heirloom varieties, mutations related to wild and induced plants, eg, treating plant material with mutagenic agents. Using the present description, plant breeders are provided with a new tool for inducing mutations. Accordingly, a person skilled in the art can analyze the genome of resistance gene sources and in Varieties with desired characteristics or traits the present description is used to induce the elevation of resistance genes more accurately than the previous mutagenic agents and therefore, plant cultivation programs are accelerated and improved.
En un aspecto, la descripción proporciona estuches que contienen uno o más cualesquiera de los elementos descritos en los métodos y composiciones anteriores. En algunas realizaciones, el estuche comprende un sistema vector e instrucciones para usar el estuche. En algunas realizaciones, el sistema vector comprende (a) un primer elemento regulador unido de manera operable a una secuencia de emparejamiento tracr y uno o más sitios de inserción para insertar una secuencia guía aguas arriba de la secuencia de emparejamiento tracr, en el que cuando se expresa, la secuencia guía dirige la unión específica de la secuencia de un complejo CRISPR a una secuencia fijada como objetivo en una célula eucariota, en la que el complejo CRISPR comprende una enzima CRISPR complejada con (1) la secuencia guía que se hibrida a la secuencia objetivo y (2) la secuencia de emparejamiento tracr que se hibrida a la secuencia tracr y/o (b) un segundo elemento regulador unido de manera operable a una secuencia codificadora de enzima que codifica dicha enzima CRISPR que comprende una secuencia de localización nuclear. Los elementos se pueden proporcionar de manera individual o en combinaciones y se pueden proporcionar en cualquier envase adecuado, tal como un vial, un frasco o un tubo. En algunas realizaciones, el estuche incluye instrucciones en uno o más idiomas, por ejemplo, en más de un idioma.In one aspect, the description provides cases containing one or more of any of the elements described in the above methods and compositions. In some embodiments, the case comprises a vector system and instructions for using the case. In some embodiments, the vector system comprises (a) a first regulatory element operably linked to a tracr pairing sequence and one or more insertion sites for inserting a guide sequence upstream of the tracr pairing sequence, in which when expressed, the guide sequence directs the specific binding of the sequence of a CRISPR complex to a target-fixed sequence in a eukaryotic cell, in which the CRISPR complex comprises a CRISPR enzyme complexed with (1) the guide sequence that hybridizes to the target sequence and (2) the tracr pairing sequence that hybridizes to the tracr sequence and / or (b) a second regulatory element operably linked to an enzyme coding sequence encoding said CRISPR enzyme comprising a localization sequence nuclear. The elements can be provided individually or in combinations and can be provided in any suitable container, such as a vial, a bottle or a tube. In some embodiments, the kit includes instructions in one or more languages, for example, in more than one language.
En algunas realizaciones, un estuche comprende uno o más reactivos para uso en un procedimiento utilizando uno o más de los elementos descritos en la presente memoria. Los reactivos se pueden proporcionar en cualquier envase adecuado. Por ejemplo, un estuche puede proporcionar uno o más tampones de reacción o de almacenamiento. Los reactivos se pueden proporcionar en una forma que sea utilizable en un ensayo particular o en una forma que requiera la adición de otro u otros componentes más antes de uso (por ejemplo, en forma concentrada o liofilizada). Un tampón puede ser cualquier tampón, incluyendo, pero no limitándose a un tampón de carbonato de sodio, un tampón de bicarbonato de sodio, un tampón de borato, un tampón de Tris, un tampón de MOPS, un tampón de HEPES y combinaciones de los mismos. En algunas realizaciones, el tampón es alcalino. En algunas realizaciones, el tampón presenta un pH de aproximadamente 7 a aproximadamente 10. En algunas realizaciones, el estucheIn some embodiments, a kit comprises one or more reagents for use in a method using one or more of the elements described herein. Reagents can be provided in any suitable container. For example, a case may provide one or more reaction or storage buffers. The reagents can be provided in a form that is usable in a particular assay or in a form that requires the addition of another or other components before use (for example, in concentrated or lyophilized form). A buffer can be any buffer, including, but not limited to a sodium carbonate buffer, a sodium bicarbonate buffer, a borate buffer, a Tris buffer, a MOPS buffer, an HEPES buffer and combinations of the same. In some embodiments, the buffer is alkaline. In some embodiments, the buffer has a pH of about 7 to about 10. In some embodiments, the case
Tabla BTable B
Tabla CTable C
55
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
50fifty
de ejemplo para adaptar este sistema de nucleasa programable de ARN para dirigir la actividad del complejo CRISPR en el núcleo de las células eucariotas.example to adapt this RNA programmable nuclease system to direct the activity of the CRISPR complex in the nucleus of eukaryotic cells.
Cultivo celular y transinfección.Cell culture and transfection.
Se mantuvo la estirpe celular HEK 293FT (Life Technologies) de riñón embriónico humano (HEK, por sus siglas en inglés) en Medio Eagle modificado de Dulbecco (DMEM, por sus siglas en inglés) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación en CO2 al 5%. Se mantuvo la estirpe celular neuro2A (N2A) de ratón (ATCC) con DMEM enriquecido con suero fetal bovino al 5% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con CO2 al 5%.The HEK 293FT (Life Technologies) human embryonic kidney (HEK) cell line was maintained in Dulbecco's Modified Eagle Medium (DMEM) enriched with 10% fetal bovine serum (HyClone) , 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 µg / ml streptomycin at 37 ° C with 5% CO2 incubation. The mouse neuro2A (N2A) cell line (ATCC) was maintained with DMEM enriched with 5% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml penicillin and 100 µg / ml streptomycin a 37 ° C with 5% CO2.
Se sembraron células 293FT de HEK o N2A en placas de 24 pozos (Corning) un día previamente a transinfección a una densidad de 200.000 células por pozo. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 24 pozos, se usó un total de 800 ng de plásmido.293FT HEK or N2A cells were seeded in 24-well plates (Corning) one day prior to transfection at a density of 200,000 cells per well. Cells were transinfected using Lipofectamine 2000 (Life Technologies) following the protocol recommended by the manufacturer. For each well of a 24-well plate, a total of 800 ng of plasmid was used.
Ensayo surveyor y análisis de secuenciación para modificación de genomas.Surveyor test and sequencing analysis for genome modification.
Se transinfectaron células 293FT de HEK o N2A con ADN de plásmido como se describió anteriormente. Después de transinfección, se incubaron las células a 37°C durante 72 horas antes de extracción de ADN genómico. Se extrajo ADN genómico usando el estuche de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células en disolución QuickExtract y se incubaron a 65°C durante 15 minutos y 98°C durante 10 minutos. El ADN genómico extraído se trató inmediamente o se almacenó a 20ºC.293FT HEK or N2A cells were transinfected with plasmid DNA as described above. After transfection, the cells were incubated at 37 ° C for 72 hours before genomic DNA extraction. Genomic DNA was extracted using the QuickExtract (Epicenter) DNA extraction kit following the manufacturer's protocol. In summary, the cells were resuspended in QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes. The extracted genomic DNA was treated immediately or stored at 20 ° C.
La región genómica que rodea un sitio objetivo de CRISPR para cada gen se multiplicó por PCR y se purificaron los productos usando una columna de QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezcló un total de 400 ng los productos PCR purificados con 2 µl de tampón PCR Taq Polimerasa (Enzymatics) X 10 y agua ultrapura a un volumen final de 20 µl y se sometió a un procedimiento de rehibridación para permitir la formación de heterodúplex: 95°C durante 10 min, 95°C a 85°C descendiendo a -2°C/s, 85°C a 25°C a – 0,25°C/s y 25°C mantenidos durante 1 minuto. Después de rehibridación, se trataron los productos con nucleasa Surveyor y estimulador S Surveyor (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaron sobre geles de poliacrilamida Novex TBE al 4-20% (Life Technologies). Se tiñeron los geles con tinción de ADN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Gel Doc (Bio-rad). La cuantificación estuvo basada en intensidades de banda relativas, como una medición de la fracción de ADN escindido. La Figura 8 proporciona una ilustración esquemática de esta prueba Surveyor.The genomic region surrounding a CRISPR target site for each gene was multiplied by PCR and the products were purified using a QiaQuick Spin column (Qiagen) following the manufacturer's protocol. A total of 400 ng of the purified PCR products was mixed with 2 µl of Taq Polymerase (Enzymatics) X 10 PCR buffer and ultrapure water to a final volume of 20 µl and underwent a rehybridization procedure to allow heteroduplex formation: 95 ° C for 10 min, 95 ° C to 85 ° C falling to -2 ° C / s, 85 ° C to 25 ° C at - 0.25 ° C / s and 25 ° C maintained for 1 minute. After rehybridization, the products were treated with Surveyor nuclease and S Surveyor stimulator (Transgenomics) following the protocol recommended by the manufacturer and analyzed on 4-20% Novex TBE polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA staining (Life Technologies) for 30 minutes and images were formed with a Gel Doc (Bio-rad) gel imaging system. The quantification was based on relative band intensities, as a measurement of the fraction of cleaved DNA. Figure 8 provides a schematic illustration of this Surveyor test.
Prueba de polimorfismo de longitud de fragmento de restricción para detección de recombinación homóloga.Restriction fragment length polymorphism test for homologous recombination detection.
Se transinfectaron células 293FT de HEK y N2A con ADN de plásmido y se incubaron a 37ºC durante 72 horas antes de extracción de ADN genómico como se describió anteriormente. La región genómica objetivo se multiplicó por PCR usando cebadores fuera de las ramas de homología de la plantilla de recombinación homóloga (RH). Los productos PCR se separaron en un gel de agarosa al 1% y se extrajo con Estuche MinElute GelExtraction (Qiagen). Se digirieron los productos purificados con HindIII (Fermentas) y se analizaron en un gel de poliacrilamida Novex TBE al 6% (Life Technologies).HEK and N2A 293FT cells were transinfected with plasmid DNA and incubated at 37 ° C for 72 hours before genomic DNA extraction as described above. The target genomic region was multiplied by PCR using primers outside the homology branches of the homologous recombination template (RH). The PCR products were separated on a 1% agarose gel and extracted with MinElute GelExtraction Case (Qiagen). Products purified with HindIII (Fermentas) were digested and analyzed on a 6% Novex TBE polyacrylamide gel (Life Technologies).
Predicción y análisis de la estructura secundaria de ARN.Prediction and analysis of the secondary structure of RNA.
Se realizó la predicción de la estructura secundaria de ARN usando el webserver RNAfold online desarrollado en el Instituto para Química Teórica de la Universidad de Viena, usando el algoritmo de predicción de estructura centroide (véase por ej., A. R. Gruber et al., 2.008, Cell 106 (1): 23-24 y PA Carr y GM Church, 2.009, Nature Biotechnology 27 (12): 1.151-62).The secondary RNA structure prediction was performed using the online RNAfold webserver developed at the Institute for Theoretical Chemistry of the University of Vienna, using the centroid structure prediction algorithm (see, for example, AR Gruber et al., 2008, Cell 106 (1): 23-24 and PA Carr and GM Church, 2009, Nature Biotechnology 27 (12): 1,151-62).
Prueba de interferencia de transformación de plásmidos bacterianos.Interference test for transformation of bacterial plasmids.
Se reconstituyeron elementos del sitio 1 de CRISPR de S. pyogenes suficientes para actividad de CRISPR en E. coli usando plásmido de pCRISPR (ilustrado de manera esquemática en la Figura 10A). pCRISPR contenía ARNtracr, SpCas9, y una secuencia líder que conducía a la matriz de ARNcr. Se insertaron espaciadores (también referidos como “secuencias guía”) en la matriz de ARNcr entre los sitios BsaI usando oligonucleótidos hibridados, como se ilustra. Se construyeron plásmidos provocadores usados en la prueba de interferencia insertando la secuencia protoespaciadora (también referida como una “secuencia diana”) junto con una secuencia unidad de CRISPR adyacente (PAM) en pUC19 (véase la Figura 10B). El plásmido provocador contenía resistencia a la ampicilina. La figura 10C proporciona una representación esquemática de la prueba de interferencia. Las cepas E. coli químicamente competentes que ya soportaban pCRISPR y el espaciador apropiado se transformaron con el plásmido provocador que contenía la correspondiente secuencia protoespaciador-PAM. Se usó pUC19 para valorarElements of the S. pyogenes CRISPR site 1 were reconstituted sufficient for CRISPR activity in E. coli using pCRISPR plasmid (schematically illustrated in Figure 10A). pCRISPR contained ARNtracr, SpCas9, and a leader sequence that led to the matrix of ARNcr. Spacers (also referred to as "guide sequences") were inserted into the rRNA matrix between the BsaI sites using hybridized oligonucleotides, as illustrated. Provocative plasmids used in the interference test were constructed by inserting the proto-spacer sequence (also referred to as a "target sequence") together with an adjacent CRISPR unit sequence (PAM) in pUC19 (see Figure 10B). The provocative plasmid contained resistance to ampicillin. Figure 10C provides a schematic representation of the interference test. Chemically competent E. coli strains that already supported pCRISPR and the appropriate spacer were transformed with the provocative plasmid containing the corresponding proto-spacer-PAM sequence. PUC19 was used to assess
55
1010
15fifteen
20twenty
2525
3030
3535
4040
especifica, después de identificar todos los sitios potenciales, el programa filtra secuencias basadas en el número de veces que aparecen en el genoma de referencia relevante. Para esas enzimas CRISPR para las cuales se determina la especificidad de secuencia mediante una secuencia "simiente", tal como la 5’ de 11-12 pb de la secuencia PAM, incluyendo la propia secuencia PAM, la etapa de filtración puede estar basada en la secuencia simiente. Así, para evitar la edición en sitios genómicos adicionales, los resultados se filtran basándose en el número de apariciones de la secuencia simiente:PAM en el genoma relevante. Se puede permitir que el usuario elija la longitud de la secuencia simiente. También se puede permitir que el usuario especifique el número de apariciones de la secuencia simiente:PAM en un genoma para fines de pase del filtro. El defecto es investigar secuencias únicas. El nivel de filtración se modifica cambiando tanto la longitud de la secuencia simiente como el número de apariciones de la secuencia en el genoma. El programa puede proporcionar además o alternativamente la secuencia de una secuencia guía complementaria a la secuencia o secuencias objetivo indicadas proporcionando el complemento inverso de la secuencia o secuencias objetivo identificadas.Specifies, after identifying all potential sites, the program filters sequences based on the number of times they appear in the relevant reference genome. For those CRISPR enzymes for which sequence specificity is determined by a "seed" sequence, such as the 5 'of 11-12 bp of the PAM sequence, including the PAM sequence itself, the filtration step may be based on the seed sequence. Thus, to avoid editing in additional genomic sites, the results are filtered based on the number of occurrences of the seed sequence: PAM in the relevant genome. The user can be allowed to choose the length of the seed sequence. The user can also be allowed to specify the number of occurrences of the seed sequence: PAM in a genome for filter pass purposes. The defect is to investigate unique sequences. The level of filtration is modified by changing both the length of the seed sequence and the number of occurrences of the sequence in the genome. The program may additionally or alternatively provide the sequence of a complementary guide sequence to the indicated sequence or target sequences by providing the inverse complement of the identified sequence or target sequences.
Ejemplo 4: Evaluación de híbridos ARNcr-ARNtracr quiméricos múltiples.Example 4: Evaluation of multiple chimeric ARNcr-ARNtracr hybrids.
Este ejemplo describe los resultados obtenidos para los ARN quiméricos (los ARNqui; que comprenden una secuencia guía, una secuencia de emparejamiento tracr y una secuencia tracr en un transcrito único) que tienen secuencias tracr que incorporan diferentes longitudes de secuencia ARNtracr natural. La Figura 18a ilustra un esquema de un vector bicistrónico de expresión para ARN quimérico y Cas9. Cas9 es conducido por el activador CBh y el ARN quimérico es conducido por un activador U6. El ARN guía quimérico consta de una secuencia guía de 20 pb (Ns) unida a la secuencia tracr (barriendo desde la primera "U" de la cadena menor al extremo del transcrito), que se trunca en diversas posiciones como se indica. Las secuencias guía y tracr se separan mediante la secuencia de emparejamiento tracr GUUUUAGAGCUA seguido por la secuencia bucle GAAA. Los resultados de los ensayos SURVEYOR para inserciones o supresiones mediadas por Cas9 en los sitios EMX1 y PVALB humanos se ilustran en la Figura 18b y 18c, respectivamente. Las flechas indican los fragmentos SURVEYOR esperados. Los ARNqui se indican por su designación "+n" y ARNcr se refiere a un ARN híbrido donde las secuencias guía y tracr se expresan como transcritos separados. La cuantificación de estos resultados, realizados por triplicado, se ilustran por histograma en las Figuras 19a y 19b, que corresponden a las Figuras 18b y 18c, respectivamente ("N. D." indica no inserciones o supresiones detectadas). Los ID del protoespaciador y su correspondiente objetivo genómico, secuencia del protoespaciador, secuencia PAM y posición de la cadena se proporcionan en la Tabla D. Las secuencias guía se diseñaron para que fueran complementarias a la secuencia completa del protoespaciador en el caso de transcritos separados en el sistema híbrido o sólo a la porción subrayada en el caso de ARN quiméricos.This example describes the results obtained for the chimeric RNAs (the siRNAs, which comprise a guide sequence, a tracr pairing sequence and a tracr sequence in a single transcript) that have tracr sequences that incorporate different lengths of natural RNAcrcr sequence. Figure 18a illustrates a schematic of a bicistronic expression vector for chimeric RNA and Cas9. Cas9 is driven by the CBh activator and the chimeric RNA is driven by a U6 activator. The chimeric guide RNA consists of a 20 bp guide sequence (Ns) attached to the tracr sequence (sweeping from the first "U" of the minor chain to the end of the transcript), which is truncated at various positions as indicated. The guide and tracr sequences are separated by the GUUUUAGAGCUA tracr pairing sequence followed by the GAAA loop sequence. The results of SURVEYOR tests for insertions or deletions mediated by Cas9 at human EMX1 and PVALB sites are illustrated in Figure 18b and 18c, respectively. The arrows indicate the expected SURVEYOR fragments. The siRNAs are indicated by their designation "+ n" and cRNA refers to a hybrid RNA where the guide and tracr sequences are expressed as separate transcripts. The quantification of these results, performed in triplicate, are illustrated by histogram in Figures 19a and 19b, which correspond to Figures 18b and 18c, respectively ("N.D." indicates no insertions or deletions detected). The proto-spacer IDs and their corresponding genomic target, proto-spacer sequence, PAM sequence and chain position are provided in Table D. The guiding sequences were designed to be complementary to the complete proto-spacer sequence in the case of separate transcripts in the hybrid system or only the underlined portion in the case of chimeric RNA.
Tabla D:Table D:
Cultivo celular y transinfección.Cell culture and transfection.
Se mantuvo la estirpe celular 293FT (Life Technologies) de riñón embriónico humano (HEK) en Medio Eagle modificado de Dulbecco (DMEM) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación en CO2 al 5%. Se sembraron células 293FT en placas de 24 pozos (Coming) 24 horas previamente a transinfección a una densidad deThe human embryonic kidney (HEK) cell line 293FT (Life Technologies) was maintained in Dulbecco's Modified Eagle Medium (DMEM) enriched with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml of penicillin and 100 µg / ml of streptomycin at 37 ° C with incubation in 5% CO2. 293FT cells were seeded in 24-well plates (Coming) 24 hours prior to transfection at a density of
150.000 células por pozo. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 24 pozos, se usó un total de 500 ng de plásmido.150,000 cells per well. Cells were transinfected using Lipofectamine 2000 (Life Technologies) following the protocol recommended by the manufacturer. For each well of a 24-well plate, a total of 500 ng of plasmid was used.
Prueba SURVEYOR para modificación de genomas.SURVEYOR test for genome modification.
Se transinfectaron células 293FT con ADN de plásmido como se describió anteriormente. Se incubaron las células a 51293FT cells were transinfected with plasmid DNA as described above. Cells were incubated at 51
NLS-SpCas9-EGFP-NLS:NLS-SpCas9-EGFP-NLS:
U6-St_ARNtracr(7-97):U6-St_ARNtracr (7-97):
U6-RD-espaciador-RD (SF370 S. pyogenes)U6-RD-spacer-RD (SF370 S. pyogenes)
(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador)(N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)
ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador)(N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)
ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
10 (N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador)10 (N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)
ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; 15 negrita = terminador)(N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; 15 bold = terminator)
ARN quimérico de ejemplo para Cas9 de CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)Example chimeric RNA for Cas9 of CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador)(N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)
20 ARN quimérico de ejemplo para Cas9 CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)20 Example chimeric RNA for Cas9 CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
(N = secuencia guía; primer subrayado = secuencia de emparejamiento tracr; segundo subrayado = secuencia tracr; negrita = terminador)(N = guide sequence; first underline = tracr pairing sequence; second underline = tracr sequence; bold = terminator)
ARN quimérico de ejemplo para Cas9 CRISPR1 LMD-9 de S. thermophilus (con PAM de NNAGAAW)Example chimeric RNA for Cas9 CRISPR1 LMD-9 from S. thermophilus (with NNAGAAW PAM)
Interferencia parcial de los patrones NAGNN y NNGGNPartial interference of the NAGNN and NNGGN patterns
Los patrones NAGNN eran significativamente diferentes de los otros patrones pero soportan un efecto mucho menor que NGGNN (véase el ensayo de significancia verdadera de Tukey a continuación).The NAGNN patterns were significantly different from the other patterns but withstand a much smaller effect than NGGNN (see Tukey's true significance test below).
Finalmente, los patrones NTGGN y NCGGN son similares y muestran interferencia de CRISPR más significativamente que los patrones NTGHN y NCGHN (donde H es A,T o C), como se muestra por un ensayo de student de pares ajustados de bonferroni.Finally, the NTGGN and NCGGN patterns are similar and show CRISPR interference more significantly than the NTGHN and NCGHN patterns (where H is A, T or C), as shown by a student essay of bonferroni adjusted pairs.
Comparaciones de pares del efecto de b4 sobre secuencias NYGNN usando ensayos t con DE agrupada.Peer comparisons of the effect of b4 on NYGNN sequences using t-tests with pooled ED.
Tomados juntos, estos resultados permiten concluir que los patrones NNGGN producen en general una interferencia 10 completa en el caso de NGGGN, o una interferencia parcial en el caso de NAGGN, NTGGN o NCGGN.Taken together, these results allow us to conclude that NNGGN patterns generally produce complete interference in the case of NGGGN, or partial interference in the case of NAGGN, NTGGN or NCGGN.
Comparaciones múltiples de Tukey de medias: 95% de nivel de confianza a nivel familiar.Multiple Tukey comparisons of means: 95% confidence level at family level.
Objetivo aleatorizadoRandomized target
Para el experimento de objetivo aleatorizado se obtuvieron 540.726 lecturas para crR6 y 753.570 para R6. Como antes, se esperó que sólo la mitad de las lecturas secuenciara el extremo de interés del producto PCR. Después de 5 filtrar para las lecturas que soportan un objetivo que está exento de error o con una mutación puntual única, permanecieron 217.656 y 353.141 lecturas para crR6 y R6, respectivamente. Se computó la proporción relativa de cada mutante en la muestra crR6 sobre la muestra R6 (Figura 24c). Todas las mutaciones fuera de la secuencia simiente (13-20 bases lejos de la PAM) muestran interferencia completa. Esas secuencias se usaron con una referencia para determinar si se podía decir que otras mutaciones en el interior de la secuencia simiente alterabanFor the randomized objective experiment, 540,726 readings were obtained for crR6 and 753,570 for R6. As before, only half of the readings were expected to sequence the end of interest of the PCR product. After filtering for the readings that support an objective that is free of error or with a single point mutation, 217,656 and 353,141 readings for crR6 and R6 remained, respectively. The relative proportion of each mutant in the crR6 sample on the R6 sample was computed (Figure 24c). All mutations outside the seed sequence (13-20 bases away from PAM) show complete interference. Those sequences were used with a reference to determine if other mutations within the seed sequence could be said to alter
10 significativamente la interferencia. Se fijó una distribución normal para estas secuencias usando la función fitdistr del paquete MASS R. El cuantil 0,99 de la distribución fijada se muestra como una línea de puntos en la Figura 24c. La Figura 72 muestra un histograma de la densidad de datos con distribución normal fijada (línea negra) y el cuantil 0,99 (línea de puntos).10 significantly interference. A normal distribution for these sequences was set using the fitdistr function of the MASS R package. The quantile 0.99 of the fixed distribution is shown as a dotted line in Figure 24c. Figure 72 shows a histogram of the density of data with fixed normal distribution (black line) and the quantile 0.99 (dotted line).
Tabla F. Abundancia relativa de secuencias PAM en las muestras crR6/R6 promediadas sobre las bases 1 y 5.Table F. Relative abundance of PAM sequences in crR6 / R6 samples averaged on bases 1 and 5.
15fifteen
Ejemplo 6: Optimización del ARN guía para Cas9 de Streptococcus pyogenes (referido como SpCas9).Example 6: Optimization of the guide RNA for Cas9 of Streptococcus pyogenes (referred to as SpCas9).
Los solicitantes mutaron las secuencias ARNtracr y de repetición directa o mutaron el ARN guía quimérico para activar los ARN en las células.Applicants mutated the RNAtracr and direct repeat sequences or mutated the chimeric guide RNA to activate the RNAs in the cells.
La optimización se basa en la observación de que hay tramos de timinas (Ts) en el ARNtracr y ARN guía, que podían conducir a terminación de la transcripción temprana por el activador pol 3. Por lo tanto, los Solicitantes generaron las siguientes secuencias optimizadas. Se presentan en parejas ARNtracr optimizada y la repetición directa optimizada correspondiente.The optimization is based on the observation that there are stretches of thymine (Ts) in the RNAtracr and guide RNA, which could lead to early transcription termination by the pol 3 activator. Therefore, the Requesters generated the following optimized sequences. They are presented in optimized ARNtracr pairs and the corresponding optimized direct repeat.
ARNtracr optimizado 1 (mutación subrayada):Optimized ARNtracr 1 (underlined mutation):
Repetición directa optimizada 1 (mutación subrayada):Optimized direct repeat 1 (underlined mutation):
ARNtracr optimizado 2 (mutación subrayada):Optimized ARNtracr 2 (underlined mutation):
15 Repetición directa optimizada 2 (mutación subrayada):15 Optimized direct repeat 2 (underlined mutation):
Los solicitantes también optimizaron el ARN guía quimérico para actividad óptima en células eucariotas. ARN guía original :Applicants also optimized the chimeric guide RNA for optimal activity in eukaryotic cells. Original guide RNA:
20 Secuencia de ARN guía quimérico optimizado 1:20 Stream of optimized chimeric guide RNA 1:
Secuencia de ARN guía quimérico optimizado 2:Sequence of optimized chimeric guide RNA 2:
Secuencia de ARN guía quimérico optimizado 3: 5RNA sequence optimized chimeric guide 3: 5
1010
15fifteen
20twenty
2525
3030
3535
4040
45Four. Five
Los solicitantes mostraron que el ARN guía quimérico optimizado funciona mejor como se indica en la Figura 3. El experimento se realizó por cotransinfección de células 293FT con Cas9 y una casete de ADN ARN guía de U6 para expresar una de las cuatro formas de ARN mostradas anteriormente. El objetivo del ARN guía es el mismo sitio objetivo en el lugar Emx1 humano: "GTCACCTCCAATGACTAGGG".Applicants showed that the optimized chimeric guide RNA works best as indicated in Figure 3. The experiment was performed by co-transfection of 293FT cells with Cas9 and a U6 guide RNA DNA cassette to express one of the four forms of RNA shown above. . The objective of the guide RNA is the same target site in the human Emx1 site: "GTCACCTCCAATGACTAGGG".
Ejemplo 7: Optimización de Cas9 CRISPR1 LMD-9 de Streptococcus thermophilus (referido como StlCas9).Example 7: Optimization of Cas9 CRISPR1 LMD-9 of Streptococcus thermophilus (referred to as StlCas9).
Los solicitantes diseñaron los ARN quiméricos guía como se muestra en la Figura 4.Applicants designed the guide chimeric RNAs as shown in Figure 4.
Los ARN guía de StlCas9 pueden experimentar el mismo tipo de optimización que para los ARN guía de SpCas9, por rotura de los tramos de politiminas (Ts).The guide RNAs of StlCas9 may undergo the same type of optimization as for the guide RNAs of SpCas9, due to rupture of the polyimine (Ts) sections.
Ejemplo 8: Diversidad de Cas9 y mutaciones.Example 8: Diversity of Cas9 and mutations.
El sistema CRISPR-Cas es un mecanismo inmunitario adaptativo contra ADN exógeno invasor empleado por diversas especies a través de bacterias y arqueas. El sistema CRISPR-Cas9 de tipo II consiste en una serie de genes que codifica proteínas responsables de la “adquisición” de ADN extraño en el lugar CRISPR, así como una serie de genes que codifica la “ejecución” del mecanismo de escisión de ADN; estos incluyen la ADN nucleasa (Cas9), un ARN-cr de transactivación no codificante (ARNtracr) y una matriz de espaciadores procedentes de ADN extraño flanqueados por repeticiones directas (los ARNcr). En la maduración por Cas9, el dúplex de ARNtracr y ARNcr guía la nucleasa Cas9 para una secuencia de ADN fijada como objetivo especificada por las secuencias guía espaciadoras y media roturas de doble cadena en el ADN cerca de una unidad de secuencia corta en el ADN fijado como objetivo que se requiere para escisión y es específico para cada sistema CRISPR-Cas. Los sistemas CRISPR-Cas de tipo II se encuentran por todo el reino bacteriano y son muy diversos en secuencia y tamaño de la proteína Cas9, secuencia de repetición directa de ARNtracr y ARNcr, organización de genomas de estos elementos y el requerimiento de unidad para escisión fijada como objetivo. Una especie puede presentar múltiples sistemas CRISPR-Cas distintos.The CRISPR-Cas system is an adaptive immune mechanism against invasive exogenous DNA used by various species through bacteria and archaea. The CRISPR-Cas9 type II system consists of a series of genes that encode proteins responsible for the "acquisition" of foreign DNA at the CRISPR site, as well as a series of genes that encode the "execution" of the DNA cleavage mechanism; these include the DNA nuclease (Cas9), a non-coding transactivation RNA-cr (RNAcr) and an array of spacers from foreign DNA flanked by direct repeats (the rRNAs). In maturation by Cas9, the duplex of ARNtracr and cRNA guides the Cas9 nuclease for a target DNA sequence specified by the spacer guide sequences and half double strand breaks in the DNA near a short sequence unit in the fixed DNA. as an objective that is required for excision and is specific to each CRISPR-Cas system. Type II CRISPR-Cas systems are found throughout the bacterial kingdom and are very diverse in sequence and size of the Cas9 protein, direct repeat sequence of ARNtracr and RNAcr, genome organization of these elements and the requirement of unit for excision set as objective. A species can have multiple different CRISPR-Cas systems.
Los solicitantes evaluaron 207 Cas9s putativas de especies bacterianas identificadas basándose en homología de secuencias para conocer Cas9s y estructuras ortólogas para conocer subdominios, incluyendo el dominio de la endonucleasa HNH y los dominios de endonucleasa RuvC [información de the Eugene Koonin and Kira Makarova]. El análisis filogenético basado en la conservación de secuencias de proteínas de este conjunto reveló cinco familias de Cas9s, incluyendo tres grupos de Cas9s grandes (∼1.400 aminoácidos) y dos de Cas9s pequeños (∼1.100 aminoácidos) (Figuras 39 y 40A-F).Applicants evaluated 207 putative Cas9s of bacterial species identified based on sequence homology to know Cas9s and orthologous structures to know subdomains, including the HNH endonuclease domain and RuvC endonuclease domains [information from the Eugene Koonin and Kira Makarova]. Phylogenetic analysis based on the conservation of protein sequences of this set revealed five families of Cas9s, including three large Cas9s groups (.41,400 amino acids) and two small Cas9s (∼1,100 amino acids) (Figures 39 and 40A-F).
En este ejemplo, los solicitantes muestran que las siguientes mutaciones pueden convertir SpCas9 en una enzima de mellado: D10A, E762A, H840A, N854A, N863A, D986A.In this example, applicants show that the following mutations can convert SpCas9 into a nicking enzyme: D10A, E762A, H840A, N854A, N863A, D986A.
Los solicitantes proporcionan secuencias que muestran donde se sitúan los puntos de mutación dentro del gen SpCas9 (Figura 41). Los solicitantes muestran también que las nickasas aún pueden mediar la recombinación homóloga (Prueba indicada en la Figura 2). Además, los solicitantes muestran que SpCas9 con estas mutaciones (individualmente) no inducen doble rotura de cadena (Figura 47).Applicants provide sequences that show where the mutation points are located within the SpCas9 gene (Figure 41). Applicants also show that nickases can still mediate homologous recombination (Test indicated in Figure 2). In addition, applicants show that SpCas9 with these mutations (individually) does not induce double chain breakage (Figure 47).
Ejemplo 9: Suplemento para especificidad de fijación como objetivo de ADN de la nucleasa Cas9 guiada por ARN.Example 9: Supplement for binding specificity as a target of RNA-guided Cas9 nuclease DNA.
Cultivo celular y transinfección.Cell culture and transfection.
Se mantuvo la estirpe celular 293FT (Life Technologies) de riñón embriónico humano (HEK) en medio Eagle modificado de Dulbecco (DMEM) enriquecido con suero fetal bovino al 10% (HyClone), GlutaMAX 2 mM (Life Technologies), 100 U/ml de penicilina y 100 µg/ml de estreptomicina a 37°C con incubación con CO2 al 5%.The human embryonic kidney (HEK) cell line 293FT (Life Technologies) was maintained in Dulbecco's modified Eagle's medium (DMEM) enriched with 10% fetal bovine serum (HyClone), 2 mM GlutaMAX (Life Technologies), 100 U / ml of penicillin and 100 µg / ml of streptomycin at 37 ° C with incubation with 5% CO2.
Se sembraron células 293FT en placas de 6 pozos, placas de 24 pozos o placas de 96 pozos (Corning) 24 horas previas a transinfección. Se transinfectaron las células usando Lipofectamine 2000 (Life Technologies) a confluencia del 80-90% siguiendo el protocolo recomendado por el fabricante. Para cada pozo de una placa de 6 pozos, se usó un total de 1 ug de plásmido Cas9+ARNsg. Para cada pozo de una placa de 24 pozos, se usó un total de 500 ng de plásmido Cas9+ARNsg a menos que se indicara de otro modo. Para cada pozo de una placa de 96 pozos, se usaron 65 ng de plásmido Cas9 a una relación molar de 1:1 para el producto PCR de U6-ARNsg.293FT cells were seeded in 6-well plates, 24-well plates or 96-well plates (Corning) 24 hours prior to transfection. Cells were transinfected using Lipofectamine 2000 (Life Technologies) at 80-90% confluence following the protocol recommended by the manufacturer. For each well of a 6-well plate, a total of 1 ug of Cas9 + RNAs plasmid was used. For each well of a 24-well plate, a total of 500 ng of Cas9 + RNAs plasmid was used unless otherwise indicated. For each well of a 96-well plate, 65 ng of Cas9 plasmid was used at a 1: 1 molar ratio for the U6-RNAsg PCR product.
Se mantuvo estirpe de células madre embrionarias humanas HUES9 (núcleo del instituto de células madre de Harvard) en condiciones exentas de alimentador en GelTrex (Life Technologies) en medio mTesR (Stemcell Technologies) enriquecido con 100 ug/ml de Normocina (InvivoGen). Se transinfectaron células HUES9 con estuche Amaxa P3 Primary Cell 4-D Nucleofector (Lonza) siguiendo el protocolo del fabricante.Lineage of human embryonic stem cells HUES9 (core of the Harvard stem cell institute) was maintained under feeder-free conditions at GelTrex (Life Technologies) in mTesR medium (Stemcell Technologies) enriched with 100 ug / ml Normocin (InvivoGen). HUES9 cells were transinfected with Amaxa P3 Primary Cell 4-D Nucleofector (Lonza) case following the manufacturer's protocol.
Prueba de la nucleasa SURVEYOR para modificación de genomas.SURVEYOR nuclease test for genome modification.
Se transinfectaron células 293FT con ADN de plásmido como se describió anteriormente. Se incubaron las células a 37°C durante 72 horas postransinfección previamente a extracción de ADN genómico. Se extrajo ADN genómico usando la disolución de extracción de ADN QuickExtract (Epicentre) siguiendo el protocolo del fabricante. En resumen, se volvieron a suspender las células granuladas en disolución QuickExtract y se incubaron a 65°C durante 15 minutos y 98°C durante 10 minutos.293FT cells were transinfected with plasmid DNA as described above. Cells were incubated at 37 ° C for 72 hours post-infection prior to genomic DNA extraction. Genomic DNA was extracted using the QuickExtract DNA extraction solution (Epicenter) following the manufacturer's protocol. In summary, the granulated cells were resuspended in QuickExtract solution and incubated at 65 ° C for 15 minutes and 98 ° C for 10 minutes.
La región genómica flanqueando el sitio fijado como objetivo de CRISPR para cada gen se multiplicó por PCR (cebadores enumerados en las Tablas J y K) y se purificaron los productos usando Columna QiaQuick Spin (Qiagen) siguiendo el protocolo del fabricante. Se mezclaron 400 ng totales de los productos PCR purificados con 2 µl de tampón PCR de ADN polimerasa 10X Taq (Enzymatics) y agua ultrapura a un volumen final de 20 µl y se sometió a un procedimiento de hibridación de nuevo para permitir la formación de heterodúplex: 95°C durante 10 min, 95°C a 85°C variando a -2°C/s, 85°C a 25°C a -0,25°C/s y se mantuvieron 25°C durante 1 minuto. Después de hibridar de nuevo, los productos se trataron con nucleasa SURVEYOR y activador S SURVEYOR (Transgenomics) siguiendo el protocolo recomendado por el fabricante y se analizaron en geles de poliacrilamida Novex TBE al 4-20% (Life Technologies). Se tiñeron los geles con tinte de ADN SYBR Gold (Life Technologies) durante 30 minutos y se formaron imágenes con un sistema de formación de imágenes de gel Doc (Bio-rad). La cuantificación se basó en intensidades de banda relativas.The genomic region flanking the CRISPR target site for each gene was multiplied by PCR (primers listed in Tables J and K) and the products were purified using QiaQuick Spin Column (Qiagen) following the manufacturer's protocol. Total 400 ng of the purified PCR products were mixed with 2 µl of 10X Taq DNA polymerase PCR buffer (Enzymatics) and ultrapure water to a final volume of 20 µl and subjected to a hybridization procedure again to allow heteroduplex formation : 95 ° C for 10 min, 95 ° C to 85 ° C varying at -2 ° C / s, 85 ° C at 25 ° C at -0.25 ° C / s and 25 ° C were maintained for 1 minute. After hybridizing again, the products were treated with SURVEYOR nuclease and S SURVEYOR activator (Transgenomics) following the manufacturer's recommended protocol and analyzed in Novex TBE 4-20% polyacrylamide gels (Life Technologies). The gels were stained with SYBR Gold DNA dye (Life Technologies) for 30 minutes and images were formed with a Doc gel imaging system (Bio-rad). The quantification was based on relative band intensities.
Análisis de Northern de expresión de ARNtracr en células humanas.Northern analysis of RNAcrcr expression in human cells.
Se realizaron análisis Northern como se describió previamente 1. En resumen, se calentaron los ARN a 95°C durante 5 min antes de la carga en geles de poliacrilamida desnaturalizadantes al 8% (SequaGel, National Diagnostics). Después, se transfirió el ARN a una membrana Hybond N+ prehibridada (GE Healthcare) y se reticuló con reticulador de UV Stratagene (Stratagene). Se etiquetaron las sondas con [gamma-32P] ATP (Perkin Elmer) con T4 polinucleótido cinasa (New England Biolabs). Después de lavado, se expuso la membrana a pantalla de fósforo durante una hora y se escaneó con fosforimager (Typhoon).Northern analyzes were performed as previously described 1. In summary, the RNAs were heated at 95 ° C for 5 min before loading in 8% denatured polyacrylamide gels (SequaGel, National Diagnostics). Then, the RNA was transferred to a pre-hybridized Hybond N + membrane (GE Healthcare) and crosslinked with Stratagene UV crosslinker (Stratagene). The probes were labeled with [gamma-32P] ATP (Perkin Elmer) with T4 polynucleotide kinase (New England Biolabs). After washing, the membrane was exposed to phosphor screen for one hour and scanned with phosphorimager (Typhoon).
Secuenciación de bisulfito para valorar estado de metilación de ADN.Bisulfite sequencing to assess DNA methylation status.
Se transinfectaron células 293FT HEK con Cas9 como se describió anteriormente. Se aisló ADN genómico con el estuche DNeasy Blood & Tissue (Qiagen) y bisulfito convertido con estuche EZ DNA Methylation-Lightning (Zymo Research). Se llevó a cabo PCR con bisulfito usando ADN polimerasa KAPA2G Robust HotStart (KAPA Biosystems) con cebadores diseñados usando el buscador de cebadores de bisulfito (Zymo Research, Tablas J y K). Los amplicones PCR resultantes se purificaron en gel, se digirieron con EcoRI y HindIII y se ligaron en una cadena principal de pUC19 previamente a transformación. Los clones individuales fueron sometidos a secuenciación de Sanger para valorar el estado de metilacion de ADN.293FT HEK cells were transinfected with Cas9 as described above. Genomic DNA was isolated with the DNeasy Blood & Tissue (Qiagen) case and bisulfite converted with EZ DNA Methylation-Lightning (Zymo Research) case. Bisulfite PCR was performed using KAPA2G Robust HotStart DNA polymerase (KAPA Biosystems) with primers designed using the bisulfite primer finder (Zymo Research, Tables J and K). The resulting PCR amplicons were gel purified, digested with EcoRI and HindIII and ligated into a pUC19 backbone prior to transformation. The individual clones were subjected to Sanger sequencing to assess the state of DNA methylation.
Prueba de transcripción y escisión in vivo.In vivo transcription and excision test.
Se transinfectaron células 293FT HEK con Cas9 como se describió anteriormente. Se prepararon después lisados celulares completos con un tampón de lisis (HEPES 20 mM, KCl 100 mM, MgCl2 5 mM, DTT 1 mM, glicerol al 5%, Tritón X-100 al 0,1%) enriquecido con cóctel de inhibidores de proteasas (Roche). Se transcribió ARNsg conducido por T7 in vitro usando oligos modificados (Ejemplo 10) y estuche de transcripción in vitro de T7 HiScribe (NEB), siguiendo el protocolo recomendado por el fabricante. Para preparar sitios fijados como objetivo metilados, se metiló plásmido de pUC19 por M.SssI y después se linearizó por NheI. Se realizó la prueba de escisión in vitro como sigue: para una reacción de escisión de 20 ul, se incuban 10 ul de lisado celular con 2 ul de tampón de escisión (HEPES 100 mM, KCl 500 mM, MgCl2 25 mM, DTT 5 mM, glicerol al 25%), el ARN transcrito in vitro y 300 ng de ADN de plásmido de pUC19.293FT HEK cells were transinfected with Cas9 as described above. Complete cell lysates were then prepared with a lysis buffer (20 mM HEPES, 100 mM KCl, 5 mM MgCl2, 1 mM DTT, 5% glycerol, 0.1% Triton X-100) enriched with protease inhibitor cocktail (Roche). T7-driven RNAs was transcribed in vitro using modified oligos (Example 10) and T7 HiScribe in vitro transcription kit (NEB), following the manufacturer's recommended protocol. To prepare methylated target sites, pUC19 plasmid was methylated by M.SssI and then linearized by NheI. The in vitro excision test was performed as follows: for a 20 ul excision reaction, 10 ul of cell lysate is incubated with 2 ul excision buffer (100 mM HEPES, 500 mM KCl, 25 mM MgCl2, 5 mM DTT , 25% glycerol), RNA transcribed in vitro and 300 ng of plasmid DNA from pUC19.
Secuenciación profunda para valorar la especificidad de la fijación como objetivo.Deep sequencing to assess the specificity of the fixation as an objective.
Se transinfectaron células 293FT HEK en placas de 96 pozos con ADN de plásmido Cas9 y casete PCR de ARN de una sola guía (ARNsg) 72 horas previas a extracción de ADN genómico (Fig. 72). La región genómica que flanquea el sitio fijado como objetivo de CRISPR para cada gen se multiplicó (Fig. 74, Fig. 80, (Ejemplo 10) por un método PCR de fusión para unir los adaptadores Illumina P5 así como códigos de barras específicos de una muestra única para los amplicones fijados como objetivo (esquema descrito en la Fig. 73). Se purificaron los productos PCR usando placas de filtro del 96 pozos EconoSpin (Epoch Life Sciences) siguiendo el protocolo recomendado por el fabricante.293FT HEK cells were transinfected in 96-well plates with Cas9 plasmid DNA and single guide RNA (CasRG) PCR cassette 72 hours prior to genomic DNA extraction (Fig. 72). The genomic region flanking the CRISPR target site for each gene was multiplied (Fig. 74, Fig. 80, (Example 10) by a fusion PCR method to join Illumina P5 adapters as well as specific barcodes of a single sample for the amplicons set as the target (scheme described in Fig. 73) PCR products were purified using EconoSpin 96 well filter plates (Epoch Life Sciences) following the manufacturer's recommended protocol.
Tabla K | Secuencias para cebadores para ensayar la arquitectura de ARNsg. Los cebadores se hibridan a la cadena inversa del activador U6 a menos que se indique de otro modo. El sitio para cebar U6 está en cursiva, la secuencia guía se indica como un tramo de N, la secuencia repetida directa se destaca en negrita y subrayada la secuencia de ARNtracr. La estructura secundaria de cada arquitectura de ARNsg se muestra en la Fig. 43.K table | Sequences for primers to test the architecture of RNAsg. The primers hybridize to the reverse chain of activator U6 unless otherwise indicated. The site for priming U6 is in italics, the guide sequence is indicated as a stretch of N, the direct repeated sequence is highlighted in bold and the RNAcrcr sequence is underlined. The secondary structure of each rRNA architecture is shown in Fig. 43.
Tabla L | Sitios fijados como objetivo con las PAM alternas para ensayar la especificidad de PAM de Cas9. Todos los sitios fijados como objetivo para ensayar la especificidad de PAM se encuentran dentro del lugar EMX1 humano.Table L | Target sites with alternate MAPs to test the specificity of Cas9 MAP. All target sites to test the specificity of PAM are within the human EMX1 site.
39) y 1 cría natural para comparación (vía 40) se muestran en la Figura A2. Se inyectó a las crías 1-19 ARNg Chd8.2 y a las crías 20-38 se inyectó ARNg Chd8.3. De las 38 crías vivas, 13 fueron positivas para una mutación. La cría muerta también tuvo una mutación. No hubo mutación detectada en la muestra natural. La secuenciación por PCR genómica fue consistente con los hallazgos de la prueba SURVEYOR.39) and 1 natural offspring for comparison (lane 40) are shown in Figure A2. The offspring 1-19 Chd8.2 siRNA were injected and the 20-38 offspring Chd8.3 siRNA was injected. Of the 38 live offspring, 13 were positive for a mutation. The dead baby also had a mutation. There was no mutation detected in the natural sample. Genomic PCR sequencing was consistent with the findings of the SURVEYOR test.
5 Ejemplo 13: Modulación transcripcional mediada por CRISPR/Cas.5 Example 13: Transcriptional modulation mediated by CRISPR / Cas.
La Figura 67 representa un diseño del CRISPR-FT (Factor de Transcripción) con actividad de activación transcripcional. El ARN quimérico se expresa por el activador de U6, mientras una versión de doble mutante, codón optimizada humana de la proteína Cas9 (hSpCas9m), ligada de manera operable a un dominio funcional de NLS triple y uno de VP64 se expresa por un activador de EF1a. Las dobles mutaciones, D10A y H840A, hacen la proteínaFigure 67 represents a design of the CRISPR-FT (Transcription Factor) with transcriptional activation activity. The chimeric RNA is expressed by the activator of U6, while a double mutant, human optimized codon version of the Cas9 protein (hSpCas9m), operably linked to a triple functional domain of NLS and one of VP64 is expressed by an activator of EF1a. The double mutations, D10A and H840A, make the protein
10 cas9 incapaz de introducir escisión, pero mantuvieron su capacidad para unirse a un ADN fijado como objetivo cuando se guía por el ARN quimérico.10 cas9 unable to introduce cleavage, but maintained their ability to bind to a target DNA when guided by the chimeric RNA.
La Figura 68 representa activación transcripcional del gen SOX2 humano con sistema CRISPR-FT (ARN quimérico y la proteína de fusión Cas9-NLS-VP64). Se transinfectaron células 293FT con plásmidos que soportaban dos componentes: (1) secuencias de 20 pb de fijación como objetivo de ARN quiméricos diferentes conducidos por U6 15 dentro o alrededor del lugar genómico SOX2 humano y (2) proteína de fusión hSpCas9m (doble mutante)-NLS-VP64 conducida por EF1a. 96 horas postransinfección, se recogieron células 293FT y se midió el nivel de activación por la inducción de expresión de ARNm usando una prueba qRT-PCR. Todos los niveles de expresión se normalizan frente al grupo de control (barra gris), que representa los resultados de células transinfectadas con el plásmido de cadena principal de CRISPR-FT sin ARN quimérico. Las ondas qRT-PCR usadas para detectar el ARNm de SOX2Figure 68 depicts transcriptional activation of the human SOX2 gene with CRISPR-FT system (chimeric RNA and Cas9-NLS-VP64 fusion protein). 293FT cells were transfected with plasmids supporting two components: (1) 20 bp binding sequences targeting different chimeric RNAs driven by U6 15 into or around the human SOX2 genomic site and (2) hSpCas9m fusion protein (double mutant) -NLS-VP64 driven by EF1a. 96 hours post-infection, 293FT cells were collected and the level of activation was measured by induction of mRNA expression using a qRT-PCR test. All expression levels are normalized against the control group (gray bar), which represents the results of cells transinfected with the CRISPR-FT main chain plasmid without chimeric RNA. The qRT-PCR waves used to detect the SOX2 mRNA
20 es prueba de expresión de genes humanos de Taqman (Life Technologies). Todos los experimentos representan datos de 3 replicados biológicos, n=3, las barras de error muestran e. e. m.20 is Taqman human life expression test (Life Technologies). All experiments represent data from 3 biological replicates, n = 3, the error bars show e. and. m.
Ejemplo 14: NLS: NLS de Cas9Example 14: NLS: Cas9 NLS
Se transinfectaron células 293FT con plásmido que contenía dos componentes: (1) activador de EF1a que conducía la expresión de Cas9 (Sp Cas9 codón optimizada, humana, natural) con diferentes diseños NLS (2) activador de U6293FT cells were transfected with plasmid containing two components: (1) EF1a activator that led to Cas9 expression (Sp Cas9 codon optimized, human, natural) with different NLS designs (2) U6 activator
25 que conducía el mismo lugar EMX1 humano que fija como objetivo ARN quimérico.25 leading the same human EMX1 site that targets chimeric RNA.
Se recogieron células en el instante de tiempo de 72 h postransinfección y se extrajeron después con 50 µl de la disolución de extracción de ADN genómico QuickExtract siguiendo el protocolo del fabricante. Se multiplicó por PCR ADN genómico de EMX1 fijado como objetivo y se purificó en gel con gel de agarosa al 1%. Se volvió a hibridar el producto PCR genómico y se sometió a la prueba Surveyor siguiendo el protocolo del fabricante. La eficacia deCells were collected at the time of 72 h post-infection and then extracted with 50 µl of the QuickExtract genomic DNA extraction solution following the manufacturer's protocol. Genomic target EMX1 DNA was multiplied by PCR and gel purified with 1% agarose gel. The genomic PCR product was re-hybridized and subjected to the Surveyor test following the manufacturer's protocol. The effectiveness of
30 escisión genómica de diferentes construcciones se midió usando SDS-PAGE en un gel TBE-PAGE al 4-12% (Life Technologies), se analizó y se cuantificó con el programa informático ImageLab (Bio-rad), todo siguiendo el protocolo del fabricante.Genomic cleavage of different constructs was measured using SDS-PAGE on a 4-12% TBE-PAGE gel (Life Technologies), analyzed and quantified with the ImageLab (Bio-rad) software, all following the manufacturer's protocol .
La Figura 69 representa un diseño de diferentes construcciones NLS Cas9. Todas las Cas9 eran la versión codón optimizada humana de la Sp Cas9. Se ligaron las secuencias NLS al gen cas9 en el N-terminal o C-terminal. TodasFigure 69 represents a design of different NLS Cas9 constructions. All Cas9 were the human optimized codon version of the Cas9 Sp. The NLS sequences were linked to the cas9 gene in the N-terminal or C-terminal. All
35 las variantes de Cas9 con diferentes diseños de NLS se clonaron en una cadena principal conteniendo así vector para ser conducido por el activador de EF1a. En el mismo vector hay un lugar EMX1 humano de fijación como objetivo de ARN quimérico conducido por activador de U6, formando juntos un sistema de dos componentes.35 Cas9 variants with different NLS designs were cloned into a main chain thus containing vector to be driven by the EF1a activator. In the same vector there is a human EMX1 binding site as a target for chimeric RNA driven by U6 activator, together forming a two component system.
Tabla M. Resultados de ensayo de diseño NLS Cas9. Cuantificación de escisión genómica de diferentes construcciones cas9-nls por prueba surveyor.Table M. Design test results NLS Cas9. Quantification of genomic excision of different cas9-nls constructs by surveyor test.
La Figura 70 representa la eficacia de escisión genómica inducida por variantes de Cas9 que soportan diferentes diseños de NLS. El porcentaje indica la porción de ADN genómico de EMX1 humano que fue escindido por cada construcción. Todos los experimentos son de 3 replicados biológicos. n = 3, error indica E. E. M.Figure 70 depicts the efficacy of genomic cleavage induced by Cas9 variants that support different NLS designs. The percentage indicates the portion of human EMX1 genomic DNA that was cleaved by each construct. All experiments are of 3 biological replicates. n = 3, error indicates E. E. M.
Secuencia de ARN guía conducida por el activador T7 (activador T7, las N representan secuencia de fijación como objetivo):Sequence of guide RNA driven by activator T7 (activator T7, the Ns represent the target sequence):
Suministro génico:Gene supply:
Se usarán cepas CC-124 y CC-125 de Chlamydomonas reinhardtii del centro de recursos de Chlamydomonas para electroporación. El protocol de electroporación sigue el protocolo recomendado estándar del estuche de ingenieríaStrains CC-124 and CC-125 of Chlamydomonas reinhardtii from the Chlamydomonas resource center will be used for electroporation. The electroporation protocol follows the standard recommended protocol of the engineering case
10 de Chlamydomonas GeneArt.10 of Chlamydomonas GeneArt.
También, los solicitantes generan una línea de Chlamydomonas reinhardtii que expresa Cas9 de manera constitutiva. Esto se puede realizar usando pChlamy1 (linearizado usando PvuI) y seleccionando colonias resistentes a higromicina. La secuencia para pChlamy1 que contiene Cas9 está a continuación. De esta manera para conseguir inactivación génica se requiere simplemente suministrar ARN para el ARN guía. Para recombinaciónAlso, the applicants generate a line of Chlamydomonas reinhardtii that expresses Cas9 constitutively. This can be done using pChlamy1 (linearized using PvuI) and selecting hygromycin resistant colonies. The sequence for pChlamy1 containing Cas9 is below. In this way to achieve gene inactivation, it is simply required to supply RNA for the guide RNA. For recombination
15 homóloga, los solicitantes suministran ARN guía, así como una plantilla de recombinación homóloga linearizada.15 homologous, applicants provide guide RNA, as well as a linearized homologous recombination template.
Para todas las células de Chlamydomonas reinhardtii, los solicitantes usaron PCR, prueba de la nucleasa SURVEYOR y secuenciación de ADN para verificar la modificación exitosa.For all Chlamydomonas reinhardtii cells, applicants used PCR, SURVEYOR nuclease test and DNA sequencing to verify the successful modification.
5 Ejemplo 16: Uso de Cas9 como un represor transcripcional en bacterias.5 Example 16: Use of Cas9 as a transcriptional repressor in bacteria.
La capacidad para transcripción de control de manera artificial es esencial tanto para el estudio de la función génica como para la construcción de redes de genes sintéticos con propiedades deseadas. Los solicitantes describen en la presente el uso de la proteína Cas9 guiada por ARN como un represor transcripcional programable.The ability to control transcription artificially is essential both for the study of gene function and for the construction of synthetic gene networks with desired properties. Applicants herein describe the use of RNA-guided Cas9 protein as a programmable transcriptional repressor.
Los solicitantes han demostrado previamente cómo puede usarse la proteína Cas9 de SF370 de StreptococcusApplicants have previously demonstrated how Streptococcus Cas9 SF370 protein can be used
10 pyogenes para dirigir la edición de genomas en Streptococcus pneumoniae. En este estudio, los solicitantes lograron la cepa crR6Rk que contenía un sistema CRISPR mínimo, que consistía en cas9, el ARNtracr y una repetición. Se introdujeron las mutaciones D10A-H840 en cas9 en esta cepa, proporcionando cepa crR6Rk**. Se clonaron cuatro espaciadores fijando como objetivo diferentes posiciones del activador del gen de β-galactosidasa bgaA en la matriz CRISPR por el plásmido pDB98 descrito previamente. Los solicitantes observaron una reducción de X a Y veces en10 pyogenes to direct genome editing in Streptococcus pneumoniae. In this study, the applicants achieved the crR6Rk strain that contained a minimum CRISPR system, which consisted of cas9, the ARNtracr and a repeat. D10A-H840 mutations in cas9 were introduced into this strain, providing strain crR6Rk **. Four spacers were cloned by targeting different positions of the β-galactosidase bgaA gene activator in the CRISPR matrix by plasmid pDB98 previously described. Applicants observed a reduction from X to Y times in
15 actividad de la β-galactosidasa dependiendo de la posición fijada como objetivo, que demuestra el potencial de Cas9 como un represor programable (Figura 73).The activity of β-galactosidase depending on the target position, demonstrating the potential of Cas9 as a programmable repressor (Figure 73).
Para conseguir la represión de Cas9** en Escherichia coli se construyó un plásmido informador de proteínaIn order to achieve repression of Cas9 ** in Escherichia coli a protein reporter plasmid was constructed
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201261736527P | 2012-12-12 | 2012-12-12 | |
| US201261736527P | 2012-12-12 | ||
| US201361748427P | 2013-01-02 | 2013-01-02 | |
| US201361748427P | 2013-01-02 | ||
| US201361757972P | 2013-01-29 | 2013-01-29 | |
| US201361757972P | 2013-01-29 | ||
| US201361768959P | 2013-02-25 | 2013-02-25 | |
| US201361768959P | 2013-02-25 | ||
| US201361791409P | 2013-03-15 | 2013-03-15 | |
| US201361791409P | 2013-03-15 | ||
| US201361835931P | 2013-06-17 | 2013-06-17 | |
| US201361835931P | 2013-06-17 |
| Publication Number | Publication Date |
|---|---|
| ES2618531T3true ES2618531T3 (en) | 2017-06-21 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES14188820.6TActiveES2618531T3 (en) | 2012-12-12 | 2013-12-12 | CRISPR-Cas systems, methods and component compositions for sequence manipulation |
| ES13812430.0TActiveES2635244T3 (en) | 2012-12-12 | 2013-12-12 | CRISPR-Cas systems, methods and component compositions for sequence manipulation |
| ES17162030TActiveES2861623T3 (en) | 2012-12-12 | 2013-12-12 | CRISPR-Cas Systems, Methods, and Component Compositions for Sequence Manipulation |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES13812430.0TActiveES2635244T3 (en) | 2012-12-12 | 2013-12-12 | CRISPR-Cas systems, methods and component compositions for sequence manipulation |
| ES17162030TActiveES2861623T3 (en) | 2012-12-12 | 2013-12-12 | CRISPR-Cas Systems, Methods, and Component Compositions for Sequence Manipulation |
| Country | Link |
|---|---|
| DK (1) | DK2825654T3 (en) |
| ES (3) | ES2618531T3 (en) |
| RU (1) | RU2701662C9 (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2004046321A2 (en)* | 2002-11-15 | 2004-06-03 | Trustees Of Boston University | Cis/trans riboregulators |
| DK2341149T3 (en)* | 2005-08-26 | 2017-02-27 | Dupont Nutrition Biosci Aps | Use of CRISPR-associated genes (Cas) |
| US20100076057A1 (en)* | 2008-09-23 | 2010-03-25 | Northwestern University | TARGET DNA INTERFERENCE WITH crRNA |
| US20140113376A1 (en)* | 2011-06-01 | 2014-04-24 | Rotem Sorek | Compositions and methods for downregulating prokaryotic genes |
| Publication number | Publication date |
|---|---|
| DK2825654T3 (en) | 2017-08-21 |
| ES2635244T3 (en) | 2017-10-03 |
| HK1208045A1 (en) | 2016-02-19 |
| RU2701662C2 (en) | 2019-09-30 |
| RU2701662C9 (en) | 2019-10-31 |
| RU2015128102A (en) | 2018-12-21 |
| ES2861623T3 (en) | 2021-10-06 |
| RU2015128102A3 (en) | 2018-12-21 |
| HK1247961A1 (en) | 2018-10-05 |
| RU2019127238A (en) | 2019-09-20 |
| Publication | Publication Date | Title |
|---|---|---|
| US20250250553A1 (en) | Engineering of systems, methods and optimized guide compositions for sequence manipulation | |
| US20230374527A1 (en) | Crispr-cas component systems, methods and compositions for sequence manipulation | |
| US20200354742A1 (en) | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes | |
| EP2896697B1 (en) | Engineering of systems, methods and optimized guide compositions for sequence manipulation | |
| ES2552535T3 (en) | CRISPR-Cas systems and methods to alter the expression of gene products | |
| ES2618531T3 (en) | CRISPR-Cas systems, methods and component compositions for sequence manipulation | |
| HK1209153B (en) | Engineering of systems, methods and optimized guide compositions for sequence manipulation | |
| HK1209154B (en) | Engineering of systems, methods and optimized guide compositions for sequence manipulation | |
| HK1206388B (en) | Crispr-cas component systems, methods and compositions for sequence manipulation |