Ubicación y estructura del ADN en unacélula eucariota. Durante ladivisión celular, el ADN se agrupa encromosomas. El resto del tiempo, se encuentra disperso en forma decromatina.Animación de parte de una estructura de ADN de doble hélice.
Elácido desoxirribonucleico —conocido por las siglasADN— es unácido nucleico que contiene las instruccionesgenéticas fundamentales para eldesarrollo, funcionamiento yreproducción de todos losseres vivos[1] y algunosvirus (losvirus ADN); también es responsable de la transmisiónhereditaria.[2] La función principal de lamolécula de ADN es el almacenamiento a largo plazo deinformación para construir otros componentes de lascélulas, como lasproteínas y las moléculas deARN. Los segmentos de ADN que llevan esta información genética son llamadosgenes, pero las otras secuencias de ADN tienen propósitos estructurales o toman parte en la regulación del uso de esta información genética y biológica.
Desde el punto de vistaquímico, el ADN es unpolímero de nucleótidos, es decir, unpolinucleótido.[3] Cadanucleótido, a su tiempo, está formado por un glúcido (ladesoxirribosa), unabase nitrogenada (que puede seradenina→A,timina→T,citosina→C oguanina→G) y un grupofosfato (derivado delácido fosfórico). Lo que distingue a un polinucleótido de otro es, entonces, la base nitrogenada, y por ello la secuencia del ADN se especifica nombrando solo la secuencia de sus bases. La disposición secuencial de estas cuatro bases a lo largo de la cadena es la que codifica la información genética, siguiendo el siguiente criterio de complementariedad: A‑T y G‑C. Esto se debe a que la adenina y la guanina son de mayor tamaño que la timina y la citosina, por lo que este criterio permite cumplir una uniformidad. En los seres vivos, el ADN se presenta como una doble cadena de nucleótidos, en la que las dos hebras están unidas entre sí por unas conexiones denominadaspuentes de hidrógeno.[4][5]
Para que la información que contiene el ADN pueda ser utilizada por la maquinaria celular debe copiarse en primer lugar en unos trenes de nucleótidos, más cortos y con unas unidades diferentes, llamados ARN. Lasmoléculas de ARN se copian exactamente del ADN mediante un proceso denominadotranscripción. Una vez procesadas en elnúcleo celular, las moléculas de ARN pueden salir alcitoplasma para su utilización posterior. La información contenida en el ARN se interpreta usando elcódigo genético, que especifica la secuencia de losaminoácidos de las proteínas, según una correspondencia de un triplete de nucleótidos (codón) para cada aminoácido. Esto es, la información genética (esencialmente: qué proteínas se van a producir en cada momento del ciclo de vida de una célula) se halla codificada en las secuencias de nucleótidos del ADN y debe traducirse para poder funcionar. Tal traducción se realiza usando el código genético a modo de diccionario. El diccionario «secuencia de nucleótido-secuencia de aminoácidos» permite el ensamblado de largas cadenas de aminoácidos (las proteínas) en el citoplasma de la célula. Por ejemplo, en el caso de la secuencia de ADN indicada antes (ATGCTAGCATCG...), la ADNpolimerasa utilizaría como molde la cadena complementaria de dicha secuencia de ADN (que seríaTAC‑GAT‑CGT‑AGC‑...) para transcribir una molécula de ARNm que se leeríaAUG‑CUA‑GCA‑UCG‑...; el ARNm resultante, utilizando el código genético, se traduciría como la secuencia de aminoácidosmetionina-leucina-ácido aspártico-arginina-...
Las secuencias de ADN que constituyen la unidad fundamental, física y funcional de la herencia se denominangenes. Cada gen contiene una parte que setranscribe a ARN y otra que se encarga de definir cuándo y dónde debenexpresarse. La información contenida en los genes (genética) se emplea para generar ARN yproteínas, que son los componentes básicos de las células, los «ladrillos» que se utilizan para la construcción de losorgánulos u organelos celulares, entre otras funciones.
El ADN fue aislado por primera vez durante 1869, por el médicosuizoFriedrich Miescher, mientras trabajaba en laUniversidad de Tubinga. Miescher realizaba experimentos acerca de la composición química delpus de vendasquirúrgicas desechadas cuando notó un precipitado de una sustancia desconocida que caracterizó químicamente más tarde.[6][7] Lo llamónucleína, debido a que lo había extraído a partir de núcleos celulares.[8] Se necesitaron casi 70 años de investigación para poder identificar loscomponentes y laestructura de los ácidos nucleicos.
En 1919Phoebus Levene identificó que un nucleótido está formado por unabase nitrogenada, unazúcar y unfosfato.[9] Levene sugirió que el ADN generaba una estructura con forma desolenoide (muelle) con unidades de nucleótidos unidos a través de los grupos fosfato. En 1930 Levene y su maestroAlbrecht Kossel probaron que la nucleína de Miescher es un ácido desoxirribonucleico (ADN) formado por cuatro bases nitrogenadas (citosina (C),timina (T),adenina (A) yguanina (G), el azúcar desoxirribosa y un grupo fosfato, y que, en suestructura básica, el nucleótido está compuesto por un azúcar unido a la base y al fosfato.[10] Sin embargo, Levene pensaba que la cadena era corta y que las bases se repetían en un orden fijo. En 1937William Astbury produjo el primer patrón dedifracción de rayos X que mostraba que el ADN tenía una estructura regular.[11]
La función biológica del ADN comenzó a dilucidarse en 1928, con una serie básica de experimentos de la genética moderna realizados porFrederick Griffith, quien estaba trabajando con cepas «lisas» (S) o «rugosas» (R) de la bacteriaPneumococcus (causante de la neumonía), según la presencia (S) o no (R) de una cápsula azucarada, que es la que confiere virulencia (véase tambiénexperimento de Griffith). La inyección de neumococos S vivos en ratones produce la muerte de estos, y Griffith observó que, si inyectaba ratones con neumococos R vivos o con neumococos S muertos por calor, los ratones no morían. Sin embargo, si inyectaba a la vez neumococos R vivos y neumococos S muertos, los ratones morían, y en su sangre se podían aislar neumococos S vivos. Como las bacterias muertas no pudieron haberse multiplicado dentro del ratón, Griffith razonó que debía producirse algún tipo de cambio o transformación de un tipo bacteriano a otro por medio de una transferencia de alguna sustancia activa, que denominóprincipio transformante. Esta sustancia proporcionaba la capacidad a los neumococos R de producir una cápsula azucarada y transformarse así en virulentas. En los siguientes 15 años, estos experimentos iniciales se replicaron mezclando distintos tipos de cepas bacterianas muertas por el calor con otras vivas, tanto en ratones (in vivo) como en tubos de ensayo (in vitro).[12] La búsqueda del «factor transformante» que era capaz de hacer virulentas a cepas que inicialmente no lo eran continuó hasta 1944, año en el cualOswald Avery,Colin MacLeod yMaclyn McCarty realizaron un experimento hoy clásico. Estos investigadores extrajeron la fracción activa (el factor transformante) y, mediante análisis químicos, enzimáticos yserológicos, observaron que no contenía proteínas, ni lípidos no ligados, ni polisacáridos activos, sino que estaba constituido principalmente por «una forma viscosa de ácido desoxirribonucleico altamente polimerizado», es decir, ADN. El ADN extraído de las cepas bacterianas S muertas por el calor lo mezclaronin vitro con cepas R vivas: el resultado fue que se formaron colonias bacterianas S, por lo que se concluyó inequívocamente que el factor o principio transformante era el ADN.[13]
A pesar de que la identificación del ADN como principio transformante aún tardó varios años en ser universalmente aceptada, este descubrimiento fue decisivo en el conocimiento de la base molecular de la herencia, y constituye el nacimiento de lagenética molecular. Finalmente, el papel exclusivo del ADN en la heredabilidad fue confirmado en 1952 mediante los experimentos deAlfred Hershey yMartha Chase, en los cuales comprobaron que elfago T2 transmitía su información genética en su ADN, pero no en su proteína[14] (véase tambiénexperimento de Hershey y Chase).
En cuanto a la caracterización química de la molécula,Chargaff realizó en 1940 algunos experimentos que le sirvieron para establecer lasproporciones de las bases nitrogenadas en el ADN. Descubrió que las proporciones de purinas eran idénticas a las de pirimidinas, la «equimolecularidad» de las bases ([A]=[T], [G]=[C]) y el hecho de que la cantidad de G+C en una determinada molécula de ADN no siempre es igual a la cantidad de A+T y puede variar desde el 36 hasta el 70 por ciento del contenido total.[10] Con toda esta información y junto con los datos dedifracción de rayos X proporcionados porRosalind Franklin,James Watson yFrancis Crick propusieron en 1953 el modelo de lahélice doble de ADN para representar laestructura tridimensional delpolímero.[15] En una serie de cinco artículos en el mismo número deNature se publicó la evidencia experimental que apoyaba el modelo de Watson y Crick.[16] De estos, el artículo deFranklin yRaymond Gosling fue la primera publicación con datos de difracción de rayos X que apoyaba el modelo de Watson y Crick,[17][18] y en ese mismo número deNature también aparecía un artículo sobre la estructura del ADN deMaurice Wilkins y sus colaboradores.[19]
Watson, Crick y Wilkins recibieron conjuntamente, en 1962, después de la muerte de Rosalind Franklin, elPremio Nobel en Fisiología o Medicina.[20] Sin embargo, el debate continúa sobre quién debería recibir crédito por el descubrimiento.[21]
Propiedades físicas y químicas
Estructuraquímica del ADN: dos cadenas de nucleótidos conectadas mediantepuentes de hidrógeno, que aparecen como líneas punteadas.
El ADN es un largopolímero formado por unidades repetitivas, losnucleótidos.[22][23] Una doble cadena de ADN mide de 22 a 26ángstroms (2.2 a 2.6nanómetros) de ancho, y una unidad (un nucleótido) mide 3.3 Å (0.33 nm) de largo.[24] Aunque cada unidad individual que se repite es muy pequeña, los polímeros de ADN pueden sermoléculas enormes que contienen millones denucleótidos. Por ejemplo, el cromosoma humano más largo, elcromosoma número 1, tiene aproximadamente 220 millones depares de bases.[25]
En losseres vivos, el ADN no suele existir como una molécula individual, sino como una pareja de moléculas estrechamente asociadas. Las dos cadenas de ADN se enroscan sobre sí mismas formando una especie de escalera de caracol, denominada «hélice doble». El modelo de estructura en doble hélice fue propuesto en 1953 porJames Watson yFrancis Crick (el artículo «Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid» fue publicado el 25 de abril de 1953 enNature), después de obtener una imagen de la estructura de doble hélice gracias a la refracción por rayos X hecha porRaymond Gosling.[26][27] El éxito de este modelo radicaba en su consistencia con las propiedades físicas y químicas del ADN. El estudio mostraba, además, que lacomplementariedad de bases podía ser relevante en sureplicación, y también la importancia de la secuencia de bases como portadora de información genética.[28][29][30] Cada unidad que se repite, el nucleótido, contiene un segmento de la estructura de soporte (azúcar + fosfato), que mantiene la cadena unida, y unabase, que interacciona con la otra cadena de ADN en la hélice. En general, una base ligada a un azúcar se denominanucleósido y una base ligada a un azúcar y a uno o más grupos fosfatos se denominanucleótido.
Cuando muchos nucleótidos están unidos, como ocurre en el ADN, el polímero resultante se denominapolinucleótido.[31]
Componentes
Estructura de soporte:La estructura de soporte de una hebra deADN está formada por unidades alternas de gruposfosfato yazúcar (desoxirribosa).[32] El azúcar en el ADN es una pentosa, específicamente, ladesoxirribosa.
Sufórmula química es H3PO4. Cadanucleótido puede contener uno (monofosfato:AMP), dos (difosfato:ADP) o tres (trifosfato:ATP) grupos de ácido fosfórico, aunque como monómeros constituyentes de losácidos nucleicos solo aparecen como nucleósidos monofosfato.
Es unmonosacárido de 5átomos decarbono (unapentosa) derivado de laribosa, que es parte de la estructura de nucleótidos del ADN. Su fórmula química es C5H10O4. Una de las diferencias principales entre elADN y elARN es elazúcar, pues en el ARN la 2‑desoxirribosa del ADN es reemplazada por unapentosa alternativa, laribosa.[30]
Las moléculas de azúcar se unen entre sí a través de grupos fosfato, que formanenlaces fosfodiéster entre los átomos de carbono tercero (3′, «tres prima») y quinto (5′, «cinco prima») de dos anillos adyacentes de azúcar. La formación deenlace= asimétricos implica que cada hebra de ADN tiene una dirección. En unahélice doble, la dirección de losnucleótidos en una hebra (3′ → 5′) es opuesta a la dirección en la otra hebra (5′ → 3′). Esta organización de las hebras de ADN se denominaantiparalela; son cadenas paralelas, pero con direcciones opuestas. De la misma manera, los extremos asimétricos de las hebras de ADN se denominanextremo 5′ («cinco prima») yextremo 3′ («tres prima»), respectivamente.
Las cuatro bases nitrogenadas mayoritarias que se encuentran en elADN son laadenina (A), lacitosina (C), laguanina (G) y latimina (T). Cada una de estas cuatro bases está unida al armazón de azúcar-fosfato a través del azúcar para formar el nucleótido completo (base-azúcar-fosfato). Las bases soncompuestos heterocíclicos yaromáticos con dos o másátomos denitrógeno, y, dentro de las bases mayoritarias, se clasifican en dos grupos: lasbases púricas opurinas (adenina y guanina), derivadas de la purina y formadas por dos anillos unidos entre sí, y lasbases pirimidínicas obases pirimídicas opirimidinas (citosina y timina), derivadas de la pirimidina y con un solo anillo.[30] En los ácidos nucleicos existe una quinta base pirimidínica, denominadauracilo (U), que normalmente ocupa el lugar de la timina en elARN y difiere de esta en que carece de un grupo metilo en su anillo. El uracilo no se encuentra habitualmente en el ADN, solo aparece raramente como un producto residual de la degradación de la citosina por procesos de desaminación oxidativa.
En elcódigo genético se representa con la letraT. Es un derivado pirimidínico con ungrupo oxo en las posiciones 2 y 4, y ungrupo metil en la posición 5. Forma elnucleósidotimidina (siempre desoxitimidina, ya que solo aparece en el ADN) y elnucleótidotimidilato o timidina monofosfato (dTMP). En el ADN, la timina siempre seempareja con la adenina de la cadena complementaria mediante 2puentes de hidrógeno,T=A. Su fórmula química es C5H6N2O2 y su nomenclatura 2, 4‑dioxo, 5‑metilpirimidina.
En el código genético se representa con la letraC. Es un derivado pirimidínico, con ungrupo amino en posición 4 y un grupo oxo en posición 2. Forma elnucleósidocitidina (desoxicitidina en el ADN) y elnucleótidocitidilato o (desoxi)citidina monofosfato (dCMP en el ADN, CMP en el ARN). La citosina siempre seempareja en el ADN con la guanina de la cadena complementaria mediante un enlace triple,C≡G. Su fórmula química es C4H5N3O y su nomenclatura 2‑oxo, 4 aminopirimidina. Sumasa molecular es de 111.1unidades de masa atómica. La citosina se descubrió en 1894, al aislarla del tejido deltimo de carnero.
En el código genético se representa con la letraA. Es un derivado de la purina con un grupo amino en la posición 6. Forma el nucleósidoadenosina (desoxiadenosina en el ADN) y el nucleótidoadenilato o (desoxi)adenosina monofosfato (dAMP, AMP). En el ADN siempre seempareja con la timina de la cadena complementaria mediante 2 puentes de hidrógeno,A=T. Su fórmula química es C5H5N5 y su nomenclatura 6‑aminopurina. La adenina, junto con la timina, fue descubierta en 1885 por el médico alemánAlbrecht Kossel.
En el código genético se representa con la letraG. Es un derivado púrico con un grupo oxo en la posición 6 y un grupo amino en la posición 2. Forma el nucleósido (desoxi)guanosina y el nucleótidoguanilato o (desoxi)guanosina monofosfato (dGMP, GMP). La guanina siempre seempareja en el ADN con la citosina de la cadena complementaria mediante tres enlaces de hidrógeno,G≡C. Su fórmula química es C5H5N5O y su nomenclatura 6‑oxo, 2‑aminopurina.
También existen otras bases nitrogenadas (las llamadasbases nitrogenadas minoritarias), derivadas de forma natural o sintética de alguna otra base mayoritaria. Lo son por ejemplo lahipoxantina, relativamente abundante en elARNt, o lacafeína, ambas derivadas de la adenina; otras, como elaciclovir, derivadas de la guanina, son análogos sintéticos usados en terapia antivírica; otras, como una de las derivadas del uracilo, son antitumorales.
Las bases nitrogenadas tienen una serie de características que les confieren unas propiedades determinadas. Una característica importante es su carácteraromático, consecuencia de la presencia en el anillo de dobles enlaces en posición conjugada. Ello les confiere la capacidad de absorber luz en la zonaultravioleta delespectro en torno a los 260 nm, lo cual puede aprovecharse para determinar elcoeficiente de extinción del ADN y hallar la concentración existente de los ácidos nucleicos. Otra de sus características es que presentantautomería oisomería de grupos funcionales, debido a que un átomo dehidrógeno unido a otro átomo puede migrar a una posición vecina; en las bases nitrogenadas se dan dos tipos de tautomerías: tautomeríalactama-lactima, donde el hidrógeno migra del nitrógeno aloxígeno del grupo oxo (forma lactama) y viceversa (forma lactima), y tautomeríaimina-amina primaria, donde el hidrógeno puede estar formando el grupo amina (forma amina primaria) o migrar al nitrógeno adyacente (forma imina). La adenina solamente puede presentar tautomería amina-imina, la timina y el uracilo muestran tautomería doble lactama-lactima, y la guanina y citosina pueden presentar ambas. Por otro lado, y aunque se trate de moléculasapolares, las bases nitrogenadas presentan suficiente carácterpolar como para establecerpuentes de hidrógeno, ya que tienen átomos muyelectronegativos (nitrógeno y oxígeno) que presentan carga parcial negativa, y átomos de hidrógeno con carga parcial positiva, de manera que se forman dipolos que permiten que se formen estosenlaces débiles.
Se estima que elgenoma humanohaploide tiene alrededor de 3000 millones de pares de bases. Para indicar el tamaño de las moléculas de ADN se indica el número de pares de bases, y como derivados hay dos unidades de medida muy utilizadas, lakilobase (kb), que equivale a 1000 pares de bases, y lamegabase (Mb), que equivale a un millón de pares de bases.
Un par de basesC≡G con trespuentes de hidrógenoUn parA=T con dos puentes de hidrógeno. Los puentes de hidrógeno se muestran como líneas discontinuas.
La hélice doble de ADN se mantiene estable mediante la formación depuentes de hidrógeno entre las bases asociadas a cada una de las dos hebras. Para la formación de unenlace de hidrógeno una de las bases debe presentar un «donador» de hidrógenos con un átomo de hidrógeno con carga parcial positiva (-NH2 o -NH) y la otra base debe presentar un grupo «aceptor» de hidrógenos con un átomo cargadoelectronegativamente (C=O o N). Los puentes de hidrógeno son uniones más débiles que los típicosenlaces químicos covalentes, como los que conectan los átomos en cada hebra de ADN, pero más fuertes que interacciones hidrófobas individuales,enlaces de Van der Waals, etc.Como los puentes de hidrógeno no sonenlaces covalentes, pueden romperse y formarse de nuevo de forma relativamente sencilla. Por esta razón, las dos hebras de la doble hélice pueden separarse como una cremallera, bien por fuerza mecánica o por altatemperatura.[33] La doble hélice se estabiliza además por el efectohidrofóbico y el apilamiento, que no se ven influidos por la secuencia de bases del ADN.[34]
Cada tipo de base en una hebra forma un enlace únicamente con un tipo de base en la otra hebra, lo que se denominacomplementariedad de las bases. Así, las purinas forman enlaces con las pirimidinas, de forma que A se enlaza solo con T, y C solo con G. La organización de dos nucleótidos apareados a lo largo de la doble hélice se denominaapareamiento de bases. Este emparejamiento corresponde a la observación ya realizada porErwin Chargaff (1905‑2002),[35] que mostró que la cantidad de adenina era muy similar a la cantidad de timina, y que la cantidad de citosina era igual a la cantidad de guanina en el ADN. Como resultado de esta complementariedad, toda la información contenida en la secuencia de doble hebra de la hélice de ADN está duplicada en cada hebra, lo cual es fundamental durante el proceso de replicación del ADN. En efecto, esta interacción reversible y específica entre pares de bases complementarias es crítica para todas las funciones del ADN en los seres vivos.[22]
Como se ha indicadoanteriormente, los dos tipos de pares de bases forman un número diferente de enlaces de hidrógeno: A=T forman dos puentes de hidrógeno, y C≡G forman tres puentes de hidrógeno (ver imágenes). El par de bases GC es por tanto más fuerte que el par de bases AT. Como consecuencia, tanto el porcentaje de pares de bases GC como la longitud total de la doble hélice de ADN determinan la fuerza de la asociación entre las dos hebras de ADN. Las dobles hélices largas de ADN con alto contenido en GC tienen hebras que interaccionan más fuertemente que las dobles hélices cortas con alto contenido en AT.[36] Por esta razón, las zonas de la doble hélice de ADN que necesitan separarse fácilmente tienden a tener un alto contenido en AT, como por ejemplo la secuencia TATAAT de lacaja de Pribnow de algunospromotores.[37] En el laboratorio, la fuerza de esta interacción puede medirse buscando la temperatura requerida para romper los puentes de hidrógeno, latemperatura de fusión (también denominado valorTm, del inglésmelting temperature). Cuando todas las pares de bases en una doble hélice se funden, las hebras se separan en solución en dos hebras completamente independientes. Estas moléculas de ADN de hebra simple no tienen una única forma común, sino que algunas conformaciones son más estables que otras.[38]
Otros tipos de pares de bases
Par de bases A=T de tipoWatson-Crick. En azul el «donador» de hidrógenos y en rojo el «aceptor».Par de bases A=T de tipoWatson-Crick reverso. En azul el «donador» de hidrógenos y en rojo el «aceptor». Nótese que la pirimidina ha sufrido un giro de 180º sobre el eje del carbono 6.
Existen diferentes tipos de pares de bases que se pueden formar según el modo como se forman los puentes de hidrógeno. Los que se observan en la doble hélice de ADN son los llamadospares de bases Watson-Crick, pero también existen otros posibles pares de bases, como los denominadosHoogsteen yWobble u oscilante, que pueden aparecer en circunstancias particulares. Además, para cada tipo existe a su vez el mismo par reverso, es decir, el que se da si se gira la base pirimidínica 180° sobre su eje.
Watson-Crick (pares de bases de la doble hélice): los grupos de la base púrica que intervienen en el enlace de hidrógeno son los que corresponden a las posiciones 1 y 6 (N aceptor y -NH2 donador si la purina es una A) y los grupos de la base pirimidínica, los que se encuentran en las posiciones 3 y 4 (-NH donador y C=O aceptor si la pirimidina es una T). En el par de bases Watson-Crick reverso participarían los grupos de las posiciones 2 y 3 de la base pirimidínica (ver imágenes).
Hoogsteen: en este caso cambian los grupos de la base púrica, que ofrece una cara diferente (posiciones 6 y 7) y que forman enlaces con los grupos de las pirimidinas de las posiciones 3 y 4 (como en Watson-Crick). También puede haber Hoogsteen reversos. Con este tipo de enlace pueden unirse A=U (Hoogsteen y Hoogsteen reverso) y A=C (Hoogsteen reverso).
Wobble u oscilante: este tipo de enlace permite que se unan guanina y timina con un enlace doble (G=T). La base púrica (G) forma enlace con los grupos de las posiciones 1 y 6 (como en Watson-Crick) y la pirimidina (T) con los grupos de las posiciones 2 y 3. Este tipo de enlace no funcionaría con A=C, ya que quedarían enfrentados los 2 «aceptores» y los 2 «donadores», y solo se podría dar en el caso inverso. Encontramos pares de bases de tipo oscilante en el ARN, durante el apareamiento decodón yanticodón. Con este tipo de enlace pueden unirse G=U (oscilante y oscilante reverso) y A=C (oscilante reverso).
En total, en su forma tautomérica mayoritaria, existen 28 posibles pares de bases nitrogenadas: 10 posibles pares de bases purina-pirimidina (2 pares Watson-Crick y 2 Watson Crick reverso, 1 par Hoogsteen y 2 pares Hoogsteen reverso, 1 par oscilante y 2 pares oscilante reverso), 7 pares homo purina-purina (A=A, G=G), 4 pares A=G y 7 pares pirimidina-pirimidina. Esto sin contar con los pares de bases que pueden formarse si también tenemos en cuenta las otras formas tautoméricas minoritarias de las bases nitrogenadas; estos, además, pueden ser responsables demutaciones puntuales por sustitución de tipotransición.
Estructura
El ADN es unamolécula bicatenaria, es decir, está formada por dos cadenas dispuestas de forma antiparalela y con las bases nitrogenadas enfrentadas. En su estructura tridimensional, se distinguen distintos niveles:[39][40]
Estructura primaria
Secuencia denucleótidos encadenados. Es en estas cadenas donde se encuentra la información genética, y dado que el esqueleto es el mismo para todos, la diferencia de la información radica en la distinta secuencia de bases nitrogenadas. Esta secuencia presenta un código, que determina una información u otra, según el orden de las bases.
Estructura secundaria
Es unaestructura en doble hélice. Permite explicar el almacenamiento de la información genética y el mecanismo de duplicación del ADN. Fue postulada por Watson y Crick, basándose en la difracción de rayos X que habían realizado Franklin y Wilkins, y en la equivalencia de bases de Chargaff, según la cual la suma de adeninas más guaninas es igual a la suma de timinas más citosinas.
Es una cadena doble, dextrógira olevógira, según el tipo de ADN. Ambas cadenas son complementarias, pues la adenina y la guanina de una cadena se unen, respectivamente, a la timina y la citosina de la otra. Ambas cadenas son antiparalelas, pues el extremo 3´ de una se enfrenta al extremo 5' de la homóloga.
Existen tres modelos de ADN. El ADN de tipo B es el más abundante y es el que tiene la estructura descrita por Watson y Crick.
Estructura terciaria
Se refiere a cómo se almacena el ADN en un espacio reducido, para formar losnucleosomas.[41] Varía según se trate de seresprocariotas oeucariotas:
Enprocariotas el ADN se pliega como una súperhélice, generalmente en forma circular y asociada a una pequeña cantidad de proteínas. Lo mismo ocurre enorgánulos celulares como lasmitocondrias y en loscloroplastos.
Eneucariotas, dado que la cantidad de ADN de cadacromosoma es muy grande, el empaquetamiento ha de ser más complejo y compacto; para ello se necesita la presencia de proteínas, como lashistonas yotras proteínas de naturaleza no histónica (en losespermatozoides estas proteínas son lasprotaminas).[39]
Estructura cuaternaria
Lacromatina presente en el núcleo tiene un grosor de 300 Å, pues la fibra de cromatina de 100 Å se enrolla formando una fibra de cromatina de 300 Å. El enrollamiento de losnucleosomas recibe el nombre de solenoide. Dichos solenoides se enrollan formando la cromatina del núcleo interfásico de lacélula eucariota. Cuando la célula entra en división, el ADN se compacta más, formando así loscromosomas.
Estructuras en hélice doble
De izquierda a derecha, las estructuras de ADN A, B y Z.
El ADN existe en muchas conformaciones.[32] Sin embargo, en organismos vivos solo se han observado las conformacionesADN-A,ADN-B yADN-Z. La conformación que adopta el ADN depende de su secuencia, la cantidad y dirección desuperenrollamiento que presenta, la presencia demodificaciones químicas en las bases y las condiciones de la solución, tales como la concentración deiones demetales ypoliaminas.[42] De las tres conformaciones, la forma «B» es la más común en las condiciones existentes en las células.[43] Las dos dobles hélices alternativas del ADN difieren en su geometría y dimensiones.
La forma «A» es una espiral que gira hacia la derecha, más amplia que la «B», con una hendidura menor superficial y más amplia, y una hendidura mayor más estrecha y profunda. La forma «A» ocurre en condiciones no fisiológicas en formas deshidratadas de ADN, mientras que en la célula puede producirse en apareamientos híbridos de hebras ADN‑ARN, además de en complejos enzima-ADN.[44][45]
Los segmentos de ADN en los que las bases han sido modificadas pormetilación pueden sufrir cambios conformacionales mayores y adoptar la forma «Z». En este caso, las hebras giran alrededor del eje de la hélice en una espiral que gira a mano izquierda, lo opuesto a la forma «B» más frecuente.[46] Estas estructuras poco frecuentes pueden ser reconocidas por proteínas específicas que se unen a ADN‑Z y posiblemente estén implicadas en la regulación de latranscripción.[47]
Estructuras en cuádruplex
Estructura de un ADN en cuádruplex formada por repeticiones en lostelómeros. La conformación de la estructura de soporte del ADN difiere significativamente de la típica estructura en hélice.[48]
En los extremos de los cromosomas lineales existen regiones especializadas de ADN denominadastelómeros. La función principal de estas regiones es permitir a la célula replicar los extremos cromosómicos utilizando la enzimatelomerasa, puesto que las enzimas que replican el resto del ADN no pueden copiar los extremos 3' de los cromosomas.[49] Estas terminaciones cromosómicas especializadas también protegen los extremos del ADN, y evitan que los sistemas dereparación del ADN en la célula los procesen como ADN dañado que debe ser corregido.[50] En las células humanas, los telómeros son largas zonas de ADN de hebra sencilla que contienen algunos miles de repeticiones de una única secuencia TTAGGG.[51]
Estas secuencias ricas en guanina pueden estabilizar los extremos cromosómicos mediante la formación de estructuras de juegos apilados de unidades de cuatro bases, en lugar de los pares de bases encontrados normalmente en otras estructuras de ADN. En este caso, cuatro bases guanina forman unidades con superficie plana que se apilan una sobre otra, para formar una estructura cuádruple-G estable.[52] Estas estructuras se estabilizan formandopuentes de hidrógeno entre los extremos de las bases y laquelatación de un metal iónico en el centro de cada unidad de cuatro bases.[53] También se pueden formar otras estructuras, con el juego central de cuatro bases procedente, o bien de una hebra sencilla plegada alrededor de las bases, o bien de varias hebras paralelas diferentes, de forma que cada una contribuye con una base a la estructura central.
Además de estas estructuras apiladas, lostelómeros también forman largas estructuras en lazo, denominadas lazos teloméricos o lazos‑T (T‑loops en inglés). En este caso, las hebras simples de ADN se enroscan sobre sí mismas en un amplio círculo estabilizado por proteínas que se unen a telómeros.[54] En el extremo del lazo T, el ADN telomérico de hebra sencilla se sujeta a una región de ADN de doble hebra porque la hebra de ADN telomérico altera la doble hélice y se aparea a una de las dos hebras. Esta estructura de triple hebra se denominalazo de desplazamiento olazo D (D‑loop).[52]
Hendiduras mayor y menor
Animación de la estructura de una sección de ADN. Las bases se encuentran horizontalmente entre las dos hebras en espiral.Versión ampliada[55]Doble hélice: a) Dextrógira, b) Levógira.
Lahélice doble es una espiraldextrógira, esto es, cada una de las cadenas denucleótidos gira a la derecha; esto puede verificarse si nos fijamos, yendo de abajo arriba, en la dirección que siguen los segmentos de las hebras que quedan en primer plano. Si las dos hebras giran a derechas se dice que la doble hélice es dextrógira, y si giran a izquierdas,levógira (esta forma puede aparecer en hélices alternativas debido a cambios conformacionales en el ADN). Pero en la conformación más común que adopta el ADN, la doble hélice es dextrógira, girando cada par de bases respecto al anterior unos 36º.[56]
Cuando las dos hebras de ADN se enrollan una sobre la otra (sea a derechas o a izquierdas), se forman huecos o hendiduras entre una hebra y la otra, dejando expuestos los laterales de lasbases nitrogenadas del interior (ver la animación). En la conformación más común que adopta el ADN aparecen, como consecuencia de los ángulos formados entre losazúcares de ambas cadenas de cada par de bases nitrogenadas, dos tipos de hendiduras alrededor de la superficie de la doble hélice: una de ellas, la hendidura o surco mayor, que mide 22 Å (2.2 nm) de ancho, y la otra, la hendidura o surco menor, que mide 12 Å (1.2 nm) de ancho.[57] Cada vuelta de hélice, que es cuando esta ha realizado un giro de 360° o lo que es lo mismo, de principio de hendidura mayor a final de hendidura menor, medirá por tanto 34 Å, y en cada una de esas vueltas hay unos 10.5 pb.
Hendiduras mayor y menor de la doble hélice
La anchura de la hendidura mayor implica que los extremos de las bases son más accesibles en esta, de forma que la cantidad de grupos químicos expuestos también es mayor lo cual facilita la diferenciación entre los pares de bases A‑T, T‑A, C‑G, G‑C. Como consecuencia de ello, también se verá facilitado el reconocimiento de secuencias de ADN por parte de diferentesproteínas sin la necesidad de abrir la doble hélice. Así, proteínas como losfactores de transcripción que pueden unirse a secuencias específicas, frecuentemente contactan con los laterales de las bases expuestos en la hendidura mayor.[58] Por el contrario, los grupos químicos que quedan expuestos en la hendidura menor son similares, de forma que el reconocimiento de los pares de bases es más difícil; por ello se dice que la hendidura mayor contiene más información que la hendidura menor.[56]
Una secuencia de ADN se denomina «sentido» si su secuencia es la misma que la secuencia de unARN mensajero que se traduce en una proteína. La secuencia de la hebra de ADN complementaria se denomina «antisentido» (antisense). En ambas hebras de ADN de la doble hélice pueden existir tanto secuencias «sentido», que codifican ARNm, como «antisentido», que no lo codifican. Es decir, las secuencias que codifican ARNm no están todas presentes en una sola de las hebras, sino repartidas entre las dos hebras. Tanto enprocariotas como eneucariotas se producen ARN con secuencias antisentido, pero la función de esos ARN no está completamente clara.[59] Se ha propuesto que los ARNantisentido están implicados en la regulación de laexpresión génica mediante apareamiento ARN‑ARN: los ARNantisentido se aparearían con los ARNm complementarios, bloqueando de esta forma sutraducción.[60]
En unas pocas secuencias de ADN en procariotas y eucariotas —este hecho es más frecuente enplásmidos yvirus—, la distinción entre hebrassentido yantisentido es más difusa, debido a que presentan genes superpuestos.[61] En estos casos, algunas secuencias de ADN tienen una función doble, codificando una proteína cuando se lee a lo largo de una hebra, y una segunda proteína cuando se lee en la dirección contraria a lo largo de la otra hebra. Enbacterias, esta superposición puede estar involucrada en la regulación de latranscripción del gen,[62] mientras que en virus los genes superpuestos aumentan la cantidad de información que puede codificarse en sus diminutos genomas.[63]
Superenrollamiento
Estructura de moléculas de ADN lineales con los extremos fijos y superenrolladas. Por claridad, se ha omitido la estructura en hélice del ADN.
El ADN puede retorcerse como una cuerda en un proceso denominado:superenrollamiento de ADN. Cuando el ADN está en un estado «relajado», una hebra normalmente gira alrededor del eje de la doble hélice una vez cada 10.4 pares de bases, pero si el ADN está retorcido las hebras pueden estar unidas más estrechamente o más relajadamente.[64] Si el ADN está retorcido en la dirección de la hélice, se dice que el superenrollamiento es positivo, y las bases se mantienen juntas de forma más estrecha. Si el ADN se retuerce en la dirección opuesta, el superenrollamiento se llama negativo, y las bases se alejan. En la naturaleza, la mayor parte del ADN tiene un ligero superenrollamiento negativo que es producido porenzimas denominadastopoisomerasas.[65] Estas enzimas también son necesarias para liberar las fuerzas de torsión introducidas en las hebras de ADN durante procesos como latranscripción y lareplicación.[66]
La expresión de los genes está influenciada por la forma en la que el ADN está empaquetado en cromosomas, en una estructura denominadacromatina. Las modificaciones de bases pueden estar implicadas en el empaquetamiento del ADN: las regiones que presentan una expresión génica baja o nula normalmente contienen niveles altos demetilación de las basescitosina. Por ejemplo, la metilación de citosina produce 5‑metil‑citosina, que es importante para la inactivación delcromosoma X.[67] El nivel medio de metilación varía entre organismos: el gusanoCaenorhabditis elegans carece de metilación de citosina, mientras que losvertebrados presentan un nivel alto —hasta 1 %— de su ADN contiene 5‑metil‑citosina.[68] A pesar de la importancia de la 5‑metil‑citosina, esta puede desaminarse para generar una base timina. Las citosinas metiladas son por tanto particularmente sensibles amutaciones.[69] Otras modificaciones de bases incluyen la metilación deadenina enbacterias y laglicosilación deuracilo para producir la «base‑J» enkinetoplastos.[70][71]
Molécula debenzopireno, mutágeno presente por ejemplo en el humo deltabaco, ligada a una hélice de ADN.[72]
El ADN puede resultar dañado por muchos tipos demutágenos, que cambian la secuencia del ADN:agentes alquilantes, además deradiación electromagnética de alta energía, como luzultravioleta yrayos X. El tipo de daño producido en el ADN depende del tipo de mutágeno. Por ejemplo, la luz UV puede dañar al ADN produciendo dímeros detimina, que se forman por ligamiento cruzado entre basespirimidínicas.[73] Por otro lado, oxidantes tales comoradicales libres o elperóxido de hidrógeno producen múltiples daños, incluyendo modificaciones de bases, sobre todo guanina, y roturas de doble hebra (double‑strand breaks).[74] En una célula humana cualquiera, alrededor de 500 bases sufren daño oxidativo cada día.[75][76] De estas lesiones oxidativas, las más peligrosas son las roturas de doble hebra, ya que son difíciles de reparar y pueden producirmutaciones puntuales,inserciones ydeleciones de la secuencia de ADN, así comotranslocaciones cromosómicas.[77]
Muchos mutágenos se posicionan entre dos pares de bases adyacentes, por lo que se denominanagentes intercalantes. La mayoría de los agentes intercalantes son moléculasaromáticas y planas, como elbromuro de etidio, ladaunomicina, ladoxorubicina y latalidomida. Para que un agente intercalante pueda integrarse entre dos pares de bases, estas deben separarse, distorsionando las hebras de ADN y abriendo la doble hélice. Esto inhibe latranscripción y lareplicación del ADN, causando toxicidad y mutaciones. Por ello, los agentes intercalantes del ADN son a menudocarcinógenos: elbenzopireno, lasacridinas, laaflatoxina y elbromuro de etidio son ejemplos bien conocidos.[78][79][80] Sin embargo, debido a su capacidad para inhibir la replicación y la transcripción del ADN, estas toxinas también se utilizan enquimioterapia para inhibir el rápido crecimiento de las célulascancerosas.[81]
El daño en el ADN inicia una respuesta que activa diferentes mecanismos de reparación que reconocen lesiones específicas en el ADN, que son reparadas en el momento para recuperar la secuencia original del ADN. Asimismo, el daño en el ADN provoca una parada en elciclo celular, que conlleva la alteración de numerosos procesos fisiológicos, que a su vez implica síntesis, transporte y degradación de proteínas (véase tambiénCheckpoint de daños en el ADN). Alternativamente, si el daño genómico es demasiado grande para que pueda ser reparado, los mecanismos de control inducirán la activación de una serie de rutas celulares que culminarán en lamuerte celular.
Funciones biológicas
Las funciones biológicas del ADN incluyen el almacenamiento de información (genes y genoma), la codificación de proteínas (transcripción y traducción) y su autoduplicación (replicación del ADN) para asegurar la transmisión de la información a las células hijas durante la división celular.
El ADN se puede considerar como un almacén cuyo contenido es la información (mensaje) necesaria para construir y sostener el organismo en el que reside, la cual se transmite de generación en generación. El conjunto de información que cumple esta función en un organismo dado se denominagenoma, y el ADN que lo constituye, ADN genómico.
La información de ungenoma está contenida en losgenes, y al conjunto de toda la información que corresponde a un organismo se le denomina sugenotipo. Un gen es una unidad deherencia y es una región de ADN que influye en una característica particular de un organismo (como el color de los ojos, por ejemplo). Los genes contienen unmarco de lectura abierto que puede transcribirse, además desecuencias reguladoras, tales comopromotores yenhancers, que controlan la transcripción del marco de lectura abierto.
Desde este punto de vista, las «obreras» de este mecanismo son las proteínas. Estas pueden ser «estructurales», como las proteínas de losmúsculos,cartílagos, pelo, etc., o «funcionales», como lahemoglobina o las innumerablesenzimas del organismo. La función principal de la herencia es la especificación de las proteínas, siendo el ADN una especie de «plano» o «receta» para producirlas. La mayor parte de las veces la modificación del ADN provocará una disfunción proteica que dará lugar a la aparición de algunaenfermedad. Pero en determinadas ocasiones, las modificaciones podrán provocar cambios beneficiosos que darán lugar a individuos mejor adaptados a su entorno.
Las aproximadamente treinta mil proteínas diferentes en el cuerpo humano están constituidas por veinteaminoácidos diferentes, y una molécula de ADN debe especificar la secuencia en que se unen dichos aminoácidos.
En el proceso de elaborar una proteína, el ADN de un gen se lee y se transcribe aARN. Este ARN sirve como mensajero entre el ADN y lamaquinaria que elaborará las proteínas y por eso recibe el nombre deARN mensajero o ARNm. El ARN mensajero sirve de molde a la maquinaria que elabora las proteínas, para que ensamble los aminoácidos en el orden preciso paraarmar la proteína.
Eldogma central de la biología molecular establecía que el flujo de actividad y de información era: ADN → ARN → proteína. No obstante, en la actualidad ha quedado demostrado que este «dogma» debe ser ampliado, pues se han encontrado otros flujos de información: en algunos organismos (virus de ARN) la información fluye de ARN a ADN; este proceso se conoce como «transcripción inversa o reversa», también llamada «retrotranscripción». Además, se sabe que existen secuencias de ADN que se transcriben a ARN y son funcionales como tales, sin llegar a traducirse nunca a proteína: son losARN no codificantes, como es el caso de losARN interferentes.[39][40]
ADN no codificante
El ADN del genoma de un ser vivo puede dividirse conceptualmente en dos: el que codifica las proteínas (los genes) y el que no codifica. En muchasespecies, solo una pequeña fracción delgenoma codifica proteínas. Por ejemplo, solo alrededor del 1.5 % del genoma humano consiste enexones que codifican proteínas (20 000 a 25 000 genes), mientras que más del 90 % consiste en ADN no codificante.[84]
ElADN no codificante (también denominadoADN basura) corresponde a secuencias del genoma que no generan una proteína (procedentes de transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.), incluyendo losintrones. Hasta hace poco tiempo se pensaba que el ADN no codificante no tenía utilidad alguna, pero estudios recientes indican que eso es inexacto. Entre otras funciones, se postula que el llamado «ADN basura» regula laexpresión diferencial de los genes.[85] Por ejemplo, algunas secuencias tienen afinidad hacia proteínas especiales que tienen la capacidad de unirse al ADN (como loshomeodominios, los complejos receptores de hormonas esteroides, etc.), con un papel importante en el control de los mecanismos de trascripción y replicación. Estas secuencias se llaman frecuentemente «secuencias reguladoras», y los investigadores suponen que solo se ha identificado una pequeña fracción de las que realmente existen. La presencia de tanto ADN no codificante en genomas eucarióticos y las diferencias en tamaño del genoma entre especies representan un misterio que es conocido como el «enigma del valor de C».[86] Los elementos repetitivos también son elementos funcionales. Si no se considerasen así, se excluiría más del 50 % de los nucleótidos totales, ya que constituyen elementos de repetición.
Recientemente, un grupo de investigadores de laUniversidad de Yale ha descubierto una secuencia de ADN no codificante que sería la responsable de que los seres humanos hayan desarrollado la capacidad de agarrar y/o manipular objetos o herramientas.[87]
Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los cromosomas: lostelómeros ycentrómeros contienen pocos o ningún gen codificante de proteínas, pero son importantes para estabilizar la estructura de los cromosomas. Algunos genes no codifican proteínas, pero sí se transcriben en ARN:ARN ribosómico,ARN de transferencia yARN de interferencia (ARNi, que son ARN que bloquean la expresión de genes específicos). La estructura de intrones y exones de algunos genes (como los deinmunoglobulinas yprotocadherinas) son importantes por permitir loscortes y empalmes alternativos del pre‑ARN mensajero que hacen posible la síntesis de diferentes proteínas a partir de un mismo gen (sin esta capacidad no existiría el sistema inmune, por ejemplo). Algunas secuencias de ADN no codificante representanpseudogenes que tienen valor evolutivo, ya que permiten la creación de nuevos genes con nuevas funciones.[40] Otros ADN no codificantes proceden de la duplicación de pequeñas regiones del ADN; esto tiene mucha utilidad, ya que el rastreo de estas secuencias repetitivas permite estudios defilogenia.
En ungen, la secuencia de nucleótidos a lo largo de una hebra de ADN setranscribe a unARN mensajero (ARNm) y esta secuencia a su vez setraduce a unaproteína que un organismo es capaz de sintetizar o «expresar» en uno o varios momentos de su vida, usando la información de dicha secuencia.
La relación entre la secuencia de nucleótidos y la secuencia deaminoácidos de la proteína viene determinada por elcódigo genético, que se utiliza durante el proceso de traducción osíntesis de proteínas. La unidad codificadora del código genético es un grupo de tres nucleótidos (triplete), representado por las tres letras iniciales de las bases nitrogenadas (por ej., ACT, CAG, TTT). Los tripletes del ADN se transcriben en sus bases complementarias en el ARN mensajero, y en este caso los tripletes se denominancodones (para el ejemplo anterior, UGA, GUC, AAA). En el ribosoma cada codón del ARN mensajero interacciona con una molécula deARN de transferencia (ARNt) que contenga el triplete complementario, denominado anticodón. Cada ARNt porta el aminoácido correspondiente al codón de acuerdo con elcódigo genético, de modo que el ribosoma va uniendo los aminoácidos para formar una nueva proteína de acuerdo con las «instrucciones» de la secuencia del ARNm. Existen 64 codones posibles, por lo cual corresponde más de uno para cada aminoácido (por esta duplicidad de codones se dice que el código genético es un código degenerado: no es unívoco); algunos codones indican la terminación de la síntesis, el fin de la secuencia codificante; estos «codones de terminación» o «codones de parada» son UAA, UGA y UAG.[39]
La replicación del ADN es el proceso por el cual se obtienen copias o réplicas idénticas de una molécula de ADN. La replicación es fundamental para la transferencia de la información genética de una generación a la siguiente y, por ende, es la base de laherencia. El mecanismo consiste esencialmente en la separación de las dos hebras de la doble hélice, las cuales sirven de molde para la posterior síntesis de cadenas complementarias a cada una de ellas, que llevará por nombre ARNm. El resultado final son dos moléculas idénticas a la original. Este tipo de replicación se denomina «semiconservativa» debido a que cada una de las dos moléculas resultantes de la duplicación presenta una cadena procedente de la molécula «madre» y otra recién sintetizada.
Hipótesis sobre la duplicación del ADN
En un principio, se propusieron tres hipótesis:
Semiconservativa: Según el experimento de Meselson-Stahl, cada hebra sirve de molde para que se forme una hebra nueva, mediante la complementariedad de bases, quedando al final dos dobles hélices formadas por una hebra antigua (molde) y una nueva hebra (copia).
Conservativa: Tras la duplicación quedarían las dos hebras antiguas juntas y, por otro lado, las dos hebras nuevas formando una doble hélice.
Dispersiva: Según esta hipótesis, las hebras resultantes estarían formadas por fragmentos en doble hélice ADN antiguo y ADN recién sintetizado.
Interacciones ADN-proteína
Todas las funciones del ADN dependen de sus interacciones con proteínas. Estas interacciones pueden ser inespecíficas, o bien la proteína puede unirse de forma específica a una única secuencia de ADN. También pueden unirse enzimas, entre las cuales son particularmente importantes las polimerasas, que copian las secuencia de bases del ADN durante la transcripción y la replicación.
Proteínas que unen ADN
Interacciones inespecíficas
Interacción de ADN conhistonas (en blanco, arriba). Los aminoácidos básicos de estas proteínas (abajo a la izquierda, en azul) se unen a los grupos ácidos de los fosfatos del ADN (abajo a la derecha, en rojo).
Las proteínas estructurales que se unen al ADN son ejemplos bien conocidos de interacciones inespecíficas ADN-proteínas. En los cromosomas, el ADN se encuentra formando complejos con proteínas estructurales. Estas proteínas organizan el ADN en una estructura compacta denominadacromatina. Eneucariotas esta estructura implica la unión del ADN a un complejo formado por pequeñas proteínas básicas denominadashistonas, mientras que enprocariotas están involucradas una gran variedad de proteínas.[88][89] Las histonas forman un complejo de forma cilíndrica denominadonucleosoma, en torno al cual se enrollan casi dos vueltas de ADN de doble hélice. Estas interacciones inespecíficas quedan determinadas por la existencia de residuos básicos en las histonas, que formanenlaces iónicos con el esqueleto de azúcar-fosfato del ADN y, por tanto, son en gran parte independientes de la secuencia de bases.[90] Estos aminoácidos básicos experimentan modificaciones químicas demetilación,fosforilación yacetilación,[91] que alteran la fuerza de la interacción entre el ADN y las histonas, haciendo al ADN más o menos accesible a losfactores de transcripción y por tanto modificando la tasa de transcripción.[92]
Otras proteínas que se unen a ADN de manera inespecífica en la cromatina incluyen lasproteínas del grupo de alta movilidad (HMG,High Mobility Group) que se unen a ADN plegado o distorsionado.[93] Estas proteínas son importantes durante el plegamiento de los nucleosomas, organizándolos en estructuras más complejas para constituir los cromosomas[94] durante el proceso decondensación cromosómica. Se ha propuesto que en este proceso también intervendrían otras proteínas, formando una especie de «andamio» sobre el cual se organiza la cromatina; los componentes principales de esta estructura serían: la enzimatopoisomerasa II α (topoIIalpha) y lacondensina 13S.[95] Sin embargo, el papel estructural de latopoIIalpha en la organización de los cromosomas aún es discutido, ya que otros grupos argumentan que esta enzima se intercambia rápidamente tanto en los brazos cromosómicos como en loscinetocoros durante lamitosis.[96]
Interacciones específicas
Un grupo bien definido de proteínas que unen ADN es el conformado por las proteínas que se unen específicamente aADN monocatenario oADN de hebra sencilla (ssDNA). En humanos, la proteína A de replicación es la mejor conocida de su familia y actúa en procesos en los que la doble hélice se separa, como lareplicación del ADN, larecombinación o lareparación del ADN.[97] Estas proteínas parecen estabilizar el ADN monocatenario, protegiéndolo para evitar que forme estructuras de tallo-lazo(stem-loop) o que sea degradado pornucleasas.
El factor de transcripción represor delfago lambda unido a su ADN diana mediante un motivo hélice-giro-hélice(helix-turn-helix).[98]
Sin embargo, otras proteínas han evolucionado para unirse específicamente a secuencias particulares de ADN. La especificidad de la interacción de las proteínas con el ADN procede de los múltiples contactos con las bases de ADN, lo que les permite «leer» la secuencia del ADN. La mayoría de esas interacciones con las bases ocurre en lahendidura mayor, donde las bases son más accesibles.[99]
Las proteínas específicas estudiadas con mayor detalle son las encargadas de regular la transcripción, denominadas por ellofactores de transcripción. Cada factor de transcripción se une a una secuencia concreta de ADN y activa o inhibe la transcripción de los genes que presentan estas secuencias próximas a sus promotores. Los factores de transcripción pueden efectuar esto de dos formas:
En primer lugar, pueden unirse a la polimerasa de ARN responsable de la transcripción, bien directamente o a través de otras proteínas mediadoras. De esta forma. se estabiliza la unión entre la ARN polimerasa y el promotor, lo que permite el inicio de la transcripción.[100]
En segundo lugar, los factores de transcripción pueden unirse aenzimas que modifican las histonas del promotor, lo que altera la accesibilidad del molde de ADN a la ARN polimerasa.[101]
Como los ADN diana pueden encontrarse por todo elgenoma del organismo, los cambios en la actividad de un tipo de factor de transcripción pueden afectar a miles de genes.[102] En consecuencia, estas proteínas son frecuentemente las dianas de los procesos detransducción de señales que controlan las respuestas a cambios ambientales o diferenciación y desarrollo celular.
Lasnucleasas sonenzimas que cortan las hebras de ADN mediante lacatálisis de lahidrólisis de losenlaces fosfodiéster. Las nucleasas que hidrolizannucleótidos a partir de los extremos de las hebras de ADN se denominanexonucleasas, mientras que lasendonucleasas cortan en el interior de las hebras. Las nucleasas que se utilizan con mayor frecuencia enbiología molecular son lasenzimas de restricción, endonucleasas que cortan el ADN por determinadas secuencias específicas. Por ejemplo, la enzimaEcoRV, que se muestra a la izquierda, reconoce la secuencia de 6 bases 5′‑GAT|ATC‑3′, y hace un corte en ambas hebras en la línea vertical indicada, generando dos moléculas de ADN con los extremos romos. Otras enzimas de restricción generan, sin embargo, extremos cohesivos, ya que cortan de forma diferente las dos hebras de ADN. En la naturaleza, estas enzimas protegen a lasbacterias contra las infecciones defagos, al digerir el ADN de dicho fago cuando entra a través de la pared bacteriana, actuando como un mecanismo de defensa.[104] Enbiotecnología, estas nucleasas específicas de la secuencias de ADN se utilizan eningeniería genética paraclonar fragmentos de ADN y en la técnica dehuella genética.
Las enzimas denominadasADN ligasas pueden reunir hebras de ADN cortadas o rotas.[105] Las ligasas son particularmente importantes en lareplicación de la hebra que sufre replicación discontinua en el ADN, ya que unen los fragmentos cortos de ADN generados en lahorquilla de replicación para formar una copia completa del molde de ADN. También se utilizan en lareparación del ADN y en procesos derecombinación genética.[105]
Topoisomerasas y helicasas
Lastopoisomerasas son enzimas que poseen a la vez actividad nucleasa y ligasa. Estas proteínas varían la cantidad deADN superenrollado. Algunas de estas enzimas funcionan cortando la hélice de ADN y permitiendo que una sección rote, de manera que reducen el grado de superenrollamiento. Una vez hecho esto, la enzima vuelve a unir los fragmentos de ADN.[65] Otros tipos de enzimas son capaces de cortar una hélice de ADN y luego pasar la segunda hebra de ADN a través de la rotura, antes de reunir las hélices.[106] Las topoisomerasas son necesarias para muchos procesos en los que interviene el ADN, como lareplicación del ADN y latranscripción.[66]
Lashelicasas son unas proteínas que pertenecen al grupo de losmotores moleculares. Utilizan energía química almacenada en los nucleósidos trifosfatos, fundamentalmenteATP, para romper puentes de hidrógeno entre bases y separar la hélice doble de ADN en hebras simples.[107] Estas enzimas son esenciales para la mayoría de los procesos en los que las enzimas necesitan acceder a las bases del ADN.
Polimerasas
Laspolimerasas sonenzimas que sintetizan cadenas de nucleótidos a partir de nucleósidos trifosfatos. La secuencia de sus productos son copias de cadenas de polinucleótidos existentes, que se denominanmoldes. Estas enzimas funcionan añadiendo nucleótidos al grupohidroxilo en 3' del nucleótido previo en una hebra de ADN. En consecuencia, todas las polimerasas funcionan en dirección 5′ → 3′.[108] En lossitios activos de estas enzimas, el nucleósido trifosfato que se incorpora aparea su base con la correspondiente en el molde: esto permite que la polimerasa sintentice de forma precisa la hebra complementaria al molde.
Las polimerasas se clasifican de acuerdo al tipo de molde que utilizan:
En lareplicación del ADN, unaADN polimerasa dependiente de ADN realiza una copia de ADN a partir de una secuencia de ADN. La precisión es vital en este proceso, por lo que muchas de estas polimerasas tienen una actividad de verificación de la lectura (proofreading). Mediante esta actividad, la polimerasa reconoce errores ocasionales en la reacción de síntesis, debido a la falta de apareamiento entre el nucleótido erróneo y el molde, lo que genera un desacoplamiento (mismatch). Si se detecta un desacoplamiento, se activa una actividadexonucleasa en dirección 3′ → 5′ y la base incorrecta se elimina.[109] En la mayoría de los seres vivos las ADN polimerasas funcionan en un gran complejo denominadoreplisoma, que contiene múltiples unidades accesorias, comohelicasas.[110]
LasADN polimerasas dependientes de ARN son una clase especializada de polimerasas que copian la secuencia de una hebra de ARN en ADN. Incluyen latranscriptasa inversa, que es una enzimaviral implicada en la infección de células porretrovirus, y latelomerasa, que es necesaria para la replicación de los telómeros.[111][49] La telomerasa es una polimerasa inusual, porque contiene su propio molde de ARN como parte de su estructura.[50]
Latranscripción se lleva a cabo por unaARN polimerasa dependiente de ADN que copia la secuencia de una de las hebras de ADN en ARN. Para empezar a transcribir un gen, la ARN polimerasa se une a una secuencia del ADN denominadapromotor, y separa las hebras del ADN. Entonces copia la secuencia del gen en un transcrito deARN mensajero hasta que alcanza una región de ADN denominadaterminador, donde se detiene y se separa del ADN. Como ocurre con las ADN polimerasas dependientes de ADN en humanos, la ARN polimerasa II (la enzima que transcribe la mayoría de los genes del genoma humano) funciona como un gran complejo multiproteico que contiene múltiples subunidades reguladoras y accesorias.[112]
La recombinación implica la rotura y reunión de dos cromosomas homólogos (M y F) para producir dos cromosomas nuevos reorganizados (C1 y C2).
Una hélice de ADN normalmente no interacciona con otros segmentos de ADN, y en las células humanas los diferentes cromosomas incluso ocupan áreas separadas en elnúcleo celular denominadas «territorios cromosómicos».[114] La separación física de los diferentes cromosomas es importante para que el ADN mantenga su capacidad de funcionar como un almacén estable de información. Uno de los pocos momentos en los que los cromosomas interaccionan es durante elsobrecruzamiento cromosómico (chromosomal crossover), durante el cual serecombinan. El sobrecruzamiento cromosómico ocurre cuando dos hélices de ADN se rompen, se intercambian y se unen de nuevo.
La recombinación permite a los cromosomas intercambiar información genética y produce nuevas combinaciones de genes, lo que aumenta la eficiencia de laselección natural y puede ser importante en la evolución rápida de nuevas proteínas.[115] Durante la profase I de lameiosis, una vez que los cromosomas homólogos están perfectamente apareados formando estructuras llamadas bivalentes, se produce el fenómeno de sobrecruzamiento o entrecruzamiento(crossing-over), en el cual las cromátidas homólogas no hermanas (procedentes del padre y de la madre) intercambian material genético. La recombinación genética resultante hace aumentar en gran medida la variación genética entre la descendencia de progenitores que se reproducen por vía sexual. La recombinación genética también puede estar implicada en lareparación del ADN, en particular en la respuesta celular a las roturas de doble hebra(double-strand breaks).[116]
La forma más frecuente de sobrecruzamiento cromosómico es larecombinación homóloga, en la que los dos cromosomas implicados comparten secuencias muy similares. La recombinación no-homóloga puede ser dañina para las células, ya que puede producirtranslocaciones cromosómicas y anomalías genéticas. La reacción de recombinación está catalizada por enzimas conocidas comorecombinasas, tales comoRAD51.[117] El primer paso en el proceso de recombinación es una rotura de doble hebra, causada bien por una endonucleasa o por daño en el ADN.[118] Posteriormente, una serie de pasos catalizados en parte por la recombinasa, conducen a la unión de las dos hélices formando al menos unaunión de Holliday, en la que un segmento de una hebra simple es anillado con la hebra complementaria en la otra hélice. La unión de Holliday es una estructura de unión tetrahédrica que puede moverse a lo largo del par de cromosomas, intercambiando una hebra por otra. La reacción de recombinación se detiene por el corte de la unión y la reunión de los segmentos de ADN liberados.[119]
El ADN contiene la información genética que permite a la mayoría de los seres vivientes funcionar, crecer y reproducirse. Sin embargo, no está claro durante cuánto tiempo ha ejercido esta función en los ~3000 millones de años de lahistoria de la vida, ya que se ha propuesto que las formas de vida más tempranas podrían haber utilizadoARN como material genético.[120][121] El ARN podría haber funcionado como la parte central de un metabolismo primigenio, ya que puede transmitir información genética y simultáneamente actuar comocatalizador formando parte de lasribozimas.[122] Este antiguoMundo de ARN donde los ácidos nucleicos funcionarían como catalizadores y como almacenes de información genética podría haber influido en laevolución delcódigo genético actual, basado en cuatronucleótidos. Esto se debería a que el número de bases únicas en un organismo es un compromiso entre un número pequeño de bases (lo que aumentaría la precisión de la replicación) y un número grande de bases (que a su vez aumentaría la eficiencia catalítica de las ribozimas).[123]
Desafortunadamente, no se cuenta con evidencia directa de los sistemas genéticos ancestrales porque la recuperación del ADN a partir de la mayor parte de los fósiles es imposible. Esto se debe a que el ADN es capaz de sobrevivir en el medio ambiente durante menos de un millón de años, y luego empieza a degradarse lentamente en fragmentos de menor tamaño en solución.[124] Algunas investigaciones pretenden que se ha obtenido ADN más antiguo, por ejemplo un informe sobre el aislamiento de una bacteria viable a partir de un cristal salino de 250 millones de años de antigüedad,[125] pero estos datos son controvertidos.[126][127]
Sin embargo, pueden utilizarse herramientas de evolución molecular para inferir los genomas de organismos ancestrales a partir de organismos contemporáneos.[128][129] En muchos casos, estas inferencias son suficientemente fiables, de manera que una biomolécula codificada en un genoma ancestral puede resucitarse en el laboratorio para ser estudiada hoy.[130][131] Una vez que la biomolécula ancestral se ha resucitado, sus propiedades pueden ofrecer inferencias sobre ambientes y estilos de vida primigenios. Este proceso se relaciona con el campo emergente de lapaleogenética experimental.[132]
A pesar de todo, el proceso de trabajohacia atrás desde el presente tiene limitaciones inherentes, razón por la cual otros investigadores tratan de elucidar el mecanismo evolutivo trabajando desde el origen de la Tierra en adelante. Dada suficiente información sobre la química en el cosmos, la manera en la que las sustancias cósmicas podrían haberse depositado en la Tierra, y las transformaciones que podrían haber tenido lugar en la superficie terrestre primigenia, tal vez podríamos ser capaces de aprender sobre los orígenes para desarrollar modelos de evolución ulterior de la información genética[133] (véase también el artículo sobre elorigen de la vida).
Técnicas comunes
El conocimiento de la estructura del ADN ha permitido el desarrollo de multitud de herramientas tecnológicas que explotan sus propiedades fisicoquímicas para analizar su implicación en problemas concretos: por ejemplo, desdeanálisis filogeńeticos para detectar similitudes entre diferentestaxones, a la caracterización de la variabilidad individual de un paciente en su respuesta a un determinadofármaco, pasando por un enfoque global, a nivelgenómico, de cualquier característica específica en un grupo de individuos de interés.[134]
Podemos clasificar las metodologías de análisis del ADN en aquellas que buscan su multiplicación, yain vivo, como lareacción en cadena de la polimerasa (PCR), yain vitro, como laclonación, y aquellas que explotan las propiedades específicas de elementos concretos, o de genomas adecuadamente clonados. Es el caso de la secuenciación de ADN y de la hibridación con sondas específicas (Southern blot ychips de ADN).
La tecnología del ADN recombinante, piedra angular de laingeniería genética, permite propagar grandes cantidades de un fragmento de ADN de interés, el cual se dice que ha sido clonado. Para ello, debe introducirse dicho fragmento en otro elemento de ADN, generalmente unplásmido, que posee en su secuencia los elementos necesarios para que la maquinaria celular de un hospedador, normalmenteEscherichia coli, lo replique. De este modo, una veztransformada la cepa bacteriana, el fragmento de ADN clonado se reproduce cada vez que aquella se divide.[135]
Para clonar la secuencia de ADN de interés, se empleanenzimas como herramientas de corte y empalme del fragmento y del vector (el plásmido). Dichas enzimas corresponden a dos grupos: en primer lugar, lasenzimas de restricción, que poseen la capacidad de reconocer y cortar secuencias específicas; en segundo lugar, laADN ligasa, que establece unenlace covalente entre extremos de ADN compatibles[134] (ver secciónNucleasas y ligasas).
La secuenciación del ADN consiste en dilucidar el orden de losnucleótidos de un polímero de ADN de cualquier longitud, si bien suele dirigirse hacia la determinación degenomas completos, debido a que las técnicas actuales permiten realizar esta secuenciación a gran velocidad, lo cual ha sido de gran importancia para proyectos de secuenciación a gran escala como elProyecto Genoma Humano. Otros proyectos relacionados, en ocasiones fruto de la colaboración de científicos a escala mundial, han establecido la secuencia completa del ADN de muchosgenomas deanimales,plantas ymicroorganismos.
El método de secuenciación deSanger ha sido el más empleado durante el siglo XX. Se basa en la síntesis de ADN en presencia dedidesoxinucleósidos, compuestos que, a diferencia de los desoxinucleósidos normales (dNTPs), carecen de un grupo hidroxilo en su extremo 3'. Aunque los didesoxinucleótidos trifosfatados (ddNTPs) pueden incorporarse a la cadena en síntesis, la carencia de un extremo 3'‑OH imposibilita la generación de un nuevo enlace fosfodiéster con el nucleósido siguiente; por tanto, provocan la terminación de la síntesis. Por esta razón, el método de secuenciación también se denomina «de terminación de cadena». La reacción se realiza usualmente preparando un tubo con el ADN molde, la polimerasa, un cebador, dNTPs convencionales y una pequeña cantidad de ddNTPs marcados fluorescentemente en su base nitrogenada. De este modo, el ddTTP puede ir marcado en azul, el ddATP en rojo, etc. Durante la polimerización, se van truncando las cadenas crecientes, al azar, en distintas posiciones. Por tanto, se produce una serie de productos de distinto tamaño, coincidiendo la posición de la terminación debido a la incorporación del ddNTP correspondiente. Una vez terminada la reacción, es posible correr la mezcla en unaelectroforesis capilar (que resuelve todos los fragmentos según su longitud) en la cual se lee la fluorescencia para cada posición del polímero. En nuestro ejemplo, la lectura azul‑rojo‑azul‑azul se traduciría como TATT.[136][137]
La reacción en cadena de la polimerasa, habitualmente conocida como PCR por sus siglas en inglés, es una técnica debiología molecular descrita en 1986 porKary Mullis,[138] cuyo objetivo es obtener un gran número de copias de un fragmento deADN dado, partiendo de una escasa cantidad de aquel. Para ello, se emplea unaADN polimerasa termoestable que, en presencia de una mezcla de los cuatrodesoxinucleótidos, un tampón de la fuerza iónica adecuada y loscationes precisos para la actividad de la enzima, dos oligonucleótidos (denominados cebadores) complementarios aparte de la secuencia (situados a distancia suficiente y en sentido antiparalelo) y bajo unas condiciones de temperatura adecuadas, moduladas por un aparato denominadotermociclador, generaexponencialmente nuevos fragmentos de ADN semejantes al original y acotados por los dos cebadores.[135]
La PCR puede efectuarse como una técnica de punto final, esto es, como una herramienta de generación del ADN deseado, o como un método continuo, en el que se evalúe dicha polimerización a tiempo real. Esta última variante es común en laPCR cuantitativa.[134]
El método de «hibridación Southern» oSouthern blot (el nombre original en elidioma inglés) permite la detección de una secuencia de ADN en una muestra compleja o no del ácido nucleico. Para ello, combina una separación mediantemasa ycarga (efectuada mediante unaelectroforesis en gel) con una hibridación con una sonda de ácido nucleico marcada de algún modo (ya sea conradiactividad o con un compuesto químico) que, tras varias reacciones, dé lugar a la aparición de una señal decolor ofluorescencia. Dicha hibridación se realiza tras la transferencia del ADN separado mediante la electroforesis a una membrana de filtro. Una técnica semejante, pero en la cual no se produce la mencionada separación electroforética se denominadot blot.
El método recibe su nombre en honor a su inventor, elbiólogo inglésEdwin Southern.[139] Por analogía al método Southern, se han desarrollado técnicas semejantes que permiten la detección de secuencias dadas de ARN (métodoNorthern, que emplea sondas de ARN o ADN marcadas)[140] o de proteínas específicas (técnicaWestern, basada en el uso deanticuerpos).[141]
Microarray con 37 500 oligonucleótidos específicos. Arriba a la izquierda se puede apreciar una región ampliada delchip.
Loschips de ADN son colecciones deoligonucleótidos de ADN complementario dispuestos en hileras fijadas sobre un soporte, frecuentemente de cristal. Se utilizan para el estudio de mutaciones de genes conocidos o para monitorizar la expresión génica de una preparación de ARN.
La investigación sobre el ADN tiene un impacto significativo, especialmente en el ámbito de lamedicina, pero también en agricultura y ganadería (donde los objetivos son los mismos que con las técnicas tradicionales que el hombre lleva utilizando desde hace milenios —la domesticación, la selección y los cruces dirigidos— para obtener variedades de animales y plantas más productivos). La moderna biología y bioquímica hacen uso intensivo de latecnología delADN recombinante, introduciendo genes de interés en seres vivos, con el objetivo de expresar una proteína recombinante concreta, que puede ser:
aislada para su uso posterior: por ejemplo, se pueden transformarmicroorganismos para convertirlos en auténticas fábricas que producen grandes cantidades de sustancias útiles, comoinsulina ovacunas, que posteriormente se aíslan y se utilizan terapéuticamente.[142][143][144]
necesaria para reemplazar la expresión de un gen endógeno dañado que ha dado lugar a una patología, lo que permitiría el restablecimiento de la actividad de la proteína perdida y finalmente la recuperación del estado fisiológico normal, no patológico. Este es el objetivo de laterapia génica, uno de los campos en los que se está trabajando activamente en medicina, analizando ventajas e inconvenientes de diferentes sistemas de administración del gen (virales y no virales) y los mecanismos de selección del punto de integración de los elementos genéticos (distintos para los virus y los transposones) en el genoma diana.[145] En este caso, antes de plantearse la posibilidad de realizar una terapia génica en una determinada patología, es fundamental comprender el impacto del gen de interés en el desarrollo de dicha patología, para lo cual es necesario el desarrollo de un modelo animal, eliminando o modificando dicho gen en un animal de laboratorio, mediante la técnicaknockout.[146] Solo en el caso de que los resultados en el modelo animal sean satisfactorios se procedería a analizar la posibilidad de restablecer el gen dañado mediante terapia génica.
utilizada para enriquecer un alimento: por ejemplo, la composición de la leche (una importante fuente de proteínas para el consumo humano y animal) puede modificarse mediante transgénesis, añadiendo genes exógenos y desactivando genes endógenos para mejorar su valor nutricional, reducir infecciones en las glándulas mamarias, proporcionar a los consumidores proteínas antipatógenas y preparar proteínas recombinantes para su uso farmacéutico.[147][148]
útil para mejorar la resistencia del organismo transformado: por ejemplo en plantas se pueden introducir genes que confieren resistencia a patógenos (virus, insectos, hongos…), así como a agentes estresantes abióticos (salinidad, sequedad, metales pesados…).[149][150][151]
Losmédicos forenses pueden utilizar el ADN presente en lasangre, elsemen, lapiel, lasaliva o elpelo en la escena de un crimen, para identificar al responsable. Esta técnica se denominahuella genética, o también «perfil de ADN». Al realizar la huella genética, se compara la longitud de secciones altamente variables de ADN repetitivo, como losmicrosatélites, entre personas diferentes. Este método es frecuentemente muy fiable para identificar a un criminal.[152] Sin embargo, la identificación puede complicarse si la escena está contaminada con ADN de personas diferentes.[153] La técnica de la huella genética fue desarrollada en 1984 por el genetista británicosirAlec Jeffreys,[154] y fue utilizada por primera vez en medicina forense para condenar aColin Pitchfork por los asesinatos deNarborough en 1983 y deEnderby en 1986.[155] Se puede requerir a las personas acusadas de ciertos tipos de crímenes que proporcionen una muestra de ADN para introducirlos en una base de datos. Esto ha facilitado la labor de los investigadores en la resolución de casos antiguos, donde solo se obtuvo una muestra de ADN de la escena del crimen, en algunos casos permitiendo exonerar a un convicto. La huella genética también puede utilizarse para identificar víctimas de accidentes en masa,[156] o para realizar pruebas de consanguinidad (prueba de paternidad).[157]
Labioinformática implica la manipulación, búsqueda yextracción de información de los datos de la secuencia del ADN. El desarrollo de las técnicas para almacenar y buscar secuencias de ADN ha generado avances en el desarrollo desoftware de los ordenadores, para muchas aplicaciones, especialmentealgoritmos de búsqueda de frases,aprendizaje automático y teorías debases de datos.[158] La búsqueda de frases o algoritmos de coincidencias, que buscan la ocurrencia de una secuencia de letras dentro de una secuencia de letras mayor, se desarrolló para buscar secuencias específicas de nucleótidos.[159] En otras aplicaciones comoeditores de textos, incluso algoritmos simples pueden funcionar, pero las secuencias de ADN pueden generar que estos algoritmos presenten un comportamiento de casi-el-peor-caso, debido al bajo número de caracteres. El problema relacionado delalineamiento de secuencias persigue identificar secuenciashomólogas y localizarmutaciones específicas que las diferencian. Estas técnicas, fundamentalmente elalineamiento múltiple de secuencias, se utilizan al estudiar las relacionesfilogenéticas y la función de las proteínas.[160] Las colecciones de datos que representan secuencias de ADN del tamaño de un genoma, tales como las producidas por elProyecto Genoma Humano, son difíciles de usar sin anotaciones, que marcan la localización de los genes y los elementos reguladores en cada cromosoma. Las regiones de ADN que tienen patrones asociados con genes que codifican proteínas —o ARN— pueden identificarse por algoritmos delocalización de genes, lo que permite a los investigadores predecir la presencia deproductos génicos específicos en un organismo incluso antes de que haya sido aislado experimentalmente.[161]
Nanotecnología de ADN
La estructura de ADN de la izquierda (mostrada de forma esquemática) se autoensambla en la estructura visualizada pormicroscopía de fuerza atómica a la derecha. Lananotecnología de ADN es el campo que busca diseñar estructuras a nanoescala utilizando las propiedades de reconocimiento molecular de las moléculas de ADN. Imagen de Strong, 2004.[5]
La nanotecnología de ADN utiliza las propiedades únicas de reconocimiento molecular del ADN y otros ácidos nucleicos para crear complejos ramificados autoensamblados con propiedades útiles. En este caso, el ADN se utiliza como un material estructural, más que como un portador de información biológica.[162] Esto ha conducido a la creación de láminas periódicas de dos dimensiones (ambas basadas en azulejos, así como usando el método deADN origami[163]), además de estructuras en tres dimensiones con forma depoliedros.
A lo largo del tiempo, el ADN almacena mutaciones que se heredan y, por tanto, contiene información histórica, de manera que comparando secuencias de ADN, los genetistas pueden inferir la historia evolutiva de los organismos, sufilogenia.[164] La investigación filogenética es una herramienta fundamental enbiología evolutiva. Si se comparan las secuencias de ADN dentro de una especie, losgenetistas de poblaciones pueden conocer la historia de poblaciones particulares. Esto se puede utilizar en una amplia variedad de estudios, desdeecología hastaantropología, como ilustra el análisis de ADN llevado a cabo para identificar las Diez Tribus Perdidas de Israel.[165][166] Por otro lado, el ADN también se utiliza para estudiar relaciones familiares recientes.
Igualmente enpaleontología (en lapaleogenética) el ADN en algunos casos también se puede utilizar para estudiar a especies extintas (ADN fósil).
La utilización del ADN como dispositivo de almacenamiento tiene un gran potencial dada su estabilidad, su bajo mantenimiento y su elevada densidad de almacenamiento, aunque también presenta algunas limitaciones como la vulnerabilidad de mutaciones y los altos tiempos de lectura y escritura.[167]
↑abDhanda, J. S.; Shyam, S. Chauhan (22-Feb-2008).«Structural Levels of Nucleic Acids and Sequencing.». En All India Institute of Medical Sciences, ed.Molecular Biology. (Department of Biochemistry edición). New Delhi – 110 029. Archivado desdeel original el 3 de marzo de 2014. Consultado el 7 de octubre de 2008.La referencia utiliza el parámetro obsoleto|coautores= (ayuda) (Revisado el 7 de octubre de 2008).
↑Astbury, W. (1947). «Nucleic acid».Symp. SOC. Exp. Bbl1 (66).
↑abWatson, J. D.; Baker, T. A.; Bell, S. P.; Gann, A.; Levine, M. y Losick, R (2006). «6. Las estructuras del DNA y el RNA».Biología Molecular del Gen (5ª Ed.) (Madrid: Médica Panamericana).ISBN84-7903-505-6.La referencia utiliza el parámetro obsoleto|coautores= (ayuda)
↑Douki, T., Reynaud-Angelin, A., Cadet, J., Sage, E. (2003). «Bipyrimidine photoproducts rather than oxidative lesions are the main type of DNA damage involved in the genotoxic effect of solar UVA radiation».Biochemistry42 (30): 9221-6.PMID12885257.doi:10.1021/bi034593c.,
↑Cadet, J., Delatour, T., Douki, T., Gasparutto, D., Pouget, J., Ravanat, J., Sauvaigo, S. (1999). «Hydroxyl radicals and DNA base damage».Mutat Res424 (1-2): 9-21.PMID10064846.
↑Valerie, K., Povirk, L. (2003). «Regulation and mechanisms of mammalian double-strand break repair».Oncogene22 (37): 5792-812.PMID12947387.doi:10.1038/sj.onc.1206679.
↑Braña, M., Cacho, M., Gradillas, A., de Pascual-Teresa, B., Ramos, A. (2001). «Intercalators as anticancer drugs».Curr Pharm Des7 (17): 1745-80.PMID11562309.doi:10.2174/1381612013397113.
↑Thanbichler, M., Wang, S., Shapiro, L. (2005). «The bacterial nucleoid: a highly organized and dynamic structure».J Cell Biochem96 (3): 506-21.PMID15988757.doi:10.1002/jcb.20519.
↑Dame, R. T. (2005). «The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin».Mol. Microbiol.56 (4): 858-70.PMID15853876.doi:10.1111/j.1365-2958.2005.04598.x.
↑Iftode, C., Daniely, Y., Borowiec, J. (1999). «Replication protein A (RPA): the eukaryotic SSB».Crit Rev Biochem Mol Biol34 (3): 141-80.PMID10473346.doi:10.1080/10409239991209255.
↑Spiegelman, B., Heinrich, R. (2004). «Biological control through regulated transcriptional coactivators».Cell119 (2): 157-67.PMID15479634.doi:10.1016/j.cell.2004.09.037.
↑Schoeffler, A., Berger, J. (2005). «Recent advances in understanding structure-function relationships in the type II topoisomerase mechanism».Biochem Soc Trans33 (Pt 6): 1465-70.PMID16246147.doi:10.1042/BST20051465.
↑Cremer, T., Cremer, C. (2001). «Chromosome territories, nuclear architecture and gene regulation in mammalian cells».Nat Rev Genet2 (4): 292-301.PMID11283701.doi:10.1038/35066075.
↑Pál, C., Papp, B., Lercher, M. (2006). «An integrated view of protein evolution».Nat Rev Genet7 (5): 337-48.PMID16619049.doi:10.1038/nrg1838.
↑O'Driscoll, M., Jeggo, P. (2006). «The role of double-strand break repair - insights from human genetics».Nat Rev Genet7 (1): 45-54.PMID16369571.doi:10.1038/nrg1746.
↑Birnbaum, D., Coulier, F., Pébusque, M. J., Pontarotti, P. (2000). «“Paleogenomics”: looking in the past to the future».J Exp Zool.288 ((1):).21-2.[1]
↑Blanchette, M., Green, E. D., Miller, W., Haussler, D. (2004). «Reconstructing large regions of an ancestral mammalian genome in silico».Genome Res.14 ((12):).2412-23. Erratum in: Genome Res. 2005 Mar;15(3):451.[2]
↑Brenner, S. A., Carrigan, M. A., Ricardo, A., Frye, F. (2006). «Setting the stage: the history, chemistry and geobiology behind RNA».The RNA World, 3rd Ed. Cold Spring Harbor Laboratory Press.ISBN0-87969-739-3.[3]Archivado el 10 de agosto de 2011 enWayback Machine.
↑abcGriffiths, J. F. A.et al. (2002).Genética. McGraw-Hill Interamericana.ISBN84-486-0368-0.
↑abWatson, J. D.; Baker, T. A.; Bell, S. P.; Gann, A.; Levine, M. y Losick, R. (2004).Molecular Biology of the Gene (Fifth edition edición). San Francisco: Benjamin Cummings.ISBN0-321-22368-3.La referencia utiliza el parámetro obsoleto|coautores= (ayuda)
↑Sanger, F., Coulson, A. R. «A rapid method for determining sequences in DNA by primed synthesis with DNA polymerase.»J Mol Biol. 1975 mayo 25;94(3):441-448.
↑Sanger, F., Nicklen, S., y Coulson, A. R., «DNA sequencing with chain-terminating inhibitors.»Proc Natl Acad Sci U S A, diciembre de 1977; 74(12): 5463-5467.
↑Southern, E. M. (1975): «Detection of specific sequences among DNA fragments separated by gel electrophoresis.»J Mol Biol., 98:503-517.PMID 1195397
↑Alwine, J. C., Kemp, D. J., Stark, G. R. (1977). «Method for detection of specific RNAs in agarose gels by transfer to diazobenzyloxymethyl-paper and hybridization with DNA probes».Proc. Natl. Acad. Sci. U.S.A.74 (12): 5350-4.PMID414220.doi:10.1073/pnas.74.12.5350.
↑Daniell, H., Dhingra, A. (2002). «Multigene engineering: dawn of an exciting new era in biotechnology».Curr Opin Biotechnol13 (2): 136-41.PMID11950565.doi:10.1016/S0958-1669(02)00297-5.
↑Jeffreys, A., Wilson, V., Thein, S. (1985). «Individual-specific 'fingerprints' of human DNA».Nature316 (6023): 76-9.PMID2989708.doi:10.1038/316076a0.
↑Mount, D. M. (2004).Bioinformatics: Sequence and Genome Analysis (2 edición). Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.ISBN0879697121.
Calladine, Chris R.; Drew, Horace R., Ben F. y Travers, Andrew A.Understanding DNA, Elsevier Academic Press, 2003.ISBN978-0-12-155089-9.
Clayton, Julie. (Ed.).50 Years of DNA, Palgrave MacMillan Press, 2003.ISBN978-1-4039-1479-8.
Judson, Horace Freeland.The Eighth Day of Creation: Makers of the Revolution in Biology, Cold Spring Harbor Laboratory Press, 1996.ISBN978-0-87969-478-4.
Olby, Robert.The Path to The Double Helix: Discovery of DNA (1974), MacMillan, con introducción de Francis Crick;ISBN978-0-486-68117-7.
Ridley, Matt.Francis Crick: Discoverer of the Genetic Code (Eminent Lives), HarperCollins Publishers; 192 pp.,ISBN978-0-06-082333-7. 2006.