Nota: "DNA" e "ADN" redirecionam para este artigo. Para significados adicionais, vejaDNA (desambiguação). Para outros significados, vejaADN (desambiguação).
Estrutura de um ADNAnimação de um ADN de dupla hélice
É umcompostoorgânico cujasmoléculas contêm as instruçõesgenéticas que coordenam o desenvolvimento e funcionamento de todos os seresvivos e algunsvírus, e que transmitem as característicashereditárias de cada ser vivo. A sua principal função é armazenar as informações necessárias para a construção dasproteínas deARNs. Os segmentos de ADN que contêm ainformação genética são denominadosgenes. O restante da sequência de ADN tem importância estrutural ou está envolvido na regulação do uso da informação genética.
Do ponto de vista químico, o ADN é um longopolímero de unidades simples (monômeros) denucleotídeos, cuja cadeia principal é formada por moléculas deaçúcares efosfato intercalados unidos porligações fosfodiéster. Ligada à molécula de açúcar está uma de quatrobases nitrogenadas mantidas juntas porforças hidrofóbicas.[2] A sequência de bases ao longo da molécula de ADN constitui a informação genética. A leitura destas sequências é feita por intermédio docódigo genético, que especifica a sequência linear dosaminoácidos das proteínas. A tradução é feita por umARN mensageiro que copia parte da cadeia de ADN por um processo chamadotranscrição e posteriormente a informação contida neste é "traduzida" em proteínas pelatradução. Embora a maioria do ARN produzido seja usado na síntese de proteínas, algum ARN tem função estrutural, como por exemplo oARN ribossômico, que faz parte da constituição dosribossomos.
Dentro dacélula, o ADN pode ser observado numa estrutura chamadacromossoma durante ametáfase. O conjunto de cromossomas de uma célula forma ocariótipo. Antes dadivisão celular os cromossomas são duplicados por meio de um processo chamadoreplicação.Eucariontes comoanimais,plantas,fungos eprotozoários têm o seu ADN dentro donúcleo enquantoprocariontes como asbactérias o têm disperso nocitoplasma. Dentro dos cromossomas, proteínas dacromatina como ashistonas compactam e organizam o ADN. Estas estruturas compactas guiam as interacções entre o ADN e outras proteínas, ajudando a controlar que partes do ADN são transcritas.
O ADN é um longopolímero formado por unidades repetidas chamadasnucleotídeos.[3][4]A cadeia de ADN tem 2,2 a 2,4nanómetros de largura, e um nucleotídeo possui aproximadamente 0,33 nanómetros de comprimento.[5] Embora os monômeros (nucleotídeos) que constituem o ADN sejam muito pequenos, os polímeros de ADN podem ser moléculas enormes, com milhões de nucleotídeos. Por exemplo, o maiorcromossomo humano (cromossomo 1), possui 220 milhões depares de bases de comprimento.[6] Uma molécula de ADN do ser humano possui aproximadamente dois metros de comprimento, encapsulada em um núcleo celular de 6 µm, o equivalente a acomodar uma linha de 40 km de comprimento em uma bola de tênis.[3]
Em organismos vivos, o ADN não existe como uma molécula única (cadeia simples), mas sim como um par de moléculas firmemente associadas.[7][8] As duas longas cadeias de ADN enrolam-se como uma trepadeira formando umadupla hélice. Os nucleotídeos estão presentes em ambas as cadeias da dupla hélice, unidos com nucleótidos da mesma cadeia por ligações fosfodiéster e à cadeia complementar por meio de pontes de hidrogénio formadas pelas suas bases. Em geral, uma base ligada a um açúcar é chamadanucleosídeo e uma base ligada a um açúcar e um ou mais fosfatos é chamada nucleotídeo. Portanto, o ADN pode ser referido como umpolinucleotídeo.[9]
Uma cadeia de ADN-B
A cadeia principal do ADN é formada porfosfato e resíduos deaçúcar, dispostos alternadamente. O açúcar no ADN é 2-desoxirribose, umapentose (açúcar com cincocarbonos). Os açúcares são unidos porgrupos fosfato que formamligações fosfodiester entre o terceiro e quinto átomos de carbono dos anéis de açúcar adjacentes. Estas ligações assimétricas significam que uma cadeia de ADN tem uma direção. Numa dupla hélice, a direção dos nucleotídeos de uma cadeia é oposta à direção dos nucleotídeos da outra cadeia. O formato das cadeia do ADN é designado antiparalelo. As terminações assimétricas das cadeias de ADN são designadas terminais5' (cinco linha) e3' (três linha). Uma das diferenças principais entre o ADN e o ARN encontra-se no açúcar, com a substituição da 2-desoxirribose no ADN pelaribose no ARN.[3]
A dupla hélice do ADN é estabilizada porpontes de hidrogênio entre as bases presas às duas cadeias. As quatro bases encontradas no ADN são aadenina (A),citosina (C),guanina (G) etimina (T). Estas quatro bases ligam-se ao açúcar/fosfato para formar o nucleotídeo completo.[3]
Estas bases são classificadas em dois tipos; a adenina e guanina sãocompostos heterocíclicos chamadospurinas, enquanto a citosina e timina sãopirimidinas. Uma quinta base (uma pirimidina) chamadauracila (U) aparece no ARN e substitui a timina, a uracila difere da timina pela falta de um grupo demetila no seu anel. A uracila normalmente não está presente no ADN, só ocorrendo como um produto da decomposição da citosina.[3] Exceções para esta regra são osfagos AR9, 3NT, I10, bem como o PBS1 (muito utilizado em pesquisas), que contém uracila no seu ADN, em vez de timina.[10]
No topo, pareamento GC com três pontes de hidrogênio. Em baixo, AT com duas pontes de hidrogênio.
Cada tipo de base numa cadeia forma uma ligação com apenas um tipo de base na outra cadeia. Este comportamento é designado decomplementariedade de bases. Assim, as purinas formam pontes de hidrogênio com pirimidinas, i.e. A liga-se com T e C com G. Este arranjo de dois nucleotídeos complementares na dupla hélice é chamadopar de bases. Além das pontes de hidrogênio entre as bases, as duas cadeias são mantidas juntas devido a forças geradas porinterações hidrofóbicas entre as basesempilhadas, a qual não é influenciada pela sequência do ADN.[11] Como as pontes de hidrogênio não sãoligações covalentes, podem ser quebradas e reunidas com relativa facilidade. Desta forma, as duas fitas da dupla hélice de ADN podem ser separadas como umzíper (fecho de correr) por força mecânica ou altas temperaturas.[12] Como resultado desta complementariedade, toda a informação contida numa das cadeias de ADN está também contida na outra, o que é fundamental para a replicação do ADN.[3]
Os dois tipos de pares de base formam diferentes números de pontes de hidrogênio: AT forma duas pontes de hidrogênio enquanto GC formam três pontes de hidrogênio. Desta forma a interação entre GC é mais forte que AT. Como resultado, a percentagem de GC numa dupla fita de ADN determina a força de interação entre as duas cadeias.[13] Uma parte da dupla cadeia de ADN que precisa de ser separada facilmente, tal como a TATAATCaixa de Pribnow nospromotores bacterianos, tende a ter sequências com maior predomínio de AT, para facilitar a abertura da dupla cadeia aquando da transcrição. No laboratório, a força desta interacção pode ser medida encontrando a temperatura necessária para quebrar as pontes de hidrogénio, atemperatura de desnaturação (também chamadoTm). Quando todos os pares de base numa dupla hélice de ADN quebram as suas ligações, as duas cadeias separam-se e existem em solução como duas moléculas completamente independentes. Estas moléculas de ADN de cadeia simples não têm uma única forma comum, mas algumas conformações são mais estáveis do que outras.[14]
O ADN normalmente encontra-se em forma de uma espiral dextrógira (gira para a direita, ou nosentido horário). Portanto, as duas cadeias de nucleotídeos giram uma sobre a outra e acabam por formar sulcos entre as cadeias de fosfato, deixando expostas as faces das bases nitrogenadas que não estão unidas por pontes de hidrogênio com a base complementar.[15]
Há dois tipos de sulcos na superfície da dupla hélice: um com 22 Å denominado sulco maior e um com 12 Å designado de sulco menor.[16]
A principal função dos sulcos do ADN é fornecer a informação acerca das bases que se encontram ligadas numa determinada região da dupla cadeia sem necessidade de abertura. O sulco maior oferece maior acessibilidade para ligação com proteínas do que o sulco menor. Um exemplo disto é aTBP (TATA-binding protein) uma importante proteína para a transcrição em eucariotas.[17]
Uma sequência de ADN é chamada desenso se possui a mesma sequência doARNm. A cadeia oposta (complementar) à cadeia "senso" é denominada sequênciaantissenso. Como aARN polimerase sintetiza um ARN que é complementar à fita molde, então podemos dizer que ela utiliza a cadeia anti-senso como molde para produzir um ARN. As sequências senso e anti-senso podem existir em diferentes partes da mesma cadeia de ADN, que pode ser de um lado ou do outro, dependendo de onde se encontra a sequência codificadora.
Às vezes não é possível dizer qual é a cadeia senso ou antissenso. Isto acontece devido à existência de genes que se sobrepõem. Neste caso ambas as cadeias dão origem a um ARN.[18]Nasbactérias, a sobreposição pode estar envolvida da regulação da transcrição.[19]
Nos vírus, a sobreposição aumenta a capacidade do armazenamento de informações em pequenos genomas virais.[20]
O ADN pode ser torcido num processo denominado superenrolamento. No estadorelaxado do ADN, uma fita normalmente dá uma volta completa ao eixo da dupla hélice a cada 10,4 pares de base, mas se o ADN está torcido, as cadeias ficam mais ou menos enroladas.[21]
Se o ADN está torcido na direção da hélice, é denominado umsuperenrolamento positivo e as bases estão unidas mais firmemente. Já osuperenrolamento negativo refere-se a uma torção na direção oposta, resultando numafrouxamento das bases. Na natureza, o ADN apresenta um ligeiro superenrolamento negativo que é causado pela ação daenzimatopoisomerase.[22]
Estas enzimas também são necessárias para aliviar o estresse de torção causado no ADN durante os processos detranscrição ereplicação.[23]
Da direita para a esquerda, a estrutura do ADN A, B e Z
O ADN pode existir em muitas formações diferentes. As formações mais comuns são:ADN-A, ADN-B, ADN-C, ADN-D,[24] ADN-E,[25] ADN-H,[26] ADN-L,[24] ADN-P,[27] e ADN-Z.[28]
Porém, só as formações de ADN A, B e Z foram encontradas em sistemas biológicos naturais. A formação que o ADN adopta depende de vários fatores da própria sequência de ADN: a intensidade e direção do superenrolamento, modificações químicas das bases e a solução na qual o ADN está presente (ex.: concentração demetais,iões epoliaminas).[29]
Das três formações referidas, a forma “B” é a mais comum nas condições encontradas nas células.[30]
A forma “A” corresponde à espiral dextra mais larga, com um sulco menor largo e superficial e um sulco maior estreito e profundo. A forma “A” ocorre sob condições não fisiológicas em amostras de ADN desidratadas, enquanto na célula pode ser produzida por pareamento híbrido de ADN e ARN ou pelo complexo enzima-ADN.[31][32]
Em segmentos de ADN onde as bases foram quimicamente modificadas pormetilação, o ADN pode sofrer uma grande modificação na sua formação e adoptar a forma ADN-Z. A cadeia gira sobre o eixo da dupla hélice para a esquerda, o oposto da forma mais comum – ADN-B.[33]
Esta estrutura é rara e pode ser reconhecida por proteínas especificas de ligação com o ADN-Z. Pode estar envolvida na regulação da transcrição.[34]
Estrutura de um quadrúplex de ADN formado por repetiçõesteloméricas. A conformação do esqueleto de ADN é diferente da típica estrutura helicoidal.[35]
Nas extremidades do cromossomas lineares estão zonas especializadas do ADN chamadastelómeros. A função principal destas regiões é permitir que a célula replique as extremidades do cromossoma usando a enzimatelomerase, porque enzimas que permitem replicar ADN normalmente não conseguem copiar as extremidades 3' dos cromossomas.[36] Estas tampas de cromossoma especializadas também ajudam a proteger as extremidades do ADN, e evitam que o sistema dereparação de ADN elimine estas regiões como erros que precisassem de ser corrigidos.[37] Em células humanas, os telómeros têm normalmente vários milhares de repetições de uma sequência simples (TTAGGG).[38]
Estas sequências ricas em guanina podem estabilizar as extremidades dos cromossomas formando estruturas de unidades de quatro bases empilhadas, ao invés dos pares de base usuais encontrados em outras moléculas de ADN. Quatro bases de guanina formam uma placa chata e depois estas unidades chatas de quatro bases empilham-se no topo umas das outras, para formarem estruturasquadrúplex-G estáveis.[39] Estas estruturas são estabilizadas porpontes de hidrogénio entre as margens das bases e porquelação de um ião metálico no centro de cada unidade de quatro bases.[40] Outras estruturas podem também ser formadas, com o conjunto central de quatro bases provenientes de uma cadeia simples enrolada à volta das bases ou de diversas cadeias paralelas, cada uma contribuindo com uma base para a estrutura central.[41]
Além destas estruturas empilhadas, os telómeros também formam grandes estruturas em forma de laço chamadostelomere loops ouT-loops. O ADN de cadeia simples enrola-se à volta de um círculo grande estabilizado por proteínas que se ligam a telómeros.[42] Mesmo no fim dosT-loops, o ADN de cadeia simples do telómero é mantido sobre uma região de ADN de cadeia dupla pela cadeia do telómero que desestabiliza o ADN de dupla hélice e o emparelhamento de bases de uma das duas cadeias. Esta estrutura decadeia tripla é chamada de laço de deslocamento ouD-loop.[39]
A expressão de genes é influenciado pela maneira como o ADN está disposto nos cromossomas, numa estrutura chamadacromatina. As modificações de bases podem estar envolvidas na disposição, com as regiões quem tem expressão génica baixa ou inexistente contendo usualmente níveis elevados demetilação decitosina. Por exemplo, a metilação de citosina produz5-metilcitosina, que é importante nainactivação do cromossoma X.[43] O nível médio de metilação varia entre organismos - o vermeCaenorhabditis elegans tem pouca metilação da citosina, enquantovertebrados têm níveis mais elevados, com até 1% do seu ADN contendo 5-metilcitosina[44] Apesar da importância da 5-metilcitosina, esta podedesaminar transformando-se em timina. Citosinas metiladas são por isso especialmente susceptíveis de sofrermutações.[45] Outras modificações de bases incluem metilação de adeninas em bactérias eglicosilação do uracilo para produzir a "base-J" em organismos da classeKinetoplastida.[46][47]
Muitos mutagénios encaixam entre o espaço entre dois pares de bases adjacentes, na chamadaintercalação. A maioria dos intercaladores sãoaromáticos e moléculas planas e incluembrometo de etídio,daunomicina,doxorrubicina etalidomida. Para que um intercalador encaixe entre pares de bases, as bases têm de se separar, abrindo a cadeia dupla. Isto inibe a transcrição e a replicação do ADN, causando toxicidade e mutações. Como resultado, os intercaladores de ADN são muitas vezescarcinogénicos.Benzopireno,acridinas,aflatoxina e brometo de etídio são exemplos bem conhecidos.[54][55][56] No entanto, devido à sua capacidade de inibir a transcrição e replicação, estas toxinas também são usadas emquimioterapia para inibir o crescimento rápido de células tumorais.[57]
O ADN ocorre normalmente comocromossomas lineares em eucariotas e como cromossomas circulares em procariotas. O conjunto dos cromossomas numa célula perfazem o seugenoma; ogenoma humano tem aproximadamente 3 mil milhões de pares de base dispostos em 46 cromossomas.[58] A informação transportada pelo ADN está contida nassequências de ADN chamadosgenes. Atransmissão da informação dos genes é conseguida pela complementaridade do emparelhamento das bases. Por exemplo, na transcrição, quando uma célula usa a informação num gene, a sequência de ADN é copiado para uma sequência de ARN complementar por meio da atracção entre o ADN e os nucleotídeos de ARN correctos. Esta cópia de ARN pode ser depois usada para compor uma sequência proteica correspondente no processo detradução, que depende da mesma interacção entre nucleotídeos de ARN. Alternativamente, uma célula pode simplesmente copiar a sua informação genética num processo chamado replicação do ADN.
T7 ARN polimerase (azul) produzindo um ARNm (verde) a partir de um molde de ADN (laranja).[59]
O ADN genómico está localizado nonúcleo celular dos eucariontes, assim como em pequenas quantidades emmitocôndrias e emcloroplastos. Em procariontes, o ADN está dentro de um corpo de forma irregular no citoplasma chamadonucleóide.[60] A informação genética num genoma está nos genes, e o conjunto completo desta informação num organismo é chamado o seugenótipo. Um gene é a unidade básica dahereditariedade e é uma região do ADN que influencia uma característica particular num organismo. Genes contêm umafase aberta de leitura que pode ser transcrita, assim comosequências reguladoras tais comopromotores ouacentuassomos, que controlam a transcrição da fase aberta de leitura.
Em muitasespécies, apenas uma pequena fracção da sequência total do genoma codifica uma proteína. Por exemplo, apenas 1,5% do genoma humano consiste deexões (que codificam proteínas), com mais de 50% do ADN humano consistindo desequências repetitivas.[61] As razões para a presença de tantoADN não codificante em genomas eucarióticos e as extraordinárias diferenças notamanho do genoma, ouvalor C, entre espécies representam um enigma conhecido porenigma do valor C.[62] Contudo, sequências de ADN que não codificam proteínas podem ainda codificar moléculas deARN não codificante funcional, que estão envolvidas na regulação da expressão génica.[63]
Algumas sequências de ADN não codificante têm um papel estrutural nos cromossomas. Ostelómeros ecentrómeros contêm tipicamente poucos genes, mas são importantes para a função e estabilidade dos cromossomas.[37][64] Uma forma abundante de ADN não codificante em humanos são ospseudogenes, que são cópias de genes que foram desabilitados por mutação.[65] Estas sequências são usualmente apenasfósseis moleculares, apesar de poderem servir ocasionalmente como material genético em bruto para a criação de novos genes por meio do processo deduplicação de genes edivergência.[66]
Um gene é uma sequência de ADN que contêm informação genética e pode influenciar ofenótipo de um organismo. Dentro de um gene, a sequência de bases ao longo de uma cadeia de ADN definem uma cadeia deARN mensageiro, que por sua vez define uma ou mais sequências proteicas. A relação entre a sequência de nucleótidos de um gene e a sequência deaminoácidos de uma proteína é determinada pelas regras detradução, conhecidas colectivamente como ocódigo genético. O código genético consiste de 'palavras' de três letras chamadascodões formadas por uma sequência de três nucleótidos (p.e. ACU, CAG, UUU).[67]
Na transcrição, os codões de um gene são copiados para um ARN mensageiro pelaARN polimerase. Esta cópia de ARN é depois descodificada por umribossoma que lê a sequência de ARN emparelhando o ARN mensageiro com oARN de transferência, que carrega aminoácidos. Uma vez que há quatro bases em combinações de 3 letras, há 64 codões possíveis ( combinações). Estas codificam os vinte aminoácidos, dando à maioria dos aminoácidos mais do que um codão possível. Há também três codões 'stop' ou 'nonsense' significando o fim da região codificante; estes são os codões UAA, UGA e UAG.[68]
Adivisão celular é essencial para que um organismo cresça, mas quando uma célula se divide tem de replicar o ADN do seu genoma para que as duas células-filha tenham a mesma informação genética que a célula parental. A estrutura em dupla-hélice do ADN fornece um mecanismo simples para a sua replicação. As duas cadeias são separadas e sequências de ADN complementares a cada uma das cadeias são recriadas por umaenzima chamadaADN polimerase. Esta enzima constrói a cadeia complementar encontrando a base correcta por intermédio do emparelhamento com a base complementar, e ligando-a à cadeia original. Como as polimerases de ADN só conseguem fazer a extensão de uma cadeia de ADN na direcção 5' para 3', outros mecanismos são usados para copiar a cadeia antiparalela da dupla hélice.[69] Desta forma, a base presente na cadeia antiga determina que base vai aparecer na nova cadeia e a célula acaba com uma cópia perfeita do seu ADN.
Todas as funções do ADN dependem de interacções com proteínas. Estas interacções com proteínas podem ser não específicas, ou a proteína pode ligar-se especificamente a uma única sequência de ADN. Algumas enzimas também se podem ligar ao ADN. Destas, as polimerases que copiam as sequências de ADN na transcrição e replicação são particularmente importantes.
Interacção do ADN comhistonas (mostrado em branco, em cima). Os aminoácidos básicos destas proteínas (em baixo à esquerda, em azul) liga-se aos grupos fosfato do ADN (em baixo à direita, em vermelho).
Proteínas estruturais que se ligam ao ADN são exemplos bem estudados de interacções não específicas ADN-proteínas. Nos cromossomas, o ADN está ligado a proteínas estruturais formando complexos. Estas proteínas organizam o ADN numa estrutura compacta, acromatina. Em eucariontes esta estrutura envolve a ligação do ADN a um complexo de pequenas proteínas básicas chamadas histonas, enquanto em procariontes estão envolvidas vários tipos de proteínas.[70][71] As histonas formam um complexo em forma de disco, onucleossoma, que contém duas voltas completas de ADN de cadeia dupla à sua volta. Estas interacções não específicas formam-se quando os resíduos básicos das histonas fazemligações iónicas ao esqueleto açúcar-fosfato acídico do ADN, e por isso são largamente independentes da sequência de bases.[72] Modificações químicas nestes resíduos de amino-ácidos incluemmetilação,fosforilação eacetilação.[73] Estas mudanças químicas alteram a força da interacção entre o ADN e as histonas, tornando o ADN mais ou menos acessível afactores de transcrição e mudando a taxa de transcrição.[74] Outras proteínas com ligação a ADN não específicas incluem o grupo de proteínas de alta mobilidade, que se ligam a ADN dobrado ou distorcido.[75] Estas proteínas são importantes pois dobram conjuntos de nucleossomas e organizam-nos em estruturas maiores que constituem os cromossomas.[76]
Um grupo distinto destas proteínas são as que se ligam especificamente a ADN de cadeia simples. Nos humanos, a proteína de replicação A é o membro desta família mais bem compreendido e é usado em processos onde a dupla hélice é separada, incluindo durante a replicação do ADN, recombinação e reparo.[77] Estas proteínas parecem estabilizar ADN de cadeia dupla e protegem-no da formação dehairpin loops e da degradação pornucleases.
O factor de transcrição dohélice-volta-hélice lambda repressor ligado ao seu alvo de ADN.[78]
Em contraste, outras proteínas evoluíram de modo a ligar-se a sequências de ADN específicas. Osfactores de transcrição são dos mais intensivamente estudados (proteínas que regulam a transcrição). Cada factor de transcrição liga-se a um conjunto particular de sequências de ADN e activa ou inibe a transcrição de genes que tenham estas sequências perto dos seus promotores. Os factores de transcrição fazem isto de duas maneiras. Primeiro, podem ligar-se à polimerase do ARN responsável pela transcrição, quer directamente quer por meio de proteínas mediadoras; isto posiciona a polimerase no promotor e permite que comece a transcrição.[79] Em alternativa, os factores de transcrição podem ligar-se aenzimas que modificam as histonas no promotor; isto muda a acessibilidade do molde de ADN à polimerase.[80]
Como estes locais de ligação podem ocorrer pelo genoma inteiro de um organismo, mudanças na actividade de um tipo de factor de transcrição pode afectar milhares de genes.[81] Por consequência, estas proteínas são muitas vezes alvo de processos detransdução de sinal que controlam respostas a mudanças ambientais ou diferenciação e desenvolvimento celular. A especificidade da interacção destes factores de transcrição com o ADN provém das proteínas que fazem contactos múltiplos com a extremidade das bases de ADN, permitindo a leitura da sequência de ADN. A maior parte destas interacções com bases faz-se no sulco maior, onde as bases estão mais acessíveis.[82]
Asnucleases sãoenzimas que cortam as cadeias de ADN mediante acatálise dahidrólise dasligações fosfodiéster. As nucleases que hidrolisamnucleótidos a partir dos extremos das cadeias de ADN denominam-seexonucleases, enquanto asendonucleases cortam no interior das cadeias. As nucleases que se utilizam com maior frequência embiologia molecular são asenzimas de restrição, endonucleases que cortam o ADN em sequências específicas. Por exemplo, a enzima EcoRV, mostrada à esquerda, reconhece a sequência de 6 bases 5′-GAT|ATC-3′ e faz um corte em ambas as cadeias na linha vertical indicada, gerando duas moléculas de ADN. Outras enzimas de restrição geram, no entanto, extremidades coesivas, já que cortam de forma diferente as duas cadeias de ADN. Na natureza, estas enzimas protegem asbactérias contra as infecções defagos, ao digerir o ADN do fago quando entra através da parede bacteriana, actuando como um mecanismo de defesa.[84] Embiotecnologia, estas nucleases específicas utilizam-se naclonagem molecular e na técnica deimpressão de ADN ( fingerprinting, em inglês).
As enzimas denominadasADN ligases podem reunir pedaços de ADN cortados ou quebrados.[85] As ligases são particularmente importantes nareplicação do ADN da cadeia atrasada de ADN, já que unem os fragmentos curtos de ADN gerados no garfo de replicação para formar uma cópia completa do molde de ADN. Também se utilizam noreparo de ADN e narecombinação genética.[85]
Astopoisomerases são enzimas que possuem actividade de nuclease e ligase. Estas proteínas mudam a quantidade deADN superenrolado. Algumas destas enzimas funcionam cortando a hélice de ADN e permitindo a uma secção que faça rotação, de maneira a reduzir o grau de superenrolamento; uma vez feito isto, a enzima volta a unir os fragmentos de ADN.[22] Outros tipos de enzimas são capazes de cortar uma hélice de ADN e depois passar a segunda cadeia de ADN através desta quebra, antes de reunir as hélices.[86] As topoisomerases são necessárias para muitos processos em que intervém o ADN, como areplicação e atranscrição.[23]
Ashelicases são proteínas que pertencem ao grupo dosmotores moleculares. Utilizam energia química armazenada nos trifosfatos de nucleósidos, fundamentalmenteATP, para romper pontes de hidrogénio entre bases e separar a dupla hélice de ADN em cadeias simples. Estas enzimas são essenciais para a maioria dos processos em que as enzimas necessitam de aceder às bases do ADN.[87]
Aspolimerases sãoenzimas que sintetizam cadeias de nucleótidos a partir de trifosfatos de nucleósidos. A sequência de seus produtos são cópias de cadeias de polinucleótidos existentes, que se denominammoldes. Estas enzimas funcionam adicionando nucleótidos ao grupohidróxilo em 3' do nucleótido anterior numa cadeia de ADN. Por consequência, todas as polimerases funcionam na direcção 5′ → 3′.[88] Nossítios activos destas enzimas, o trifosfato de nucleósido que se incorpora emparelha a sua base com a correspondente no molde: isto permite que a polimerase sintetize de forma precisa a cadeia complementar ao molde.
As polimerases classificam-se de acordo com o tipo de molde que utilizam:
Nareplicação do ADN, umaADN polimerase dependente de ADN realiza uma cópia de ADN a partir de uma sequência de ADN. A precisão é vital neste processo, por isso muitas destas polimerases possuem uma actividade de verificação de leitura (proofreading). Mediante esta actividade, a polimerase reconhece erros ocasionais na reacção de síntese, devido à falta de emparelhamento entre o nucleótido erróneo e o molde, o que gera um desacoplamento (mismatch). Se se detecta um desacoplamento, activa-se uma actividadeexonuclease na direcção 3′ → 5′ e a base incorrecta é eliminada.[89] Na maioria dos organismos, as ADN polimerases funcionam num grande complexo denominadoreplissoma, que contém múltiplas unidades acessórias, comohelicases.[90]
AsADN polimerases dependentes de ARN são uma classe especializada de polimerases que copiam a sequência de uma cadeia de ARN em ADN. Incluem atranscriptase reversa, que é uma enzimaviral implicada na infecção de células porretrovírus, e atelomerase, que é necessária para a replicação dos telómeros.[36][91] A telomerase é uma polimerase inusual, porque contém o seu próprio molde de ARN como parte da sua estrutura.[37]
Atranscrição é levada a cabo por umaARN polimerase dependente de ADN que copia a sequência de uma das cadeias de ADN em ARN. Para começar a transcrever um gene, a ARN polimerase une-se a uma sequência do ADN denominadapromotor, e separa as cadeias de ADN. Então copia a sequência do gene num transcrito deARN mensageiro até que alcança uma região do ADN denominadaterminador, onde se detém e se separa do ADN. Como ocorre com as ADN polimerases dependentes de ADN em humanos, a ARN polimerase II (a enzima que transcreve a maioria dos genes do genoma humano) funciona como um grande complexo multiproteíco que contém múltiplas subunidades reguladoras e acessórias.[92]
A recombinação implica a rotura e reunião de dois (M e F) para produzir dois cromossomas novos, reorganizados (C1 e C2)
Uma hélice de ADN normalmente não interage com outros segmentos de ADN. Nas células humanas os diferentes cromossomas ocupam áreas separadas nonúcleo celular denominadas “territórios cromossómicos”.[94] A separação física dos diferentes cromossomas é importante para que o ADN mantenha a sua capacidade de funcionar como um armazém estável de informação. Um dos poucos momentos em que os cromossomas interagem é durante osobrecruzamento cromossómico (chromosomal crossover, em inglês), durante o qual serecombinam. O sobrecruzamento cromossómico ocorre quando duas hélices de ADN se rompem, sofrem intercâmbio e se unem novamente.[95]
A recombinação permite aos cromossomas trocar informação genética e produzir novas combinações de genes, o que aumenta a eficiência daselecção natural e pode ser importante na evolução rápida de novas proteínas.[96] Durante a profase I dameiose, uma vez que os cromossomas homólogos estão perfeitamente emparelhados formando estruturas que se denominam bivalentes, produz-se o fenómeno de sobrecruzamento ou entrecruzamento(crossing-over), no qual os cromatídeos homólogos não irmãos (procedentes do pai e da mãe) trocam material genético. A recombinação genética resultante faz aumentar em grande medida a variação genética entre a descendência de progenitores que se reproduzem por via sexual. A recombinação genética também pode estar implicada nareparação do ADN, em particular na resposta celular às roturas da dupla cadeia (double-strand breaks).[97]
A forma mais frequente de sobrecruzamento cromossómico é arecombinação homóloga, na qual os dois cromossomas implicados compartilham sequências muito similares. A recombinação não homóloga pode ser danosa para as células, já que pode produzirtranslocações cromossómicas e anormalidades genéticas. A reacção de recombinação é catalisada por enzimas conhecidas comorecombinases, tais como aRAD51.[98] O primeiro passo no processo de recombinação é uma rotura da dupla cadeia, causada por uma endonuclease ou por dano no ADN.[99] Posteriormente, uma série de passos catalisados em parte pela recombinase conduz à união das duas hélices formando pelo menos umajunção de Holliday, na qual um segmento de uma cadeia simples é anelada com a cadeia complementar na outra hélice. A junção de Holliday é uma estrutura de união tetraédrica que pode mover-se ao longo do par de cromossomas, intercambiando uma cadeia por outra. A reacção de recombinação detém-se pelo corte da união e a reunião dos segmentos de ADN libertados.[100]
O ADN contém a informação genética que permite à maioria dos organismos vivos funcionar, crescer e reproduzir-se. No entanto, desconhece-se o intervalo de tempo durante o qual ele exerceu esta função nos ~3000 milhões de anos desde ahistória da vida, já que se propôs que as formas de vida mais precoces poderiam ter utilizadoARN como material genético.[101][102] O ARN poderia ter funcionado como parte central de um metabolismo primordial, já que pode transmitir informação genética e simultaneamente actuar comocatalisador, formando parte dasribozimas.[103] Este antigomundo de ARN onde os ácidos nucleicos funcionariam como catalisadores e como armazéns de informação genética, poderia ter influenciado naevolução docódigo genético actual, baseado em quatronucleótidos. Isto se deveria a que o número de bases únicas num organismo é determinado entre um número pequeno de bases (o que aumentaria a precisão da replicação) e um número grande de bases (que por sua vez aumentaria a eficiência catalítica das ribozimas).[104]
Infelizmente, não dispomos de evidência directa dos sistemas genéticos ancestrais, porque a recuperação do ADN a partir da maior parte dos fósseis é impossível. O ADN é capaz de sobreviver no meio ambiente durante menos de um milhão de anos, e logo começa a degradar-se lentamente em fragmentos de menor tamanho em solução.[105] Algumas investigações pretendem a obtenção de ADN mais antigo, como no caso do isolamento de uma bactéria viável a partir de um cristal salino de 250 milhões de anos de antiguidade,[106] mas estes dados são controversos.[107][108]
No entanto, podem utilizar-se ferramentas de evolução molecular para inferir os genomas de organismos ancestrais a partir de organismos contemporâneos.[109][110] Em muitos casos, estas inferências são suficientemente fiáveis, de maneira que uma biomolécula codificada num genoma ancestral pode ser ressuscitada no laboratório para ser estudada hoje.[111][112] Uma vez recomposta a biomolécula ancestral, suas propriedades poderiam oferecer informações sobre os ambientes primordial, remetendo ao campo emergente dapaleogenética experimental.[113] Apesar de tudo, o processo de trabalhoretrospectivo tem limitações inerentes, razão pela qual outros investigadores tentam elucidar o mecanismo evolutivo trabalhando desde a origem da Terra até adiante no tempo. Dada suficiente informação sobre como as substâncias cósmicas poderiam haver-se depositado na Terra e sobre as transformações que poderiam ter tido lugar na superfície terrestre, talvez poderíamos ser capazes de desenvolver modelos prospectivos de evolução da informação genética.
A história do ADN começa no final dadécada de 1860, com a chegada do bioquímico e médico suíçoFriedrich Miescher (1844-1895) àUniversidade de Tübingen, uma pacata cidade no sul daAlemanha. O jovem pesquisador estava disposto à dedicar-se ao estudo da química da célula e escolheu essa universidade porque nela o químicoFelix Hoppe-Seyler (1825-1895) havia inaugurado um importante laboratório dequímica fisiológica. Na época floresciam ideias a respeito das origens e funções das células, após a queda da teoria dageração espontânea. A teoria celular estabelecia-se como um dos pilares da Biologia. Por tudo isso, as células atraíam a atenção de estudantes entusiasmados, como Miescher.[114]
Felix Hoppe-Seyler foi quem primeiro descreveu as interações entre ahemoglobina, a proteína responsável pela cor do sangue, e o gásoxigênio. Seu trabalho levou-o a interessar-se pela composição bioquímica doslinfócitos. Mas Miescher enfrentou dificuldades para obter amostras com linfócitos em quantidade e grau de pureza adequados. Por sugestão de Hoppe-Seyler, Miescher começou a estudar a química das células do pus; o material para a pesquisa era abundante, pois dezenas de bandagens com material purulento eram diariamente descartadas por um hospital próximo à universidade. Miescher desenvolveu técnicas adequadas para o isolamento das células presentes em pus das bandagens e para a sua análise química. O objetivo inicial era investigar as proteínas celulares, um grupo de substâncias descoberto cerca de trinta anos antes.[114]
Em um dos seus muitos experimentos com células dopus, Miescher obteve um precipitado que diferia quimicamente de todas as substâncias protéicas conhecidas. Ele descobriu que a nova substância concentrava-se no núcleo celular, na época considerado uma estrutura de pouca importância para o funcionamento celular. Aprimorando os métodos deextração epurificação da nova substância, Miescher pôde realizar uma análise química mais precisa, que mostrou que as quantidades relativas dehidrogênio,carbono,oxigênio enitrogênio presentes diferiam das encontradas em proteínas, além de uma quantidade incomum defósforo. À substância descoberta Miescher denominounucleína, pelo fato de ela estar concentrada no núcleo das células.[114]
O trabalho sobre nucleína só foi publicado em1871, após certa resistência do editor da revista científica, o próprio Hoppe-Seyler, que, no início, não acreditou nos resultados apresentados por Miescher. Mesmo depois da publicação do trabalho, muitos pesquisadores continuaram duvidando da existência da nucleína; na opinião deles, o achado de Miescher devia ser uma mistura de fosfato inorgânico e proteínas.[114][115]
As desconfianças quanto à real existência da nova substância descrita por Miescher só foram superadas por volta de 1889, quandoRichard Altmann (1852-1900) obteve preparações altamente purificadas de nucleína, sem nenhuma contaminação por proteínas. Pelo fato de a substância ter caráter ácido, o que já havia sido detectado por Miescher, Altmann sugeriu que ela fosse chamada deácido nucléico em vez de nucleína.[116]
Outro pesquisador pioneiro na descoberta foiAlbrecht Kossel (1853-1927). Em 1877, ele juntou-se ao grupo de pesquisa de Hoppe-Seyler, então trabalhando na Universidade de Estrasburgo (França), e começou a estudar a composição química das nucleínas. Kossel detectou dois tipos de bases nitrogenadas já conhecidas, aadenina e aguanina. Em 1893, identificou uma nova base nitrogenada, que era liberada pela degradação de nucleína das células dotimo; por isso denominou-atimina. Logo em seguida, descobriu que a nucleína continha um quarto tipo de base nitrogenada, a qual denominoucitosina.[117] Em 1894, o grupo liderado por Kossel descobriu que os ácidos nucleicos continham tambémpentose, um açúcar com cinco átomos de carbono.[118] Em reconhecimento às suas contribuições na área, foi agraciado em1910 com oNobel de Fisiologia ou Medicina.[119]
Em 1909,Phoebus Levene eWalter Abraham Jacobs (1883-1967) conseguiram determinar a organização das moléculas de fosfato, de pentose e base nitrogenada no ácido nucleico.[120] Esses três componentes estão unidos entre si formando uma unidade fundamental, onucleotídeo. Em 1929, Levene e colaboradores identificaram pentoses componente do ácido nucleico das células do timo, que denominaram 2-deoxi-D-ribose, pelo fato de ela possuir, no carbono 2 de sua cadeia, umátomo de oxigênio a menos que a ribose, uma pentose já conhecida, encontrada pelos pesquisadores em dois tipos de ácidos nucléicos: o ácido ribonucleico, ou ribose, e o ácido desoxirribonucléico, ou ADN, cujo açúcar é a desoxirribose.[121][122]
Frederick Griffith fez uma importante observação no curso dos experimentos com abactériaStreptococcus pneumoniae em 1928. Esta bactéria, que causapneumonia em humanos, normalmente é letal emcamundongos. Entretanto algumas linhagens desta espécie de bactérias eram menos virulentas (menos capazes de causar doenças ou morte). Nos experimentos de Griffith, ele usou duas linhagens distinguíveis pelas suas colônias quando cultivadas em laboratório. Uma linhagem era um tipo normalmente virulento e mortal para a maioria dos animais de laboratório. As células desta linhagem estão envoltas em uma cápsula depolissacarídeo, dando às colônias em aspecto liso, sendo esta linhagem identificada comS (smooth, em inglês). A outra linhagem de Griffith era um tipo mutante não virulento que crescia em camundongos. Nesta linhagem, a capa de polissacarídeo está ausente, dando às colônias um aspecto rugoso. Esta linhagem é chamadaR (rough, em inglês).[123]
Griffith inativou algumas células virulentas a alta temperatura. Injetou então as células mortas por aquecimento nos camundongos. Os camundongos sobreviveram, mostrando que os restos das células não causam morte. Entretanto os camundongos injetados com uma mistura de células virulentas mortas por aquecimento e células não virulentas vivas morreram. Além disso, as células vivas podiam ser recuperadas de camundongos mortos. Estas células deram colônias lisas e foram virulentas em uma injeção subsequente. De algum modo, os restos das célulasS aquecidas haviam convertido célulasR vivas em célulasS vivas.[124]
Streptococcus pneumoniae
A etapa seguinte era determinar que componente químico das células doadoras mortas havia causado esta conversão. Esta substância tinha mudado o genótipo da linhagem receptora e portanto podia ser uma candidata a material genético. Este problema foi resolvido pelos experimentos feitos em 1944 porOswald Avery e dois colegas, C M. Macleod e M. McCarty. Seu enfoque ao problema foi destruir quimicamente todas as principais categorias de substâncias no extrato de células mortas, uma de cada vez, e descobrir se o extrato havia perdido a habilidade de conversão. As células virulentas possuíam uma capa lisa de polissacarídeo, enquanto as células não virulentas, não. Assim os polissacarídeos eram um candidato óbvio a ser o agente responsável. Entretanto, quando os polissacarídeos foram destruídos, a mistura ainda era capaz de conversão. As proteínas, gorduras e ácido ribonucleico (ARN) foram todos excluídos. A mistura só perdia a sua capacidade de conversão quando a mistura doadora era tratada comenzima desoxirribonuclease (DNase), que quebra o ADN. Estes resultados indicavam fortemente que o ADN era o material genético. Hoje sabemos que os fragmentos do ADN transformante que conferem virulência entram no cromossomo bacteriano e substituem suas contrapartes que conferem não virulência.[125]
Os experimentos feitos porAvery e seus colegas foram definitivos, mas muitos cientistas mostraram-se muito relutantes em aceitar o ADN (e não as proteínas) como material genético.[116] Evidências adicionais foram publicadas em 1952 porAlfred Day Hershey eMartha Chase, cujo experimento com ofago T2, um vírus que transfecta na bactéria a informação específica para a reprodução viral. Se eles pudessem descobrir que material o fago transmitia à bactéria hospedeira, determinariam o material genético do fago.[126]
O fago tem uma constituição molecular relativamente simples. A maior parte de sua estrutura é de proteína, com o ADN contido dentro da capa de proteína de sua "cabeça". Hershey e Chase decidiram marcar o ADN e a proteína usando radioisótopos, de modo que pudessem rastrear os dois materiais durante a infecção. Ofósforo não é encontrado nas proteínas mas é uma parte integrante do ADN. Contrariamente, oenxofre está presente nas proteínas mas nunca no ADN. Hershey e Chase incorporaram o radioisótopo de fósforo (32P) no ADN do fago e o enxofre (35S) nas proteínas de uma cultura separada de fagos. Eles então infectaram duas culturas deE. coli com muitas partículas de vírus por células: uma cultura de E.coli recebeu fagos marcados com32P e a outra recebeu fagos marcados com35S. Decorrido tempo suficiente para que ocorresse a infecção, os cientistas removeram as embalagens de fago (chamadasghosts) das células bacterianas por agitação em umliquidificador. Eles separaram as células bacterianas dos envoltórios dos fagos em umacentrífuga e então mediram a radioatividade nas duas frações. Quando o fago marcado com32P foi usado para infectar E.coli, a mais alta radioatividade foi encontrada dentro das bactérias, indicando que o ADN do fago havia entrado nas células. Quando era usado o fago marcado com35S, maior parte do material radioativo estava nos invólucros dos fagos, indicando que a proteína do fago nunca entrava nas bactérias. A conclusão era inevitável: o ADN era o material hereditário. As proteínas do fago eram apenas embalagens estruturais abandonadas após o ADN viral entrar na bactéria.[126]
A investigação sobre o ADN tem um impacto significativo, especialmente no âmbito damedicina, mas também na agricultura e pecuária, com objectivos de domesticação, selecção e de cruzamentos dirigidos. A moderna biologia e bioquímica fazem uso intensivo datecnologia doADN recombinante, introduzindo genes de interesse em organismos, com o objectivo de expressar uma proteína recombinante concreta, que pode ser:
isolada para seu uso posterior: por exemplo, podem-se transformarmicroorganismos para produzir grandes quantidades de substâncias úteis, como a insulina, que posteriormente se isolam e se utilizam em terapias;[127][128][129]
necessária para substituir a expressão de um gene endógeno danificado que seja causador de uma patologia, o que permitiria o restabelecimento da actividade da proteína perdida e eventualmente a recuperação do estado fisiológico normal, não patológico. Este é o objectivo daterapia genética, um dos campos em que se está a trabalhar activamente em medicina, analisando vantagens e inconvenientes de diferentes sistemas de administração do gene (virais e não virais) e os mecanismos de selecção do ponto de integração dos elementos genéticos (distintos para os vírus e transposões) no genoma alvo.[130] Neste caso, antes de apresentar-se a possibilidade de realizar uma terapia génica numa determinada patologia, é fundamental compreender o impacto do gene de interesse no desenvolvimento de dita patologia, para o qual é necessário o desenvolvimento de um modelo animal, eliminando ou modificando dito gene num animal de laboratório, mediante a técnicanocaute.[131] Só no caso de os resultados no modelo animal serem satisfatórios poderá ser analisada a possibilidade de restabelecer o gene danificado mediante terapia génica;
utilizada para enriquecer um alimento: por exemplo, a composição do leite (que é uma importante fonte de proteínas para o consumo humano e animal) pode modificar-se mediante transgénese, adicionando genes exógenos e inactivando genes endógenos para melhorar o seu valor nutricional, reduzir infecções nas glândulas mamárias, proporcionar aos consumidores proteínas antipatogénicas e preparar proteínas recombinantes para o uso farmacêutico;[132][133]
útil para melhorar a resistência do organismo transformado: por exemplo, em plantas podem-se introduzir genes que conferem resistência a agentes patogénicos (vírus, insectos, fungos), assim como a agentes estressantes abióticos (salinidade, seca, metais pesados).[134][135][136]
AMedicina Forense pode utilizar o ADN presente nosangue, nosémen, napele, nasaliva ou em pelos existentes na cena de um crime para identificar o responsável. Esta técnica denomina-seimpressão genética ouperfil de ADN. Ao realizar a impressão genética, compara-se o comprimento de secções altamente variáveis do ADN repetitivo, como osmicrossatélites, entre pessoas diferentes. Este método é muito fiável para identificar um criminoso.[137] No entanto, a identificação pode complicar-se se a cena do crime estiver contaminada com ADN de pessoas diferentes.[138] A técnica da impressão genética foi desenvolvida em 1984 pelo geneticista britânico SirAlec Jeffreys,[139] e utilizada pela primeira vez para condenarColin Pitchfork por causa dos assassinatos de Narborough (Reino Unido) em 1983 e 1986.[140] Pode-se requerer às pessoas acusadas de certos tipos de crimes que cedam uma amostra de ADN para ser introduzida numa base de dados. Isto tem facilitado o trabalho dos investigadores na resolução de casos antigos, onde só se obteve uma amostra de ADN da cena do crime, em alguns casos permitindo exonerar um convicto. A impressão genética também pode ser utilizado para identificar vítimas de acidentes em massa,[141] ou para realizar provas de consanguinidade.[142]
ABioinformática implica a manipulação, busca eextracção de informação dos dados da sequência do ADN. O desenvolvimento das técnicas para armazenar e procurar sequências de ADN gerou avanços no desenvolvimento desoftware para computadores, com muitas aplicações, especialmentealgoritmos de busca de frases,aprendizagem automática e teorias debases de dados.[143] A busca de frases ou algoritmos de coincidências, que procuram a ocorrência de uma sequência de letras dentro de uma sequência de letras maior, desenvolveu-se para buscar sequências específicas de nucleótidos.[144] Em outras aplicações comoeditores de textos, inclusive algoritmos simples podem funcionar, mas as sequências de ADN podem gerar que estes algoritmos apresentem um comportamento dequase o pior caso, devido ao baixo número de carácteres. O problema relacionado doalinhamento de sequências procura identificar sequênciashomólogas e localizarmutações específicas que as diferenciam. Estas técnicas, fundamentalmente oalinhamento múltiplo de sequências, utilizam-se ao estudar as relaçõesfilogenéticas e a função das proteínas.[145] As colecções de dados que representam sequências do ADN do tamanho de um genoma, tais como as produzidas peloProjecto Genoma Humano, são difíceis de utilizar sem notações que marcam a localização dos genes e dos elementos reguladores em cada cromossoma. As regiões de ADN que têm padrões associados com genes codificantes de proteínas ou ARN podem identificar-se por algoritmos delocalização de genes, o que permite aos investigadores predizer a presença deprodutos génicos específicos num organismo mesmo antes que se tenha isolado experimentalmente.[146]
A nanotecnologia de ADN utiliza as propriedades únicas de reconhecimento molecular de ADN e outros ácidos nucleicos para criar complexos ramificados auto-ensamblados com propriedades úteis. Neste caso, o ADN utiliza-se como um material estrutural, mais que como um portador de informação biológica.[147] Isto conduziu à criação de lâminas periódicas de duas dimensões (ambas baseadas em azulejos, assim como usando o método de "ADN origami"), para além de estruturas em três dimensões em forma depoliedros.[148]
O ADN armazena mutações conservadas com o tempo e portanto contém informação histórica. Comparando sequências de ADN, os geneticistas podem inferir a história evolutiva dos organismos, a suafilogenia.[149] O campo da filogenia é uma ferramenta potente nabiologia evolutiva. Se se compararem as sequências de ADN dentro de uma espécie, osgeneticistas de populações podem conhecer a história de populações particulares. Isto pode-se utilizar numa ampla variedade de estudos, desdeecologia atéantropologia; por exemplo, evidência baseada na análise de ADN está a ser utilizada para identificar as Dez Tribos Perdidas de Israel.[150][151]
Notas
↑Apesar do uso da sigla em inglês ser bem comum no Brasil, legisladores brasileiros preferem o uso da sigla em português em leis brasileiras[1]
↑Mandelkern M, Elias J, Eden D, Crothers D (1981). «The dimensions of DNA in solution».J Mol Biol.152 (1): 153–61.PMID7338906 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Gregory S; et al. (2006). «The DNA sequence and biological annotation of human chromosome 1».Nature.441 (7091): 315–21.PMID16710414
↑G. Vieira, H. de Lencastre , L. Archer (1989). «Restriction analysis of PBS 1-related phages». Springer-Verlag.Archives of Virology.106.ISSN0304-8608.doi:10.1007/BF01311043 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Ponnuswamy P, Gromiha M (1994). «On the conformational stability of oligonucleotide duplexes and tRNA molecules».J Theor Biol.169 (4): 419–32.PMID7526075
↑Isaksson J, Acharya S, Barman J, Cheruku P, Chattopadhyaya J (2004). «Single-stranded adenine-rich DNA and RNA retain structural characteristics of their respective double-stranded conformations and show directional differences in stacking pattern».Biochemistry.43 (51): 15996–6010.PMID15609994 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑G. Michael Blackburn, Michael J. Gait, David Loakes, David M. Williams (2006).Nucleic acids in chemistry and biology 3 ed. [S.l.]: Royal Society of Chemistry.ISBN978-0-85404-654-6 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Wing R, Drew H, Takano T, Broka C, Tanaka S, Itakura K, Dickerson R (1980). «Crystal structure analysis of a complete turn of B-DNA».Nature.287 (5784): 755–8.PMID7432492 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Pabo C, Sauer R (1984). «Protein-DNA recognition».Annu Rev Biochem.53: 293–321.PMID6236744
↑Makalowska I, Lin C, Makalowski W (2005). «Overlapping genes in vertebrate genomes».Comput Biol Chem.29 (1): 1–12.PMID15680581 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Johnson Z, Chisholm S (2004). «Properties of overlapping genes are conserved across microbial genomes».Genome Res.14 (11): 2268–72.PMID15520290
↑Lamb R, Horvath C (1991). «Diversity of coding strategies in influenza viruses».Trends Genet.7 (8): 261–6.PMID1771674
↑abWang J (2002). «Cellular roles of DNA topoisomerases: a molecular perspective».Nat Rev Mol Cell Biol.3 (6): 430–40.PMID12042765
↑abHayashi G, Hagihara M, Nakatani K (2005). «Application of L-DNA as a molecular tag».Nucleic Acids Symp Ser (Oxf).49: 261–262.PMID17150733 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Vargason JM, Eichman BF, Ho PS (2000). «The extended and eccentric E-DNA structure induced by cytosine methylation or bromination».Nature Structural Biology.7: 758–761.PMID10966645 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Wang G, Vasquez KM (2006). «Non-B DNA structure-induced genetic instability».Mutat Res.598 (1–2): 103–119.PMID16516932
↑Allemand; et al. (1998). «Stretched and overwound DNA forms a Pauling-like structure with exposed bases».PNAS.24: 14152-14157.PMID9826669
↑Palecek E (1991). «Local supercoil-stabilized DNA structures».Critical Reviews in Biochemistry and Molecular Biology.26 (2): 151–226.PMID1914495
↑Basu H, Feuerstein B, Zarling D, Shafer R, Marton L (1988). «Recognition of Z-RNA and Z-DNA determinants by polyamines in solution: experimental and theoretical studies».J Biomol Struct Dyn.6 (2): 299–309.PMID2482766 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Leslie AG, Arnott S, Chandrasekaran R, Ratliff RL (1980). «Polymorphism of DNA double helices».J. Mol. Biol.143 (1): 49–72.PMID7441761 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Wahl M, Sundaralingam M (1997). «Crystal structures of A-DNA duplexes».Biopolymers.44 (1): 45–63.PMID9097733
↑Lu XJ, Shakked Z, Olson WK (2000). «A-form conformational motifs in ligand-bound DNA structures».J. Mol. Biol.300 (4): 819-40.PMID10891271 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Rothenburg S, Koch-Nolte F, Haag F. «DNA methylation and Z-DNA formation as mediators of quantitative differences in the expression of alleles».Immunol Rev.184: 286–98.PMID12086319 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑«NDB UD0017». Ndbserver.rutgers.edu. Consultado em 25 de junho de 2008. Arquivado dooriginal em 7 de junho de 2013
↑abGreider C, Blackburn E (1985). «Identification of a specific telomere terminal transferase activity in Tetrahymena extracts».Cell.43 (2 Pt 1): 405–13.PMID3907856
↑Parkinson G, Lee M, Neidle S (2002). «Crystal structure of parallel quadruplexes from human telomeric DNA».Nature.417 (6891): 876–80.PMID12050675.doi:10.1038/nature755 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Griffith J, Comeau L, Rosenfield S, Stansel R, Bianchi A, Moss H, de Lange T (1999). «Mammalian telomeres end in a large duplex loop».Cell.97 (4): 503–14.PMID10338214 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Ratel D, Ravanat J, Berger F, Wion D (2006). «N6-methyladenine: the other methylated base of DNA».Bioessays.28 (3): 309–15.PMID16479578.doi:10.1002/bies.20342 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Gommers-Ampt J, Van Leeuwen F, de Beer A, Vliegenthart J, Dizdaroglu M, Kowalak J, Crain P, Borst P (1993). «beta-D-glucosyl-hydroxymethyluracil: a novel modified base present in the DNA of the parasitic protozoan T. brucei».Cell.75 (6): 1129–36.PMID8261512.doi:10.1016/0092-8674(93)90322-H !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Douki T, Reynaud-Angelin A, Cadet J, Sage E (2003). «Bipyrimidine photoproducts rather than oxidative lesions are the main type of DNA damage involved in the genotoxic effect of solar UVA radiation».Biochemistry.42 (30): 9221–6.PMID12885257.doi:10.1021/bi034593c !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Cadet J, Delatour T, Douki T, Gasparutto D, Pouget J, Ravanat J, Sauvaigo S (1999). «Hydroxyl radicals and DNA base damage».Mutat Res.424 (1–2): 9–21.PMID10064846 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Valerie K, Povirk L (2003). «Regulation and mechanisms of mammalian double-strand break repair».Oncogene.22 (37): 5792–812.PMID12947387.doi:10.1038/sj.onc.1206679
↑Ferguson L, Denny W (1991). «The genetic toxicology of acridines».Mutat Res.258 (2): 123–60.PMID1881402
↑Stephens T, Bunde C, Fillmore B (2000). «Mechanism of action in thalidomide teratogenesis».Biochem Pharmacol.59 (12): 1489–99.PMID10799645.doi:10.1016/S0006-2952(99)00388-3 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Braña M, Cacho M, Gradillas A, de Pascual-Teresa B, Ramos A (2001). «Intercalators as anticancer drugs».Curr Pharm Des.7 (17): 1745–80.PMID11562309.doi:10.2174/1381612013397113 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Thanbichler M, Wang S, Shapiro L (2005). «The bacterial nucleoid: a highly organized and dynamic structure».J Cell Biochem.96 (3): 506–21.PMID15988757.doi:10.1002/jcb.20519 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Wolfsberg T, McEntyre J, Schuler G (2001). «Guide to the draft human genome».Nature.409 (6822): 824–6.PMID11236998.doi:10.1038/35057000 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑The ENCODE Project Consortium (2007). «Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project».Nature.447 (7146): 799–816.doi:10.1038/nature05874
↑Harrison P, Gerstein M (2002). «Studying genomes through the aeons: protein families, pseudogenes and proteome evolution».J Mol Biol.318 (5): 1155–74.PMID12083509.doi:10.1016/S0022-2836(02)00109-2
↑Sandman K, Pereira S, Reeve J (1998). «Diversity of prokaryotic chromosomal proteins and the origin of the nucleosome».Cell Mol Life Sci.54 (12): 1350–64.PMID9893710.doi:10.1007/s000180050259 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Dame RT (2005). «The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin».Mol. Microbiol.56 (4): 858–70.PMID15853876.doi:10.1111/j.1365-2958.2005.04598.x
↑Luger K, Mäder A, Richmond R, Sargent D, Richmond T (1997). «Crystal structure of the nucleosome core particle at 2.8 A resolution».Nature.389 (6648): 251–60.PMID9305837.doi:10.1038/38444 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Grosschedl R, Giese K, Pagel J (1994). «HMG domain proteins: architectural elements in the assembly of nucleoprotein structures».Trends Genet.10 (3): 94–100.PMID8178371.doi:10.1016/0168-9525(94)90232-1 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Iftode C, Daniely Y, Borowiec J (1999). «Replication protein A (RPA): the eukaryotic SSB».Crit Rev Biochem Mol Biol.34 (3): 141–80.PMID10473346.doi:10.1080/10409239991209255 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Schoeffler A, Berger J (2005). «Recent advances in understanding structure-function relationships in the type II topoisomerase mechanism».Biochem Soc Trans.33 (Pt 6): 1465–70.PMID16246147.doi:10.1042/BST20051465
↑Cremer T, Cremer C (2001). «Chromosome territories, nuclear architecture and gene regulation in mammalian cells».Nat Rev Genet.2 (4): 292–301.PMID11283701.doi:10.1038/35066075
↑«Chromosomal crossover» (em inglês). Sciencedaily.com. Consultado em 7 de outubro de 2010. Arquivado dooriginal em 21 de maio de 2011
↑Pál C, Papp B, Lercher M (2006). «An integrated view of protein evolution».Nat Rev Genet.7 (5): 337–48.PMID16619049.doi:10.1038/nrg1838 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑O'Driscoll M, Jeggo P (2006). «The role of double-strand break repair - insights from human genetics».Nat Rev Genet.7 (1): 45–54.PMID16369571.doi:10.1038/nrg1746
↑Neale MJ, Keeney S (2006). «Clarifying the mechanics of DNA strand exchange in meiotic recombination».Nature.442 (7099): 153–8.PMID16838012.doi:10.1038/nature04885
↑Dickman M, Inglêston S, Sedelnikova S, Rafferty J, Lloyd R, Grasby J, Hornby D (2002). «The RuvABC resolvasome».Eur J Biochem.269 (22): 5492–501.PMID12423347.doi:10.1046/j.1432-1033.2002.03250.x !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Lindahl T (1993). «Instability and decay of the primary structure of DNA».Nature.362 (6422): 709–15.PMID8469282.doi:10.1038/362709a0
↑Vreeland R, Rosenzweig W, Powers D (2000). «Isolation of a 250 million-year-old halotolerant bacterium from a primary salt crystal».Nature.407 (6806): 897–900.PMID11057666.doi:10.1038/35038060 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Hebsgaard M, Phillips M, Willerslev E (2005). «Geologically ancient DNA: fact or artefact?».Trends Microbiol.13 (5): 212–20.PMID15866038.doi:10.1016/j.tim.2005.03.010 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Nickle D, Learn G, Rain M, Mullins J, Mittler J (2002). «Curiously modern DNA for a "250 million-year-old" bacterium».J Mol Evol.54 (1): 134–7.PMID11734907.doi:10.1007/s00239-001-0025-x !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Birnbaum D, Coulier F, Pébusque MJ, Pontarotti P. (2000). «"Paleogenomics": looking in the past to the future».J Exp Zool.288 ((1): 21-2).PMID10750049 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Blanchette M, Green ED, Miller W, Haussler D. (2004). «Reconstructing large regions of an ancestral mammalian genome in silico».Genome Res.14 ((12): 2412-23).PMID15574820.doi:10.1101/gr.2800104 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Gaucher EA, Thomson JM, Burgan MF, Benner SA. (2003). «Inferring the palaeoenvironment of ancient bacteria on the basis of resurrected proteins».Nature.425 ((6955): 285-8).PMID13679914.doi:10.1038/nature01977 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Thornton JW. (2004). «Resurrecting ancient genes: experimental analysis of extinct molecules».Nat Rev Genet.5 ((5): 366-75).PMID15143319.doi:10.1038/nrg1324
↑Benner SA, Caraco MD, Thomson JM, Gaucher EA. (2002). «Planetary biology--paleontological, geological, and molecular histories of life».Science.296 ((5569): 864-8).PMID11988562.doi:10.1126/science.1069863 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Avery, O T; Macleod C M, McCarty M (outubro 2000). "Studies on the chemical nature of the substance inducing transformation of pneumococcal types: Induction of transformation by a desoxyribonucleic acid fraction isolated from Pneumococcus type III. Oswald Theodore Avery (1877-1955)". Clin. Orthop. Relat. Res. 379 (379 Suppl): S3–8. doi:10.1097/00003086-200010001-00002.PMID 11039746.
↑Soler E, Thépot D, Rival-Gervier S, Jolivet G, Houdebine LM. (2006). «Preparation of recombinant proteins in milk to improve human and animal health».Reprod Nutr Dev.46 ((5) 579-88) !CS1 manut: Nomes múltiplos: lista de autores (link)[1]Arquivado em 3 de julho de 2009, noWayback Machine.
↑Chávez A, Muñoz de Chávez M. (2003). «Nutrigenomics in public health nutrition: short-term perspectives».Eur J Clin Nutr.57 (Suppl 1 S97-100)[2]Arquivado em 6 de janeiro de 2009, noWayback Machine.
↑Daniell H, Dhingra A (2002). «Multigene engineering: dawn of an exciting new era in biotechnology».Curr Opin Biotechnol.13 (2): 136–41.PMID11950565.doi:10.1016/S0958-1669(02)00297-5
↑Weir B, Triggs C, Starling L, Stowell L, Walsh K, Buckleton J (1997). «Interpreting DNA mixtures».J Forensic Sci.42 (2): 213–22.PMID9068179 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Jeffreys A, Wilson V, Thein S (1985). «Individual-specific 'fingerprints' of human DNA».Nature.316 (6023): 76–9.PMID2989708.doi:10.1038/316076a0 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Baldi, Pierre. Brunak, Soren (2001).Bioinformatics: The Machine Learning Approach. [S.l.]: MIT Press.ISBN978-0-262-02506-5 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Gusfield, Dan.Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, 15 de janeiro de 1997.ISBN 978-0-521-58519-4.
↑Mount, DM (2004).Bioinformatics: Sequence and Genome Analysis 2 ed. Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press.ISBN0879697121
↑Yin P, Hariadi RF, Sahu S, Choi HMT, Park SH, LaBean T, Reif JH. (2008).«Programming DNA Tube Circumferences».Science.321 (5890): 824 - 826 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Andersen ES, Dong M, Nielsen MM (maio de 2009). «Self-assembly of a nanoscale DNA box with a controllable lid».Nature.459 (7243): 73–6.PMID19424153.doi:10.1038/nature07971 !CS1 manut: Nomes múltiplos: lista de autores (link)
↑Lost Tribes of Israel,NOVA, data de transmissão na PBS: 22 de Fevereiro de 2000. Transcrição disponível emPBS.org,Arquivado em 16 de setembro de 2008, noWayback Machine.. Página acedida a 4 de Março de 2006.
«DNA Interactive» (em inglês). Sítio do Dolan DNA Learning Center que inclui dezenas de animações assim como entrevistas com James Watson e outros (requerAdobe Flash)
«DNA from the Beginning» (em inglês). Sítio da DNA Learning Center sobre DNA, genes e hereditariedade desde Mendel até ao Projecto Genoma Humano