Animazione tridimensionale delladoppia elica del DNA
Rappresentazione bidimensionale della doppia elica del DNA
L'acido desossiribonucleico odeossiribonucleico (siglaDNA, dall'ingleseDeoxyriboNucleic Acid[1][2][3]) è l'acido nucleico che contiene leinformazioni genetiche per lo sviluppo, l'omeostasi e la riproduzione di tutti gliesseri viventi conosciuti. Costituisce inoltre la molecola base del funzionamento di una piccola minoranza deivirus.[4]
Dal punto di vista chimico, il DNA è unpolimero organico a doppia catena i cuimonomeri sono chiamatinucleotidi (desossiribonucleotidi).[5] I nucleotidi sono costituiti da tre componenti fondamentali: ungruppo fosfato, unozucchero (ildeossiribosio) e unabase azotata, legata alglicide con unlegame N-glicosidico. Le basi azotate che entrano nella formazione dei nucleotidi sono quattro:adenina,timina,citosina eguanina (nell'RNA al posto della timina è presente l'uracile). La doppia catena polinucleotidica del DNA ha struttura antiparallela, spiralizzata e complementare poiché le basi azotate di una catena si accoppiano con l'altra conlegami idrogeno secondo lo schema:A-T eG-C.
La sequenza dei nucleotidi costituisce ilcodice genetico, che è tradotto negliamminoacidi corrispondenti. La sequenza amminoacidica prodotta forma le proteine. Il processo dellasintesi proteica avviene tramite la sintesi di una molecolaintermedia diRNA (RNA messaggero), che è formata per complementarità con le quattro basi dei nucleotidi del DNA in un processo noto cometrascrizione. Il DNA non genera solo filamenti di RNA destinati alla traduzione in aminoacidi, ma anche frammenti in grado di svolgere svariate funzioni biologiche, ad esempio all'interno deiribosomi, dove l'RNA ha una funzione strutturale.
Neglieucarioti, il DNA si complessa all'interno delnucleo in strutture chiamatecromosomi. Negli altri organismi, privi di nucleo, esso può essere organizzato in cromosomi o meno (nei batteri è presente un'unica molecola di DNA circolare a doppia catena). All'interno dei cromosomi, le proteine dellacromatina come gliistoni, lecoesine e le condensine organizzano il DNA e lo avvolgono in strutture ordinate. Queste strutture guidano l'interazione tra il codice genetico e le proteine responsabili della trascrizione, contribuendo al controllo della trascrizione genica. Nel corso dellamitosi avviene lareplicazione del DNA, con cui l'informazione genica è trasmessa integralmente nel passaggio tra diverse generazioni cellulari.
Il DNA fu inizialmente isolato dal biochimicosvizzeroFriedrich Miescher, il quale, nel1869, individuò una sostanza microscopica contenuta nelpus di bende chirurgiche utilizzate. Dal momento che tale molecola aveva la sua localizzazione nelnucleo, egli la chiamònucleina.[6] Nel1919Phoebus Levene individuò la struttura del nucleotide, composta da base azotata, zucchero e fosfato.[7] Levene suggerì che il DNA consistesse in un filamento di nucleotidi legati tra loro attraverso i fosfati. Egli, però, era convinto che tale filamento fosse corto e che le basi fossero disposte secondo un preciso ordine ripetuto. Nel1937William Astbury presentò i primi risultati di alcuni studi didiffrazione a raggi X, i quali dimostrarono che il DNA ha una struttura estremamente regolare[8]. Nel1944Erwin Schrödinger asserì che, visto che secondo la fisica quantistica i sistemi di pochi atomi hanno un comportamento disordinato, il materiale genetico doveva essere costituito da una grande molecola non ripetitiva, sufficientemente stabile da mantenere l'informazione genetica, chiamata "cristallo aperiodico".[9]
Nel1928Frederick Griffith scoprì che icaratteri della formasmooth ("liscia") diPneumococcus potevano essere trasferiti alla formarough ("rugosa"), miscelando i resti dibatterismooth morti con batterirough vivi.[10] Questo sistema, pur non fornendo nessuna evidenza su quale fosse la sostanza che determinava il cambiamento, mostrava che qualcosa potesse trasportare l'informazione genetica dai resti dei batteri morti a quelli vivi. Si parlò quindi di unprincipio trasformante in grado di modificare i batteri vivi. Nel1943Oswald Theodore Avery dimostrò, in uncelebre esperimento insieme aColin MacLeod eMaclyn McCarty, che il DNA è ilprincipio trasformante alla base di questo fenomeno.[11] Il ruolo del DNA nell'ereditarietà è stato provato, infine, nel1953 daAlfred Hershey eMartha Chase attraverso un altroclassico esperimento, che dimostrò che il materiale genetico delfago T2 è effettivamente il DNA.[12]
James Watson (a sinistra) eFrancis Crick (a destra), scopritori della struttura a doppia elica del DNA.
Il 1953 è anche l'anno in cui, attraverso ulteriori immagini da diffrazione a raggi X[13] realizzate daRosalind Franklin, chimica-fisica inglese,James Watson eFrancis Crick presentarono[13], sulla rivistaNature, quello che è oggi accertato come il primo modello accurato della struttura del DNA,[14] ovvero il modello adoppia elica. A disegnarne il bozzetto fuOdile Speed, pittrice e moglie di Crick. Le evidenze sperimentali a supporto del modello di Watson e Crick furono riportate in una serie di cinque articoli pubblicati sullo stesso numero di Nature.[15] Tra questi figurava l'articolo dellaFranklin e diRaymond Gosling, che conteneva i dati di diffrazione a raggi X, fondamentale per sostenere il modello.[16][17] Tale numero conteneva anche un articolo sulla struttura del DNA scritto daMaurice Wilkins.[18] Nel1962, dopo la morte di Rosalind Franklin (a causa di un tumore provocato, probabilmente, dalle alte dosi di raggi X a cui si era esposta nel corso dei suoi esperimenti), Watson, Crick e Wilkins ricevettero congiuntamente ilPremio Nobel per la medicina.[19] Dal momento che la scoperta del modello si basò essenzialmente sui dati di Rosalind Franklin, ancora oggi esistono pareri molto eterogenei nella comunità scientifica su chi avrebbe dovuto ricevere tale premio.
Struttura a doppia elica del DNA. Sono messi in evidenza gli accoppiamenti tra le quattro basi azotate.
Il DNA è un lungopolimero costituito da unità ripetute dinucleotidi.[23][24] La catena del DNA è larga tra i 22 e i 26 Ångström (da 2,2 a 2,6 nanometri) e ogni unità nucleotidica è lunga 3,3 Ångstrom (0,33 nanometri).[25] Sebbene ogni unità occupi uno spazio decisamente ridotto, la lunghezza dei polimeri di DNA può essere sorprendentemente elevata, dal momento che ogni filamento può contenere diversi milioni di nucleotidi. Ad esempio, il più grandecromosoma umano (ilcromosoma 1) contiene quasi 250 milioni dipaia di basi.[26]
Negli organismi viventi, il DNA non è quasi mai presente sotto forma di singolo filamento, ma come una coppia di filamenti saldamente associati tra loro.[14][27] Essi si intrecciano tra loro a formare una struttura definitadoppia elica. Ogni nucleotide è costituito da unoscheletro laterale, che ne permette illegame covalente con i nucleotidi adiacenti, e da una base azotata, che instauralegami idrogeno con la corrispondente base azotata presente sul filamento opposto. Il composto formato da una base azotata legata allo zucchero è definitonucleoside; unnucleotide è invece un nucleoside a cui sono legati uno o più gruppi fosfato.[28]
La struttura laterale del DNA è composta da unità ripetute e alternate di gruppi fosfato e di 2-deossiribosio,[29] uno zuccheropentoso (a cinqueatomi dicarbonio) che si lega ai fosfati adiacenti attraversolegami fosfodiesterici presso il terzo e il quinto carbonio; in pratica, ogni molecola di fosfato forma un ponte molecolare collegando, attraverso legami fosfodiesterici, il carbonio in posizione 3′ di una molecola di deossiribosio con quello in posizione 5′ dello zucchero successivo. Conseguenza di questi legami asimmetrici è che ogni filamento di DNA ha un senso, determinato dalla direzione dei legami fosfodiesterici. Le basi azotate, invece, si uniscono in posizione 1' dello zucchero desossiribosio con legami N-glicosidici. In una doppia elica, il senso di un filamento è opposto a quello del filamento complementare. Per tale motivo, i due filamenti che costituiscono una doppia elica sono detti antiparalleli. Le estremità asimmetriche di un filamento di DNA sono definiteestremità5′ (cinque primo) ed estremità3′ (tre primo). La principale differenza tra il DNA e l'RNA è lo zucchero pentoso utilizzato: l'RNA, infatti, utilizza ilribosio.[27]
La doppia elica del DNA è stabilizzata dai legami idrogeno che si instaurano tra le basi azotate presenti sui due filamenti.[30] Le quattro basi che sono presenti nel DNA sono l'adenina (abbreviata con la lettera A), lacitosina (C), laguanina (G) e latimina (T). Tutte e quattro le basi hanno strutturaeterociclica, ma adenina e guanina sono, dal punto di vista strutturale, derivate dellapurina, e pertanto dettebasi puriniche, mentre citosina e timina sono correlate allapirimidina e dettebasi pirimidiniche.[27] Esiste una quinta base, di tipo pirimidinico, chiamatauracile (U), ma essa non è di norma presente nelle catene di DNA. L'uracile è altresì presente nei filamenti di RNA al posto della timina, dalla quale si differenzia per la mancanza di ungruppo metile. L'uracile è presente nel DNA solo come prodotto della degradazione della citosina. Solo nelbatteriofago PBS1 tale base può essere utilizzata all'interno del DNA.[31] Al contrario, è molto più frequente individuare la timina all'interno di molecole di RNA, a causa dellametilazioneenzimatica di diversi uracili. Questo evento avviene solitamente a carico di RNA con funzione strutturale o enzimatica (rRNA etRNA).[32]
La doppia elica è una spirale destrorsa. Con l'avvitarsi su sé stessi dei due filamenti, restano esposti dei solchi tra i diversi gruppi fosfato. Ilsolco maggiore è largo 22 Å, mentre ilsolco minore è largo 12 Å.[33] La differente ampiezza dei due solchi si traduce concretamente in una differente accessibilità delle basi, a seconda che si trovino nel solco maggiore o minore. Proteine che legano il DNA, come i fattori di trascrizione, dunque, solitamente prendono contatto con le basi presenti nel solco maggiore.[34][35]
In alto, un appaiamentoGC, caratterizzato da trelegami idrogeno. In basso, un appaiamentoAT con due legami idrogeno.
Ogni tipo di base presente su un filamento forma un legame con la base posta sul filamento opposto. Tale evento è noto comeappaiamentocomplementare. Le basi puriniche formano legami idrogeno con le basi pirimidiniche: A può legare solo T e G può legare solo C. L'associazione di due basi viene comunemente chiamatapaio di basi ed è l'unità di misura maggiormente utilizzata per definire la lunghezza di una molecola di DNA. Dal momento che i legami idrogeno non sonocovalenti, essi possono esser rotti e riuniti in modo relativamente semplice, poiché questi sono legami ad alta energia. I due filamenti possono essere allontanati tra loro, come avviene per unacerniera, sia dalle altetemperature che da un'azione meccanica (come avviene durante lareplicazione del DNA).[36] Conseguenza di questa complementarità è che tutte le informazioni contenute nella doppia elica possono essere duplicate a partire da entrambi i filamenti, evento fondamentale per una corretta replicazione del DNA.[23]
I due tipi di paia di basi formano un numero differente di legami idrogeno: A e T ne formano due, G e C tre. Per tale motivo, la stabilità del legame GC è decisamente maggiore di quello AT. Di conseguenza, la stabilità complessiva di una molecola di DNA è direttamente correlata alla frequenza di GC presenti nella molecola stessa, nonché alla lunghezza dell'elica: una molecola di DNA è dunque tanto più stabile quanto più contiene GC ed è lunga.[37] Un'altra conseguenza di tale evento è il fatto che le regioni di DNA che devono essere separate facilmente contengono un'elevata concentrazione di A e T, come avviene ad esempio per ilPribnow box deipromotori batterici, la cui sequenza è infatti TATAAT.[38]
In laboratorio, la stabilità dell'interazione tra filamenti è misurata attraverso la temperatura necessaria a rompere tutti i legami idrogeno, chiamatatemperatura di melting (oTm). Quando tutti i legami idrogeno sono rotti, i singoli filamenti si separano e possono assumere strutture molto variegate.[39]
Struttura chimica del DNA. Le sequenze possono essere definitesenso e non senso.
Unasequenza di DNA è definitasenso se la sua sequenza è la stessa del relativomRNA. La sequenza posta sul filamento opposto è invece dettaantisenso. Dal momento che leRNA polimerasi lavorano producendo una copia complementare, il filamento necessario per latrascrizione è l'antisenso. Sia nei procarioti che negli eucarioti vengono prodotte numerose molecole diRNA antisenso a partire dalle sequenzesenso. La funzione di questiRNA non codificanti non è stata ancora completamente chiarita.[41] Si ritiene che gli RNA antisenso possano giocare un ruolo nella regolazione dell'espressione genica.[42]
Esistono alcune sequenze di DNA, sia in procarioti che in eucarioti (ma soprattutto neiplasmidi e neivirus) in cui la differenza tra sequenze senso e antisenso è meno chiara, dal momento che le sequenze di alcuni geni si sovrappongono tra loro.[43] In questi casi, dunque, alcune sequenze rivestono un doppio compito: codificare una proteina se lette in direzione 5'→3′ su un filamento; codificarne un'altra se lette sull'altro (sempre in direzione 5'→3′). Nei batteri, questa sovrapposizione genica è spesso coinvolta nella regolazione della trascrizione,[44] mentre nei virus il fenomeno è dovuto alla necessità di contenere in un piccologenoma un'elevata quantità di informazioni.[45] Un altro modo di ridurre le dimensioni genomiche è quello individuato da altri virus, che contengono molecole di DNA lineare o circolare a singolo filamento.[46][47]
Il DNA può essere distorto come avviene per una corda attraverso un processo definitosuperavvolgimento. Quando il DNA è in uno statorilassato, un filamento percorre un giro completo intorno all'asse ogni 10.4 paia di basi. Se invece il DNA è distorto, il numero di basi può aumentare o diminuire.[48] Lo stato di superavvolgimento in cui si trova una molecola di DNA è definitotopologia. Se il DNA si avvolge nella direzione dell'elica, si parla disuperavvolgimento positivo, con le basi strette tra loro in modo più marcato. In caso contrario, si parla disuperavvolgimento negativo. In natura, la maggior parte delle molecole di DNA presentano un lieve superavvolgimento negativo, introdotto da enzimi definititopoisomerasi.[49] Questi enzimi sono anche necessari in processi come la trascrizione e la replicazione del DNA, dal momento che sono in grado di risolvere gli stress topologici indotti dai processi stessi.[50]
Il DNA esiste in diversi tipi diconformazioni. Esse sono denominate A-DNA, B-DNA, C-DNA, D-DNA,[51] E-DNA,[52] H-DNA,[53] L-DNA,[51] P-DNA[54] e Z-DNA.[29][55] In ogni caso, solo le conformazioni A-DNA, B-DNA e Z-DNA sono state osservate nei sistemi biologici naturali. La conformazione del DNA può dipendere dalla sequenza, dal superavvolgimento, dalla presenza di modificazioni chimiche delle basi o dalle condizioni del solvente, come la concentrazione diionimetallici.[56] Di tali conformazioni, la conformazioneB è la più frequente nelle condizioni standard delle cellule.[57] Le due conformazioni alternative sono differenti dal punto di vista dellageometria e delle dimensioni.
La formaA è un'ampia spirale destrorsa (il solco minore è largo ma poco profondo, quello maggiore è più stretto e profondo), con un passo di 2,9 nm (circa 11bp) e un diametro di 2,5 nm. Tale conformazione è presente in condizioni non fisiologiche, quando il DNA viene disidratato. In condizioni fisiologiche, questa conformazione caratterizza glieteroduplex di DNA e RNA e i complessi formati dalle associazioni DNA-proteina.[58][59]
La conformazioneZ è tipica invece delle sequenze che presentano modificazioni chimiche come lametilazione, e dei tratti di DNA ricchi di basi C e G. Essa assume un andamento sinistrorso, opposto rispetto alla conformazione B.[60] Ha un passo di 4,6 nm e un diametro di 1,8 nm, il solco maggiore più superficiale e quello minore più stretto; deve il suo nome all'andamento a zig-zag che la caratterizza. Queste strutture inusuali possono essere riconosciute da specifiche Z-DNA-binding proteins, con conseguenze notevoli nella regolazione della trascrizione, anche se non ne sono stati trovati esempi in natura.[61]
La struttura di unquadruplex di DNA formato da ripetizioni ditelomeri. La conformazione dello scheletro laterale è ampiamente differente rispetto alla tipica struttura a elica. In verde sono evidenziati ioni potassio che stabilizzano la struttura.[62]
Le regioni terminali deicromosomi lineari sono sequenze ripetute dettetelomeri. La funzione principale di tali regioni è quella di permettere alla cellula di replicare le estremità dei cromosomi senza che ci sia perdita di informazioni geniche, dal momento che leDNA polimerasi coinvolte nella replicazione del DNA non sono in grado di replicare le estremità 3' dei cromosomi.[63] Se un cromosoma non avesse telomeri, infatti, diventerebbe un po' più corto a ogni replicazione, con il rischio di perdere sequenze codificanti. Attraverso un particolare tipo di DNA polimerasi (dettotelomerasi), invece, i telomeri mantengono costantemente la loro lunghezza, proteggendo così la parte interna del cromosoma. Nelle cellule umane, i telomeri sono composti da alcune migliaia di ripetizioni di una semplice sequenza costituita da TTAGGG.[64]
Questa sequenza ricca in guanina può stabilizzare le estremità dei cromosomi formando strutture insolite, composte da unità di quattro basi azotate al posto delle canoniche due. Ciò è dovuto all'interazione tra quattro guanine, che formano una struttura planare che si impila sopra ad altre strutture dello stesso tipo, a ottenere un filamento stabile definitoG-quadruplex structure.[65] Tali strutture sono stabilizzate dalla formazione di legami idrogeno che si instaurano tra le sommità delle basi e dallachelazione con uno ione metallico, situato al centro di ogni unità di quattro basi.[66]
Oltre a queste, i telomeri generano anche strutture circolari, chiamatetelomere-loops oT-loops. In questo caso, il singolo filamento di DNA si piega a formare ampie circonferenze, stabilizzate da proteine specifiche che legano i telomeri.[67] Al termine delT-loop, il singolo filamento di DNA prende contatto con un doppio filamento, che si apre e forma una struttura atripla elica. Questa struttura è chiamatadisplacement-loop oD-loop.[65]
Struttura della citosina senza (a sinistra) e con (al centro) il gruppometile in posizione 5. In seguito a unadeaminazione, la 5-metilcitosina (al centro) acquisisce la stessa struttura della timina (a destra).
L'espressione genica di un determinatolocus è influenzata dalla struttura che lacromatina assume presso il locus stesso. Regionieterocromatiniche (caratterizzate da un'espressione scarsa o assente) sono estesamentemetilate sullecitosine. La metilazione della citosina, ad esempio, è fondamentale per l'inattivazione del cromosoma X.[68] Il livello medio di metilazione è molto variabile tra i diversi organismi:Caenorhabditis elegans non presenta metilazione delle citosine, mentre ivertebrati mostrano livelli maggiori, con circa l'1% delgenoma contenente 5-metilcitosina.[69] La 5-metilcitosina, essendo suscettibile di deaminazione spontanea, è una base presso cui l'incidenza di mutazioni è elevatissima.[70]
Ulteriori modificazioni di basi sono la metilazione dell'adenina (presente nei batteri) e laglicosilazione dell'uracile che produce le cosiddettebasi J neicinetoplastidi.[71][72]
Ilbenzopirene è il maggiore agente mutageno presente nel fumo ditabacco. In quest'immagine è riportato un addotto al DNA generato dalla molecola.[73]
Il DNA può essere alterato dall'azione di numerosi agenti, genericamente definitimutageni; è fondamentale notare però come una mutazione -ovverosia un cambiamento raro, casuale, che alteri la sequenza di basi azotate- non sia necessariamente un evento pernicioso ma anzi sia alla base dell'evoluzione: suddetta mutazione dovrà però farsi spazio nella fittissima rete cibernetica cellulare nonché nell'ambiente nel quale vive e opera l'organismo vivente in questione; qualora vengano superati questi punti di restrizione (altamente selettivi vista la loro complessità intrinseca, la stragrande maggioranza delle mutazioni difatti si rivela non vantaggiosa od anche neutra), si avrà un organismo arricchito dalla mutazione. Tra gli agenti alteranti figurano ad esempioagenti ossidanti,agenti alchilanti e ancheradiazioni ad alta energia, come iraggi X e gliUV.
Il tipo di danno causato al DNA dipende dal tipo di agente: gli UV, ad esempio, danneggiano il DNA generando la formazione didimeri di timina, costituiti da ponti aberranti che si instaurano tra basi pirimidiniche adiacenti.[74] Agenti ossidanti come iradicali liberi o ilperossido di idrogeno, invece, producono danni di tipo più eterogeneo, come modificazioni di basi (in particolare di guanine) o rotture del DNA a doppio filamento.[75] Secondo diversi studi, in ogni cellula umana almeno 500 basi al giorno sono sottoposte a danni ossidativi.[76][77] Di tali lesioni, le più pericolose sono le rotture a doppio filamento, dal momento che tali danni sono i più difficili da riparare e costituiscono l'origine primaria dellemutazioni puntiformi eframeshift che si accumulano sulle sequenze genomiche, nonché delletraslocazioni cromosomiche.[78]
Molti agenti devono il loro potere mutageno alla capacità diintercalarsi tra due basi azotate consecutive. Gli intercalanti sono tipicamente molecole planari earomatiche, come l'etidio, ladaunomicina, ladoxorubicina o latalidomide. Perché un intercalante possa trovare posto tra le due basi, occorre che la doppia elica si apra e perda la sua conformazione standard. Tali modifiche strutturali inibiscono sia la trascrizione che la replicazione del DNA e aumentano la possibilità di insorgenza di mutazioni. Per tale motivo, gli intercalanti sono considerati molecolecancerogene, come dimostrato da numerosi studi su molecole come ilbenzopirene, l'acridina, l'aflatossina e ilbromuro di etidio.[79][80][81] In ogni caso, proprio grazie alla loro capacità di inibire trascrizione e replicazione, tali molecole sono anche utilizzate inchemioterapia per inibire la rapida crescita delle cellule neoplastiche.[82]
Neglieucarioti, il DNA è solitamente presente all'interno dicromosomi lineari (circolari neiprocarioti). La somma di tutti i cromosomi di una cellula ne costituisce ilgenoma; ilgenoma umano conta circa 3 miliardi dipaia di basi contenute in 46 cromosomi.[83]
La disposizione finale a cromosomi segue precise regole gerarchiche diimpacchettamento. Nelle cellule, infatti, il doppio filamento di DNA non può essere dispostoa casaccio, ma deve seguire precise regole di ordinamento. Tali accorgimenti si rivelano necessari perché la lunghezza dei filamenti di DNA è solitamente molto elevata e creerebbe seri problemi alla cellula ospite. Ad esempio, il cromosoma diEscherichia coli, il procariote più studiato nella storia della biomedicina, misura circa 1 mm. In una cellula lunga solo 2 µm, come quella di E.coli, la disposizione casuale di un cromosoma del genere potrebbe generare problemi. Se una molecola di questa lunghezza si disponesse casualmente, infatti, ci sarebbe bisogno di una cellula grande almeno1000 volte tanto. Le modalità diimpacchettamento sono differenti tra gli organismiprocarioti e quellieucarioti.
Nella maggior parte delle cellule batteriche il DNA è disposto su un unico cromosoma circolare (e presenta, come molti altri batteri, un'unicaorigine di replicazione), come previsto da numerosi esperimenti di linkage e infine evidenziato in cellule cresciute contimina marcata contritio.
I meccanismi messi in atto dalla cellula procariote per ridurre lo spazio necessario consistono anzitutto nelmascheramento delle cariche negative presenti sul DNA attraverso la sua associazione conpoliammine cariche positivamente, come laspermina e laspermidina. Oltre a queste, il DNA procariote prende contatto anche con numerose piccole proteine, che compattano la struttura complessiva del DNA. Tra di esse, figuraH-NS, un dimero con funzioni molto simili agli istoni eucariotici. In ogni cellula di E.coli esistono in media20000 molecole di H-NS, che si dispongono lungo il DNA a distanza di circa 400bp.
Il DNA di E.coli è inoltre moltosuperavvolto. Tale fenomeno contribuisce ulteriormente al compattamento del DNA, permettendo a esso di disporsi comodamente all'interno della cellula.
Negli eucarioti l'impacchettamento è ottenuto attraverso diversi accorgimenti. Il DNA è associato a un gran numero di proteine: l'associazione complessiva DNA-proteine è definitacromatina, la cui struttura è ampiamente conservata tra tutti gli organismi eucarioti.
Le proteine cromatiniche più abbondanti sono gliistoni, una famiglia di polipeptidibasici presenti nel nucleo. Le principali proteine istoniche sonoH1,H2A,H2B,H3 e H4. La basicità degli istoni è dovuta alla grande quantità di amminoacidi carichi positivamente (lisina earginina), in grado di instaurare interazioni elettrostatiche con i gruppi fosfato del DNA. Le proteine istoniche sono anche pesantemente modificate, proprio sui residui carichi, damodificazioni post-traduzionali, tra cui l'aggiunta diacetili, difosfati e dimetili, che neutralizzano la carica positiva o la rendono negativa.
Le sequenze amminoacidiche di quattro dei cinque istoni (H2A, H2B, H3 e H4) sono altamente conservate, anche tra specie molto diverse. La sequenza di H1 presenta invece maggiori variazioni lungo l'evoluzione: in alcuni organismi, H1 non è nemmeno presente in tutti i tessuti (ad esempio neglieritrociti degliuccelli H1 è sostituita da un sesto istone, chiamato H5). La presenza di differenti H1, in ogni caso, non modifica sostanzialmente la struttura complessiva dell'apparato istonico (definitonucleosoma), che resta ampiamente conservato nell'architettura nella quasi totalità degli eucarioti.
Nel genoma, l'informazione è conservata in sequenze di DNA chiamategeni. La trasmissione dell'informazione contenuta nei geni è garantita dalla presenza di sequenze di basi azotate complementari. Infatti, durante latrascrizione, l'informazione può essere facilmente copiata in un filamento complementare di RNA. Solitamente, tale copia di RNA è utilizzata per sintetizzare una proteina, attraverso un processo definitotraduzione (o sintesi proteica). In alternativa, una cellula può semplicemente duplicare l'informazione genetica attraverso un processo definitoreplicazione del DNA.
Negli organismi eucarioti, il DNA genomico è localizzato all'interno del nucleo cellulare, nonché in piccole quantità all'interno dimitocondri ecloroplasti. Nei procarioti, il DNA è invece racchiuso in un organello irregolare, privo di membrana, contenuto nel citoplasma, chiamatonucleoide.[84] L'informazione è contenuta all'interno dei geni, unitàereditarie in grado di influire sulfenotipo dell'organismo. Ogni gene contiene unopen reading frame (regione in grado di essere trascritta a RNA) e una regione regolatoria, costituita sia da unpromotore che daenhancers.
In moltespecie, solo una piccola frazione della sequenza totale di un genoma può essere trascritta e tradotta. Ad esempio, solo l'1,5% del genoma umano è costituito daesoni codificanti una proteina, mentre più del 50% consiste disequenze ripetute diDNA non codificante.[85] La ragione per cui ci sia una tale quantità di DNA non codificante non è tuttora completamente chiara ed è stata definita comeenigma del C-value.[86] In ogni caso, le sequenze di DNA che non codificano una proteina possono essere trascritte inRNA non codificante, coinvolto nella regolazione dell'espressione genica.[87]
UnaT7 RNA polimerasi (blu) mentre produce una molecola di mRNA (verde) a partire da uno stampo di DNA (arancione).[88]
Alcune sequenze non codificanti ricoprono un ruolo strutturale per i cromosomi. Le regionitelomeriche ecentromeriche contengono solitamente pochissimi geni, ma sono necessarie per la funzione e la stabilità dei cromosomi.[89] Nell'uomo, grandi quantità di DNA non codificante si ritrovano neglipseudogeni, copie di geni rese inattive dalla presenza di una mutazione.[90] Queste sequenze sono considerate comefossili molecolari, anche se esistono evidenze secondo le quali si può ipotizzare che siano una sorta dimateriale grezzo necessario per la creazione di nuovi geni attraverso i processi diduplicazione genica e dievoluzione divergente.[91]
Un gene è una sequenza di DNA che contiene le informazioni in grado di influire sulle caratteristiche delfenotipo dell'organismo. All'interno di un gene, la sequenza di basi di DNA è utilizzata come stampo per la sintesi di una molecola di RNA che, nella maggior parte dei casi, è tradotta in una molecola peptidica.
Il meccanismo attraverso il quale la sequenza nucleotidica di un gene è copiata in un filamento di RNA è dettotrascrizione e avviene per mezzo dell'enzimaRNA polimerasi. Il filamento di RNA può andare incontro a destini differenti: alcune molecole di RNA hanno funzioni di tipo strutturale (come quelle che si trovano all'interno delribosoma) o catalitica (molecole note comeribozimi); la funzione più nota è tuttavia quella dellatraduzione in proteine tramite la produzionemRNA. Il processo di traduzione avviene nel citoplasma, dove gli mRNA si associano ai ribosomi, ed è mediato dalcodice genetico. Il ribosoma permette la lettura sequenziale dei codoni del mRNA, favorendone il riconoscimento e l'interazione con specificitRNA, molecole che trasportano gli amminoacidi corrispondenti a ogni singolo codone.
Ilcodice genetico consiste diparole di tre lettere chiamatecodoni, costituite dalla sequenza di tre nucleotidi (ad esempio ACU, CAG, UUU), presenti sull'mRNA, ognuna delle quali è associata a un particolare amminoacido. Ad esempio la timina ripetuta in una serie di tre (UUU) codifica lafenilalanina. Utilizzando gruppi di tre lettere si possono avere fino a 64 combinazioni diverse (), in grado di codificare i venti diversi amminoacidi esistenti. Poiché esistono 64 triplette possibili e solo 20 amminoacidi, ilcodice genetico è dettoridondante (odegenere): alcuni amminoacidi possono infatti essere codificati da più triplette diverse. Non è invece vero il contrario: a ogni tripletta corrisponderà un solo amminoacido (senza possibilità di ambiguità). Esistono infine tre triplette che non codificano alcun amminoacido, ma rappresentano codoni distop (ononsense), ovvero indicano il punto in cui, all'interno del gene, termina la sequenza che codifica la proteina corrispondente: si tratta dei codoni UAA, UGA e UAG.
La divisione cellulare, necessaria a un organismo per crescere e vivere, richiede una duplicazione del DNA cellulare, in modo che le cellule figlie possano avere la stessa informazione genetica della cellula madre. La struttura a doppia elica del DNA permette un meccanismo estremamente semplice per la replicazione del DNA. I due filamenti, infatti, sono separati e da ognuno viene creato un filamento complementare, a opera di un enzima chiamatoDNA polimerasi. Con questo meccanismo, le basi presenti sul filamento figlio sono determinate da quelle presenti sul filamento parentale: è proprio attraverso questo meccanismo che le cellule figlie presentano genoma identico alla cellula madre (salvo errori avvenuti durante il processo, che portano alla comparsa di mutazioni). Tale tipo di replicazione, che porta a doppie eliche costituite da un filamento preesistente e uno neoformato è dettasemiconservativa.
Per iniziare la replicazione, occorre anzitutto l'apertura dellaforca replicativa, attraverso la parziale denaturazione del DNA a doppia elica, portata a termine dalle elicasi e dallesingle-strand-binding proteins (SSBPs): leelicasi sono enzimi che separano attivamente i due filamenti usando l'energia dell'ATP; le SSBPs sono in grado di mantenere la denaturazione del DNA legandosi esclusivamente alle porzioni a singolo filamento e stabilizzandole. Nelle molecole di DNA circolari deiprocarioti si ha una sola regione diorigine della replicazione dalla quale partono due forche replicative (la struttura prende il nome dibolla di replicazione). Quando le due forche si incontrano dal lato opposto la replicazione è completata. Neglieucarioti la replicazione di ogni cromosoma inizia invece in più punti.
LeDNA polimerasi, enzimi capaci di costruire una nuova catena solo in direzione 5'-3', sono stati individuati per la prima volta daArthur Kornberg, il quale, grazie a un suo famoso esperimento,[92] identificò la DNA polimerasi I inEscherichia coli. La reazione della DNA polimerasi èdiretta dallo stampo, perché produce un nuovo filamento di DNA esattamente complementare a uno preesistente che funge, appunto, da stampo. La DNA polimerasi non è in grado di iniziare la sintesi di un filamentoex novo, mentre può allungare un filamento polinucleotidico preesistente. In una cellula in replicazione, dunque, è indispensabile la presenza di un filamento preesistente (dettoprimer), che consiste solitamente in un breve segmento di RNA complementare allo stampo, sintetizzato da enzimi specifici dettiprimasi.
Dal momento che le DNA polimerasi sono in grado di svolgere la loro attività solo in direzione 5'-3', esse hanno messo a punto diversi meccanismi per copiare i due filamenti della doppia elica.[93] Un filamento (chiamatofilamento guida) può essere replicato in modo quasi continuo, man mano che viene esposto, l'altro (filamento lento) risulta invece disseminato da brevi filamenti di DNA di nuova sintesi (iframmenti di Okazaki), ognuno dei quali presenta un innesco iniziale di RNA. I nuovi filamenti devono essere quindi completati mediante la rimozione degli inneschi da parte diendonucleasi e il riempimento degli spazi rimasti a opera di polimerasi diriparazione. Successivamente tutti questi frammenti di DNA di nuova sintesi delfilamento lento vengono legati dalleDNA ligasi.
Tutte le funzioni del DNA dipendono dalle sue interazioni con specifiche proteine. Tali interazioni possono sia essere aspecifiche, sia prevedere un legame estremamente specifico della proteina a una singola sequenza di DNA. Sono numerosi anche gli enzimi che possono legare il DNA e, tra questi, sono particolarmente importanti le polimerasi che copiano le sequenze nella trascrizione e nella replicazione del DNA.
Interazione del DNA con gliistoni (in bianco). Gli amminoacidi basici di queste proteine (in blu) legano in modo noncovalente i gruppi fosfato del DNA, acid (in rosso).
Le proteine strutturali che legano il DNA sono esempi delle interazioni aspecifiche tra DNA e proteine. All'interno dei cromosomi, il DNA è associato a complessi di natura proteica, che si organizzano tra loro a formare una struttura compatta chiamatacromatina. Negli eucarioti, questa struttura presuppone il legame del DNA a piccoli complessi proteici basici chiamatiistoni; nei procarioti, invece, sono coinvolti diversi tipi di differenti proteine.[94][95] Gli istoni formano un complesso a forma di disco chiamatonucleosoma, che instaura interazioni di tipo ionico (tra i residui basici degli istoni e lo scheletro fosforico acido del DNA) con circa duecento paia di basi di DNA, che si avvolgono intorno al disco formando due giri completi, indipendentemente dalla sequenza che li caratterizza.[96] Questi residui basici possono subiremetilazioni,fosforilazioni eacetilazioni:[97] tali modificazioni chimiche alterano l'interazione tra gli istoni e il DNA, rendendolo così più o meno accessibile aifattori di trascrizione e modulando la velocità della trascrizione stessa.[98]
AltreDNA-binding proteins (DNAbp) di tipo aspecifico, anch'esse presenti nellacromatina, sono lehigh-mobility group proteins, che legano preferenzialmente il DNA ripiegato o distorto.[99] Queste proteine hanno un ruolo fondamentale nel ripiegamento delle file di nucleosomi e nel loro impacchettamento all'interno di strutture cromatiniche più complesse.[100]
Un ulteriore gruppo di DNAbp sono lesingle-strand-binding proteins (SSBP), che si legano esclusivamente a una molecola di DNA a singolo filamento. Nell'uomo, la RPA (replication protein A) è il membro meglio caratterizzato di questa famiglia ed è essenziale per la maggior parte dei processi che richiedono una separazione della doppia elica, tra cui la replicazione del DNA, la sua ricombinazione e la suariparazione.[101] Queste DNAbp sono in grado di stabilizzare la forma a singolo filamento, impedendo che la molecola si ripieghi a formarestem loops o venga degradata dall'azione dellenucleasi.
Il repressore lambda, con la sua caratteristica strutturaelica-giro-elica, legato al proprio DNA bersaglio[102]
A differenza di quelle finora presentate, esistono anche numerose proteine che legano specificamente determinate sequenze di DNA. Quelle maggiormente studiate sono ifattori di trascrizione (TF), proteine in grado di regolare la trascrizione. Ognuna di esse si lega a una o più sequenze specifiche, poste solitamente nei pressi delpromotore di un gene, attivando o inibendo la trascrizione del gene stesso. Tale processo viene svolto attraverso due tipi di meccanismo: anzitutto, i TF sono in grado di legare, direttamente o attraverso proteine adattatrici, la RNA polimerasi responsabile della trascrizione, localizzandola presso il sito di inizio della trascrizione e favorendone dunque l'avvio;[103] un'altra modalità consiste nel legame tra i TF ed enzimi in grado di modulare metilazioni e acetilazioni degli istoni presenti presso il promotore, modificando dunque l'accessibilità di quella regione alla polimerasi.[104]
Dal momento che un TF può avere numerose sequenze bersaglio, cambiamenti di attività di un TF possono avere effetti sull'espressione di migliaia di geni.[105] Di conseguenza, queste proteine sono spesso i bersagli finali delle cascate ditrasduzione del segnale, che mediano le risposte cellulari agli stimoli interni ed esterni alla cellula. La specificità dei TF per il DNA è legato ai contatti multipli che si instaurano tra la proteina e il solco maggiore, dove le basi azotate sono maggiormente accessibili.[34]
Lenucleasi sonoenzimi in grado di tagliare filamenti di DNA, dal momento che catalizzano l'idrolisi dellegame fosfodiesterico. Le nucleasi che idrolizzano il DNA partendo dai nucleotidi situati alle estremità dei filamenti sono definiteesonucleasi. Sonoendonucleasi, invece, quelle che tagliano direttamente all'interno del filamento. Le nucleasi più utilizzate inbiologia molecolare, detteenzimi di restrizione, tagliano il DNA in corrispondenza di specifiche sequenze. L'enzimaEcoRV, ad esempio, riconosce la sequenza di sei basi 5′-GAT|ATC-3′ ed effettua il taglio presso la linea verticale. In natura, questo enzima protegge ibatteri dalle infezionifagiche, digerendo il DNA del fago quando esso fa il suo ingresso nella cellula batterica.[107]Generalmente, le nucleasi di restrizione riconoscono particolari sequenze nucleotidichepalindromiche, note comesiti di restrizione, nelle quali la stessa sequenza si ripete in direzioni opposte sulle due eliche complementari, e quindi producono dei tagli su entrambi i filamenti. Tali enzimi sono utilizzati ampiamente nelle tecniche che prevedono ilsubclonaggio di DNA all'interno divettori. Si crede che le sequenze palindromiche possano essere, oltre a sti di restrizione, anche segnali di riconoscimento per alcune proteine di regolazione oppure segnalare il sito di avvio della replicazione del DNA.
LeDNA ligasi sono enzimi in grado di riunire filamenti di DNA precedentemente tagliati o spezzati, utilizzando energia chimica proveniente daATP o daNAD.[108] Le ligasi sono particolarmente importanti nella replicazione delfilamento lento, dal momento che esse riuniscono iframmenti di Okazaki in un filamento unico. Esse rivestono un ruolo importante anche nellariparazione del DNA e nellaricombinazione genetica.[108]
Letopoisomerasi sono enzimi che presentano sia un'attivitànucleasica che unaligasica. Queste proteine sono in grado di modificare le proprietàtopologiche del DNA. Alcune di esse svolgono tale funzione tagliando l'elica di DNA e permettendole di ruotare, riducendo il suo grado di superavvolgimento, per poi procedere alla ligazione delle due estremità.[49] Altre topoisomerasi sono invece in grado di tagliare l'elica e far passare attraverso il sito di rottura una seconda elica, prima di ligare il filamento spezzato.[109] Le topoisomerasi sono necessarie per molti processi che coinvolgono il DNA, come ad esempio la replicazione del DNA e la trascrizione.[50]
Leelicasi sono proteine in grado di utilizzare l'energia chimica presente neinucleosidi trifosfato, soprattuttoATP, per rompere i legami idrogeno che si instaurano tra le basi azotate, permettendo l'apertura della doppia elica di DNA in singoli filamenti.[110] Questi enzimi sono essenziali per la maggior parte dei processi biologici che coinvolgono enzimi che richiedono un diretto contatto con le basi del DNA.
Lepolimerasi sono enzimi che sintetizzano catene polinucleotidiche a partire dalnucleosidi trifosfato. Esse funzionano aggiungendo nucleotidi al 3′-OH del precedente nucleotide presente sul filamento. Come conseguenza di ciò, tutte le polimerasi lavorano in direzione5′-3′.[111] Nel sito attivo di questi enzimi, il nucleoside trifosfato si appaia a un nucleotide presente su un filamento usato come stampo: ciò permette alle polimerasi di sintetizzare in modo accurato filamenti fedelmente complementari agli stampi. Le polimerasi sono classificate sulla base del tipo di stampo che utilizzano.
Lareplicazione del DNA richiede unaDNA polimerasi DNA-dipendente, in grado cioè di realizzare una perfetta copia di una sequenza di DNA. L'accuratezza è fondamentale in questo processo, motivo per cui molte di queste polimerasi presentano anche un'attività diproofreading (dall'inglese,correzione di bozze). Esse sono infatti in grado di rilevare un errore di appaiamento (omismatch) tra basi azotate e attivare un'azione 3' o 5' esonucleasica per rimuovere la base scorretta.[112] Nella maggior parte degli organismi, le DNA polimerasi funzionano all'interno di un più ampio complesso proteico definitoreplisoma, che consiste anche di numerose subunità accessorie come ad esempio leelicasi.[113]
LeDNA polimerasi RNA-dipendenti sono una classe di polimerasi specializzate nella sintesi di una copia di DNA, usando come stampo un frammento di RNA. Tra di esse figurano latrascrittasi inversa, un enzima virale coinvolto nell'infezione deiretrovirus, e latelomerasi, necessaria per la replicazione deitelomeri.[63][114] La telomerasi è una polimerasi inusuale, dal momento che contiene una sequenza stampo di RNA all'interno della propria struttura.
La trascrizione è invece svolta daRNA polimerasi DNA-dipendenti, che legano il DNA presso ilpromotore di un gene e separano i due filamenti. Successivamente, l'enzima genera una molecola dimRNA fino al raggiungimento delterminatore, dove si interrompe la trascrizione e l'enzima si distacca dal DNA. Come avviene per le DNA polimerasi DNA-dipendenti, anche queste polimerasi operano all'interno di un ampio complesso proteico, composto di molecole accessorie e regolatorie.[115]
Un filamento di DNA solitamente non interagisce con altri segmenti di DNA e, nelle cellule umane, i differenti cromosomi occupano addirittura regioni separate del nucleo (territori cromosomici).[117] Tale separazione fisica è fondamentale per permettere al DNA di essere un archivio stabile e sicuro dell'informazione genetica. L'interazione tra diversi segmenti di DNA è invece possibile e frequente attraverso il fenomeno delcrossing-over, che permette laricombinazione genetica attraverso la rottura di due eliche, lo scambio di segmenti tra di esse e il ricongiungimento finale.
La ricombinazione permette ai cromosomi di scambiare informazioni genetiche e produrre nuove combinazioni di geni, con il risultato di aumentare l'efficienza dellaselezione naturale e di facilitare l'evoluzione di nuove proteine.[118] La ricombinazione genetica può anche essere coinvolta nella riparazione del DNA, in particolare come risposta cellulare in seguito a rotture a doppio filamento.[119]
La principale forma di crossing-over cromosomico è laricombinazione omologa, nella quale i due cromosomi coinvolti condividono sequenze molto simili. Le ricombinazioni non omologhe, invece, possono essere dannose per la cellula, perché in grado di produrretraslocazioni cromosomiche e anomalie genetiche. La reazione di ricombinazione è catalizzata da enzimi noti comericombinasi.[120] Il primo passaggio del processo di ricombinazione consiste nella rottura a singolo filamento provocata da un'endonucleasi o da un danno al DNA.[121] Una serie di passaggi successivi, in parte catalizzati dalla ricombinasi, porta all'unione tra due eliche attraverso la formazione di unagiunzione di Holliday, nella quale un segmento a singolo filamento di ogni elica è appaiato al filamento complementare presente sull'altra elica. La reazione di ricombinazione è quindi interrotta dalla rottura della giunzione e dalla re-ligazione del DNA così ottenuto.[122]L'esistenza della giunzione di Holliday è stata dimostrata da fotografie al microscopio elettronico di molecole di DNA in ricombinazione.
Il DNA contiene l'informazione genetica che permette a tutti gli organismi viventi (esclusi i virus, la cui ammissibilità tra i viventi è tuttavia ampiamente dibattuta) di funzionare, crescere e riprodursi. In ogni caso, non è stato ancora chiarito in quale momento dellastoria della vita il DNA abbia assunto tale ruolo fondamentale. È generalmente accettato dalla comunità scientifica, infatti, l'ipotesi che il DNA non sia stato il primo acido nucleico a essere utilizzato dai viventi: tale ruolo spetterebbe infatti all'RNA.[123][124] L'RNA potrebbe aver giocato un ruolo centrale del metabolismo cellulare ancestrale, dal momento che può avere sia un ruolo nella conservazione dell'informazione genetica, sia uno catalitico (ad esempio attraverso iribozimi), sia uno strutturale (all'interno deiribosomi).[125] Ilmondo a RNA, basato su un unico tipo di molecola avente funzioni genetiche, catalitiche e strutturali, potrebbe avere avuto un'influenza sullo sviluppo dell'attuale codice genetico, basato proprio su quattro nucleotidi. Tale numero potrebbe essere un compromesso tra la necessità da una parte di ridurre la quantità di basi possibili, per migliorare l'accuratezza della replicazione, e dall'altra di aumentarla, per incrementare l'efficacia catalitica dei ribozimi.[126]
Non si conoscono fossili di DNA risalenti all'origine della vita (dopo il mondo a RNA) per poterne studiare l'evoluzione molecolare, dal momento che è impossibile recuperare DNA dai fossili. Ciò è dovuto al fatto che il DNA può sopravvivere nell'ambiente per meno di un milione di anni e, se in soluzione, si degrada rapidamente in piccoli frammenti.[127] Sebbene ci siano stati diversi annunci di scoperte di DNA antichissimo, tra cui quella relativa all'isolamento di un batterio vivo da un cristallo di sale risalente a 250 milioni di anni fa,[128] queste affermazioni sono controverse.[129][130]
La moderna biologia e biochimica fa un uso intensivo del DNA. Con il termine diDNA ricombinante ci si riferisce a segmenti di DNA realizzati e assemblati artificialmente. Essi possono essere inseriti all'interno di organismi viventi sotto forma diplasmidi o mediante altri tipi divettori.[131] Gli organismi così prodotti sono dettigeneticamente modificati e possono essere utilizzati per la produzione di proteine ricombinanti, necessarie per la ricerca biomedica,[132] o per le coltivazioniagricole.[133][134]
Lamedicina forense si serve del DNA, generalmente isolato dalsangue, dallapelle, dallasaliva, daicapelli e da altri tessuti e fluidi biologici, per identificare i responsabili di atti criminosi, come delitti o violenze. Il processo utilizzato è ilfingerprinting genetico: tale tecnica consiste nel comparare la lunghezza delle sezioni variabili delDNA ripetitivo, come leshort tandem repeats e iminisatelliti, che possono risultare molto diverse tra un individuo e l'altro. La comparazione tra due campioni di DNA in esame, non si basa perciò sull'analisi di tutta la sequenza desossiribonucleotidica, ma solo su tali sezioni. Infatti, due individui non legati da rapporti di parentela hanno in comune ben il 99,9% di sequenza di DNA. Tale metodo è solitamente molto affidabile,[135] anche se a volte l'identificazione dei criminali può risultare complicata qualora la scena sia contaminata dal DNA di diverse persone.[136] Questo metodo, sviluppato nel1984 dalgenetistabritannico SirAlec Jeffreys,[137] fu usato per la prima volta nel1988 per incriminare Colin Pitchfork. Nella pratica attuale, spesso i sospettati sono invitati a fornire un campione di DNA per il confronto con eventuali reperti biologici presenti sulla scena del delitto. Il fingerprinting genetico può essere utilizzato anche per identificare le vittime di incidenti di massa.
L'acquisizione del DNA senza consenso viene indicato con il termine diGene theft.
Labioinformatica è una branca dellabiologia che comprende la manipolazione, la ricerca e ildata mining dei dati relativi a sequenze di DNA. Lo sviluppo di tecniche utili a immagazzinare e ricercare sequenze di DNA, infatti, ha condotto ad ampi sviluppi dell'informatica applicata alla biologia molecolare, specialmente per quanto riguarda gli algoritmi di ricerca di stringhe e l'apprendimento automatico.[138] Gli algoritmi di ricerca (o appaiamento) di stringhe, in grado di individuare la presenza di una sequenza di lettere all'interno di sequenze molto più ampie, furono inizialmente sviluppati per la ricerca di specifiche sequenze nucleotidiche.[139]
Esistono da molto tempo, ovviamente, semplicialgoritmi in grado di affrontare questi problemi (quelli presenti, ad esempio, neglieditor di testo), ma l'analisi del DNA, che si presenta come composto di sole quattro lettere, richiede programmi più elaborati. Il problema immediatamente correlato dell'allineamento di sequenze si pone come obiettivo quello di identificare le sequenzeomologhe e individuare le specifichemutazioni che le rendono differenti. Queste tecniche, in particolare l'allineamento di sequenze multiple, sono utilizzate per studiare lerelazioni filogenetiche e la funzione delle proteine.[140] Esistono anche algoritmi di ricerca genetica.
La grande quantità di dati ottenuta da progetti come ilprogetto genoma umano è infatti di difficile utilizzo senza una prima analisi che permetta di localizzare i geni e le regioni regolatorie sui cromosomi. Tali algoritmi, dunque, sono in grado di riconoscere regioni putative di presenza di geni codificanti RNA o proteine.[141]
La struttura di DNA presente a sinistra è in grado di autoassemblarsi nella configurazione presente a destra. L'uso del DNA nelle nanotecnologie sfrutta le proprietà diriconoscimento molecolare tipiche del DNA[142]
Il DNA è stato utilizzato in informatica per la prima volta per risolvere un semplice problema dicammino hamiltoniano, unproblema NP-completo.[143] Il calcolo attraverso il DNA è più vantaggioso rispetto a quelloclassico per via elettronica sia dal punto di vista dell'energia consumata, sia da quello dello spazio utilizzato: strutture di questo genere sono infatti in grado di svolgerecalcoli in modalità parallele che permettono di risolvere agevolmente numerosi altri problemi quali la simulazione dimacchine astratte, ilproblema di soddisfacibilità booleana e la versionebounded delproblema del commesso viaggiatore.[144] Grazie alla sua compattezza, il DNA presenta anche un ruolo (almeno teorico) nel campo dellacrittografia, nella quale permetterebbe in particolare la costituzione e l'utilizzo efficiente dicifrari di Vernam sicuri.[145]
Il DNA è utilizzato anche nel campo dellenanotecnologie poiché presenta proprietà diriconoscimento molecolare che lo rendono in grado di auto-assemblarsi in strutture complesse di tipo bidimensionale opoliedrico. Tali assemblati sono utilizzati con funzioni essenzialmente strutturali e non come vettori di informazione biologica.[146]
Dal momento che il DNA è sottoposto nel tempo a mutazioni che vengono ereditate, esso contiene informazioni preziose che possono essere utilizzate dai genetisti per studiare l'evoluzione degli organismi e la lorofilogenesi.[148] Sulla base delle diverse mutazioni presenti in geni estremamente conservati tra gli organismi (oppure, tramite algoritmi comparativi bioinformatici più avanzati, confrontando direttamente interi genomi) i genetisti sono in grado di ricostruirealberi filogenetici in grado di descrivere l'evoluzione di diverse specie anche molto diverse tra loro.[149][150] Studiando le mutazioni accumulatesi nel tempo, è anche possibile ricostruire alberi che descrivano l'evoluzione all'interno di famiglie di proteine.
Comparando le sequenze di DNA all'interno di una stessa specie, inoltre, è possibile studiare la storia genetica di particolaripopolazioni. Ciò presenta una notevole rilevanza sia per analisiecologiche sia per studiantropologici: il DNA è stato usato, ad esempio, per ricostruire la vicenda delledieci tribù perdute d'Israele.[151]
Questa sezione sugli argomenti biologia e chimica è solo unabbozzo.Contribuisci a migliorarla secondo leconvenzioni di Wikipedia. Segui i suggerimenti dei progetti di riferimento1,2.
Nel 1987Tamar Barkay descrisse il metodo diestrazione diretta del DNA ambientale, eDNA[152].
^ Takahashi I, Marmur J.,Replacement of thymidylic acid by deoxyuridylic acid in the deoxyribonucleic acid of a transducing phage for Bacillus subtilis, inNature, vol. 197, 1963, pp. 794-5,PMID13980287.
^ Isaksson J, Acharya S, Barman J, Cheruku P, Chattopadhyaya J,Single-stranded adenine-rich DNA and RNA retain structural characteristics of their respective double-stranded conformations and show directional differences in stacking pattern, inBiochemistry, vol. 43, n. 51, 2004, pp. 15996-6010,PMID15609994.
^ Ponnuswamy P, Gromiha M,On the conformational stability of oligonucleotide duplexes and tRNA molecules, inJ Theor Biol, vol. 169, n. 4, 1994, pp. 419-32,PMID7526075.
^ Munroe S,Diversity of antisense regulation in eukaryotes: multiple mechanisms, emerging patterns, inJ Cell Biochem, vol. 93, n. 4, 2004, pp. 664-71,PMID15389973.
^ Makalowska I, Lin C, Makalowski W,Overlapping genes in vertebrate genomes, inComput Biol Chem, vol. 29, n. 1, 2005, pp. 1-12,PMID15680581.
^ Johnson Z, Chisholm S,Properties of overlapping genes are conserved across microbial genomes, inGenome Res, vol. 14, n. 11, 2004, pp. 2268-72,PMID15520290.
^ Lamb R, Horvath C,Diversity of coding strategies in influenza viruses, inTrends Genet, vol. 7, n. 8, 1991, pp. 261-6,PMID1771674.
^ Davies J, Stanley J,Geminivirus genes and vectors, inTrends Genet, vol. 5, n. 3, 1989, pp. 77-81,PMID2660364.
^ Berns K,Parvovirus replication, inMicrobiol Rev, vol. 54, n. 3, 1990, pp. 316-29,PMID2215424.
^ab Wang J,Cellular roles of DNA topoisomerases: a molecular perspective, inNat Rev Mol Cell Biol, vol. 3, n. 6, 2002, pp. 430-40,PMID12042765.
^ab Hayashi G, Hagihara M, Nakatani K,Application of L-DNA as a molecular tag, inNucleic Acids Symp Ser (Oxf), vol. 49, 2005, pp. 261-262,PMID17150733.
^ Vargason JM, Eichman BF, Ho PS,The extended and eccentric E-DNA structure induced by cytosine methylation or bromination, inNature Structural Biology, vol. 7, 2000, pp. 758-761,PMID10966645.
^ Wang G, Vasquez KM,Non-B DNA structure-induced genetic instability, inMutat Res, vol. 598, 1–2, 2006, pp. 103-119,PMID16516932.
^ Allemand, et al,Stretched and overwound DNA forms a Pauling-like structure with exposed bases, inPNAS, vol. 24, 1998, pp. 14152-14157,PMID9826669.
^ Palecek E,Local supercoil-stabilized DNA structures, inCritical Reviews in Biochemistry and Molecular Biology, vol. 26, n. 2, 1991, pp. 151-226,PMID1914495.
^ Basu H, Feuerstein B, Zarling D, Shafer R, Marton L,Recognition of Z-RNA and Z-DNA determinants by polyamines in solution: experimental and theoretical studies, inJ Biomol Struct Dyn, vol. 6, n. 2, 1988, pp. 299-309,PMID2482766.
^ Leslie AG, Arnott S, Chandrasekaran R, Ratliff RL,Polymorphism of DNA double helices, inJ. Mol. Biol., vol. 143, n. 1, 1980, pp. 49-72,PMID7441761.
^ Lu XJ, Shakked Z, Olson WK,A-form conformational motifs in ligand-bound DNA structures, inJ. Mol. Biol., vol. 300, n. 4, 2000, pp. 819-40,PMID10891271.
^ Rothenburg S, Koch-Nolte F, Haag F,DNA methylation and Z-DNA formation as mediators of quantitative differences in the expression of alleles, inImmunol Rev, vol. 184, pp. 286-98,PMID12086319.
^ab Greider C, Blackburn E,Identification of a specific telomere terminal transferase activity in Tetrahymena extracts, inCell, vol. 43, 2 Pt 1, 1985, pp. 405-13,PMID3907856.
^ Parkinson G, Lee M, Neidle S,Crystal structure of parallel quadruplexes from human telomeric DNA, inNature, vol. 417, n. 6891, 2002, pp. 876-80,PMID12050675.
^ Griffith J, Comeau L, Rosenfield S, Stansel R, Bianchi A, Moss H, de Lange T,Mammalian telomeres end in a large duplex loop, inCell, vol. 97, n. 4, 1999, pp. 503-14,PMID10338214.
^ Klose R, Bird A,Genomic DNA methylation: the mark and its mediators, inTrends Biochem Sci, vol. 31, n. 2, 2006, pp. 89-97,PMID16403636.
^ Bird A,DNA methylation patterns and epigenetic memory, inGenes Dev, vol. 16, n. 1, 2002, pp. 6-21,PMID11782440.
^ Walsh C, Xu G,Cytosine methylation and DNA repair, inCurr Top Microbiol Immunol, vol. 301, pp. 283-315,PMID16570853.
^ Ratel D, Ravanat J, Berger F, Wion D,N6-methyladenine: the other methylated base of DNA, inBioessays, vol. 28, n. 3, 2006, pp. 309-15,PMID16479578.
^ Gommers-Ampt J, Van Leeuwen F, de Beer A, Vliegenthart J, Dizdaroglu M, Kowalak J, Crain P, Borst P,beta-D-glucosyl-hydroxymethyluracil: a novel modified base present in the DNA of the parasitic protozoan T. brucei, inCell, vol. 75, n. 6, 1993, pp. 1129-36,PMID8261512.
^ Douki T, Reynaud-Angelin A, Cadet J, Sage E,Bipyrimidine photoproducts rather than oxidative lesions are the main type of DNA damage involved in the genotoxic effect of solar UVA radiation, inBiochemistry, vol. 42, n. 30, 2003, pp. 9221-6,PMID12885257.
^ Cadet J, Delatour T, Douki T, Gasparutto D, Pouget J, Ravanat J, Sauvaigo S,Hydroxyl radicals and DNA base damage, inMutat Res, vol. 424, 1–2, 1999, pp. 9-21,PMID10064846.
^ Stephens T, Bunde C, Fillmore B,Mechanism of action in thalidomide teratogenesis, inBiochem Pharmacol, vol. 59, n. 12, 2000, pp. 1489-99,PMID10799645.
^ Braña M, Cacho M, Gradillas A, de Pascual-Teresa B, Ramos A,Intercalators as anticancer drugs, inCurr Pharm Des, vol. 7, n. 17, 2001, pp. 1745-80,PMID11562309.
^ Venter J,et al.,The sequence of the human genome, inScience, vol. 291, n. 5507, 2001, pp. 1304-51,PMID11181995.
^ Thanbichler M, Wang S, Shapiro L,The bacterial nucleoid: a highly organized and dynamic structure, inJ Cell Biochem, vol. 96, n. 3, 2005, pp. 506-21,PMID15988757.
^ Wolfsberg T, McEntyre J, Schuler G,Guide to the draft human genome, inNature, vol. 409, n. 6822, 2001, pp. 824-6,PMID11236998.
^ Harrison P, Gerstein M,Studying genomes through the aeons: protein families, pseudogenes and proteome evolution, inJ Mol Biol, vol. 318, n. 5, 2002, pp. 1155-74,PMID12083509.
^ Dame RT,The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin, inMol. Microbiol., vol. 56, n. 4, 2005, pp. 858-70,PMID15853876.
^ Luger K, Mäder A, Richmond R, Sargent D, Richmond T,Crystal structure of the nucleosome core particle at 2.8 A resolution, inNature, vol. 389, n. 6648, 1997, pp. 251-60,PMID9305837.
^ Jenuwein T, Allis C,Translating the histone code, inScience, vol. 293, n. 5532, 2001, pp. 1074-80,PMID11498575.
^ Ito T,Nucleosome assembly and remodelling, inCurr Top Microbiol Immunol, vol. 274, pp. 1-22,PMID12596902.
^ Thomas J,HMG1 and 2: architectural DNA-binding proteins, inBiochem Soc Trans, vol. 29, Pt 4, 2001, pp. 395-401,PMID11497996.
^ Iftode C, Daniely Y, Borowiec J,Replication protein A (RPA): the eukaryotic SSB, inCrit Rev Biochem Mol Biol, vol. 34, n. 3, 1999, pp. 141-80,PMID10473346.
^ Schoeffler A, Berger J,Recent advances in understanding structure-function relationships in the type II topoisomerase mechanism, inBiochem Soc Trans, vol. 33, Pt 6, 2005, pp. 1465-70,PMID16246147.
^Immagine realizzata a partire dalla entryPDB1M6G.
^ Cremer T, Cremer C,Chromosome territories, nuclear architecture and gene regulation in mammalian cells, inNat Rev Genet, vol. 2, n. 4, 2001, pp. 292-301,PMID11283701.
^ Pál C, Papp B, Lercher M,An integrated view of protein evolution, inNat Rev Genet, vol. 7, n. 5, 2006, pp. 337-48,PMID16619049.
^ O'Driscoll M, Jeggo P,The role of double-strand break repair - insights from human genetics, inNat Rev Genet, vol. 7, n. 1, 2006, pp. 45-54,PMID16369571.
^ Neale MJ, Keeney S,Clarifying the mechanics of DNA strand exchange in meiotic recombination, inNature, vol. 442, n. 7099, 2006, pp. 153-8,PMID16838012.
^ Dickman M, Ingleston S, Sedelnikova S, Rafferty J, Lloyd R, Grasby J, Hornby D,The RuvABC resolvasome, inEur J Biochem, vol. 269, n. 22, 2002, pp. 5492-501,PMID12423347.
^ Joyce G,The antiquity of RNA-based evolution, inNature, vol. 418, n. 6894, 2002, pp. 214-21,PMID12110897.
^ Lindahl T,Instability and decay of the primary structure of DNA, inNature, vol. 362, n. 6422, 1993, pp. 709-15,PMID8469282.
^ Vreeland R, Rosenzweig W, Powers D,Isolation of a 250 million-year-old halotolerant bacterium from a primary salt crystal, inNature, vol. 407, n. 6806, 2000, pp. 897-900,PMID11057666.
^ Goff SP, Berg P,Construction of hybrid viruses containing SV40 and lambda phage DNA segments and their propagation in cultured monkey cells, inCell, vol. 9, 4 PT 2, 1976, pp. 695-705,PMID189942.
^ Houdebine L,Transgenic animal models in biomedical research, inMethods Mol Biol, vol. 360, pp. 163-202,PMID17172731.
^ Daniell H, Dhingra A,Multigene engineering: dawn of an exciting new era in biotechnology, inCurr Opin Biotechnol, vol. 13, n. 2, 2002, pp. 136-41,PMID11950565.
^ Job D,Plant biotechnology in agriculture, inBiochimie, vol. 84, n. 11, 2002, pp. 1105-10,PMID12595138.
^ Weir B, Triggs C, Starling L, Stowell L, Walsh K, Buckleton J,Interpreting DNA mixtures, inJ Forensic Sci, vol. 42, n. 2, 1997, pp. 213-22,PMID9068179.
^ Jeffreys A, Wilson V, Thein S,Individual-specific 'fingerprints' of human DNA., inNature, vol. 316, n. 6023, pp. 76-9,PMID2989708.
^Baldi, Pierre. Brunak, Soren.Bioinformatics: The Machine Learning Approach MIT Press (2001)ISBN 978-0-262-02506-5
^Gusfield, Dan.Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, 15 January 1997.ISBN 978-0-521-58519-4.
^Ashish Gehani, Thomas LaBean and John Reif.DNA-Based Cryptography.. Proceedings of the 5th DIMACS Workshop on DNA Based Computers, Cambridge, MA, USA, 14–15 June 1999.
(EN) Baldi, Pierre. Brunak, Soren,Bioinformatics: The Machine Learning Approach, MIT Press, 2001,ISBN978-0-262-02506-5.
Gusfield, Dan,Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology, Cambridge University Press, 15 gennaio 1997,ISBN 978-0-521-58519-4.
(EN) Mount DM,Bioinformatics: Sequence and Genome Analysis, 2ª ed., Cold Spring Harbor, NY, Cold Spring Harbor Laboratory Press, 2004,ISBN0-87969-712-1.