Strukturen af DNA-dobbelthelix.Atomerne i strukturen er farvekodet eftergrundstof, og to basepars detaljerede struktur er vist i nederste højre hjørne.Strukturen i en del af en DNA-dobbelthelix
DNA kaldesorganismens byggeplan fordi det opbevarer biologiskinformation.[3]DNA-rygraden er resistent over for spaltning, og begge strenge af den dobbelt-strengede struktur opbevarer den samme biologiske information. Biologisk information replikeres, idet de to strenge separeres. En betragtelig del af DNA (mere end 98% for mennesker) erikke-kodende, hvilket betyder, at disse sektioner ikke fungerer som koder for proteinsekvenser.
DNA er en langpolymer lavet af gentagende enheder kaldetnukleotider.[5][6] DNA's struktur er ikke-statisk,[7] alle arter består af to heliske kæder, der hver snor sig om den samme akse, og hver med en bane på 34ångström (3,4nanometer) og en radius på 10ångström (1,0nanometer).[8] Ifølge et andet studium kan DNA-kæden, i en bestemt opløsning, måles til at være 22 til 26ångström bred (2,2 til 2,6nanometer), og en nukleotidenhed blev målt til at være 3,3Å (0,33nm) lang.[9] Selvom hver individuel gentagende enhed er meget lille, kan DNA-polymerer være meget store molekyler indeholdende millioner af nukleotider. For eksempel består DNA'en i det største menneskekromosom,kromosom nummer 1, af omkring 220 millionerbasepar[10] og ville være 85mm langt, hvis det blev rettet ud.
I levende organismer eksisterer DNA normalt ikke som et enkelt molekyle, men derimod som et molekylepar, der holdes stramt sammen.[11][12] Disse to lange strenge flettes omkring hinanden i form af endobbelthelix. Hver nukleotidenhed indeholder både en del af molekylets rygradssegment, som holder kæden sammen, og en nukleobase, som interagerer med den anden DNA-streng i helixen. En nukleobase, der er forbundet med en sukker, kaldes etnukleosid, mens en base, der er forbundet med en sukker og en eller flere fosfatgrupper, kaldes etnukleotid. En polymer bestående af flere forbundne nukleotider (som i DNA) kaldes etpolynukleotid.[13]
DNA-strengens rygrad består af alternerendefosfat- ogsukkergrupper.[14] Sukkeret i DNA er2-deoxyribose, som er enpentose (fem-carbon-sukker). Sukkeret bindes sammen af fosfatgrupper, som dannerfosfodiesterbindinger mellem det tredje og femte carbonatom på nærliggende sukkerringe. Disse asymmetriskebindinger betyder, at en DNA-streng har en retning. I en dobbelthelix er retningen på nukleotiderne i en streng modsat af nukleotidernes retning i den anden streng: Strengene erantiparallelle. DNA-strengenes asymmetriske ender kaldes 5′-enden og 3′-enden, hvor 5′-enden har en terminal fosfatgruppe og 3′-enden har en terminal hydroxylgruppe. En stor forskel mellem DNA ogRNA er sukkeret, der i DNA er 2-deoxyribose og i RNA den alternative pentosesukkerribose.[12]
En sektion af DNA. Baserne ligger horisontalt mellem de to spiralsnoede strenge.[15] (animeret version).
Nukleobaserne klassificeres i to typer:purinerne, A og G, som er fusionerede fem- og seksdelteheterocykliske forbindelser, ogpyrimidinerne, de seksleddede ringe C og T.[12] En femte pyrimidinnukleobase,uracil (U), erstatter normalt thymin i RNA og adskiller sig fra thymin idet den mangler enmethylgruppe på sin ring. Udover RNA og DNA er der også blevet skabt en lang række kunstigenukleinsyreanaloger til brug ved studier i nukleinsyrernes egenskaber, eller i bioteknologi.[19]
Uracil findes normalt ikke i DNA og opstår kun som et nedbrydningsprodukt af cytosin. I en rækkebakteriofager–Bacillus subtilis-bakteriofagerne PBS1 og PBS2 ogYersinia-bakteriofagen piR1-37– er thymin erstattet af uracil.[20] En anden fag – stafylokokkerfag S6 – er blevet identificeret som et genom, hvor thymin er erstattet af uracil.[21]
Base J (beta-d-glukopyranosyloxymethyluracil), en modificeret form af uracil, findes også i en række organismer: flagellaterneDiplonema ogEuglena, og alleslægter afkinetoplastider.[22] Biosyntese af J sker i to trin: i det første trin konverteres en specifik thymidin i DNA til hydroxymethyldeoxyuridin; i det andetglykosyleres HOMedU til at danne form J.[23] Der er blevet fundet proteiner, der binder specifikt til denne base.[24][25][26] Disse proteiner lader til at være en fjern slægtning til det Tet1-onkogen, der er involveret i patogenesen afakut myeloid leukæmi.[27] J lader til at opføre sig som et terminationssignal forRNA polymerase II.[28][29]
Store og små riller i DNA. Små riller er bindingssted for farvenHoechst 33258.
To heliske strenge udgør DNA'ens rygrad. En anden dobbelthelix kan findes ved at følge rummene, eller rillerne (på engelsk kaldet "grooves"), mellem strengene. Disse hulrum støder op til baseparrene og kan udgøre etbindingssted. Da strengene ikke ligger symmetrisk i forhold til hinanden, er rillerne af forskellig størrelse. En rille, den store rille, er 22Å bred, mens den anden, den lille rille, er 12Å bred.[30] Bredden af den store rille medfører, at kanterne på baserne er mere tilgængelige i den store rille end i den lille. Som følge heraf får proteiner såsomtransskriptionsfaktorer, der kan binde til specifikke sekvenser i dobbelt-strenget DNA, normalt kontakt med siderne af de baser, der er blotlagt i den store rille.[31] Denne situation varierer i nogle usædvanlige DNA-konformere i cellen, men navnene "store" og "lille" rille er til for at reflektere de forskelle i størrelse, der ville ses, hvis DNA'en drejedes tilbage til almindelig B-form.
I en DNA-dobbelthelix binder hver type nukleobase på en streng kun til en bestemt type nukleobase på den anden streng. Dette kaldes komplementærbaseparring. Her danner purinerhydrogenbindinger til pyrimidiner, idet adenin kun binder til thymin via to hydrogenbindinger, og cytosin kun binder til guanin via tre hydrogenbindinger. Dette arrangement af to nukleotider, der binder sig sammen på tværs af en dobbelthelix, kaldes et basepar. Da hydrogenbindinger ikke erkovalente, kan de brydes og genforenes relativt nemt. DNA's to strenge i en dobbelthelix kan derfor trækkes fra hinanden som en lynlås, enten ved mekanisk kraft eller højetemperaturer.[32] Som følge af denne komplementaritet duplikeres al information i den dobbelt-strengede sekvens i en DNA-helix på hver streng, hvilket er livsvigtigt i DNA-replikation. Denne reversible og specifikke interaktion imellem komplementære basepar er kritisk for alle DNA's funktioner i levende organismer.[6]
Øverst: etGC-basepar med trehydrogenbindinger. Nederst: etAT-basepar med to hydrogenbindinger. Ikke-kovalente hydrogenbindinger mellem parrene vises som stiplede linjer.
De to typer basepar danner forskellige antal hydrogenbindinger, hvor AT danner to hydrogenbindinger og GC danner tre.DNA med højtGC-indhold er mere stabilt end DNA med lavt GC-indhold.
Som bemærket ovenfor er de fleste DNA-molekyler i virkeligheden to polymerstrenge, bundet sammen i helisk form af ikke-kovalente bindinger; denne dobbeltstrengede struktur (dsDNA) vedligeholdes hovedsageligt af intrastrengs-basestablingsinteraktioner, som er stærkest for G,C-stakke. De to strenge kan adskilles fra hinanden– en proces kendt som smeltning– for at danne to enkelt-strengede DNA-molekyler (ssDNA, efter engelsksingle-stringed DNA). Smeltning sker ved høje temperaturer, lav saltkoncentration og høj pH (lav pH smelter også DNA, men siden DNA er ustabilt pga. syreafpurinering bruges lav pH sjældent).
dsDNA-formens stabilitet afhænger ikke kun af GC-indholdet (% G,C-basepar), men også af sekvensen (siden stabling er sekvensspecifikt) og af længden (længere molekyler er mere stabile). Stabiliteten kan måles på forskellige måder; en udbredt måde er "smeltetemperaturen", hvilket er temperaturen hvor 50% af ds-molekylerne konverteres til ss-molekyler; smeltetemperaturer er afhængige af ionisk styrke og DNA'ens koncentration.Som følge heraf er det både procentdelen af GC-basepar og den overordnede længde af DNA-dobbelthelixen, der afgør styrken af forbindelsen mellem de to DNA-strenge. Lange DNA-helixer med højt GC-indhold har stærkere-interagerende strenge, mens korte helixer med højt AT-indhold har svagere-interagerende strenge.[33] Inden for biologien er der en tendens til, at dele af DNA-dobbelthelixen, som skal kunne separere nemt, såsom TATAATPribnow-boksen i noglepromotere, har højt AT-indhold, hvilket gør strengene lettere at trække fra hinanden.[34]
I laboratoriet kan styrken af denne interaktion måles ved at finde den temperatur, der er nødvendig for at bryde hydrogenbindingerne, deressmeltetemperatur (også kaldetTm-værdien). Når alle baseparrene i en DNA-dobbelthelix smelter, adskilles og eksisterer strengene i opløsning som to fuldstændigt uafhængige molekyler. Disse enkeltstrengede DNA-molekyler (ssDNA) har ingen almindelig form, men nogle konformere er mere stabile end andre.[35]
En DNA-sekvens kaldes "sense" hvis dens sekvens er den samme som enmessenger RNA-kopi, der translateres til protein.[36] Sekvensen på den modsatte streng kaldes "antisense"-sekvensen. Både sense- og antisense-sekvenser kan eksistere på forskellige dele af den samme DNA-streng (dvs. begge strenge kan indeholde både sense- og antisensesekvenser). Antisense-RNA-sekvenser produceres i både prokaryoter og eukaryoter, men disse RNA'ers funktioner er ikke helt visse.[37] En mulighed er, at antisense-RNA er involveret i reguleringen afgenudtryk gennem RNA-RNA-baseparring.[38]
Nogle få DNA-sekvenser i prokaryoter og eukaryoter, og flere iplasmider ogvira, slører grænsen mellem sense- og antisense-strenge ved at haveoverlappende gener.[39] I disse tilfælde fungerer nogle DNA-sekvenser dobbelt, og koder et protein når de læser langs en streng, og et andet protein når de læses i den modsatte retning langs den anden streng. Ibakterier kan dette overlap være involveret i reguleringen af gentransskription,[40] mens overlappende gener hos vira kan øge mængden af information, der kan indkodes i det lille virale genom.[41]
DNA kan snos som et reb ved en proces kaldetDNA supercoiling. I DNA'ens "afslappede" tilstand cirkler en streng normalt omkring dobbelthelixens akse en gang hvert 10,4 basepar, men hvis DNA'en snos, bliver strengene strammere eller løsere bundet.[42] Hvis DNA'en snos i samme retning som helixen, kaldes dette positiv supercoiling, og baserne holdes strammere sammen. Hvis de snos i den modsatte retning, kaldes det negativ supercoiling, og baserne kan nemmere adskilles. I naturen har den meste DNA en let negativ supercoiling, der skyldesenzymernetopoisomerase.[43] Disse enzymer behøves også for at aflaste de snoede spændinger, der introduceres i DNA-strenge under processer såsomtransskription ogDNA-replikation.[44]
Fra venstre mod højre: strukturerne for A-, B- og Z-DNA
DNA eksisterer i mange muligekonformere, der inkludererA-DNA, B-DNA ogZ-DNA, selvom kun B-DNA og Z-DNA er blevet direkte observeret i funktionelle organismer.[14] Den konformer som DNA indtager afhænger af hydratiseringsniveauet, DNA-sekvensen, mængden og retningen af supercoiling, kemiske modifikationer af baserne, typen og koncentrationen af metalioner, såvel som tilstedeværelsen afpolyaminer i opløsningen.[45]
De første offentliggjorte rapporter om A-DNA-røntgendiffraktionsmønstre – såvel som B-DNA – brugte analyser baseret påPatterson-metoden, der kun gav begrænsede mængder strukturel information om orienterede DNA-fibre.[46][47] En alternativ analyse blev efterfølgende foreslået af Wilkinset al., i 1953, forin vivo B-DNA røntgendiffraktionsmønstre af højt hydratiserede DNA-fibre i form af kvadrater afBesselfunktioner.[48] I den samme journal præsenteredeJames Watson ogFrancis Crick deres molekylærmodelleringsanalyse af DNA-røntgendiffraktionsmønstrene for at sandsynliggøre at strukturen var en dobbelthelix.[8]
Selvom "B-DNA-formen" er den mest almindelige under de forhold, der findes i celler,[49] er den ikke en veldefineret konformer, men en familie af relaterede DNA-konformere,[50] der finder sted på de høje hydratiseringsniveauer i levende celler. Deres tilsvarende røntgendiffraktions- og spredningsmønstre er karakteristiske for molekylæreparakrystaller med en signifikant grad af uorden.[51][52]
Sammenlignet med B-DNA er A-DNA-formen en bredere, højrehåndet spiral, med en overfladisk, bred lille rille og en smallere, dybere stor rille. A-formen fremkommer under ikke-fysiologiske forhold i delvist dehydrerede DNA-prøver, mens den i cellen kan produceres i hybridparringer af DNA- og RNA-strenge, såvel som i enzym-DNA-komplekser.[53][54] Segmenter af DNA, hvor baserne er blevet kemisk modificeret vedmethylering, kan undergå en større forandring i konformer og indtageZ-form. Her drejer strengene omkring den heliske akse i en venstrehåndet spiral, det modsatte af den mere almindelige B-form.[55] Disse usædvanlige strukturer kan genkendes på specifikke Z-DNA-bindingsproteiner og kan være involveret i reguleringen af transskription.[56]
I en række år harexobiologer foreslået, at der findes enskyggebiosfære, en postuleret mikrobiel biosfære af Jorden som anvender radikalt anderledes biokemiske og molekylære processer end det liv der kendes i dag. Et af forslagene var eksistensen af livsformer, som brugerarsen i stedet for fosfor i DNA. En rapport om denne mulighed i bakterienGFAJ-1 blev bebudet i 2010,[57][57][58] selvom forskningen var omstridt,[58][59] og beviserne peger i retning af, at bakterien aktivt forhindrer inkorporeringen afarsen i DNA-rygraden og andre biomolekyler.[60]
DNA-quadruplex dannet aftelomergentagelser. DNA-rygradens gentagede konformer er meget anderledes fra den typiske DNA-helix.[61]
I enderne af de lineære kromosomer findes specialiserede DNA-regioner kaldettelomerer. Disse regioners centrale funktion er at tillade cellen at replikere kromosomender ved brug af enzymettelomerase, da enzymerne som normalt replikerer DNA ikke kan kopiere de yderste 3′-ender af kromosomer.[62] Disse specialiserede 'kromosomdæksler' hjælper også med at beskytte DNA-enderne og stoppeDNA-reparationssystemerne i cellen fra at behandle dem som skade, der skal repareres.[63] I menneskeceller har telomerer normalt en længde på enkelt-strenget DNA indeholdende flere tusinde gentagelser af en simpel TTAGGG-sekvens.[64]
Disse guaninrige sekvenser kan stabilisere kromosomender ved at danne strukturer af stablede sæt af fire-baseenheder, snarere end de normale basepar i andre DNA-molekyler. Her danner fire guaninbaser en flad tallerken, og disse flade firebaseenheder stables derefter ovenpå hinanden for at danne en stabilG-quadruplexstruktur.[65] Disse strukturer stabiliseres af hydrogenbindinger mellem basekanterne ogchelat fra en metalion i midten af hver firebase-enhed.[66] Der kan også dannes andre strukturer, hvor det centrale sæt af fire baser kommer fra enten en enkelt streng foldet omkring baserne, eller flere forskellige parallelle strenge, der hver bidrager med en base til den centrale struktur.
Udover disse stablede strukturer danner telomerer også store loopende strukturer kaldet telomerloops, eller T-loops. Her krøller den enkelt-strengede DNA sig sammen til en lang cirkel stabiliseret af telomerbindende proteiner.[67] I den sidste ende af T-loopet holdes den enkelt-strengede telomer-DNA på en region af dobbelt-strenget DNA af den telomerstreng, der splitter den dobbeltheliske DNA og baseparring til en af de to strenge. Dennetrippel-strengede struktur kaldes etD-loop.[65]
Forgrenet DNA kan danne netværk indeholdende flere grene.
DNA "flosser", når ikke-komplementære regioner eksisterer i enden af en ellers komplementær dobbelt-strenget DNA. Forgrenet DNA kan dog opstå, hvis en tredje streng af DNA introduceres og indeholder tilstødende regioner i stand til athybridisere med de flossede regioner i den allerede eksisterende dobbelt-streng. Selvom det mest simple eksempel på forgrenet DNA kun involverer tre DNA-strenge, er det også muligt at skabe komplekser med yderligere strenge og flere grene.[68] Forgrenet DNA kan bruges inanoteknologi til at konstruere geometriske former.
Cytosins struktur med og uden 5-methyl-gruppen.Deaminering konverterer 5-methylcytosin til thymin.
Ekspressionen af gener påvirkes af, hvordan DNA'en pakkes i kromosomer, i en struktur kaldetkromatin. Basemodifikationer kan også være involverede i pakningen, hvor regioner med lav eller ingen genekspression normalt indeholder store mængdermethylering afcytosinbaser. DNA-pakning og dens indflydelse på genekspression kan også ske ved kovalente modifikationer afhistonproteinkernen, som DNA er pakket omkring i kromatinstrukturen, eller ved remodellering udført af kromatinremodelleringskomplekser. Herudover er derkrydstale mellem DNA-methylering og histonmodifikation, så de kan koordinere deres påvirkning af kromatin og genekspression.[69]
For at tage et eksempel, producerer cytosinmethylering5-methylcytosin, som er vigtigt forX-kromosominaktivering.[70] Det gennemsnitlige methyleringsniveau varierer mellem organismer– ormenCaenorhabditis elegans har ingen cytosinmethylering, menshvirveldyr har højere niveauer, med 5-methylcytosin i op til 1% af deres DNA .[71] På trods af 5-methylcytosins vigtighed har det den ulempe, at det kandeamineres til en thyminbase, hvilket gør methylerede cytosiner særligt sårbare over formutationer.[72] Blandt andre basemodifikationer er adeninmethylering i bakterier, tilstedeværelsen af5-hydroxymethylcytosin ihjernen[73] ogglykosyleringen af uracil til "J-basen" ikinetoplastider.[74][75]
DNA kan beskadiges af mange typermutagener, som kan ændre DNA-sekvensen. Blandt disse mutagener eroxidations- ogalkyleringsmidler, såvel som højenergi-elektromagnetisk stråling såsomultraviolet lys ogrøntgenstråling. Typen af skade på DNA'en afhænger af typen af mutagen. For eksempel kan UV-lys beskadige DNA ved at producerethymindimerer, som er krydsbindinger mellempyrimidinbaser.[77] Omvendt forårsager oxidanter såsomfrie radikale ellerbrintoverilte flere typer skade, heriblandt basemodifikationer, særligt af guanosin, og dobbelt-streng-brud.[78] En typisk menneskecelle indeholder omkring 150.000 baser, som har lidt oxidativ skade.[79] Af disse oxidative læsioner er de farligste dobbelt-strengede brud, da disse er svære at reparere og kan producerepunktmutationer,indsættelser ogdeletioner fra DNA-sekvensen, såvel somkromosomale translokationer.[80] Disse mutationer kan forårsagekræft. På grund af iboende begrænsninger i DNA-reparationsmekanismerne ville alle mennesker, såfremt de levede længe nok, før eller siden udvikle kræft.[81][82] DNA-skader, som opstår naturligt på grund af normale cellulære processer, der producerer reaktive oxygenforbindelser, cellulært vands hydrolytiske aktiviteter osv., sker også ofte. Selvom de fleste af disse skader repareres, kan der i enhver celle være nogle rester af DNA-skade på trods af reparationsprocesserne. Disse tilbageværende DNA-skader ophober sig med alderen i postmitotisk pattedyrsvæv. Denne ophobning lader til at være en vigtig underliggende årsag til aldring.[83][84][85]
Mange mutagener passer ind i rummet mellem to tilstødende basepar – dette kendes sominterkalation. De fleste interkalatorer eraromatiske og plane molekyler; eksempler kunne væreethidiumbromid,akridiner,daunomycin ogdoxorubicin. En interkalator kan kun passe mellem basepar, hvis baserne separeres, og DNA-strengene forvrides ved at dreje dobbelthelixen ud. Dette hæmmer både transskriptionen og DNA-replikationen, hvilket skaber toxicitet og mutationer.[86] Som resultat heraf kan DNA-interkalatorer værecarcinogene, og ithalidomids tilfælde, etteratogen.[87] Andre, såsombenzo[a]pyrenoxid ogaflatoksin, danner DNA-addukter, som fremkalder fejl i replikationen.[88] Alligevel bruges andre lignende toksiner også ikemoterapi til at sløve hurtigtvoksende kræftceller, pga. deres evne til at hæmme transskription og DNA-replikation.[89]
Der er gjort forsøg med at udvide den genetiske kode med flere syntetiske bogstaver, sehachimoji DNA. Fordelene ved en udvidet kode kunne omfatte lagring af stærkt komprimerede data, dvs. en forbedret genetisk kode, samt indsigt i livets generelle kemiske forudsætninger dvs. hvad man også kunne forvente af eventueltudenjordisk liv.
Beliggenheden af en eukaryotskerne-DNA i kromosomerne.
DNA forekommer normalt som lineærekromosomer ieukaryoter og cirkulære kromosomer iprokaryoter. Kromosomsættet i en celle udgør densgenom;menneskets genom har omkring 3 milliarder DNA-basepar arrangeret i 46 kromosomer.[90] Informationen i DNA ligger isekvensen af DNA-stykker, der kaldesgener.Transmission af genetisk information i gener opnås ved hjælp af komplementærbaseparring. For eksempel kopieres DNA-sekvensen ved hjælp af transskription ind i en komplementær RNA-sekvens gennem tiltrækningen mellem DNA'en og de korrekte RNA-nukleotider når en celle bruger informationen i et gen. Normalt bruges denne RNA-kopi derefter til at skabe en matchendeproteinsekvens ved en proces kaldettranslation, som afhænger af den samme interaktion mellem RNA-nukleotider. Alternativt kan en celle simpelthen kopiere sin genetiske information ved DNA-replikation.[91]
Genomisk DNA pakkes stramt og velordnet ved en proces kaldetDNA-kondensering for at passe ind i cellens små tilgængelige voluminer. I eukaryoter befinder DNA sig icellekernen, såvel som små mængder imitokondrier oggrønkorn. I prokaryoter holdes DNA'en i et uregelmæssigt formet legeme i cytoplasmaen kaldetnukleoiden.[92] Et genoms genetiske information ligger i generne, og det fuldstændige informationssæt i en organisme kaldes densgenotype. Et gen er enarvelig enhed og er en DNA-region, som påvirker en bestemt egenskab i en organisme. Gener indeholder enåben læseramme, der kan transskriberes, såvel somregulerende sekvenser såsompromotere ogenhancere, som kontrollerer transskriptionen af den åbne læseramme.
I mangearter er det kun en lille fraktion af den samledegenomsekvens der koder protein. For eksempel er det kun omkring 1,5% af det menneskelige genom, som består af proteinkodendeexoner, mens over 50% af menneskelig DNA består afikke-kodenderepetitive sekvenser.[93] Det har længe været en gåde hvorfor der findes så store mængderikke-kodende DNA og ekstraordinære forskelle igenomstørrelse (kendt somC-værdi) i eukaryotiske genomer arterne imellem.[94] Nogle af de DNA-sekvenser, som ikke koder protein, kan dog stadig kode funktionelleikke-kodende RNA-molekyler, som er involverede i reguleringen af genekspression.[95]
Nogle ikke-kodende DNA-sekvenser spiller en strukturel rolle i kromosomer.Telomerer ogcentromerer indeholder typisk kun få gener, men er vigtige for kromosomernes funktion og stabilitet.[63][97] En talstærk form for ikke-kodende DNA i mennesker erpseudogener, som er kopier af gener, der er blevet deaktiveret af mutation.[98] Disse sekvenser er normalt kun molekylære fossiler, omend de en gang imellem kan fungere som råtgenetisk materiale for skabelsen af nye gener gennem en proces kendt somgenduplikation og divergens.[99]
En delvira har DNA i deres arvemateriale – eksempelviskopper (dobbeltstrenget) oglussingesyge (enkeltstrenget) – mens andre anvender RNA.[100]
Et gen er en DNA-sekvens, der indeholder genetisk information og kan påvirke en organismesfænotype. Inde i et gen definerer sekvensen af baser langs en DNA-streng enmessenger RNA-sekvens, som så til gengæld definerer en eller flere proteinsekvenser. Forholdet mellem geners nukleotidsekvenser og proteinersaminosyresekvenser bestemmes af reglerne fortranslation, der overordnet kendes som dengenetiske kode. Den genetiske kode består af tre-bogstav 'ord' kaldetcodoner, der dannes fra en sekvens af tre nukleotider (f.eks. ACT, CAG, TTT).
Under transskriptionen kopieres et gens codoner ind i messenger-RNA (mRNA) ved hjælp afRNA-polymerase II. Denne RNA-kopi afkodes derefter af etribosom, som læser RNA-sekvensen ved at baseparre mRNA'et medtransfer RNA (tRNA), som bærer aminosyrer. Da der er 4 baser i 3-bogstavkombinationer, er der 64 mulige codoner (43kombinationer). Disse koder så de tyvestandardaminosyrer og giver de fleste aminosyrer mere end ét muligt komplementært codon. Der findes også tre 'stop'-codoner ('nonsense'-codoner), der indikerer slutningen af kodningsregionen; disse er de tre codoner TAA, TGA og TAG, idet der ikke findes en tRNA, der er komplementær til disse.
Transskriptionen af DNA behøver dog ikke have dannelsen af mRNA, der skal translateres til et protein, som mål, da det ved transskriptionens producerede RNA i sig selv kan være målet. Dette kan f.eks. være tilfældet ved dannelsen af det omtalte tRNA (her bruges dog RNA-polymerase III frem for II) eller andre typer RNA, f.eks. precursor-miRNA, der regulerer den cellulære proteinudtrykkelse ved processenRNA-interferens.
Celledeling er essentiel for at en organisme kan vokse, men når en celle deler sig, skal den replikere DNA'en i sit genom, så de to datterceller har samme genetiske information som deres forælder. DNA's dobbeltstrengede struktur sørger for en simpel mekanisme tilDNA-replikation. Her separeres de to strenge, hvorefter hver strengskomplementære DNA-sekvens genskabes af etenzym kaldetDNA-polymerase. Dette enzym skaber den komplementære streng ved at finde den korrekte base gennem komplementær baseparring, og binder den derefter med den oprindelige streng. Da DNA-polymeraser kun kan udvide en DNA-streng i retningen 5′ til 3′, bruges andre mekanismer til at kopiere dobbelthelixens antiparallelle strenge.[101] På denne måde bestemmer basen på den gamle streng, hvilken base der dannes på den nye streng, og cellen ender op med en perfekt kopi af sin DNA.
Nøgen ekstracellulær DNA (eDNA), som oftest udsendes ved celledød, er næsten allestedsnærværende i miljøet. Dets koncentration i jordbunden kan være helt op til 2 μg/L, og dets koncentration i naturlige vandmiljøer kan være helt op til 88 μg/L.[102] Der er blevet spekuleret i flere mulige funktioner, som eDNA varetager: det kan være involveret i horisontalgenoverførsel;[103] det kan levere næringsstoffer;[104] og det kan fungere som en buffer til at rekruttere eller titrere ioner eller antibiotika.[105] Ekstracellulær DNA opfører sig som en funktionel ekstracellulær matrixkomponent i en række bakterieartersbiofilm. Det kan opføre sig som en genkendelsesfaktor til at regulere tilknytning og spredning af bestemte celletyper i biofilmen;[106] det kan bidrage til dannelsen af biofilm;[107] og det kan bidrage til biofilmens fysiske styrke og modstandsdygtighed over for biologisk pres.[108]
Alle DNA's funktioner afhænger af samspillet med proteiner. Disse proteininteraktioner kan være ikke-specifikke, eller proteinet kan binde sig specifikt til en enkelt DNA-sekvens. Enzymer kan også binde til DNA og af disse er polymeraserne, som kopierer DNA-basesekvensen i transskription og DNA-replikation, særligt vigtige.
Interaktion mellem DNA (orange) oghistoner (blå). Disse proteiners basiske aminosyrer binder til DNA'ens sure fosfatgrupper.
Strukturelle proteiner, som binder DNA, er velkendte eksempler på ikke-specifikke interaktioner mellem DNA og protein. Inde i kromosomer holdes DNA i komplekser med strukturelle proteiner. Disse proteiner organiserer DNA'en i en kompakt struktur kaldetkromatin. I eukaryoter involverer denne struktur DNA-binding til et kompleks af små, basiske proteiner kaldethistoner, mens der er flere typer proteiner involveret i prokaryoter.[109][110] Histonerne danner et pladeformet kompleks kaldet etnukleosom, som indeholder to komplette drejninger af dobbelt-strenget DNA viklet omkring dets overflade. Disse ikke-specifikke interaktioner udgøres afionbindinger mellembasiske grupper i histonerne og sure fosfatgrupper i DNA'ens sukker-fosfat-rygrad og er derfor mestendels uafhængige af basesekvensen.[111] Kemiske modifikationer af disse basiske grupper (der sidder på sidekæderne af aminosyrer) inkluderermethylering,fosforylering ogacetylering.[112] Disse kemiske modifikationer ændrer styrken af interaktionen mellem DNA'en og histonerne, hvilket gør DNA'en mere eller mindre tilgængelig fortransskriptionsfaktorer og ændrer transskriptionshastigheden.[113]
En særlig gruppe DNA-bindende proteiner er de DNA-bindende proteiner, som specifikt binder enkeltstrenget DNA. I mennesker erreplikationsprotein A det bedst kendte eksempel fra denne familie og bruges i processer, hvor dobbelthelixen er separeret, heriblandt ved DNA-replikation, rekombination og DNA-reparation.[114] Disse bindingsproteiner lader til at stabilisere enkeltstrenget DNA og beskytte det fra at dannehårnålsstrukturer eller blive nedbrudt afnukleaser.
I modsætning hertil er der andre proteiner, som har udviklet sig til at binde til bestemte DNA-sekvenser. De mest intensivt studerede af disse er de forskelligetransskriptionsfaktorer, som er proteiner, der regulerer transskription. Hver transskriptionsfaktor binder til et bestemt sæt af DNA-sekvenser og aktiverer eller hæmmer transskriptionen af gener, som har disse sekvenser tæt på deres promotere. Transskriptionsfaktorerne gør dette på to måder. For det første kan de binde RNA-polymerasen ansvarlig for transskription, enten direkte eller gennem andre mediatorproteiner; dette lokaliserer polymerasen ved promoteren og lader den begynde transskription.[115] Alternativt kan transskriptionsfaktorer bindeenzymer, som modificerer histonerne ved promoteren. Dette ændrer på DNA-skabelonens tilgængelighed for polymerasen.[116]
Da disse DNA-targets kan forekomme overalt i en organismes genom, kan ændringer i en type transskriptionsfaktors aktivitet påvirke tusinder af gener.[117] Som følge heraf er disse proteiner ofte mål for designaltransduktionsprocesser, som styrer responset på miljøforandringer ellercellulær differentiering og udvikling. Specificiteten af disse transskriptionsfaktorers interaktioner med DNA kommer af, at proteinerne har flere kontakter til DNA-basernes kant, hvilket tillader dem at "læse" DNA-sekvensen. De fleste af disse baseinteraktioner sker i den store rille, hvor baserne er mest tilgængelige.[31]
Enzymer kaldetDNA-ligaser kan genforbinde skårede eller brækkede DNA-strenge.[120] Ligaser er særligt vigtige i DNA-replikation af tilbagestående strenge, da de forbinder de korte DNA-segmenter, der produceres ved replikationsgaflen til en fuldstændig kopi af DNA-skabelonen. De bruges også iDNA-reparation oggenetisk rekombination.[120]
Topoisomeraser er enzymer med både nuklease- og ligaseaktivitet. Disse proteiner ændrer mængden afsupercoiling i DNA. Nogle af disse enzymer fungerer ved at skære DNA-helixen og lader en sektion rotere, hvorved de reducerer mængden af supercoiling; enzymet forsegler derefter DNA-bruddet.[43] Andre typer af disse enzymer er i stand til at skære en DNA-helix og derefter sende en anden DNA-streng igennem dette brud, før det genforbinder helixen.[121] Topoisomeraser er nødvendige for mange processer, der involverer DNA, såsom DNA-replikation og transskription.[44]
Helicaser er proteiner, der er en form formolekylær motor. De bruger den kemiske energi inukleosidtrifosfater, særligtATP, til at bryde hydrogenbindinger mellem baser og strække DNA-dobbelthelixen ud i enkelte strenge.[122] Disse enzymer er essentielle for de fleste processer hvor enzymer skal have adgang til DNA-baserne.
Polymeraser erenzymer, der syntetiserer polynukleotidekæder franukleosidtrifosfater. Deres produkters sekvens skabes på basis af eksisterende polynukleotidkæder – kaldet "skabeloner". Disse enzymer fungerer ved at føje et nukleotid til 3′-hydroxylgruppen i enden af den voksende polynukleotidkæde gentagne gange. Som konsekvens heraf arbejder alle polymeraser i en 5′- til 3′-retning.[123] I disse enzymersaktive sæde baseparres den nye nukleosidtrifosfat til skabelonen: Dette lader polymeraser syntetisere deres skabelons komplementære streng på korrekt vis. Polymeraser klassificeres efter den type skabelon, som de anvender.
Ved DNA-replikation tager DNA-afhængigeDNA-polymeraser kopier af DNA-polynukleotidkæder. For at kunne bevare biologisk information er det essentielt, at sekvensen af baser i hver kopi er præcist komplementær til sekvensen af baser i skabelonstrengen. Mange DNA-polymeraser har en korrekturlæsende aktivitet. Her genkender polymerasen den lejlighedsvise fejl i syntesereaktionen ud fra manglen på baseparring mellem de fejlmatchede nukleotider. Hvis der opdages en fejlmatch, aktiveres en 3′ til 5′exonukleaseaktivitet, og den ukorrekte base fjernes.[124] I de fleste organismer fungerer DNA-polymeraser i et stort kompleks kaldetreplisomet, der indeholder flere tilhørende underenheder, såsomDNA-klemmen ellerhelicaserne.[125]
RNA-afhængige DNA-polymeraser er en specialiseret klasse af polymeraser, som kopierer en RNA-strengs sekvens ind i DNA. De omfatterrevers transkriptase, som er etviralt enzym involveret iretroviras infektion af celler, ogtelomerase, som er påkrævet ved replikation af telomerer.[62][126] Telomerase er en usædvanlig polymerase, fordi den indeholder sin egen RNA-skabelon som en del af sin struktur.[63]
Transskription udføres af en DNA-afhængigRNA-polymerase, der kopierer en DNA-strengs sekvens ind i RNA. For at påbegynde transskriptionen af et gen binder RNA-polymerasen til en DNA-sekvens kaldet enpromoter og separerer DNA-strengene. Derefter kopierer den gensekvensen ind i enmessenger RNA-udskrift, indtil den når en DNA-region kaldetterminatoren, hvor den stopper og afkobles fra DNA'en. Ligesom det er tilfældet med menneskelige DNA-afhængige DNA-polymeraser, operererRNA polymerase II, det enzym, der transskriberer de fleste af generne i det menneskelige genom, som en del af et stortproteinkompleks med flere regulerende og tilhørende underenheder.[127]
Rekombination involverer brydningen og genforeningen af to kromosomer (M og F) for at producere to omarrangerede kromosomer (C1 og C2).
En DNA-helix interagerer normalt ikke med andre DNA-segmenter, og i menneskeceller er de forskellige kromosomer oven i købet placeret i separate områder i cellekernen kaldet "kromosomterritorier".[129] Denne fysiske adskillelse af forskellige kromosomer er vigtig for DNA'ens evne til at fungere som et stabilt informationsarkiv, da en af de få gange kromosomer interagerer er vedoverkrydsning, der sker underkønnet formering, hvorgenetisk rekombination finder sted. "Overkrydsning" betegner når to DNA-helixer brydes op, udveksler en sektion og derefter genforenes.
Rekombination lader kromosomer udveksle genetisk information og producerer nye kombinationer af gener, som øgernaturlig selektions effektivitetet, og kan være vigtigt i den hurtige udvikling af nye proteiner.[130] Genetisk rekombination kan også være involveret i DNA-reparation, særligt i cellens respons på dobbeltstrengsbrud.[131]
Den mest almindelige form for overkrydsning erhomolog rekombination, hvor de to involverede kromosomer deler meget ens sekvenser. Ikke-homolog rekombination kan være skadelig for celler, da det kan producerekromosomale translokationer og genetiske abnormiteter. Rekombinationsreaktionen katalyseres af enzymer kendt somrekombinaser, såsomRAD51.[132] Det første skridt ved rekombination er et dobbeltstrenget brud forårsaget af enten enendonuklease eller beskadigelse af DNA'en.[133] En række skridt delvist katalyseret af rekombinasen fører derefter til sammenføjningen af de to helixer ved mindst etHollidaykors, hvori et segment af en enkelt streng i hver helix knyttes til den komplementære streng i den anden helix. Hollidaykorset er entetraedrisk knudepunktsstruktur, der kan flyttes langs kromosomparret, og udskifter en streng med en anden. Rekombinationsreaktionen stoppes derefter af spaltning af knudepunktet og re-ligeringen af det frigivne DNA.[134]
DNA indeholder den genetiske information, der lader alle moderne levende ting fungere, vokse og reproducere. Det er dog uklart, hvor langt tilbage i livets fire milliarder år lange historie DNA har haft denne funktion, og det har været foreslået at de tidligste livsformer kan have anvendt RNA som deres genetiske materiale.[135][136] RNA kan have opført sig som den centrale del af tidligcellemetabolisme, da det både kan transmittere genetisk information og udførekatalyse som en del afribozymer.[137] Denne urgamleRNA-verden, hvor nukleinsyrer i så fald blev brugt til både katalyse og genetik, kan have påvirketudviklingen af den nuværende genetiske kode baseret på fire nukleotidbaser. Dette ville ske fordi antallet af forskellige baser i en sådanne organisme er en afvejning mellem et lille antal baser med bedre replikationspræcision og et stort antal baser med bedre katalytisk ribozymeffektivitet.[138] Der er dog ingen direkte beviser på urgamle genetiske systemer, da det er umuligt at isolere DNA fra de fleste fossiler, idet DNA kun overlever i miljøet i mindre end en million år og langsomt nedbrydes til korte fragmenter i opløsning.[139] Der er blevet fremsat påstande om ældre DNA; bedst kendt er en rapport om isoleringen af en levedygtig bakterie fra en 250 millioner år gammel saltkrystal,[140] men disse påstande er kontroversielle.[141][142]
Kriminalteknikere kan bruge DNA iblod,sæd,hud,spyt ellerhår fundet på etgerningssted til at identificere matchende DNA fra et individ, såsom en gerningsmand. Denne proces kendes formelt som etablering af enDNA-profil, men kan også kaldes "genetiske fingeraftryk". I DNA-profiler sammenlignes længderne på variable sektioner af repetitiv DNA, såsommikrosatellitter, mellem to mennesker. Denne metode er normalt en ekstremt troværdig teknik til at identificere matchende DNA.[151] Identifikation kan dog være kompliceret, hvis stedet er forurenet med DNA fra flere mennesker.[152] DNA-profiler blev udviklet i 1984 af den britiske genetiker SirAlec Jeffreys[153] og brugt første gang inden for kriminalteknik til at dømme Colin Pitchfork iEnderby-mordene i 1988.[154]
Udviklingen af kriminalteknik, og evnen til nu at fremskaffe genetisk match på små prøver af blod, hud, spyt eller hår, har ført til en genundersøgelse af en række sager. Mennesker, der er anklaget for en alvorlig forbrydelse, kan blive afkrævet en DNA-prøve til sammenligning. IDanmark har et af de mest notable eksempler på en sag, hvor DNA-profil var af afgørende betydning, været ved efterforskningen af de drab og voldtægter, der blev begået afMarcel Lychau Hansen, bedre kendt som "Amagermanden"[155]. Det mest åbenlyse forsvar imod kriminaltekniske DNA-matches er at påstå at der er blevet byttet rundt på beviser. Dette har resulteret i omhyggelige og strenge håndteringsprocedurer i alle nye sager.DNA-profiler bruges også til at identificere ofre for hændelser med mange omkomne,[156] såvel som til at identificere lig eller kropsdele i alvorlige ulykker og sågar til at identificere individuelle ofre i massegrave– ved at sammenligne med familiemedlemmer.
DNA-profiler bruges også tilfaderskabstests for at afgøre, hvorvidt en person er biologisk forælder eller bedsteforælder til et barn med en sandsynlighedsgrad på 99,99% for, hvorvidt den angivelige forælder er biologisk beslægtet med barnet. Normale DNA-sekventeringsmetoder sker efter fødslen, men der findes nye metoder, hvorved man kan teste for faderskab mens moderen stadig er gravid.[157]
Deoxyribozymer, også kaldet DNAzymer eller katalytisk DNA, blev opdaget i 1994.[158] Det er for det meste enkeltstrengede DNA-sekvenser, der er isoleret fra en stor pulje af tilfældige DNA-sekvenser gennem en kombineret tilgang kaldetin vitro-selektion ellerSELEX. DNAzymer katalyserer en række kemiske reaktioner, heriblandt RNA/DNA-spaltning, RNA/DNA-ligering, aminosyrefosforylering/defosforylering, o.a. DNAzymer kan øge hastigheden af kemiske reaktioner op til 100.000.000.000 gange hastigheden af den ukatalyserede reaktion.[159] Den mest studerede klasse af DNAzymer er RNA-spaltende DNAzymer, som er blevet brugt til opdagelse af forskellige metalioner og til at designe terapeutiske midler. Der er fundet flere metalspecifikke DNAzymer, heriblandt GR-5-DNAzymet (bly-specifikt),[158] CA1-3-DNAzymet (kobber-specifikt),[160] 39E-DNAzymet (uranyl-specifikt) og NaA43-DNAzymet (natrium-specifikt).[161]
Bioinformatik involverer udviklingen af teknikker til at opbevare,data mine, søge i og manipulere biologiske data, heriblandtDNA-sekvensdata. Dette har ført til vidt anvendte fremskridt inden fordatalogi, særligtstring-searching-algoritmer,maskinelæring ogdatabaseteori.[162] String-searching eller matchingalgoritmer, som genkender en bogstavsekvens inde i en større sekvens af bogstaver, blev udviklet til at søge efter bestemte nukleotidsekvenser.[163] DNA-sekvensen bliversammenstillet med andre DNA-sekvenser for at identificerehomologe sekvenser og lokalisere de specifikkemutationer, der gør dem specielle. Disse teknikker, særligtmultiple sekvenssammenstillinger, bruges til at studerefylogenetiske forhold og proteinfunktioner.[164] Datasæt, der repræsenterer hele genomers DNA-sekvenser, såsom de der er produceret afHuman Genome Project, er svære at bruge uden de annoteringer, der identificerer generne og de regulerende elementers beliggenhed på hvert kromosom. DNA-sekvensregioner, der har de karakteristiske mønstre, som associeres med protein- eller RNA-kodende gener, kan identificeres vedgenfindende algoritmer, som tillader forskere at forudsige tilstedeværelsen af bestemtegenprodukter og deres mulige funktioner i en organisme, selv før de er blevet isoleret eksperimentelt.[165] Hele genomer kan også sammenlignes, hvilket kan skabe klarhed omkring en bestemt organismes evolutionære historie og tillade undersøgelsen af komplekse evolutionære begivenheder.
DNA-nanoteknologi anvender DNA's og andre nukleinsyrers unikkemolekylære genkendelsesegenskaber til at skabe selvsamlende forgrenede DNA-komplekser med nyttige egenskaber.[166] DNA bruges således som et strukturelt materiale snarere end som en bærer af biologisk information. Dette har ført til skabelsen af to-dimensionelle periodiske gitre (der begge er flise-baserede og anvender "DNA-origami"-metoden) såvel som tredimensionelle strukturer i form afpolyedre.[167]Nanomekaniske enheder ogalgoritmisk selv-samling er også blevet demonstreret,[168] og disse DNA-strukturer er blevet anvendt som skabeloner for arrangeringen af andre molekyler såsomguldnanopartikler ogstreptavidin-proteiner.[169]
Fordi DNA undergår mutationer over tid, som derefter nedarves, indeholder det historisk information, og ved at sammenligne DNA-sekvenser kan genetikere udlede organismers evolutionære historie, deresfylogeni.[170] Feltet fylogenetik er et vigtigt værktøj inden forevolutionsbiologi. Hvis der sammenlignes DNA-sekvenser inden for samme art, kanpopulationsgenetikere lære om en bestemt populations historie. Dette kan bruges i studier af alt fraøkologisk genetik tilantropologi; for eksempel benyttes DNA-beviser til at forsøge at identificereIsraels ti forsvundne stammer.[171][172]
I en rapport udgivet iNature i januar 2013 foreslog forskere fraEuropean Bioinformatics Institute ogAgilent Technologies en mekanisme til at benytte DNA's evne til at kode information som en måde at lagre digitale data. Gruppen var i stand til at kode 739 kilobyte data ind i DNA-kode, syntetisere den faktiske DNA og derefter sekventere DNA'en og afkode informationen tilbage til dens oprindelige form, med 100% nøjagtighed. Den kodede information bestod af tekst- og lydfiler. Et tidligere eksperiment blev udgivet i august 2012, udført af forskere vedHarvard University, hvor man kodede teksten til en 54.000 ord lang bog ind i DNA.[173][174]
James Watson ogFrancis Crick (højre), ophavsmændene til dobbelthelix-modellen, med Maclyn McCarty (venstre).Blyantskladde af DNA-dobbelthelixen af Francis Crick i 1953
DNA blev identificeret og isoleret for første gang af den schweiziske lægeFriedrich Miescher, som i 1869 opdagede en mikroskopisk substans i materie fra kasserede kirurgibandager. Da det var placeret i cellernes kerner (latin:nukleus,flertalnuklei) kaldte han det "nuklein".[175][176]
I 1878 isoleredeAlbrecht Kossel ikke-protein-komponenten af "nuklein", nukleinsyre, og isolerede senere dets fem primærenukleobaser.[177][178] I 1919 identificerede Phoebus Levene de grundlæggende sukker- og fosfat-nukleotidenheder.[179] Levene foreslog, at DNA bestod af en streng af nukleotidenheder, der er forbundet via fosfatgrupperne. Levene troede, at kæden var kort, og at baserne blev gentaget i en fast rækkefølge. I 1937 produceredeWilliam Astbury de første røntgendiffraktionsmønstre, der viste, at DNA har en regelmæssig struktur.[180]
I 1953 foreslogJames Watson ogFrancis Crick det, der nu er accepteret som den første korrekte dobbelthelix-model af DNA-strukturen, i tidsskriftetNature.[8] Deres dobbeltheliske, molekylære DNA-model var dengang baseret på et enkeltrøntgendiffraktionsbillede (kaldt "Foto 51")[187] taget afRosalind Franklin ogRaymond Gosling i maj 1952, såvel som informationen om, at DNA-baserne er parrede – også opnået gennem privat kommunikation fra Erwin Chargaff i de tidligere år.
Eksperimentelt bevis til støtte for Watson og Cricks model blev udgivet i en serie af fem artikler i den samme udgave afNature.[188] Ud af disse var Franklin og Goslings rapport den første udgivelse af deres egne røntgendiffraktionsdata og originale analyse, som delvist understøttede Watson og Cricks model;[47][189] denne udgave indeholdt også en artikel om DNA-strukturen afMaurice Wilkins og to af hans kollegaer, hvis analyse ogin vivo B-DNA røntgenmønstre også understøttede tilstedeværelsenin vivo af dobbelthelix-DNA-konfigurationer som foreslået af Crick og Watson.[48] I 1962, efter Franklin's død, blev Watson, Crick og Wilkins i fællesskab tildeltNobelprisen i fysiologi eller medicin[190] (nobelpriser tildeles kun levende personer). Der er fortsat debat omkring, hvem der bør tilskrives opdagelsen.[191]
I en indflydelsesrig præsentation i 1957 forklarede Crickmolekylærbiologiens centrale dogme, som forudsagde forholdet mellem DNA, RNA og proteiner, og formulerede "adaptorhypotesen".[192] Den endelige bekræftelse af replikationsmekanismen, der blev antydet af dobbelthelix-strukturen, fulgte i 1958 i form af Meselson-Stahl-eksperimentet.[193] Yderligere arbejde af Crick og kollegaer viste, at den genetiske kode blev baseret på ikke-overlappende basetripletter, kaldetcodoner, hvilket gjordeHar Gobind Khorana,Robert W. Holley ogMarshall Warren Nirenberg i stand til at dechifrere den genetiske kode.[194] Disse fund kom til at repræsentere molekylærbiologiens fødsel.
↑Gregory SG, Barlow KF, McLay KE, Kaul R, Swarbreck D, Dunham A; et al. (2006). "The DNA sequence and biological annotation of human chromosome 1".Nature.441 (7091): 315-21.Bibcode:2006Natur.441..315G.doi:10.1038/nature04727.PMID16710414.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Kiljunen S, Hakala K, Pinta E, Huttunen S, Pluta P, Gador A, Lönnberg H, Skurnik M (2005). "Yersiniophage phiR1-37 is a tailed bacteriophage having a 270 kb DNA genome with thymidine replaced by deoxyuridine".Microbiology.151 (12): 4093-4102.doi:10.1099/mic.0.28265-0.PMID16339954.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Uchiyama J, Takemura-Uchiyama I, Sakaguchi Y, Gamoh K, Kato SI, Daibata M, Ujihara T, Misawa N, Matsuzaki S (marts 2014). "Intragenus generalized transduction inStaphylococcus spp. by a novel giant phage".ISME J.8: 1949-1952.doi:10.1038/ismej.2014.29.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑DiPaolo C, Kieft R, Cross M, Sabatini R (2005). "Regulation of trypanosome DNA glycosylation by a SWI2/SNF2-like protein".Mol Cell.17 (3): 441-451.doi:10.1016/j.molcel.2004.12.022.PMID15694344.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Vainio S, Genest PA, ter Riet B, van Luenen H, Borst P (2009). "Evidence that J-binding protein 2 is a thymidine hydroxylase catalyzing the first step in the biosynthesis of DNA base J".Molecular and biochemical parasitology.164 (2): 157-61.doi:10.1016/j.molbiopara.2008.12.001.PMID19114062.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑van Luenen HG, Farris C, Jan S, Genest PA, Tripathi P, Velds A, Kerkhoven RM, Nieuwland M, Haydock A, Ramasamy G, Vainio S, Heidebrecht T, Perrakis A, Pagie L, van Steensel B, Myler PJ, Borst P (2012)."Leishmania".Cell.150 (5): 909-921.doi:10.1016/j.cell.2012.07.030.PMC3684241.PMID22939620.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Isaksson J, Acharya S, Barman J, Cheruku P, Chattopadhyaya J (2004). "Single-stranded adenine-rich DNA and RNA retain structural characteristics of their respective double-stranded conformations and show directional differences in stacking pattern".Biochemistry.43 (51): 15996-6010.doi:10.1021/bi048221v.PMID15609994.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
12Wang JC (2002). "Cellular roles of DNA topoisomerases: a molecular perspective".Nature Reviews Molecular Cell Biology.3 (6): 430-40.doi:10.1038/nrm831.PMID12042765.
↑Basu HS, Feuerstein BG, Zarling DA, Shafer RH, Marton LJ (1988). "Recognition of Z-RNA and Z-DNA determinants by polyamines in solution: experimental and theoretical studies".J Biomol Struct Dyn.6 (2): 299-309.doi:10.1080/07391102.1988.10507714.PMID2482766.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Lu XJ, Shakked Z, Olson WK (2000). "A-form conformational motifs in ligand-bound DNA structures".J. Mol. Biol.300 (4): 819-40.doi:10.1006/jmbi.2000.3690.PMID10891271.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Rothenburg S, Koch-Nolte F, Haag F (2001). "DNA methylation and Z-DNA formation as mediators of quantitative differences in the expression ofalleles".Immunol Rev.184: 286-98.doi:10.1034/j.1600-065x.2001.1840125.x.PMID12086319.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
12Greider CW, Blackburn EH (1985). "Identification of a specific telomere terminal transferase activity in Tetrahymena extracts".Cell.43 (2 Pt 1): 405-13.doi:10.1016/0092-8674(85)90170-9.PMID3907856.
123Nugent CI, Lundblad V (1998). "The telomerase reverse transcriptase: components and regulation".Genes Dev.12 (8): 1073-85.doi:10.1101/gad.12.8.1073.PMID9553037.
↑Griffith JD, Comeau L, Rosenfield S, Stansel RM, Bianchi A, Moss H, de Lange T (1999). "Mammalian telomeres end in a large duplex loop".Cell.97 (4): 503-14.doi:10.1016/S0092-8674(00)80760-6.PMID10338214.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Gommers-Ampt JH, Van Leeuwen F, de Beer AL, Vliegenthart JF, Dizdaroglu M, Kowalak JA, Crain PF, Borst P (1993). "beta-D-glucosyl-hydroxymethyluracil: a novel modified base present in the DNA of the parasitic protozoan T. brucei".Cell.75 (6): 1129-36.doi:10.1016/0092-8674(93)90322-H.PMID8261512.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Douki T, Reynaud-Angelin A, Cadet J, Sage E (2003). "Bipyrimidine photoproducts rather than oxidative lesions are the main type of DNA damage involved in the genotoxic effect of solar UVA radiation".Biochemistry.42 (30): 9221-6.doi:10.1021/bi034593c.PMID12885257.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Cadet J, Delatour T, Douki T, Gasparutto D, Pouget JP, Ravanat JL, Sauvaigo S (1999). "Hydroxyl radicals and DNA base damage".Mutat Res.424 (1-2): 9-21.doi:10.1016/S0027-5107(99)00004-4.PMID10064846.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Alberts, B, Johnson A, Lewis J; et al. (2002). "The Preventable Causes of Cancer".Molecular biology of the cell (4th udgave). New York: Garland Science.ISBN0-8153-4072-9.A certain irreducible background incidence of cancer is to be expected regardless of circumstances: mutations can never be absolutely avoided, because they are an inescapable consequence of fundamental limitations on the accuracy of DNA replication, as discussed in Chapter 5. If a human could live long enough, it is inevitable that at least one of his or her cells would eventually accumulate a set of mutations sufficient for cancer to develop.{{cite book}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Braña MF, Cacho M, Gradillas A, de Pascual-Teresa B, Ramos A (2001). "Intercalators as anticancer drugs".Curr Pharm Des.7 (17): 1745-80.doi:10.2174/1381612013397113.PMID11562309.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Folkersen, Lasse (2021-05-31)."Hvad er DNA".Videnskab.dk. København: Videnskab.dk. Hentet2021-09-21.
↑Thanbichler M, Wang SC, Shapiro L (2005). "The bacterial nucleoid: a highly organized and dynamic structure".J Cell Biochem.96 (3): 506-21.doi:10.1002/jcb.20519.PMID15988757.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Gregory TR (2005). "The C-value enigma in plants and animals: a review of parallels and an appeal for partnership".Annals of Botany.95 (1): 133-46.doi:10.1093/aob/mci009.PMID15596463.
↑Harrison PM, Gerstein M (2002). "Studying genomes through the aeons: protein families, pseudogenes and proteome evolution".J Mol Biol.318 (5): 1155-74.doi:10.1016/S0022-2836(02)00109-2.PMID12083509.
↑Blehm Bidstrup, Bodil:Bioteknologi 4, 2011, Forlaget Nucleus, s. 16-17
↑Dame RT (2005). "The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin".Mol. Microbiol.56 (4): 858-70.doi:10.1111/j.1365-2958.2005.04598.x.PMID15853876.
↑Iftode C, Daniely Y, Borowiec JA (1999). "Replication protein A (RPA): the eukaryotic SSB".Crit Rev Biochem Mol Biol.34 (3): 141-80.doi:10.1080/10409239991209255.PMID10473346.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑Spiegelman BM, Heinrich R (2004). "Biological control through regulated transcriptional coactivators".Cell.119 (2): 157-67.doi:10.1016/j.cell.2004.09.037.PMID15479634.
↑Schoeffler AJ, Berger JM (2005). "Recent advances in understanding structure-function relationships in the type II topoisomerase mechanism".Biochem Soc Trans.33 (Pt 6): 1465-70.doi:10.1042/BST20051465.PMID16246147.
↑Cremer T, Cremer C (2001). "Chromosome territories, nuclear architecture and gene regulation in mammalian cells".Nature Reviews Genetics.2 (4): 292-301.doi:10.1038/35066075.PMID11283701.
↑Pál C, Papp B, Lercher MJ (2006). "An integrated view of protein evolution".Nature Reviews Genetics.7 (5): 337-48.doi:10.1038/nrg1838.PMID16619049.{{cite journal}}: CS1-vedligeholdelse: Flere navne: authors list (link)
↑O'Driscoll M, Jeggo PA (2006). "The role of double-strand break repair– insights from human genetics".Nature Reviews Genetics.7 (1): 45-54.doi:10.1038/nrg1746.PMID16369571.
↑Goff SP, Berg P (1976). "Construction of hybrid viruses containing SV40 and lambda phage DNA segments and their propagation in cultured monkey cells".Cell.9 (4 PT 2): 695-705.doi:10.1016/0092-8674(76)90133-1.PMID189942.
↑Miescher, Friedrich (1871)"Ueber die chemische Zusammensetzung der Eiterzellen",Medicinisch-chemische Untersuchungen,4: 441–460.Fra p. 456:"Ich habe mich daher später mit meinen Versuchen an die ganzen Kerne gehalten, die Trennung der Körper, die ich einstweilen ohne weiteres Präjudiz als lösliches und unlösliches Nuclein bezeichnen will, einem günstigeren Material überlassend."
↑Dahm R (2008). "Discovering DNA: Friedrich Miescher and the early years of nucleic acid research".Hum. Genet.122 (6): 565-81.doi:10.1007/s00439-007-0433-0.PMID17901982.
Albrect Kossel (1886) "Weitere Beiträge zur Chemie des Zellkerns",Zeitschrift für Physiologische Chemie,10: 248-264. Tilgængelig online på:Max Planck Institute for the History of Science, Berlin, Germany. på p. 264 bemærker Kossel:"Der Erforschung der quantitativen Verhältnisse der vier stickstoffreichen Basen, der Abhängigkeit ihrer Menge von den physiologischen Zuständen der Zelle, verspricht wichtige Aufschlüsse über die elementaren physiologisch-chemischen Vorgänge."
W. T. Astbury and Florence O. Bell (1938) "Some recent developments in the X-ray study of proteins and related structures,"Cold Spring Harbor Symposia on Quantitative Biology,6: 109-121. Available on-line at:University of Leeds.Arkiveret 14. juli 2014 hosWayback Machine
Astbury, W. T., (1947) "X-ray studies of nucleic acids,"Symposia of the Society for Experimental Biology,1: 66-76. Available on-line at:Oregon State University.
↑Koltsov foreslog, at en celles genetiske information blev kodet i en lang kæde af aminosyrer. Se:
Н. К. Кольцов, "Физико-химические основы морфологии" (The physical-chemical basis of morphology) -- speech given at the 3rd All-Union Meeting of Zoologist, Anatomists, and Histologists at Leningrad, U.S.S.R., December 12, 1927.
Genoptrykt i:Успехи экспериментальной биологии (Advances in Experimental Biology), series B, 7 (1):?-? (1928).
Genoptrykt på tysk som: Nikolaj K. Koltzoff (1928) "Physikalisch-chemische Grundlagen der Morphologie",Biologisches Zentralblatt,48 (6): 345-369.
I 1934 argumenterede Koltsov for, at proteinerne, der indeholder en celles genetiske information, undergik replikation. Se: N. K. Koltzoff (October 5, 1934) "The structure of the chromosomes in the salivary glands of Drosophila,"Science,80 (2075): 312-313. Citat side 313: "I think that the size of the chromosomes in the salivary glands [of Drosophila] is determined through the multiplication ofgenonemes. By this term I designate the axial thread of the chromosome, in which the geneticists locate the linear combination of genes; … In the normal chromosome there is usually only one genoneme; before cell-division this genoneme has become divided into two strands."
↑Soyfer VN (2001). "The consequences of political dictatorship for Russian science".Nature Reviews Genetics.2 (9): 723-729.doi:10.1038/35088598.PMID11533721.
Calladine, Chris R.; Drew, Horace R.; Luisi, Ben F. and Travers, Andrew A. (2003).Understanding DNA: the molecule & how it works. Amsterdam: Elsevier Academic Press.ISBN0-12-155089-3.{{cite book}}: CS1-vedligeholdelse: Flere navne: authors list (link)(engelsk)
Dennis, Carina; Julie Clayton (2003).50 years of DNA. Basingstoke: Palgrave Macmillan.ISBN1-4039-1479-6.{{cite book}}: CS1-vedligeholdelse: Flere navne: authors list (link)(engelsk)
Judson, Horace F. 1979.The Eighth Day of Creation: Makers of the Revolution in Biology. Touchstone Books,ISBN0-671-22540-5. 2nd edition: Cold Spring Harbor Laboratory Press, 1996 paperback:ISBN0-87969-478-5.(engelsk)
Micklas, David. 2003.DNA Science: A First Course. Cold Spring Harbor Press:ISBN978-0-87969-636-8.(engelsk)
Olby, Robert C. (1994).The path to the double helix: the discovery of DNA. New York: Dover Publications.ISBN0-486-68117-3., first published in October 1974 by MacMillan, with foreword by Francis Crick;the definitive DNA textbook,revised in 1994 with a 9-page postscript.(engelsk)
12 May, 2004, BBC News: 'Junk' throws up precious secret Citat: "..."It is very lucky that entire genomes were mapped, as this work is showing." He added: "I think other bits of 'junk' DNA will turn out not to be junk. I think this is the tip of the iceberg, and that there will be many more similar findings."..."