L'acide désoxyribonucléique, ouADN, est unemacromolécule biologique présente dans presque toutes[a] lescellules ainsi que chez de nombreuxvirus. L'ADN contient toute l'information génétique, appeléegénome, permettant le développement, le fonctionnement et la reproduction desêtres vivants. C'est unacide nucléique, au même titre que l'acide ribonucléique (ARN). Les acides nucléiques sont, avec lespeptides et lesglucides, l'une des trois grandes familles debiopolymères essentiels à toutes les formes de vie connues.
Les molécules d'ADN des cellules vivantes sont formées de deuxbrinsantiparallèles enroulés l'un autour de l'autre pour former unedouble hélice. On dit que l'ADN estbicaténaire, ou double brin. Chacun de ces brins est unpolymère appelépolynucléotide. Chaquemonomère qui le constitue est unnucléotide, lequel est formé d'unebase nucléique, ou base azotée —adénine (A),cytosine (C),guanine (G) outhymine (T) — liée à unose — ici, ledésoxyribose — lui-même lié à ungroupephosphate. Les nucléotidespolymérisés sont unis les uns aux autres par desliaisons covalentes entre le désoxyribose d'un nucléotide et le groupe phosphate du nucléotide suivant, formant ainsi une chaîne où alternent oses et phosphates, avec des bases nucléiques liées chacune à un ose. L'ordre dans lequel se succèdent les nucléotides le long d'un brin d'ADN constitue laséquence de ce brin. C'est cette séquence qui porte l'information génétique. Celle-ci est structurée engènes, qui sontexprimés à travers latranscription enARN. Ces ARN peuvent êtrenon codants —ARN de transfert etARN ribosomique notamment — ou bien codants : il s'agit dans ce cas d'ARN messagers, qui sonttraduits enprotéines par desribosomes. La succession des bases nucléiques sur l'ADN détermine la succession desacides aminés qui constituent les protéines issues de ces gènes. La correspondance entre bases nucléiques et acides aminés est lecode génétique. L'ensemble des gènes d'un organisme constitue songénome.
Les bases nucléiques d'un brin d'ADN peuvent interagir avec les bases nucléiques d'un autre brin d'ADN à travers desliaisons hydrogène, qui déterminent des règles d'appariement entrepaires de bases : l'adénine et lathymine s'apparient au moyen de deux liaisons hydrogène, tandis que laguanine et lacytosine s'apparient au moyen de trois liaisons hydrogène. Normalement, l'adénine et la cytosine ne s'apparient pas, tout comme la guanine et la thymine. Lorsque les séquences des deux brins sont complémentaires, ces brins peuvent s'apparier en formant une structurebicaténaire hélicoïdale caractéristique qu'on appelle double hélice d'ADN. Cette double hélice est bien adaptée au stockage de l'information génétique : la chaîne oses-phosphates est résistante aux réactions declivage ; de plus, l'information est dupliquée sur les deux brins de la double hélice, ce qui permet deréparer un brin endommagé à partir de l'autre brin resté intact ; enfin, cette information peut être copiée à travers un mécanisme appeléréplication de l'ADN au cours duquel une double hélice d'ADN est recopiée fidèlement en une autre double hélice portant la même information. C'est en particulier ce qui se passe lors de ladivision cellulaire : chaque molécule d'ADN de la cellule mère est répliquée en deux molécules d'ADN, chacune des deux cellules filles recevant ainsi un jeu complet de molécules d'ADN, chaque jeu étant identique à l'autre.
Dans les cellules, l'ADN est organisé en structures appeléeschromosomes. Ces chromosomes ont pour fonction de rendre l'ADN plus compact à l'aide deprotéines, notamment d'histones, qui forment, avec lesacides nucléiques, une substance appeléechromatine. Les chromosomes participent également à la régulation de l'expression génétique en déterminant quelles parties de l'ADN doivent être transcrites enARN. Chez leseucaryotes (animaux,plantes,champignons etprotistes), l'ADN est essentiellement contenu dans lenoyau des cellules, avec une fraction d'ADN présent également dans lesmitochondries ainsi que, chez lesplantes, dans leschloroplastes. Chez lesprocaryotes (bactéries etarchées), l'ADN est contenu dans lecytoplasme. Chez lesvirus qui contiennent de l'ADN, celui-ci est stocké dans lacapside. Quel que soit l'organisme considéré, l'ADN est transmis au cours de lareproduction : il joue le rôle de support de l'hérédité. La modification de la séquence des bases d'un gène peut conduire à unemutation génétique, laquelle peut, selon les cas, être bénéfique, sans conséquence ou néfaste pour l'organisme, voire incompatible avec sa survie. À titre d'exemple, la modification d'une seule base d'un seulgène — celui de laβ-globine, unesous-unité protéique de l'hémoglobine A — dugénotypehumain est responsable de ladrépanocytose, unemaladie génétique parmi les plus répandues dans le monde.
L'ADN « permet de constituer, par un enroulement en double hélice, des molécules de grande taille (macromolécules) constituant ainsi les chromosomes qui codent l'information génétique des êtres vivants »[1].
L'ADN est un longpolymère formé par la répétition demonomères appelésnucléotides. Le premier ADN a été identifié et isolé en 1869 à partir dunoyau deglobules blancs par le SuisseFriedrich Miescher. Sa structure en double hélice a été mise en évidence en 1953 par le BritanniqueFrancis Crick et l'AméricainJames Watson à partir des données expérimentales obtenues par les BritanniquesRosalind Franklin (en fait volées à cette dernière) etMaurice Wilkins (qui les a communiquées). Cette structure, commune à toutes lesespèces, est constituée de deux chaînespolynucléotidiques hélicoïdales enroulées l'une autour de l'autre autour d'un axe commun, avec unpas d'environ3,4nm pour un diamètre d'environ2,0nm[2]. Une autre étude mesurant les paramètres géométriques de l'ADNen solution donne un diamètre de2,2 à 2,6nm avec une longueur par nucléotide de0,33nm[3]. Bien que chaque nucléotide soit très petit, les molécules d'ADN peuvent en contenir des millions et atteindre des dimensions significatives. Par exemple, lechromosome 1 humain, qui est le plus grand deschromosomes humains, contient environ 220 millions depaires de bases[4] pour une longueur linéaire de plus de7cm.
L'ose constituant le squelette de la molécule est le2’-désoxyribose, dérivé duribose. Cepentose alterne avec des groupes phosphate en formant desliaisons phosphodiester entre lesatomesno 3’ etno 5’ derésidus de désoxyribose adjacents[5]. En raison de cette liaison asymétrique, les brins d'ADN ont un sens. Dans une double hélice, les deux brins d'ADN sont de sens opposés : ils sont ditsantiparallèles. Lesens 5’ vers 3’ d'un brin d'ADN désigne conventionnellement celui de l'extrémité portant ungroupephosphate –PO32− vers l'extrémité portant un groupehydroxyle –OH ; c'est dans ce sens qu'estsynthétisé l'ADN par lesADN polymérases. L'une des grandes différences entre l'ADN et l'ARN est le fait que l'ose du squelette de la molécule est leribose dans le cas de l'ARN à la place du désoxyribose de l'ADN, ce qui joue sur la stabilité et la géométrie de cettemacromolécule.
uneadénine interagit avec unethymine à traversdeux liaisons hydrogène ;
uneguanine interagit avec unecytosine à traverstrois liaisons hydrogène.
En raison de cette complémentarité, toute l'information génétique portée par l'un desbrins de la double hélice d'ADN est également portée à l'identique sur l'autre brin. C'est sur ce principe que repose le mécanisme de laréplication de l'ADN, et c'est sur cette complémentarité entre bases nucléiques que reposent toutes les fonctions biologiques de l'ADN dans les cellules vivantes.
L'ADN de certainsvirus, tels que lesbactériophages PBS1 et PBS2 deBacillus subtilis, le bactériophage φR1-37 deYersinia[7] et le phage S6 deStaphylococcus[8], peut remplacer la thymine par l'uracile, une pyrimidine habituellement caractéristique de l'ARN mais normalement absente de l'ADN, où on ne le trouve que comme produit de dégradation de la cytosine.
Appariements non canoniques entre bases nucléiques
Lesbases nucléiques s'apparient le plus souvent en formant lespaires de bases dites « Watson-Crick » correspondant à deux ou troisliaisons hydrogène établies entre deux bases orientées anti sur lesrésidus dedésoxyribose. Des liaisons hydrogène peuvent cependant également s'établir entre unepurine orientée syn et unepyrimidine orientée anti : il s'agit dans ce cas d'unappariement Hoogsteen. Une paire de bases Watson-Crick est susceptible d'établir en plus des liaisons hydrogène de type Hoogsteen avec une troisième base, ce qui permet la formation de structures à troisbrins d'ADN.
Appariements AT et GC : Watson-Crick (à gauche) et Hoogsteen (à droite).
Appariements Hoogsteen et Watson-Crick entre troisbases.
Seul l'un desbrins d'un segment d'ADN constituant ungène esttranscrit enARN fonctionnel, de sorte que les deux brins d'un gène ne sont pas équivalents : celui qui est transcrit en ARN fonctionnel est dit à polarité négative et porte uneséquence antisens, tandis que le brincomplémentaire — qui peut également être transcrit en ARN, mais non fonctionnel — est dit à polarité positive et porte une séquence d'ADN sens. Le brin transcrit en ARN fonctionnel est parfois appelé brin codant, mais cette désignation n'est valable qu'au sein d'un gène donné car les deux brins d'une mêmedouble hélice d'ADN peuvent coder différentes protéines ; on parle alors de brins ambisens[9],[10],[11]. Des ARN sont également transcrits à partir des séquences d'ADN sens — avec par conséquent des séquences d'ARN antisens — aussi bien chez lesprocaryotes que chez leseucaryotes, mais leur rôle biologique n'est pas entièrement élucidé[12] ; l'une des hypothèses est que ces ARN antisens pourraient intervenir dans la régulation de l'expression génétique à travers l'appariement entre séquences d'ARN sens et antisens, qui sont, par définition, complémentaires[13].
La distinction entre brins d'ADN sens et antisens est brouillée dans certains types degènes chevauchants, assez rares chez les procaryotes et les eucaryotes mais plus fréquents sur lesplasmides et chez lesvirus, dans lesquels les deux brins d'un même segment d'ADN encodent chacun un ARN fonctionnel différent[14]. Chez lesbactéries, ce chevauchement peut jouer un rôle dans la régulation de la transcription des gènes[15] tandis que, chez les virus, les gènes chevauchants accroissent la quantité d'information génétique susceptible d'être encodée dans la petite taille du génome viral[16].
L'ADN relâché peut être linéaire, comme c'est typiquement le cas chez leseucaryotes, ou circulaire, comme chez lesprocaryotes. Il peut cependant êtreentortillé de façon parfois complexe sous l'effet de l'introduction de tours d'hélice supplémentaires ou de la suppression de tours dans ladouble hélice. La double hélice d'ADN ainsi surenroulée sous l'effet de supertours positifs ou négatifs présente unpas respectivement raccourci ou allongé par rapport à son état relâché : dans le premier cas, lesbases nucléiques sont arrangées de façon plus compacte ; dans le second cas, elles interagissent au contraire de façon moins étroite[17].In vivo, l'ADN présente généralement un surenroulement légèrement négatif sous l'effet d'enzymes appeléesADN topoisomérases[18], qui sont également indispensables pour relâcher les contraintes introduites dans l'ADN lors des processus qui impliquent que la double hélice soit déroulée pour en séparer les deuxbrins, comme c'est notamment le cas lors de laréplication de l'ADN et lors de satranscription enARN[19].
La stabilité d'une double hélice d'ADN dépend essentiellement du nombre deliaisons hydrogène à briser pour en séparer les deux brins. Par conséquent, plus la double hélice est longue, plus elle est stable. Cependant, les pairesGC étant unies par trois liaisons hydrogène au lieu de deux pour les pairesAT, la stabilité de molécules d'ADNbicaténaires de même longueur croît avec le nombre de pairesGC qu'elles contiennent[22], mesuré par leurtaux de GC. Cet effet est renforcé par le fait que les interactions d'empilement entre bases nucléiques d'un même brin d'ADN sont plus fortes entrerésidus de guanine et de cytosine, de sorte que laséquence de l'ADN influence également sur sa stabilité. La température de fusion de l'ADN dépend par conséquent de la longueur des molécules, de leur taux de GC, de leur séquence, de leurconcentration dans lesolvant et de laforce ionique dans celui-ci. Enbiologie moléculaire, on observe que les segments d'ADN bicaténaire dont la fonction implique que les deux brins de la double hélice puissent s'écarter facilement possèdent un taux élevé de pairesAT[23] : c'est le cas de la séquence TATAAT typique de laboîte de Pribnow de certainspromoteurs.
Vue tridimensionnelle d'une molécule d'ADN B faisant apparaître le grand et le petit sillon.Double hélice droite (a) et gauche (b).Configuration d'unepaire de basesguanine–cytosine dans les formesA,B etZ de l'ADN.
Les deuxbrins de l'ADN forment une double hélice dont le squelette détermine deux sillons. Ces sillons sont adjacents auxpaires de bases et sont susceptibles de fournir un site de liaison pour diverses molécules. Les brins d'ADN n'étant pas positionnés de façon symétrique par rapport à l'axe de la double hélice, ils définissent deux sillons de taille inégale : le grand sillon est large de1,2nm tandis que le petit sillon est large de0,6nm[24]. Les bords desbases nucléiques sont plus accessibles dans le grand sillon que dans le petit sillon. Ainsi, lesprotéines, telles que lesfacteurs de transcription, qui se lient à desséquences spécifiques dans l'ADN bicaténaire le font généralement au niveau du grand sillon[25].
L'ADN B est la forme la plus courante de la double hélice dans les conditions physiologiques des cellules vivantes[27]. Il ne s'agit cependant pas d'une conformation définie par des paramètres géométriques stricts mais plutôt d'un ensemble de conformations apparentées survenant aux niveaux d'hydratation élevés observés dans les cellules vivantes. Leur étude parcristallographie aux rayons X révèle des diagrammes de diffraction et de diffusion caractéristiques deparacristaux moléculaires très désordonnés[28]. Laforme B est une hélice droite avec despaires de basesperpendiculaires à l'axe de l'hélice passant au centre de l'appariement de ces dernières. Un tour d'hélice a une longueur d'environ3,4nm et contient en moyenne 10,4 à 10,5 paires de bases, soit environ 21 nucléotides, pour un diamètre de l'ordre de2,0nm. Lesbases sont orientées en position anti sur lesrésidus dedésoxyribose, lesquels présentent un plissement endocycliqueC2’-endo ducyclefuranose. Les deux sillons de cette configuration ont une largeur typique de2,2nm pour le grand et de1,2nm pour le petit[24].
L'ADN A s'observe dans les échantillons d'ADN plus faiblement hydraté, à force ionique plus élevée, en présence d'éthanol ainsi qu'avec les hybridesbicaténaires d'ADN et d'ARN. Il s'agit d'une double hélice droite dont l'axe ne passe plus par lespaires de bases. Cette double hélice est plus large, avec un diamètre de l'ordre de2,3nm mais un pas de seulement2,8nm pour 11 paires de bases par tour d'hélice. Lesbases elles-mêmes demeurent orientées en position anti sur lesrésidus dedésoxyribose, mais ces derniers présentent un plissement endocycliqueC3’-endo.
L'ADN Z est plus contraint que les formes A et B de l'ADN et s'observe préférentiellement dans les régions riches enpairesguanine–cytosine lors de latranscription de l'ADN enARN. Il s'agit d'une double hélice gauche, dont l'axe s'écarte significativement des paires de bases. Cette double hélice est plus étroite, avec un diamètre d'environ1,8nm et un pas d'environ4,5nm pour 12 paires de bases par tour d'hélice. Lespyrimidines sont orientées en position anti sur lesrésidus dedésoxyribose, dont lecyclefuranose possède en leur présence un plissementC2’-endo, tandis que lespurines sont orientées en position syn sur des résidus de désoxyribose qui possède en leur présence un plissement endocycliqueC2’-exo. La forme Z de l'ADN serait notamment provoquéein vivo par uneenzyme appeléeADAR1[29],[30],[31].
ADN en épingle à cheveux — Lesséquences d'ADNpalindromiques peuvent se replier en formant des structures ditestige-boucle ou en épingle à cheveux[36]. Certaines répétitions, particulièrement les répétitions de trinucléotides (CAG)n ou (CTG)n peuvent former des épingles à cheveux imparfaites dans lesquelles lesrésidus decytosine et deguanine sontappariés tandis que les résidus d'adénine ou dethymine ne le sont pas[37].
ADN G ouG-quadruplex — L'extrémité deschromosomes linéaires est constitué d'une région spécialisée appeléetélomère dont la fonction principale est de permettre la réplication de l'extrémité des chromosomes à l'aide d'uneenzyme spécifique, latélomérase, dans la mesure où les enzymes quirépliquent l'ADN ne peuvent recopier l'extrémité 3' des chromosomes[38]. Ces structures protègent les extrémités des chromosomes et empêchent les systèmes deréparation de l'ADN de les considérer comme endommagées[39]. Dans lescelluleshumaines, les télomères sont généralement constitués d'ADNmonocaténaire répétant des milliers de fois la simpleséquence TTAGGG[40]. Ces séquences riches enrésidus deguanine forment des « G-quartets » résultant de l'appariement Hoogsteen entre quatre résidus de guanine ; l'empilement de ces structures à quatre résidus de guanine forme unG-quadruplex à la structure particulièrement stable[41]. Ces structures sont également stabilisées par lachélation d'ionsmétalliques au centre de chaque G-quartet[42].
ADN ramifié — L'ADN s'effile à une extrémité de la double hélice lorsque lesséquences de ses deux brins cessent d'y être complémentaires : les deux brins s'écartent l'un de l'autre et la molécule adopte une configuration en Y. L'ADN peut alors se ramifier si un troisième brin possède une séquence susceptible de s'apparier avec les deux extrémités libres des deux brins effilés. Il se forme alors une structure en Y intégralementbicaténaire. Il est possible d'envisager des ramifications plus complexes avec de multiples branches[43].
La réaction dedésamination hydrolytique de la cytosine ou de la 5-méthylcytosine se produit lorsqu'une molécule d'eau remplace l'amine exocyclique pour donner respectivement l'uracile ou la thymine.
L'expression génétique de l'ADN dépend de la façon dont l'ADN est conditionné dans leschromosomes en une structure appeléechromatine. Certaines bases peuvent être modifiées lors de la formation de la chromatine, lesrésidus decytosine des régions peu ou pas exprimées génétiquement étant généralement fortementméthylées, et ce majoritairement aux sitesCpG. Leshistones autour desquelles l'ADN est enroulé dans les chromatines peuvent également être modifiées de façoncovalente. La chromatine elle-même peut être modifiée par des complexes de remodelage de la chromatine. De plus, la méthylation de l'ADN et la modification covalente des histones sont coordonnées pour affecter la chromatine et l'expression desgènes[45].
Les pyrimidines ont une structure moléculaire très similaire. Ainsi, la cytosine et la5-méthylcytosine peuvent êtredésaminées pour produire l'uracile (qui n'est pas une base faisant partie du code de l'ADN) et lathymine, respectivement. La réaction de désamination pourrait par conséquent favoriser lesmutations génétiques[48],[49].
L'ADN peut être endommagé par un grand nombre demutagènes qui modifient saséquence. Ces mutagènes comprennent lesoxydants, lesalkylants, lesrayonnements électromagnétiques énergétiques tels que lesultraviolets et lesrayons X etgamma, ainsi que lesparticules subatomiques desrayonnements ionisants tels que ceux résultant de laradioactivité voire desrayons cosmiques. Le type de dommages produits dépend du type de mutagène. Ainsi, les rayons ultraviolets sont susceptibles d'endommager l'ADN en produisant desdimères de pyrimidine en établissant des liaisons entre bases adjacentes d'un mêmebrin d'ADN[63]. Les oxydants tels que lesradicaux libres ou leperoxyde d'hydrogène produisent plusieurs types de dommages, comme des modifications de bases, notamment de laguanosine, et des cassures de la structurebicaténaire[64]. Une cellule humaine typique contient environ 150 000 bases endommagées par un oxydant[65]. Parmi ces lésions dues à des oxydants, les plus dangereuses sont les ruptures bicaténaires parce que ce sont les plus difficiles à réparer et qu'elles sont susceptibles de produire desmutations ponctuelles, desinsertions et desdélétions au sein de la séquence d'ADN, ainsi que destranslocationschromosomiques[66]. Ces mutations sont susceptibles de provoquer descancers. Les altérations naturelles de l'ADN, qui résultent par exemple de processus cellulaires produisant desdérivés réactifs de l'oxygène, sont assez fréquentes. Bien que les mécanismes deréparation de l'ADN résorbent l'essentiel de ces lésions, certaines d'entre elles ne sont pas réparées et s'accumulent au fil du temps dans lestissuspostmitotiques desmammifères. L'accumulation de telles lésions non réparées semble être une importante cause sous-jacente duvieillissement[67],[68].
L'ADN se trouve essentiellement au sein dechromosomes, généralement linéaires chez leseucaryotes et circulaires chez lesprocaryotes. Chez ces derniers, il peut également se trouver en dehors des chromosomes, au sein deplasmides. L'ensemble de l'ADN d'unecellule constitue songénome. Le génomehumain représente environ trois milliards depaires de bases distribués dans 46 chromosomes[73]. L'information contenue dans le génome est portée par des segments d'ADN formant lesgènes. L'information génétique est transmise grâce aux règles spécifiques d'appariement des bases dites appariement Watson-Crick : les deux seules paires de bases normalement permises sont l'adénine avec lathymine et laguanine avec lacytosine. Ces règles d'appariement sont sous-jacentes aux différents processus à l'œuvre dans les fonctions biologiques de l'ADN :
une double hélice d'ADN peut êtrerépliquée en une autre double hélice en associant, à chaquebase de chacun des brins, lenucléotide portant la base complémentaire selon les règles d'appariement de Watson-Crick : il se forme ainsi deux molécules d'ADNbicaténaire identiques là où il n'y en avait au départ qu'une seule, assurant la conservation de l'information au cours descycles de vie successifs des cellules, ce qui fait de l'ADN le vecteur de l'hérédité ;
enfin, l'information portée par l'ADN peut également êtretranscrite enARN à travers la règle d'appariement de Watson-Crick qui, à chaquebase de l'ADN, fait correspondre une et une seule base de l'ARN ; cet ARN est lui-même susceptible d'être à son tourtraduit enprotéines à travers lecode génétique, selon un mécanisme de décodage, réalisé par desARN de transfert, qui repose sur la même règle d'appariement entre bases nucléiques.
Lorsqu'unecellule sedivise, elle doitrépliquer l'ADN portant songénome afin que les deux cellules filles héritent de la mêmeinformation génétique que la cellule mère. La double hélice de l'ADN fournit un mécanisme de réplication simple : les deuxbrins sont déroulés pour être séparés et chacun des deux brins sert de modèle pour recréer un brin à laséquence complémentaire par appariement entrebases nucléiques, ce qui permet de reconstituer deux hélices d'ADNbicaténaire identiques l'une à l'autre. Ce processus estcatalysé par un ensemble d'enzymes parmi lesquelles lesADN polymérases sont celles qui complémentent les brins d'ADN déroulées pour reconstruire les deux brins complémentaires. Comme ces ADN polymérases ne peuventpolymériser l'ADN que dans lesens 5' vers 3', différents mécanismes interviennent pour copier les brinsantiparallèles de la double hélice[74] :
Systèmeenzymatique deréplication de l'ADN. La double hélice est déroulée par unehélicase et uneADN topoisomérase. Puis uneADN polymérase — en l'occurrence unePol δ chez leseucaryotes — produit le brin avancé, ou brin direct, tandis qu'une autre ADN polymérase — unePol α — produit des segments le long du brin retardé, ou brin indirect, appelésfragments d'Okazaki, qui sont ensuite suturés par uneADN ligase. Sur ce schéma, laPol α devrait plutôt être représentée à droite de l'ADN ligase, à l'extrémité gauche du dernier fragment d'Okazaki formé sur le brin indirect.
L'ADN dugénome est organisé et compacté selon un processus appelé condensation de l'ADN afin de pouvoir se loger dans l'espace restreint d'unecellule. Chez leseucaryotes, l'ADN est localisé essentiellement dans lenoyau, avec une petite fraction également dans lesmitochondries et, chez lesplantes, dans leschloroplastes. Chez lesprocaryotes, l'ADN se trouve au sein d'une structure irrégulière ducytoplasme appeléenucléoïde[76]. L'information génétique du génome est organisée au sein degènes, et l'ensemble complet de cette information est appelégénotype. Un gène est une fraction de l'ADN qui influence une caractéristique particulière de l'organisme et constitue de ce fait un élément de l'hérédité. Il contient uncadre de lecture ouvert qui peut êtretranscrit enARN, ainsi que desséquences de régulation de l'expression génétique telles que lespromoteurs et lesamplificateurs qui en contrôlent la transcription.
Chez la plupart desespèces, seule une petite fraction du génome encode desprotéines. Ainsi, environ 1, 5 % dugénome humain est constitué d'exons codant des protéines, tandis que plus de 50 % de l'ADN humain est constitué deséquences répétées non codantes[77] ; le reste de l'ADN code différents types d'ARN tels que desARN de transfert et desARN ribosomiques. La présence d'une telle quantité d'ADN non codant dans legénome deseucaryotes ainsi que la grande variabilité de lataille du génome des différents organismes — taille qui n'a aucun rapport avec la complexité des organismes correspondants — est une question connue depuis les débuts de la biologie moléculaire et souvent appeléeparadoxe de la valeur C, cette « valeur C » désignant, chez les organismesdiploïdes, la taille du génome, et un multiple de cette taille chez lespolyploïdes[78]. Cependant, certaines séquences d'ADN qui n'encodent pas de protéines peuvent coder desmolécules d'ARN fonctionnelles intervenant dans la régulation de l'expression génétique[79].
Certaines séquences d'ADN non codantes jouent un rôle structurel dans leschromosomes. Lestélomères et lescentromères contiennent généralement peu de gènes mais contribuent significativement aux fonctions biologiques et à la stabilité mécanique des chromosomes[39],[80]. Une fraction significative de l'ADN non codant est constituée depseudogènes, qui sont des copies de gènes rendues inactives à la suite demutations[81]. Ces séquences ne sont généralement que des fossiles moléculaires mais peuvent parfois servir de matière première génétique pour la création de nouveaux gènes à travers des processus deduplication génétique et de divergence évolutive[82].
Transfert d'information permettant l'expression dugénotype dans lephénotype.
L'expression génétique consiste à convertir legénotype d'un organisme enphénotype, c'est-à-dire en un ensemble de caractéristiques propres à cet organisme. Ce processus est influencé par divers stimuli extérieurs et comprend les trois grandes étapes suivantes :
Notons qu'un même ADN peut à deux étapes du développement d'un organisme s'exprimer (en raison de répresseurs et dérépresseurs différents) de façons très dissemblables, l'exemple le plus connu étant celui de la chenille et du papillon, morphologiquement très éloignés.
L'ARN issu de latranscription de l'ADN peut êtrenon codant ou codant. Dans le premier cas, il possède une fonctionphysiologique propre dans lacellule ; dans le second cas, il s'agit d'unARN messager, qui sert à transporter l'information génétique contenue dans l'ADN vers lesribosomes, qui organisent le décodage de cette information à l'aide de l'ARN de transfert. Ces ARN de transfert sont liés à unacide aminé parmi les 22acides aminés protéinogènes et possèdent chacun un groupe de troisbases nucléiques consécutives appeléesanticodon. Les trois bases de ces anticodons peuvent s'apparier à trois bases consécutives de l'ARN messager, ce triplet de bases formant uncodon complémentaire de l'anticodon de l'ARN de transfert. La complémentarité du codon de l'ARN messager et de l'anticodon de l'ARN de transfert repose sur des règles d'appariement de type Watson-Crick régissant la structure secondaire des ADNbicaténaires.
La correspondance entre les 64 codons possibles et les 22 acides aminés protéinogènes est appeléecode génétique. Ce code est matérialisé par les différents ARN de transfert réalisant physiquement la liaison entre un acide aminé donné et différents anticodons selon les différents ARN de transfert pouvant se lier à un même acide aminé. Ainsi, une séquence donnée de bases nucléiques au sein d'un gène sur l'ADN peut être convertie en une séquence précise d'acides aminés formant une protéine dans le cytoplasme de la cellule.
Il existe davantage de codons qu'il n'existe d'acides aminés à coder. On dit de ce fait que le code génétique est dégénéré. Outre les acides aminés protéinogènes, il code également la fin de traduction à l'aide de trois codons particuliers ditscodonsSTOP : TAA, TGA et TAG sur l'ADN.
Toutes les fonctions biologiques de l'ADN dépendent d'interactions avec desprotéines. Il peut s'agir d'interactions non spécifiques comme d'interactions avec des protéines qui se lient spécifiquement à uneséquence précise de l'ADN. Desenzymes peuvent également se lier à l'ADN et, parmi celles-ci, lespolymérases qui assurent laréplication de l'ADN ainsi que satranscription enARN jouent un rôle particulièrement déterminant.
Les protéines structurelles qui se lient à l'ADN offrent des exemples bien compris d'interactions non spécifiques entre des protéines et de l'ADN. Celui-ci est maintenu au sein deschromosomes en formant des complexes avec des protéines structurelles qui condensent l'ADN en une structure compacte appeléechromatine. Chez leseucaryotes, cette structure fait intervenir de petites protéinesbasiques appeléeshistones, tandis qu'elle fait intervenir de nombreuses protéines de différentes sortes chez lesprocaryotes[85],[86]. Les histones forment avec l'ADN un complexe en forme de disque appelénucléosome contenant deux tours complets d'une molécule d'ADNbicaténaire enroulée autour de la protéine. Ces interactions non spécifiques s'établissent entre lesrésidus basiques des histones et le squeletteacide constitué d'une alternanceose–phosphate portant lesbases nucléiques de la double hélice d'ADN. Il se forme ainsi desliaisons ioniques indépendantes de laséquence des bases de l'ADN[87]. Ces résidus d'acides aminés basiques subissent des modifications chimiques telles que desméthylations, desphosphorylations et desacétylations[88]. Ces modifications chimiques modifient l'intensité des interactions entre l'ADN et les histones, rendant l'ADN plus ou moins accessible auxfacteurs de transcription et modulant ainsi l'activité detranscription[89]. Parmi les autres protéines se liant à l'ADN de façon non spécifique, on compte les protéines nucléaires du groupe à haute mobilitéélectrophorétique, ditesHMG, qui se lient à l'ADN courbé ou distordu[90]. Ces protéines sont importantes pour infléchir les réseaux de nucléosomes et les arranger en structures plus grandes qui constituent les chromosomes[91].
Parmi les protéines à interactions non spécifiques avec l'ADN, celles qui se lient spécifiquement à l'ADNmonocaténaire constituent un groupe particulier. Chez l'homme, laprotéine A en est le représentant le mieux compris. Elle intervient lorsque les deux brins d'une double hélice sont séparés, notamment lors de laréplication, larecombinaison et laréparation de l'ADN[92]. Ces protéines semblent stabiliser l'ADN monocaténaire et empêcher qu'il ne forme des structures entige-boucle — épingle à cheveux — ou ne soit dégradé par desnucléases.
A contrario, d'autres protéines ne se lient qu'à desséquences d'ADN spécifiques. Parmi ces protéines, les plus étudiées sont les différentsfacteurs de transcription, qui sont des protéines régulant latranscription. Chaque facteur de transcription ne se lie qu'à un ensemble particulier de séquences d'ADN et active ou inhibe lesgènes dont l'une de ces séquences spécifique est proche dupromoteur. Les facteurs de transcription réalisent ceci de deux façons. Ils peuvent tout d'abord se lier à l'ARN polymérase responsable de la transcription, directement ou par l'intermédiaire d'autres protéines médiatrices ; ceci positionne la polymérase au niveau du promoteur et lui permet de commencer la transcription[93]. Ils peuvent également se lier à desenzymes qui modifient les histones au niveau du promoteur, ce qui a pour effet de modifier l'accessibilité de l'ADN pour la polymérase[94].
Dans la mesure où ces cibles d'ADN peuvent se distribuer dans tout legénome d'un organisme, un changement de l'activité d'un seul type de facteurs de transcription peut affecter des milliers de gènes[95]. Par conséquent, ces protéines sont souvent la cible de processus detransduction de signal contrôlant les réponses à des changements environnementaux, le développement ou ladifférenciation cellulaires. La spécificité de l'interaction de ces facteurs de transcription avec l'ADN vient du fait que ces protéines établissent de nombreux contacts avec les bords desbases nucléiques, ce qui leur permet de « lire » la séquence de l'ADN. La plupart de ces interactions ont lieu dans le grand sillon de la double hélice de l'ADN, là où les bases sont le plus accessibles[25].
À l'inverse, les enzymes appeléesADN ligases peuvent recoller des brins d'ADN rompus ou clivés[98]. Ces enzymes sont particulièrement importantes au cours de laréplication de l'ADN car ce sont elles qui suturent lesfragments d'Okazaki produits sur le brin retardé, appelé aussi brin indirect, au niveau de la fourche de réplication. Elles interviennent également dans les mécanismes deréparation de l'ADN et derecombinaison génétique[98].
Lestopoisomérases sont desenzymes ayant à la fois une activiténucléase et une activitéligase. L'ADN gyrase est un exemple de telles enzymes. Cesprotéines modifient le taux de surenroulement de l'ADN en sectionnant une double hélice pour permettre aux deux segments formés de tourner l'un par rapport à l'autre en relâchant les supertours avant d'être à nouveau suturés l'un à l'autre[18]. D'autres types de topoisomérases sont capables de sectionner une double hélice pour permettre le passage d'un autre segment de double hélice à travers la brèche ainsi formée avant de refermer cette dernière[99]. Les topoisomérases sont indispensables à de nombreux processus impliquant l'ADN, tels que latranscription et laréplication de l'ADN[19].
LesADN polymérases sont desenzymes quisynthétisent des chaînes depolynucléotides à partir denucléosidestriphosphates. La séquence des chaînes qu'elles synthétisent est déterminée par celle d'une chaîne de polynucléotides préexistante appeléematrice. Ces enzymes fonctionnent en ajoutant continuellement desnucléotides à l'hydroxyle de l'extrémité 3’ de la chaîne polypeptidique en cours de croissance. Pour cette raison, toutes les polymérases fonctionnent dans lesens5’ vers 3’[101]. Le nucléoside triphosphate ayant unebase complémentaire de celle de la matrice s'apparie à celle-ci dans lesite actif de ces enzymes , ce qui permet aux polymérases de produire desbrins d'ADN dont la séquence est exactement complémentaire de celle du brin matrice. Les polymérases sont classées en fonction du type de brins qu'elles utilisent.
Au cours de laréplication, lesADN polymérases ADN-dépendantes réalisent des copies de brins d'ADN. Afin de préserver l'information génétique, il est essentiel que la séquence des bases de chaque copie soit exactement complémentaire de la séquence des bases sur le brin matrice. Pour ce faire, de nombreuses ADN polymérases ont la capacité de corriger leurs éventuelles erreurs de réplication — fonction deproofreading. Elles sont pour cela capables d'identifier le défaut de formation d'une paire de bases entre le brin matrice et le brin en cours de croissance au niveau de la base qu'elles viennent d'insérer et decliver cenucléotide à l'aide d'une activitéexonucléase3’ → 5’ afin d'éliminer cette erreur de réplication[102]. Chez la plupart des organismes, les ADN polymérases fonctionnent au sein de grands complexes appelésréplisomes qui contiennent plusieurssous-unités complémentaires telles queclamps — pinces à ADN — ethélicases[103].
Les ADN polymérases ARN-dépendantes sont une classe de polymérases spécialisées capables de copier une séquence d'ARN en ADN. Elles comprennent latranscriptase inverse, qui est une enzymevirale impliquée dans l'infection descelluleshôte par lesrétrovirus, et latélomérase, enzyme indispensable à la réplication destélomères[38],[104]. La télomérase est une polymérase inhabituelle en ce qu'elle contient sa propre matrice d'ARN au sein de sa structure[39].
Latranscription est réalisée par uneARN polymérase ADN-dépendante qui copie une séquence d'ADN enARN. Afin de commencer la transcription d'ungène, l'ARN polymérase se lie tout d'abord à une séquence de l'ADN appeléepromoteur et sépare les brins d'ADN. Puis elle copie la séquence d'ADN constituant le gène en une séquence complémentaire d'ARN jusqu'à atteindre une région de l'ADN appeléeterminateur, où elle s'arrête et se détache de l'ADN. Tout comme l'ADN polymérase ADN-dépendante, l'ARN polymérase II — enzyme qui transcrit la plupart des gènes dugénome humain — fonctionne au sein d'un grand complexe protéique comprenant plusieurssous-unités complémentaires et régulatrices[105].
Chaquedivision cellulaire est précédée d'uneréplication de l'ADN conduisant à une réplication deschromosomes. Ce processus conserve normalement l'information génétique de lacellule, chacune des deux cellules filles héritant d'un patrimoine génétique complet identique à celui de la cellule mère. Il arrive cependant que ce processus ne se déroule pas normalement et que l'information génétique de la cellule s'en trouve modifiée. On parle dans ce cas demutation génétique. Cette altération dugénotype peut être sans conséquence ou, au contraire, altérer également lephénotype résultant de l'expression desgènes altérés.
Une double hélice d'ADN n'interagit généralement pas avec d'autres segments d'ADN et, dans lescelluleshumaines, les différentschromosomes occupent même chacun une région qui leur est propre au sein dunoyau et appeléeterritoire chromosomique[107]. Cette séparation physique des différents chromosomes est essentielle au fonctionnement de l'ADN comme répertoire stable et pérenne de l'information génétique dans la mesure où l'une des rares fois où des chromosomes interagissent survient lors de l'enjambement responsable de larecombinaison génétique, c'est-à-dire lorsque deux doubles hélices d'ADN sont rompues, échangent leurs sections et se ressoudent.
La recombinaison permet aux chromosomes d'échanger du matériel génétique et de produire de nouvelles combinaisons degènes, ce qui accroît l'efficacité de lasélection naturelle et peut être déterminant dans l'évolution rapide de nouvellesprotéines[108]. La recombinaison génétique peut également survenir lors de laréparation de l'ADN, notamment en cas de rupture simultanée des deux brins de la double hélice d'ADN[109].
La forme la plus courante de recombinaison chromosomique est larecombinaison homologue, lors de laquelle les deux chromosomes en interaction partagent desséquences très semblables. Les recombinaisons non homologues peuvent fortement endommager les cellules car elles peuvent conduire à destranslocations et des anomalies génétiques. La réaction de recombinaison estcatalysée par desenzymes appeléesrecombinases, telle que laprotéine Rad51[110]. La première étape de ce processus est une rupture des deux brins de la double hélice provoquée par uneendonucléase ou par un dommage à l'ADN[111]. Une suite d'étapes catalysées par la recombinase conduit à réunir les deux hélices par au moins unejonction de Holliday dans laquelle un segmentmonocaténaire de chaque double hélice est ressoudé au brin complémentaire de l'autre double hélice. La jonction de Holliday est une jonction cruciforme qui, lorsque les brins ont des séquences symétriques, peut se déplacer le long de la paire de chromosomes en échangeant un brin avec l'autre. La réaction de recombinaison s'arrête parclivage de la jonction et suture de l'ADN libéré[112].
L'information génétique codée par l'ADN n'est pas nécessairement fixe dans le temps et certainesséquences sont susceptibles de se déplacer d'une partie dugénome à une autre. Ce sont leséléments génétiques mobiles. Ces éléments sontmutagènes et peuvent altérer le génome descellules. On trouve parmi eux notamment lestransposons et lesrétrotransposons, ces derniers agissant, contrairement aux premiers, à travers unARN intermédiaire redonnant une séquence d'ADN sous l'action d'unetranscriptase inverse. Ils se déplacent au sein du génome sous l'effet detransposases,enzymes particulières qui les détachent d'un endroit et les recollent à un autre endroit du génome cellulaire, et seraient responsables de la migration de pas moins de 40 % dugénome humain au cours de l'évolution d'Homo sapiens[113].
Lesbactéries en état decompétence sont susceptibles d'absorber directement une molécule d'ADN extérieure et de l'incorporer dans leur propregénome, processus appelétransformation génétique. Elles peuvent également obtenir cet ADN sous forme deplasmide d'une autre bactérie à travers le processus deconjugaison bactérienne. Enfin, elles peuvent recevoir cet ADN par l'intermédiaire d'unbactériophage (unvirus) partransduction. Leseucaryotes peuvent également recevoir du matériel génétique exogène, à travers un processus appelétransfection.
L'ADN recèle toute l'information génétique permettant aux êtres vivants de vivre, de croître et de se reproduire. On ignore cependant si, au cours des 4 milliards d'années de l'histoire de la vie surTerre, l'ADN a toujours joué ce rôle. Une théorie propose que ce soit un autreacide nucléique, l'ARN, qui ait été le support de l'information génétique des premières formes de vies apparues sur notre planète[125],[126]. L'ARN aurait joué le rôle central dans une première forme demétabolisme cellulaire dans la mesure où il est susceptible à la fois de véhiculer de l'information génétique et decatalyser desréactions chimiques en formant desribozymes[127]. Cemonde à ARN, dans lequel l'ARN aurait servi à la fois de support de l'hérédité et d'enzymes, aurait influencé l'évolution ducode génétique à quatrebases nucléiques, lequel offre un compromis entre la précision du codage de l'information génétique favorisée par un nombre restreint de bases d'une part et l'efficacité catalytique des enzymes favorisée par un plus grand nombre demonomères d'autre part[128].
Il n'existe cependant aucune preuve directe de l'existence passée de systèmes métaboliques et génétiques différents de ceux que nous connaissons aujourd'hui dans la mesure où il demeure impossible d'extraire du matériel génétique de la plupart desfossiles. L'ADN ne persiste en effet plus d'un million d'années avant d'être dégradé en fragments courts. L'existence d'ADN intact plus ancien a été proposée, en particulier celui d'unebactérie viable extraite d'uncristal desel vieux de 150 millions d'années[129], mais ces publications demeurent controversées[130],[131].
L'ADN extrait dusang, dusperme, de lasalive, d'un fragment depeau ou d'unpoil prélevé sur unescène de crime peut être utilisé enmédecine légale pour déterminer l'empreinte génétique d'un suspect. À cette fin, laséquence de segments d'ADN tels que desséquences microsatellites ou desminisatellites est comparée avec celle d'individus choisis pour l'occasion ou déjà répertoriés dans des bases de données. Cette méthode est généralement d'une très grande fiabilité pour identifier l'ADN correspondant à celui d'un individu suspect[142]. L'identification peut cependant être rendue plus complexe si la scène de crime est contaminée par l'ADN de plusieurs personnes[143]. L'identification par empreinte génétique a été développée en 1984 par legénéticien britannique SirAlec Jeffreys[144] et a été utilisée pour la première fois en 1987 pour confondre un violeur ettueur en série[145].
Dans la mesure où l'ADN accumule desmutations au cours du temps qui sont transmises parhérédité, il recèle des informations historiques qui, lorsqu'elles sont analysées par desgénéticiens en comparant desséquences issues d'organismes aux histoires différentes, permettent de retracer l'histoire de l'évolution de ces organismes, c'est-à-dire leurphylogénie[146]. Cette discipline, mettant lagénétique au service de lapaléobiologie, offre un puissant outil d'investigation enbiologie de l'évolution. En comparant des séquences d'ADN issues de différents individus d'une mêmeespèce, lesgénéticiens des populations peuvent étudier l'histoire de populations particulières d'êtres vivants, un domaine allant de la génétique écologique jusqu'à l'anthropologie. Ainsi, l'étude de l'ADN mitochondrial, de l'ADN-Y, puis de l'ADN autosomal au sein de différentes populations humaines est utilisée pour retracer lesmigrations d'Homo sapiens à travers la planète. L'haplogroupe X (ADNmt) a par exemple été étudié enpaléodémographie afin d'évaluer la parenté éventuelle desAmérindiens d'Amérique du Nord-Est avec les populations ouest-européennes duSolutréen[147].
Les répertoires de données représentant la séquence complète d'un génome, tels que ceux produits par leProjet génome humain, atteignent une taille telle qu'ils sont difficiles à utiliser sans les annotations qui identifient l'emplacement desgènes et des éléments de régulation sur chaquechromosome. Les régions des séquences d'ADN qui possèdent les motifs caractéristiques associés aux gènes codant des protéines ou desARN fonctionnels peuvent être identifiés par des algorithmes deprédiction de gènes, qui permettent aux chercheurs de prédire la présence deproduits géniques particuliers et leur fonction possible au sein d'un organisme avant même qu'ils soient isolés expérimentalement[153]. Des génomes entiers peuvent également être comparés, ce qui peut mettre en évidence l'histoire de l'évolution d'organismes particuliers et permettre d'étudier des événements complexes de cette évolution.
L'ADN étant utilisé par les êtres vivants pour stocker leurinformation génétique, certaines équipes de recherche l'étudient également comme support destiné austockage d'informationsnumériques au même titre qu'unemémoireinformatique. Lesacides nucléiques présenteraient en effet l'avantage d'une densité de stockage de l'information considérablement supérieure à celle des médias traditionnels — théoriquement plus d'une dizaine d'ordres de grandeur — avec une durée de vie également très supérieure.
Il est théoriquement possible d'encoder jusqu'à deuxbits dedonnées parnucléotide, permettant une capacité de stockage atteignant 455 millions detéraoctets pargramme d'ADNmonocaténaire demeurant lisibles pendant plusieurs millénaires y compris dans des conditions de stockage non idéales[162], et une technique d'encodage atteignant215 000téraoctets par gramme d'ADN a été proposée en 2017[163] ; à titre de comparaison, unDVD double face double couche contient à peine 17 gigaoctets pour une masse typique de16g — soit une capacité de stockage 400 milliards de fois moindre par unité de masse. Une équipe de l'Institut européen de bio-informatique est ainsi parvenue en 2012 à coder 757 051 octets sur 17 940 195 nucléotides[164], ce qui correspond à une densité de stockage d'environ 2 200 téraoctets pargramme d'ADN[165]. De son côté, une équipe suisse a publié enfévrier 2015 une étude démontrant la robustesse de l'ADN encapsulé dans de lasilice comme support durable de l'information[166].
Par ailleurs, d'autres équipes travaillent sur la possibilité de stocker des informations directement dans descellules vivantes, afin par exemple d'encoder descompteurs sur l'ADN d'une cellule pour en déterminer le nombre dedivisions ou dedifférenciations, ce qui pourrait trouver des applications dans les recherches sur lecancer et sur levieillissement[167].
L'ADN a été isolé pour la première fois en 1869 par le biologiste suisseFriedrich Miescher sous la forme d'une substance riche enphosphore dans lepus de bandages chirurgicaux usagés. Comme cette substance se trouvait dans lenoyau descellules, Miescher l'appelanucléine[168],[169]. En 1878, le biochimiste allemandAlbrecht Kossel isola le composant nonprotéique de cette « nucléine » — lesacides nucléiques — puis en identifia les cinqbases nucléiques[170]. En 1919, le biologiste américainPhoebus Levene identifia les constituants desnucléotides, c'est-à-dire la présence d'unebase, d'unose et d'ungroupephosphate[171]. Il suggéra que l'ADN consistait en une chaîne de nucléotides unis les uns aux autres par leurs groupes phosphate. Il pensait que les chaînes étaient courtes et que les bases s'y succédaient de façon répétée selon un ordre fixe. En 1937, le physicien et biologiste moléculaire britanniqueWilliam Astbury réalisa le premier diagramme de diffraction de l'ADN parcristallographie aux rayons X, montrant que l'ADN possède une structure ordonnée[172].
En 1927, le biologiste russeNikolai Koltsov eut l'intuition que l'hérédité reposait sur une « molécule héréditaire géante » constituée de « deux brins miroirs l'un de l'autre qui se reproduiraient de manière semi-conservative en utilisant chaque brin comme modèle »[173]. Il considérait cependant que c'étaient desprotéines qui portaient l'information génétique[174]. En 1928, le bactériologiste anglaisFrederick Griffith réalisa une expérience célèbre quiporte dorénavant son nom et par laquelle il démontra que desbactéries vivantes nonvirulentes mises en contact avec des bactéries virulentes tuées par la chaleur pouvaient être transformées en bactéries virulentes[175],[176]. Cette expérience ouvrit la voie à l'identification en 1944 de l'ADN comme vecteur de l'information génétique à travers l'expérience d'Avery, MacLeod et McCarty[177]. Le biochimiste belgeJean Brachet démontra en 1946 que l'ADN est un constituant deschromosomes[178], et le rôle de l'ADN dans l'hérédité fut confirmé en 1952 par lesexpériences de Hershey et Chase qui démontrèrent que le matériau génétique duphage T2 est constitué d'ADN[179].
En mai 1952, l'étudiant britanniqueRaymond Gosling, qui travaillait sous la direction deRosalind Franklin dans l'équipe deJohn Randall, prit un cliché dediffraction aux rayons X (lecliché 51[182]) d'un cristal d'ADN fortement hydraté. Ce cliché fut partagé avec Crick et Watson à l'insu de Franklin et fut déterminant dans l'établissement de la structure correcte de l'ADN. Franklin avait par ailleurs indiqué aux deux chercheurs que l'ossature phosphorée de la structure devait être à l'extérieur de celle-ci, et non près de l'axe central comme on le pensait alors. Elle avait de surcroît identifié legroupe d'espace des cristaux d'ADN, qui permit à Crick de déterminer que les deuxbrins d'ADN sont antiparallèles[183]. Alors queLinus Pauling etRobert Corey publiaient un modèle moléculaire d'acide nucléique formé de trois chaînes entrelacées avec, conformément aux idées de l'époque, lesgroupesphosphate près de l'axe central et lesbases nucléiques orientées vers l'extérieur[184], Crick et Watson finalisèrent en février 1953 leur modèle à deux chaînes antiparallèles ayant les groupes phosphate à l'extérieur et les bases nucléiques à l'intérieur de la double hélice, modèle aujourd'hui considéré comme la première structure correcte de l'ADN à avoir jamais été proposée.
Ces travaux furent publiés dans le numéro du de la revueNature à travers cinq articles décrivant la structure finalisée par Crick et Watson, ainsi que les preuves à l'appui de ce résultat. Dans le premier article, intituléMolecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid, Crick et Watson indiquent : « il ne nous a pas échappé que l'appariement spécifique que nous avons postulé suggère immédiatement un mécanisme possible pour la réplication du matériel génétique »[2]. Cet article était suivi d'une publication du BritanniqueMaurice Wilkinset al. portant sur la diffraction de rayons X par de l'ADN Bin vivo, ce qui appuyait l'existence de la structure en double hélice dans les cellules vivantes et pas seulementin vitro[185], et de la première publication des travaux de Franklin et Goslin sur les données qu'ils avaient obtenues par diffraction aux rayons X et leur propre méthode d'analyse[186].
Rosalind Franklin mourut en 1958 d'un cancer et ne reçut pas leprix Nobel de physiologie ou médecine décerné en 1962, « pour leurs découvertes relatives à la structure moléculaire des acides nucléiques et leur importance pour le transfert de l'information génétique dans la matière vivante », à Francis Crick, James Watson et Maurice Wilkins[187], qui n'eurent pas un mot pour créditer Franklin de ses travaux (sauf Maurice Wilkins) ; le fait qu'elle n'ait pas été associée à ce prix Nobel continue de faire débat[188].
La structure hélicoïdale de l'ADN a inspiré plusieurs artistes, le plus célèbre étant le peintresurréalisteSalvador Dalí, qui s'en inspire dans neuf tableaux entre 1956 et 1976, dontPaysage de papillon (Le Grand masturbateur dans un paysage surréaliste avec ADN)[192],[193] (1957-1958) etGalacidalacidesoxyribonucleicacid[194] (1963).
↑(en) « DNA building blocks can be made in space, NASA evidence suggests », surScienceDaily.com,(consulté le) :« The research gives support to the theory that a "kit" of ready-made parts created in space and delivered to Earth by meteorite and comet impacts assisted the origin of life. ».
↑(en)Dan Gusfield,Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology, Cambridge University Press,(ISBN978-0-521-58519-4)
« Ich habe mich daher später mit meinen Versuchen an die ganzen Kerne gehalten, die Trennung der Körper, die ich einstweilen ohne weiteres Präjudiz als lösliches und unlösliches Nuclein bezeichnen will, einem günstigeren Material überlassend. »
Réimpression en allemand : Nikolaj K. Koltzoff, « Physikalisch-chemische Grundlagen der Morphologie (Fondements physicochimiques de la morphologie) »,Biologisches Zentralblatt, vol. 48,no 6, 1928,p. 345-369.
« Je pense que la taille des chromosomes dans lesglandes salivaires [desdrosophiles] est déterminée par la multiplication des génonèmes. Je désigne par ce terme le fil axial du chromosome, dans lequel les généticiens situent la combinaison linéaire des gènes ; … dans le chromosome normal, il n'y a généralement qu'un seul génonème ; avant la division cellulaire, ce génonème se trouve divisé en deux brins. »
↑(en) « The Nobel Prize in Physiology or Medicine 1962 », surnobelprize.org,(consulté le) :« The Nobel Prize in Physiology or Medicine 1962 was awarded jointly to Francis Harry Compton Crick, James Dewey Watson and Maurice Hugh Frederick Wilkins "for their discoveries concerning the molecular structure of nucleic acids and its significance for information transfer in living material". ».
↑(en) « The Nobel Prize in Physiology or Medicine 1968 »,(consulté le) :« The Nobel Prize in Physiology or Medicine 1968 was awarded jointly to Robert W. Holley, Har Gobind Khorana and Marshall W. Nirenberg "for their interpretation of the genetic code and its function in protein synthesis". ».
« Butterfly Landscape (The Great Masturbator in Surrealist Landscape with DNA) shows Dali’s take. Though this was the first, created only a few years after Watson and Crick’s announcement of the double-helix, DNA would show up in many of Dali’s future works. As the agent of creation, it is perhaps easy to see why butterflies spring from the iconic structure in this painting. But it also seems that Dali used DNA to symbolize not only creation, but the greater idea of God, and this may be why some of the molecular structure is visibly jutting from the clouds. »
« Salvador Dali évoque son rapport à la science, notamment à l'ADN, comme source d'inspiration de son œuvre. Il donne à la science une dimension poétique et la détourne à des fins plastiques. Il la met en scène et l'utilise au service de ses fantasmes et de la méthode « paranoïaque-critique ». »