« ARN » redirige ici. Pour les autres significations, voirARN (homonymie).
Structure tridimensionnelle d'un ARN régulateur (riboswitch)[1].Structure moléculaire de l'ARN.
L'acide ribonucléique ouARN est unacide nucléique présent chez pratiquement tous lesêtres vivants, et aussi chezcertains virus. L'ARN est très proche chimiquement de l'ADN et il est d'ailleurs en général synthétisé dans lescellules à partir d'un segment d'ADN matrice dont il est une copie. Les cellules utilisent en particulier l'ARN comme support intermédiaire desgènes poursynthétiser lesprotéines dont elles ont besoin. L'ARN peut remplir de nombreuses autres fonctions et en particulier intervenir dans desréactions chimiques dumétabolisme cellulaire.
L'ARN a de nombreuses similitudes avec l'ADN, avec cependant quelques différences importantes : d'un point de vue structurel, l'ARN contient desrésidus de ribose là où l'ADN contient dudésoxyribose, ce qui rend l'ARN chimiquement moins stable ; de plus lathymine de l'ADN y est remplacée par l'uracile, qui possède les mêmes propriétés d'appariement de base avec l'adénine. Sur le plan fonctionnel, l'ARN se trouve le plus souvent dans lescellules sous formemonocaténaire, c'est-à-dire de simple brin, tandis que l'ADN est présent sous forme de deux brins complémentaires formant unedouble-hélice. Enfin, les molécules d'ARN présentes dans les cellules sont plus courtes que l'ADN dugénome, leur taille variant de quelques dizaines à quelques milliers de nucléotides, contre quelques millions à quelques milliards de nucléotides pour l'acide désoxyribonucléique (ADN).
Dans la cellule, l'ARN est produit partranscription à partir de l'ADN (qui est situé dans lenoyau chez les eucaryotes). L'ARN est donc une copie d'une région de l'un des brins de l'ADN. Les enzymes qui effectuent la copieADN → ARN s'appellent desARN polymérases. Les ARN ainsi produits peuvent avoir trois grands types de fonctions : ils peuvent être supports de l'information génétique d'un ou plusieurs gènes codant desprotéines (on parle alors d'ARN messagers), ils peuvent adopter unestructure secondaire ettertiaire stable et accomplir des fonctionscatalytiques (par exemple l'ARN ribosomique), ils peuvent enfin servir de guide ou de matrice pour des fonctions catalytiques accomplies par desfacteurs protéiques (ce qui est par exemple le cas desmicroARN).
Structure d'un brin d'ARN. Lesatomes de carbone duribose sont numérotés. Labase représentée est l'uracile, qui n'est présente naturellement que dans l'ARN, à la place de lathymine, présente dans l'ADN.
L'ARN est unacide nucléique, c'est-à-dire unemolécule constituée d'un enchaînement (polymère) denucléotides. Chaque nucléotide unitaire de l'ARN est constitué d'unpentose, leribose, dont les atomes decarbone sont numérotés de 1′ à 5′, d'une base azotée variable, oubase nucléique, et d'ungroupephosphate. La base nucléique est reliée par unatome d'azote aucarbone 1′ du ribose ; et le groupe phosphate du nucléotide est lié au carbone 5'.Les nucléotides se lient les uns aux autres par l'intermédiaire des groupes phosphate, le groupe phosphate d'un nucléotide (lié au carbone 5') se rattachant par l'intermédiaire deliaisons phosphodiester au niveau du carbone 3′ du nucléotide suivant.
Les quatre principales bases de l'ARN, et les seules utilisées dans l'ARN de transfert, sont l'adénine (notée A), l'uracile (noté U), lacytosine (notée C) et laguanine (notée G). Par rapport à l'ADN, lathymine de l'ADN est remplacée par l'uracile dans l'ARN[2]. La différence entre ces deux bases est le remplacement d'un groupeméthyle en position 5 de la thymine par un atome d'hydrogène dans l'uracile. Cette modification de structure ne change pas les propriétés d'appariement avec l'adénine[3],[4].
Conformation C2′-endo, observée dans les hélices de type B (ADN).Conformation C3′-endo, observée dans les hélices de type A (ARN).
Sur le plan structural, la présence d'un atome d'oxygène sur la position 2′ du ribose influence laconformation ducyclefuranose du ribose. Cethétérocycle à cinq atomes n'est pas plan, ce qui conduit à deuxconformères principaux du sucre, appelés C2′-endo et C3′-endo. Dans l'ARN, qui comporte un atome d'oxygène en position 2′, la position C3′-endo est privilégiée[7], ce qui modifie profondément la structure des doubles hélices comportant des brins ARN. Ces duplex d'ARN forment une hélice de type A, différente de celle qui est observée de façon majoritaire dans l'ADN classique, qui est une hélice de type B, où le désoxyribose est en conformation C2′-endo[8].
Comparaison des structures de l'hélice B de l'ADN[9] et de l'hélice A de l'ARN[10]. Le grand sillon est fortement modifié.
L'hélice de type A qu'adopte l'ARN lorsqu'il forme un duplex a des propriétés géométriques assez différentes de celles de l'hélice de type B. Tout d'abord le nombre de paires de bases par tour d'hélice est de 11 au lieu de 10 pour l'ADN en forme B. Le plan des paires de bases n'est plus perpendiculaire à l'axe de l'hélice, mais forme un angle d'environ 75° avec celui-ci[11],[12]. Il en résulte un déplacement de l'axe de l'hélice qui ne passe plus par le centre de l'appariement des bases, mais à l'intérieur du grand sillon. Ceci induit une augmentation du diamètre de l'hélice qui passe d'environ20Å pour l'ADN en forme B à environ26Å pour l'ARN en forme A[13]. Enfin, la géométrie des deux sillons est profondément affectée : le grand sillon devient très accessible, tandis que le petit sillon devient très profond, étroit et pincé. Ceci a un impact sur la manière dont l'ARN double brin peut interagir avec des protéines, car l'étroitesse du petit sillon est une barrière à l'accessibilité de ligands protéiques[14].
La plupart des ARN naturels sont présents sous formemonocaténaire (simple brin) dans la cellule, contrairement à l'ADN qui est sous forme d'un double brin apparié[2]. Lesbrins d'ARN se replient le plus souvent sur eux-mêmes, formant une structure intramoléculaire qui peut être très stable et très compacte. La base de cette structure est la formation d'appariements internes, entre bases complémentaires (A avecU,G avecC et, parfois,G avecU). La description des appariements internes entre les bases d'un ARN s'appelle lastructure secondaire. Cette structure secondaire peut être complétée par des interactions à distance qui définissent alors une structure tridimensionnelle oustructure tertiaire.
La formation de la structure des ARN est très souvent dépendante des conditionsphysicochimiques environnantes et en particulier de la présence, dans lasolution, decationsdivalents, comme l'ionmagnésium Mg2+. Ces cations interagissent avec les groupes phosphate du squelette et stabilisent la structure, en particulier en faisant écran à la répulsion électrostatique entre les charges négatives de ces phosphates[15].
Lastructure secondaire d'un ARN est la description de l'ensemble desappariements internes au sein d'une molécule simple brin[16]. Cet ensemble d'appariements induit unetopologie particulière, composée de régions en hélice (tiges) et de régions non-appariées (boucles). Par extension, la structure secondaire recouvre également la description de cette topologie.
La formation de structures secondaires au sein d'un ARN simple brin résulte de l'existence de régions contenant desséquences palindromiques, qui peuvent s'apparier pour former localement une structure en double hélice. Par exemple, si l'ARN contient les deuxséquences suivantes :--GUGCCACG------CGUGGCAC--, celles-ci forment une séquence palindromique, les nucléotides du second segment étant les complémentaires de ceux du premier, après inversion de leur sens de lecture ; ces deux segments peuvent alors s'apparier de manière antiparallèle pour former une région localement en duplex. La région entre les deux segments forme une « boucle » reliant les deux brins appariés, cet appariement formant une « tige ». On parle alors de structure en « épingle à cheveux », outige-boucle.
Topologie des différentes structures secondaires rencontrées dans l'ARN.
Dans des ARN de longueur plus importante, il peut exister des structures plus complexes qui résultent de l'appariement de plusieurs régions complémentaires oupalindromiques. En fonction de la manière dont sont « emboîtées » ces différentes régions, on obtient des élémentstopologiques variés, avec des tiges ou régions appariées, et divers types de boucles[17] :
lesboucles terminales, situées à l'extrémité d'une tige ;
lesboucles internes, qui connectent deux tiges ;
lesboucles multiples, qui connectent trois tiges ou plus et constituent des points de branchement de la structure ;
leshernies (en anglaisbulge), ouboucles latérales, qui sont sur un seul des deux brins d'une hélice. La continuité de l'hélice n'est en général pas affectée et les bases restent empilées de manière coaxiale, de part et d'autre de la hernie.
Il n'existe pas toujours une structure unique stable pour uneséquence donnée et il arrive que certains ARN puissent adopter plusieurs conformations alternatives en fonction de la liaison d'unligand (protéine,petite molécule…) ou des conditions physico-chimiques (force ionique,pH). On peut en général suivre la formation ou la fusion de la structure secondaire d'un ARN par des mesuresspectroscopiques. Ainsi, par exemple, l'absorption dans l'ultraviolet des bases de l'ARN est plus importante à l'état déplié qu'à l'état replié (phénomène d'hyperchromicité[18]).
Au-delà de la topologie des boucles et des hélices composées de paires de bases standard, un ARN peut adopter une structure tridimensionnelle compacte, oustructure tertiaire, comme uneprotéine. À l'intérieur de cette structure, les hélicescanoniques sont complétées par des appariements non canoniques, c'est-à-dire distincts des appariements classiques, de typeWatson-Crick (A=U etG≡C) et bancals (wobble,G=U). On a observé une grande variété de ces appariements dans les structures tridimensionnelles d'ARN résolues parcristallographie aux rayons X ou parrésonance magnétique nucléaire. On trouve par exemple desappariements Hoogsteen[19] et des appariements « en cisaille » (sheared)[20]. Il existe également des interactionsbase-ribose, notamment avec l'hydroxyle 2', qui peut former desliaisons hydrogène. Une nomenclature systématique de toutes ces interactions a été proposée parÉric Westhof et ses collaborateurs[21]. Plus de 150 types d'appariements ont été observés et ont été regroupés en douze grandes familles. Ces appariements non canoniques impliquent toujours desliaisons hydrogène entre les bases, qui sontcoplanaires, comme dans les paires Watson-Crick.
Des appariements canoniques ou non canoniques peuvent intervenir entre des régions distantes de la structure secondaire, souvent localisées dans des boucles, ce qui permet de stabiliser un repliement compact de la structure.
Parmi ces interactions non canoniques à grande distance figurent :
lespseudonœuds, structures formées par l'interaction d'une boucle avec une région située à l'extérieur de la tige qui la délimite[22] ;
lestriplex de brins, qui surviennent lorsqu'une région simple brin vient s'insérer dans le grand sillon d'une région en hélice ;
lesinteractionstétraboucle-récepteur : interactions entre boucles hyperstables de quatre nucléotides (tétraboucles) et structures en duplex ou quasi-duplex[23].
la baseuracile remplit dans l'ARN la fonction assurée par lathymine dans l'ADN ;
l'ARN existe généralement sous forme monocaténaire (simple brin), hormis chez quelquesvirus tels que lesréovirus où il existe sous forme d'ARN double brin[24], tandis que l'ADN est double brin (bicaténaire) avec une structure en double hélice ;
l'ARN est court : de quelques dizaines à quelques milliers denucléotides pour les ARN cellulaires (ARNm ou ARN structurés), contre quelques millions à quelques milliards (trois milliards chez l'Homme) dans l'ADN qui constitue le génome de la cellule.
Les trois premières différences donnent à l'ARN une stabilité bien moindre que celle de l'ADN :
le ribose possède un groupehydroxyle en position 2′, qui est absent dans ledésoxyribose de l'ADN. Cette fonction 2′-OH a des incidences multiples sur la structure de l'ARN. Tout d'abord sur le plan chimique, cette fonctionalcool rend l'ARN sensible à l'hydrolyse alcaline. La présence des deux oxygènes encis sur les positions 2′ et 3′ rend possible la cyclisation du phosphate sur les positions 2′ et 3′, qui se produit très rapidement lorsqu'unebase vient arracher leproton du 2′-OH. Cette cyclisation du nucléotide provoque une coupure de la chaîne ribose-phosphate etlibère des extrémités 5′-OH et 2′, 3′ phosphate cyclique[incompréhensible][25] ;
l'uracile est moins coûteux énergétiquement à produire pour les organismes vivants que la thymine, puisqu'il nécessite une étape de synthèse de moins qu'est la méthylation par lathymidylate synthase. La présence de thymine dans l'ADN permet à la cellule de détecter des lésions spontanées de lacytosine qui est sensible à l'oxydation. Ladésamination spontanée de la cytosine en présence d'oxygène convertit cette dernière en uracile. La présence dedésoxyuridine dans l'ADN est anormale, puisque ledésoxyribonucléotide complémentaire de ladésoxyadénosine est lathymidine. Grâce à cette distinction entre thymine et uracile au moyen d'un groupe méthyle, le système deréparation par excision de base peut détecter et corriger le défaut. Dans l'ARN, la désamination des cytosines produit des uraciles et n'est pas réparée. L'ARN ayant une durée de vie beaucoup plus courte que celle de l'ADN (de l'ordre de la minute), il est dégradé et recyclé ;
si un brin d'ARN monocaténaire est endommagé, la lésion n'est pas réparée et le dommage est irréversible ; en revanche, si un des deux brins d'ADN est endommagé, la cellule peut utiliser l'information portée par le brin complémentaire intact pourréparer la lésion.
D'un point de vue évolutif, certains éléments permettent de penser que l'ARN serait antérieur à l'ADN comme support de l'information génétique, ce qui expliquerait ses fonctions plus étendues et sa généralisation. L'ADN serait apparu plus tard et n'aurait supplanté l'ARN que pour le rôle de stockage à long terme, en raison de sa plus grande stabilité[26].
La synthèse d'une molécule d'ARN à partir de l'ADN s'appelle latranscription. C'est un processus complexe qui fait intervenir une enzyme de la famille desARN polymérases ainsi que des protéines associées. Les différentes étapes de cette synthèse sont l'initiation, l'élongation et la terminaison. Le processus de synthèse des ARN est sensiblement différent chez les organismesprocaryotes et chez les celluleseucaryotes[27]. Enfin, après la transcription proprement dite, l'ARN peut subir une série demodifications post-transcriptionnelles dans le cadre d'un processus de maturation au cours duquel sa séquence et sa structure chimique peuvent être modifiées (voir plus loin).
Le démarrage de la transcription d'un ADN par une ARN polymérase s'effectue au niveau d'uneséquence spécifique sur l'ADN, appeléepromoteur. Ce promoteur comporte un ou plusieurs éléments de séquence conservés[28] sur lesquels se fixent en général des protéines spécifiques, lesfacteurs de transcription. Juste en amont du site d'amorçage de la transcription, l'élément proximal est en général riche en nucléotidesT etA, et est pour cette raison appeléboîte TATA[29] chez les eucaryotes ouboîte de Pribnow chez les bactéries[30]. Les facteurs de transcription favorisent le recrutement de l'ARN polymérase sur le promoteur et l'ouverture du duplex d'ADN. Il se forme alors ce qu'on appelle unebulle de transcription avec l'ADN ouvert, dont l'un des brins (la matrice) est hybridé avec l'ARN en cours de synthèse.
Vue en microscopie électronique des « arbres de Noël » ou « arbres de Miller » produits par la transcription d'un gène actif[31]. Le « tronc » de l'arbre est constitué de l'ADN et les « branches » sont les différentes molécules d'ARN en cours de synthèse. Celles-ci sont plus courtes vers le début de la région transcrite et plus longues vers la fin.
Une fois l'ARN polymérase fixée sur le promoteur et la bulle de transcription formée, elle synthétise les premiers nucléotides de manière statique sans quitter la séquence du promoteur. Les facteurs de transcription se détachent et l'ARN polymérase devient processive[32]. Elle transcrit alors l'ARN dans lesens 5' vers 3', en utilisant l'un des deux brins de l'ADN comme matrice et desribonucléotidestriphosphates (ATP,GTP,CTP etUTP) comme précurseurs.
In vivo, chezEscherichia coli, la vitesse d'allongement de l'ARN polymérase est d'environ 50 à 90 nucléotides par seconde[33].
La terminaison de la transcription de l'ARN procède selon des mécanismes complètement différents chez lesbactéries et chez leseucaryotes.
Chez les bactéries, le mécanisme principal de terminaison fait intervenir unestructure particulière de l'ARN, leterminateur, composé d'unetige-boucle stable suivie d'une série derésidus d'uridine (U). Lorsque l'ARN polymérase synthétise cette séquence, le repliement de la tige d'ARN provoque une pause de la polymérase[34]. L'ARN, qui n'est plus apparié à l'ADN matrice que par une série d'appariements A-U faibles, se détache, sans intervention d'autres facteurs protéiques. La terminaison peut aussi se faire via l'intervention d'un facteur protéique spécifique, le facteur Rho[35].
Chez les eucaryotes, la terminaison de la transcription par l'ARN polymérase II est couplée à lapolyadénylation. Deux complexes protéiques,CPSF(en) etCStF(en) reconnaissent les signaux de polyadénylation (5′-AAUAAA-3′) et de coupure de l'ARN. Ils clivent l'ARN, induisent le détachement de la polymérase de l'ADN et recrutent la poly-A polymérase qui ajoute la queue poly(A)[36] (voir plus bas).
La maturation des ARN comprend un ensemble demodifications post-transcriptionnelles principalement observées chez les eucaryotes et jouent un rôle important dans le devenir de l'ARN maturé. Les principales modifications sont l'adjonction d'unecoiffe en 5′, lapolyadénylation en 3′, l'épissage, l'introduction de modifications chimiques au niveau de la base ou du ribose et enfin l'édition.
La coiffe joue plusieurs rôles : elle accroît la stabilité de l'ARN en le protégeant de la dégradation par desexonucléases 5′-3′ et permet également le recrutement defacteurs d'initiation de la traduction nécessaires à la fixation duribosome sur les ARN messagers cellulaires. La coiffe est donc essentielle à la traduction de la plupart des ARNm.
Lapolyadénylation consiste en l'addition d'une extension à l'extrémité 3′ de l'ARN composée exclusivement deribonucléotides de typeadénosine (A). Pour cette raison, l'extension est appeléequeue poly(A). Bien que composée de nucléotides standard, cette queue poly(A) est ajoutée de façon post-transcriptionnelle par une enzyme spécifique appeléepoly(A) polymérase[38] et n'est pas codée dans l'ADNgénomique. La queue poly(A) est trouvée principalement à l'extrémité desARN messagers. Chez les eucaryotes, la polyadénylation des ARNm est nécessaire à leur traduction par le ribosome et participe à leur stabilisation. La queue poly(A) est en particulier reconnue par laPABP (poly(A)-binding protein, « protéine de liaison de la poly(A) »).
Chez les bactéries et dans certainesmitochondries, la polyadénylation des ARN est au contraire un signal de dégradation[39].
L'épissage est unemodification post-transcriptionnelle qui consiste en l'élimination desintrons et la suture desexons dans les ARN messagers et dans certains ARN structurés comme les ARNt[2]. Présents chez les organismes eucaryotes, les introns sont des segments d'ARN qui sont codés dans le génome et transcrits dans l'ARN précurseur, mais qui sont éliminés du produit final. Dans la plupart des cas, ce processus fait intervenir une machinerie spécifique complexe appelée lesplicéosome[40]. L'épissage se produit dans lenoyau des cellules eucaryotes, avant l'export de l'ARN maturé vers le cytoplasme.
Après leur transcription par l'ARN polymérase, certains ARN subissent des modifications chimiques sous l'action d'enzymes spécifiques. Les principaux ARN subissant des modifications sont lesARN de transfert et lesARN ribosomiques. On peut également considérer que lesméthylations intervenant dans la synthèse de lacoiffe sont des modifications denucléotides particulières. Dans le cas général, les modifications peuvent porter soit sur labase, soit sur leribose. Les principales modifications rencontrées sont :
sur le ribose : des O-méthylations de la position 2′-OH ;
L'édition des ARN consiste en une modification de la séquence de l'acide ribonucléique, postérieure à la transcription par l'ARN polymérase. À l'issue du processus d'édition, la séquence de l'ARN est donc différente de celle de l'ADN. Les changements opérés peuvent être la modification d'une base, la substitution d'une base ou encore l'ajout d'une ou plusieurs bases. Ces modifications sont effectuées par des enzymes qui agissent sur l'ARN, comme lescytidine désaminases, qui transforment chimiquement lesrésidus decytidine enuridine.
Dans les cellules, les ARN remplissent quatre rôles distincts et complémentaires :
support temporaire de l'information génétique: c'est l'ARN messager qui remplit ce rôle, il est utilisé par lacellule pour transmettre l'information correspondant à un gène donné à l'extérieur du noyau, puis poursynthétiser des protéines à partir de ces informations ;
catalyseur enzymatique : comme lesprotéines, les ARN peuvent se replier en trois dimensions pour former des structures complexes. Ces structures permettent à certains ARN de se comporter comme desenzymes, on parle alors deribozyme. Leribosome, laribonucléase P et certainsintrons sont desribozymes. Il existe des arguments indirects indiquant que la machinerie d'épissage des ARN messagers (lesplicéosome) est aussi un ribozyme[43], même si la démonstration formelle n'en a pas encore été apportée ;
guide pour des enzymes : certains ARN sont utilisés commecofacteurs par desprotéines pour permettre leur ciblage vers desséquences spécifiques. Parmi ceux-ci, on peut citer les petits ARN nucléolaires (snoARN), qui guident les enzymes de modification de l'ARN ribosomique, l'ARN télomérique, qui est un cofacteur de latélomérase, l'enzyme qui fabrique les extrémités des chromosomes, ou encore lesARN interférents ;
régulateurs de l'expression génétique : certainsARN non codants jouent un rôle dans la répression de l'expression de certains gènes ou groupes de gènes. C'est le cas par exemple des ARNantisens qui s'apparient à un ARN cible et en bloquent la traduction par le ribosome.
Une classe particulière d'ARN, les ARN de transfert, se trouve à l'interface de plusieurs de ces fonctions en guidant les acides aminés lors de latraduction.
Enfin, le génome de certainsvirus est exclusivement constitué d'ARN et non d'ADN. C'est en particulier le cas desvirus de la grippe,du SIDA,de l'hépatite C,de la poliomyélite ou encore duvirus Ebola. Suivant les cas, la réplication de ces virus peut passer par un intermédiaire ADN (rétrovirus), mais peut aussi se faire directement d'ARN en ARN.
L'ARN est donc une molécule très polyvalente, ce qui a conduitWalter Gilbert, co-inventeur duséquençage de l'ADN, à proposer en 1986 une hypothèse selon laquelle l'ARN serait la plus ancienne de toutes les macromolécules biologiques[26]. Cette théorie, diteRNA world hypothesis (« hypothèse du monde à ARN »), permet de s'affranchir d'unparadoxe de l'œuf et de la poule qui survient lorsqu'on cherche à savoir qui des protéines (catalyseurs) et de l'ADN (information génétique) sont apparus en premier. Dans ce modèle, l'ARN, capable de combiner à la fois les deux types de fonctions, serait le précurseur universel.
L'information génétique contenue au sein de l'ADN n'est pas utilisée directement par lacellule poursynthétiser desprotéines. Celle-ci utilise pour cela des copies transitoires de l'information génétique que sont les ARN messagers ou ARNm[44]. Chaque ARN messager porte un ou, parfois, plusieurscistrons, c'est-à-dire les instructions pour former une seule protéine. Il correspond donc à la copie d'un seul des gènes du génome (on parle alors d'ARNm monocistronique) ou parfois de quelques-uns (ARNm polycistronique)[45].
L'ARN messager ne contient la copie que d'un seul des deux brins de l'ADN, celui qui est codant, et non la séquence complémentaire. Par rapport à laséquence dugène contenue dans l'ADN du génome, celle de l'ARNm correspondant peut contenir des modifications, en particulier dues à l'épissage (voir plus haut) qui élimine lesrégions non codantes. L'ARN messager synthétisé dans le noyau de la cellule est exporté dans le cytoplasme pour être traduit en protéine[2]. Contrairement à l'ADN, qui est une molécule pérenne, présente pendant toute la vie de la cellule, les ARN messagers ont une durée de vie limitée, de quelques minutes à quelques heures, après quoi ils sont dégradés et recyclés.
Un ARN messager comporte trois régions distinctes : unerégion 5′ non traduite dite 5′-UTR, située en amont du ou descistrons qu'il porte ; une région codante correspondant à ce ou à ces cistrons ; et enfin, unerégion 3′ non traduite dite 3′-UTR[2]. Les ARN messagers sonttraduits enprotéines par lesribosomes. La région 5′ non traduite contient en général les signaux de traduction permettant le recrutement du ribosome sur le cistron. Le processus de traduction fait également intervenir lesARN de transfert qui apportent au ribosome lesacides aminés nécessaires à labiosynthèse des protéines. Au sein du ribosome, par leuranticodon, les ARNt s'apparient successivement aux triplets de bases, oucodons, de la séquence de l'ARNm. Lorsque l'appariement codon-anticodon est correct, le ribosome ajoute l'acide aminé porté par l'ARNt à la protéine en cours de synthèse. Les correspondances entre codons et acides aminés constituent lecode génétique[46].
La fonction des ARN messagers est multiple. Ils permettent d'une part de préserver la matrice d'ADN originale, qui n'est pas directement utilisée pour la traduction, la cellule ne travaillant que sur la copie qu'est l'ARNm. L'existence d'ARN messagers offre surtout à la cellule un mécanisme crucial de régulation du cycle de production des protéines à partir du génome. Le besoin cellulaire en telle ou telle protéine peut varier en fonction de l'environnement, du type de cellule, du stade de développement. La synthèse protéique doit donc être activée ou arrêtée en fonction des conditions cellulaires. La régulation de la transcription de l'ADN en l'ARNm répond à cette nécessité et est contrôlée par desfacteurs de transcription spécifiques agissant sur lespromoteurs des gènes cibles. Lorsque la quantité d'une protéine donnée est suffisante, la transcription d'ARNm est inhibée, celui-ci est progressivement dégradé et la production protéique cesse. Il est donc important que l'ARNm soit une molécule transitoire, afin de pouvoir réaliser cette régulation essentielle.
Les ARN de transfert ont une structure caractéristique en feuille de trèfle, composée de quatre tiges appariées. L'une de ces tiges est terminée par une boucle qui contient l'anticodon, le triplet denucléotides qui s'apparie aucodon lors de latraduction d'unARNm par leribosome[49]. À l'autre extrémité, l'ARNt porte l'acide aminé correspondant attaché par une liaisonester à son extrémité 3′-OH. Cette estérification est catalysée par des enzymes spécifiques, lesaminoacyl-ARNt synthétases. En trois dimensions, la structure en feuille de trèfle se replie en « L », avec l'anticodon à une extrémité et l'acide aminé estérifié à l'autre extrémité[50].
Toutes les cellules vivantes contiennent un ensemble d'ARNt différents portant les différents acides aminés et capable de lire les différents codons.
Les ARN de transfert sont parfois désignés comme des « adaptateurs » entre laséquence génétique et laséquence protéique. C'estFrancis Crick qui a proposé l'existence de ces adaptateurs, avant même leur découverte en 1958[51].
Dans ces deux cas, l'ARN seul est capable de catalyser une réaction declivage (coupure) ou detransestérification spécifique en l'absence deprotéine. Ces ARN catalytiques ont été appelésribozymes, car ce sont desenzymes constituées d'acide ribonucléique. Dans le cas de l'intron deTetrahymena, il s'agit d'unauto-épissage, l'intron étant son propresubstrat, tandis que la ribonucléase P est une enzyme agissant entrans, sur des substrats multiples.
Depuis ces découvertes initiales, d'autres ribozymes naturels ont été identifiés :
les ARN deviroïdes ou devirus satellites (virusoïdes) qui sont capables de se cliver eux-mêmes[54] ;
il existe aujourd'hui des arguments très forts, basés sur la résolution de sa structure 3D, pour affirmer que leribosome, le complexe deribonucléoprotéines responsable de latraduction de l'ARNm enprotéines, est lui-même un ribozyme[55]. Les deuxsites actifs du ribosome, le centre de décodage sur la petite sous-unité et le centrepeptidyltransférase qui forme lesliaisons peptidiques, sont en effet exclusivement composés de segments d'ARN ribosomique ;
certainsriboswitchs, qui sont des régions régulatrices structurées portées par des ARN messagers, ont une activité catalytique de coupure en présence d'unligand[56] ;
il existe enfin des ribozymes synthétiques, qui ont été isolés par des méthodes d'évolutionin vitro, comme la techniqueSELEX[57],[58]. On a ainsi pu isoler des ARN catalytiques synthétiques capables de catalyser une grande variété de réactions chimiques et de fixer des ligands très divers, ce qui a été interprété comme un argument en faveur de l'hypothèse dumonde à ARN. De tels ARN synthétiques sont parfois appelés desaptamères, puisqu'ils sont « aptes » à réaliser une tâche donnée[57].
De manière générale, dans tous ces ribozymes, c'est leurrepliement spécifique qui leur permet d'effectuer la reconnaissance de leur substrat et la catalyse, comme dans le cas des enzymes protéiques.
Les ARN guides sont des ARN qui s'associent à des enzymes protéiques et servent à en guider l'action sur des ARN ou des ADN deséquencecomplémentaire. L'ARN guide s'apparie à l'acide nucléique substrat et permet de cibler l'activité de l'enzyme. On a identifié plusieurs types :
lespetits ARN nucléolaires, ou snoARN: dans lenucléole des cellules eucaryotes, ils dirigent l'action d'enzymes de modification de l'ARN ribosomique, en particulier les 2′-O-méthylations par les snoARN C/D et les pseudouridylations par les snoARN H/ACA[59]. Ce mécanisme permet à la cellule de modifier spécifiquement de multiples positions de l'ARNr, avec une seule enzyme en utilisant différents snoARN comme guides. Les snoARN sont souvent codés par des séquencesintroniques[60] ;
lesmicroARN sont également des ARN guides qui interviennent dans le processus d'interférence par ARN : associés à un complexe protéique appelé RISC (RNA induced silencing complex), ces petits ARN provoquent soit une dégradation de l'ARNm cible auquel ils s'apparient, soit unerépression de sa traduction[61] ;
TERC (telomerase RNA component), la sous-unité ARN de latélomérase : cet ARN structuré est associé à latranscriptase inverse qui synthétise lestélomères, extrémités deschromosomes. Il contient une séquence qui sert de substrat à la télomérase pour synthétiser l'ADN télomérique de séquence complémentaire[62]. Il guide donc l'activité de l'enzyme, mais en servant de matrice, plutôt qu'en formant un appariement avec le substrat ;
leslincARN, présents chez les mammifères, sont de grands ARN intergéniques non codants mais transcrits comme les ARNm par l'ARN polymérase II. Leur longueur leur permet d'adopter une structure tridimensionnelle complexe. Ces structures permettent leur interaction avec différent cofacteurs transcriptionnels tel quehnRNP-K ouPRC2 (principalement des inhibiteurs de la transcription). Ces complexes sont ensuite guidés grâce aux lincARN sur les séquences régulatrices des gènes afin d'inhiber leur expression. La liaison des lincARN avec l'ADN impliquerait un appariement des bases ARN avec les bases ADN correspondantes après désappariement de la double hélice d'ADN, voire la formation de triple hélice ADN-ADN-ARN[63].
Certains ARN jouent un rôle de régulateurs directs de l'expression génétique. C'est en particulier le cas d'ARN non codants possédant des régions complémentaires d'ARN messagers cellulaires et qui peuvent donc s'y apparier pour former localement un double brin d'ARN. Ces ARNantisens peuvent être issus du mêmelocus génétique que leur ARN cible, par transcription du brin complémentaire, on parle alors d'ARNcis-régulateurs. Ils peuvent aussi être issus de la transcription d'une autre région du génome, ce sont alors des ARNtrans-régulateurs.
L'appariement de l'ARN régulateur avec son ARN messager cible peut agir sur la capacité de ce dernier à être traduit par le ribosome ou sur sa stabilité, ce qui aboutit à une régulation de la traduction du ou des gènes portés par l'ARN messager. Chez les bactéries, il existe ainsi de nombreux exemples d'ARN antisenscis- outrans-régulateurs qui bloquent le site de démarrage de la traduction[64]. Par exemple, le gène codant laporine OmpF est régulé par un ARN antisens appelé MicF.
Chez leseucaryotes, il existe aussi de grands ARN régulateurs, qui interviennent dans des processus de régulationépigénétique. L'exemple le mieux connu est celui de l'ARNXist chez les mammifères. Celui-ci inactive non pas un gène, mais un chromosome entier. Xist recouvre l'un des deux chromosomes X de chaque cellule chez les individus femelles qui devient ainsi inactif[65]. Un seul des deux chromosomes de la paire XX est ainsi actif, ce qui permet d'avoir le même taux d'expression des gènes portés par le chromosome X que chez les individus mâles, qui n'en ont qu'un. L'inactivation du X est un processus aléatoire, ce qui peut conduire à l'expression de différents phénotypes par différentes cellules, chez la même femelle. C'est par exemple le cas pour la couleur du pelage chez les chattes.
L'ARN est utilisé aujourd'hui dans un certain nombre d'applications en biologie moléculaire, en particulier grâce au processus d'interférence par ARN, qui consiste en l'introduction dans des cellules eucaryotes de courts fragments d'ARN double-brin appelés « petits ARN interférents ». Longs d'une vingtaine de paires de bases, cespetits ARN interférents (pARNi) sont utilisés par une machinerie cellulaire capable de dégrader les ARNm de manière spécifique. Seuls les ARNm contenant une séquence correspondant à celle dupARNi sont dégradés, ce qui permet de diminuer sélectivement l'expression d'une protéine donnée[66]. Cette approche technologique est beaucoup plus simple et rapide que l'établissement de lignées murines inactivées (knock-out) et s'appelle unknock-down.
Des essais d'utilisation de cette technique à des fins thérapeutiques sont envisagés, par exemple en ciblant des gènes viraux pour lutter contre des infections, ou desoncogènes, dans le cas de cancers[67]. Ils nécessitent cependant de stabiliser lespetits ARN interférents (pARNi) pour éviter leur dégradation par des ribonucléases et de cibler leur action vers les cellules concernées.
Lesacides nucléiques ont été découverts en 1868 parFriedrich Miescher[68]. Miescher appela la nouvelle substance « nucléine » car elle se trouvait dans lenoyau des cellules. La présence d'acides nucléiques dans le cytoplasme de la levure fut identifiée en 1939[69] et leur nature ribonucléique fut établie, contrairement aux chromosomes qui contenaient de l'ADN avec des désoxyriboses.
Vers 1940, le biologiste belgeJean Brachet étudia l'ADN et l'ARN, encore appelées à l'époque les « acides thymonucléiques et zymonucléiques » (respectivement l'ADN et l'ARN). Il découvrit que l'ADN est un composant deschromosomes et qu'il est synthétisé lorsque les cellules se divisent après lafécondation. Il mit en évidence l'existence d'ARN dans tous les types cellulaires : dans lenoyau, lenucléole et lecytoplasme de toutes les cellules, alors que l'on pensait à l'époque que ces molécules étaient caractéristiques des cellules végétales et deseucaryotes inférieurs tels que leslevures. Enfin, il montra que ces acides sont particulièrement abondants dans les cellules (plus particulièrement dans l'ergastoplasme) très actives en termes desynthèse protéique. Les bases fondamentales de labiologie moléculaire étaient établies. Après la seconde guerre mondiale, Jean Brachet fut rejoint par lebiologiste moléculaire belgeRaymond Jeener, qui participa activement aux recherches sur le rôle de l'ARN dans labiosynthèse des protéines[70].
À la fin des années 1950,Severo Ochoa parvint à synthétiserin vitro des molécules d'ARN au moyen d'une enzyme spécifique, la polynucléotide phosphorylase, ce qui permit l'étude des propriétés chimiques et physiques de l'ARN.
Le rôle de l'ARN comme « messager » intermédiaire entre l'information génétique contenue dans l'ADN et les protéines fut proposé en 1960 parJacques Monod etFrançois Jacob[71] à la suite d'une discussion avecSydney Brenner etFrancis Crick[72]. La démonstration de l'existence de l'ARN messager a été faite parFrançois Gros[73]. Ensuite, le déchiffrage du code génétique a été réalisé parMarshall Nirenberg dans la première moitié des années 1960. Il utilisa pour cela des ARN synthétiques de séquence nucléotidique connue dont il étudia les propriétés de codage.
Les ribosomes furent observés pour la première fois par le biologiste belgeAlbert Claude au début des années 1940. Par des techniques de fractionnement subcellulaire et demicroscopie électronique, il mit en évidence des « petites particules » de nature ribonucléoprotéique, présentes dans tous les types de cellules vivantes. Il les baptisa « microsomes »[74], plus tard renommés ribosomes.
Lastructure secondaire desARNt a été établie parRobert Holley, qui est parvenu à purifier et à analyser la séquence de l'ARNt spécifique de l'alanine en 1964[49]. Ce fut un progrès majeur dans la compréhension du déchiffrage du message génétique porté par les ARN messagers. La structure tridimensionnelle d'un ARNt a été résolue en 1974, indépendamment, par les équipes deAaron Klug et Alexander Rich[50], montrant pour la première fois la structure complexe d'un ARN. L'existence de propriétés catalytiques des ARN a été établie indépendamment parSidney Altman etTom Cech en 1982, sur laribonucléase P[53] d'une part et sur les introns autoépissables d'autre part[52]. La résolution de la structure des sous-unités individuelles du ribosome en 2000 par les équipes deTom Steitz,Ada Yonath etVenki Ramakrishnan[75],[76],[77], puis celle du ribosome entier par l'équipe de Harry Noller en 2001[78], constituèrent un progrès essentiel dans la compréhension du mécanisme central de la biologie qu'est la traduction des ARNm en protéines. De plus, cela permit de montrer, entre autres, que le ribosome était aussi un ribozyme.
Durant les années 1970,Timothy Leary, dans son ouvrageLa Politique de l'Extase, verra dans l'ARN la promesse d'une future modification de la conscience (possiblement via de nouvelles drogues, et/ou d'exercices spirituels), dont il serait une composante agrandissant les capacités d'apprentissage de celui qui se livrerait à de telles expériences[79].
L'hypothèse du monde à ARN est une hypothèse suivant laquelle l'ARN serait le précurseur de toutes lesmacromolécules biologiques et particulièrement de l'ADN et des protéines qui auraient permis dans un environnementabiotique (caractérisé par unechimie prébiotique en partie hypothétique) l'apparition de premières cellules vivantes, c'est-à-dire formant un compartiment, et comportant de l'information et des sous-systèmes métaboliques.
Dans le cadre de l'étude desorigines de la vie, cette hypothèse permet une explication de l'apparition des différentes fonctions biologiques via la constitution de certains blocs biomoléculaires à partir d'intermédiaires prébiotique plausibles et de molécules basées sur le carbone[80]. Il a été démontré en 2009 par l'équipe deJohn Sutherland que des précurseurs plausibles des ribonucléotides, des acides aminés et des lipides peuvent tous être obtenus par homologation réductrice du cyanure d'hydrogène et de certains de ses dérivés. Chacun des sous-systèmes cellulaires connus pourrait donc être expliqué par la chimie du carbone, avec des réactions catalysées par lalumière ultraviolettea priori très présente avant l'apparition de lacouche d'ozone, à partir du sulfure d'hydrogène comme agent réducteur[80]. Le cycle photoréducteur pourrait lui-même être accéléré par le cuivre [Cu(I)-Cu(II)][80].
↑abcd eteH.Lodish, A.Berk, P.Matsudaira, C.A.Kaiser, M.Krieger, M.P.Scott, L.Zipursky et J.Darnell,Biologie moléculaire de la cellule, Bruxelles, de Boeck,,3eéd.(ISBN978-2804148027)
↑La politique de l'Extase, Timothy Leary, 1974, Ed. Fayard, Paris,p. 115-120
↑ab etcBhavesh H. Patel, Claudia Percivalle, Dougal J. Ritson, Colm D. Duffy & John D. Sutherland (2015),Common origins of RNA, protein and lipid precursors in a cyanosulfidic protometabolism ; Nature Chemistry (résumé)
La version du 19 février 2010 de cet article a été reconnue comme « bon article », c'est-à-dire qu'elle répond à des critères de qualité concernant le style, la clarté, la pertinence, la citation des sources et l'illustration.