Les protéines assurent une multitude de fonctions au sein de la cellule vivante et dans lestissus. Certaines protéines (nomméesenzymes) catalysent les réactions chimiques de synthèse et de dégradation nécessaires au métabolisme de la cellule. D'autres protéines assurent un rôle structurel au sein ducytosquelette ou des tissus (actine,collagène), certaines sont des moteurs moléculaires qui permettent lamobilité (myosine), d'autres sont impliquées dans le conditionnement de l'ADN (histones), la régulation de l'expression génétique (facteurs de transcription), le métabolisme énergétique (ATP synthase) ou encore la transmission designaux cellulaires (récepteurs membranaires).
Les chaînes protéiques sont synthétisées dans la cellule sur lesribosomes, à partir de l'information codée dans lesgènes, qui détermine l'ordre dans lequel s'enchaînent les22 acides aminés, dits« protéinogènes », qui sont incorporés directement lors de labiosynthèse des protéines. La succession des résidus d'acides aminés est nommée« séquence » du polypeptide. Desmodifications post-traductionnelles peuvent intervenir ensuite, une fois la protéine synthétisée, ce qui peut avoir pour effet d'en modifier les propriétés physiques ou chimiques. Il est également fréquent que des molécules non protéiques, nommées « cofacteurs », soient incorporés dans des protéines et jouent un rôle essentiel dans leur fonction biologique : c'est, par exemple, le cas de l'hème dans l'hémoglobine, sans lequel cette protéine ne pourrait pas transporter ledioxygène dans lesang.
Les protéines adoptent unestructure tridimensionnelle qui leur permet d'assurer leur fonction biologique. Cette structure particulière est déterminée avant tout par leur séquence en résidus d'acides aminés dont les propriétés physico-chimiques diverses conduit la chaîne protéique à adopter un repliement spécifique.
Les protéines sont un composant important de l'alimentation animale ; elles sont dégradées dans letube digestif et les acides aminés libérés sont absorbés au niveau de l'intestin grêle pour ensuite être réutilisés par l'organisme.
Le termeprotéine vient dugrec ancienπρῶτος /prỗtos, « premier », plus précisément deπρώτειος /prốteios (« qui occupe le premier rang, de première qualité »), auquel vient s'adjoindre lesuffixe-ine qui permet de former des substantifs féminin dans le vocabulaire scientifique et, particulièrement, en chimie[1],[2].
Cette étymologie fait probablement référence au fait que[réf. nécessaire] les protéines sont indispensables à la vie et qu'elles constituent souvent la part majoritaire (environ 60 %) du poids sec descellules (animales).Une autre théorie voudrait que[réf. nécessaire]protéine fasse référence, comme l'adjectifprotéiforme, audieu grecProtée, qui pouvait changer de forme à volonté. Les protéines adoptent en effet de multiples formes et assurent de multiples fonctions.Toutefois, cette caractéristique ne fut mise en évidence bien plus tard[réf. nécessaire], au cours duXXe siècle.
Les protéines sont formées d'une ou plusieurschaînes polypeptidiques, qui sont desbiopolymères linéaires pouvant être très longs, composés de résidus d'acidesL-α-aminés dont il existe une vingtaine de variétés. On parle généralement de protéine au-delà d'une cinquantaine de résidus dans la molécule[4] et depeptide jusqu'à quelques dizaines de résidus.
Tous lesacides aminés protéinogènes — à l'exception de laproline — partagent une structure commune, constituée d'unefonctionacide carboxylique, d'une fonctionamine primaire sur lecarbone α, et d'unechaîne latérale. Cette dernière présente une très grande variété de structures chimiques, et c'est l'effet combiné de toutes ces chaînes latérales d'une chaîne polypeptidique qui détermine la structure tridimensionnelle ainsi que les propriétés chimiques de cette dernière[5]. La planche ci-dessous présente lastructure chimique des22 acides aminés protéinogènes :
Structure des 22 acides aminés protéinogènes. Lapyrrolysine et lasélénocystéine (ci-dessus grisées) sont spécifiques à certainesprotéines : - lapyrrolysine ne se rencontre que chez certainesarchéesméthanogènes, - lasélénocystéine est présente également chez leseucaryotes maisa priori dans quelques dizaines d'enzymes de la famille desoxydoréductases. Les 20 autres acides aminés, dits standards, sont en revanche universellement distribués chez tous les êtres vivants connus.
Les résidus d'acides aminés d'une chaîne polypeptidique sont liés entre eux par desliaisons peptidiques qui s'établissent entre le groupecarboxyle –COOH d'un premier acide aminé et le groupeamine primaire –NH2 d'un second :
Le squelette de la protéine est ainsi constitué d'un enchaînement linéaire de résidus d'acides aminés sur lequel sont branchées les chaînes latérales et reliées par des liaisons peptidiques. La liaison peptidique présente deuxformes de résonance qui lui confèrent en partie les propriétés d'unedouble liaison, ce qui limite les rotations autour de son axe, de sorte que les quatre atomes du groupeamide -(C=O)NH- sont toujours à peu prèscoplanaires. Les deux autres liaisons constituant le squelette de l'acide aminé peuvent en revanche tourner librement. Les deuxangles dièdres correspondant à ces deux liaisons internes déterminent la géométrie locale adoptée par la chaîne protéique.
L'extrémité de la chaîne polypeptidique côté carboxyle est nomméeextrémitéC-terminale, tandis que celle qui est du côté amine est nomméextrémitéN-terminale. Les mots protéine, polypeptide et peptide sont assez ambigus, et leur sens peut se recouvrir. On parle généralement de protéine en référence à la molécule biologique complète dotée d'une conformation stable, tandis qu'un peptide désigne généralement une molécule plus courte, dépourvue de structure tridimensionnelle stable. La limite entre peptide et polypeptide se situe à dix résidus d'acides aminés[6],[7].
Les protéines étaient censées toujours être de grande taille (aux échelles biomoléculaires) ; on sait dès le début des années 1990 que ce n'est pas le cas, à la suite de la découverte d'une, puis de quelques autresmicroprotéines (parfois dénomméesMiPs). Depuis, les scientifiques ont mis en évidence l'existence de centaines, puis de milliers de microprotéines et de nanoprotéines (n'associant parfois que quelques résidus d'acides aminés, peut-être auto-assemblés[8]), si petites que les systèmes classiques d'analyse génomique ne les repéraient pas[9]. Elles semblent avoir des rôles-clés au sein des cellules au sein ducomplexe protéique, en interagissant dans les relations protéines-protéines. Certaines commandent ainsi l’activité de protéines plus grosses, jouant un rôle de régulateurs post-traductionnels, sans interagir directement avec l'ADN ou l'ARN[10]. D'autres promeuvent le développement musculaire et règlent lacontraction musculaire. D'autres encore contribuent à la gestion des déchets intracellulaires (ARN ancien, dégradé ou défectueux)[9]. Chez les plantes[11],[12], elles pourraient participer à la détection de la lumière et dans d'autres cas jouer un rôle dans la signalisationphytohormonale. Chez l'animal, elles participeraient au fonctionnement de l'horloge biologique.
On en trouve notamment dans lesvenins (d'araignées, descorpions et d'autresanimaux venimeux)[9]. Des nanoprotéines complexes peuvent être crééesin vitro parautoassemblage d'acides aminés ; elles pourraient peut-être être utilisées pour la reconnaissance et à la catalyse biomoléculaires[8]. On leur a déjà trouvé un intérêt commercial : certainsinsecticides en utilisent[9]. Elles présentent un intérêt médical : on s'en sert pour marquer des tumeurs cérébrales afin de permettre une chirurgie plus précise[9].
La nature des protéines est déterminée avant tout par leur séquence en résidus d'acides aminés, qui constitue leurstructure primaire. Les acides aminés ayant des propriétés chimiques très diverses, leur disposition le long de la chaîne polypeptidique détermine leur arrangement spatial. Celui-ci est décrit localement par leurstructure secondaire, stabilisée par desliaisons hydrogène entre résidus d'acides aminés voisins, et, globalement, par leurstructure tertiaire, stabilisée par l'ensemble des interactions entre les résidus — parfois très éloignés sur la séquence peptidique mais mis en contact spatialement par lerepliement de la protéine — ainsi qu'entre la protéine elle-même et son environnement. Enfin l'assemblage de plusieurssous-unités protéiques pour former un complexe fonctionnel est décrit par lastructure quaternaire de cet ensemble.
Il peut aussi se former des liaisons covalentes supplémentaires, soit au sein d'une même chaîne protéique, soit entre différentes chaînes peptidiques au sein d'une protéine, notamment par la formation deponts disulfure entre résidus decystéine.
La plupart des protéines adoptent une conformation tridimensionnelle unique. La forme naturelle d'une protéinein vivo est sonétat natif, qui correspond à la forme qu'elle prend pour être biologiquement active et fonctionnelle. De nombreuses protéines prennent par elles-mêmes leur forme biologiquement active sous l'effet de la distribution spatiale desrésidus d'acides aminés qui les constituent, d'autres ont besoin d'être assistées pour ce faire par desprotéines chaperonnes pour êtrerepliées selon leur état natif.
Lastructure secondaire décrit l'arrangement des résidus d'acides aminés observable à l'échelle atomique. Stabilisés par desliaisons hydrogène, ces arrangements locaux sont par exemple leshélices α, lesfeuillets β, lestonneaux β, ou les coudes. Il en existe plusieurs variétés, et il est courant qu'une protéine possède globalement plusieurs types de structures secondaires.
Lastructure tertiaire correspond à la forme générale de la protéine observable à l'échelle de la molécule tout entière. Elle décrit les interactions entre les différents éléments de la structure secondaire. Elle est stabilisée par tout un ensemble d'interactions conduisant le plus souvent à la formation d'un cœurhydrophobe, avec éventuellement desliaisons salines, des liaisons hydrogène, desponts disulfure, voire desmodifications post-traductionnelles. On désigne souvent par structure tertiaire lerepliement d'une protéine.
Lastructure quaternaire décrit le complexe résultant de l'assemblage de plusieurs molécules de protéines (plusieurs chaînes polypeptidiques), appelées dans ce cassous-unités protéiques, pour former un complexe protéique unique. Toutes les protéines ne sont pas nécessairement constituées de plusieurs sous-unités et ne possèdent par conséquent pas toujours de structure quaternaire.
Les protéines ne sont pas des molécules entièrement rigides. Elles sont susceptibles d'adopter plusieurs conformations apparentées en réalisant leurs fonctions biologiques. La transition d'une de ces conformations à une autre est appeléechangement conformationnel. Dans le cas d'uneenzyme par exemple, de tels changements conformationnels peuvent être induits par l'interaction avec lesubstrat au niveau dusite actif. En solution, les protéines subissent également de nombreux changements conformationnels en raison de la vibration thermique de la collision avec d'autres molécules.
On peut distinguer trois grands groupes de protéines en fonction de leur structure tertiaire ou quaternaire : lesprotéines globulaires, lesprotéines fibreuses et lesprotéines membranaires. Presque toutes les protéines globulaires sont solubles et ce sont souvent desenzymes. Les protéines fibreuses jouent souvent un rôle structurel, à l'instar ducollagène, constituant principal destissus conjonctifs, ou de lakératine, constituant protéique despoils et desongles. Les protéines membranaires sont souvent desrécepteurs ou des canaux permettant aux molécules polaires ou électriquement chargées de traverser lamembrane.
La connaissance de la structure tertiaire, voire quaternaire, d'une protéine peut fournir des éléments importants pour comprendre comment cette protéine remplit sa fonction biologique. Lacristallographie aux rayons X et laspectroscopie RMN sont des méthodes expérimentales courantes pour étudier la structure des protéines, qui peuvent l'une et l'autre fournir des informations avec unerésolution à l'échelleatomique. Les données RMN permettent d'obtenir des informations à partir desquelles il est possible d'estimer un sous-ensemble de distances entre certaines paires d'atomes, ce qui permet d'en déduire les conformations possible de cette molécule. L'interférométrie par double polarisation est une méthode analytique quantitative permettant de mesurer la conformation globale de la protéine ainsi que ses changements conformationnels en fonction de son interaction avec d'autres stimulus. Ledichroïsme circulaire fournit une autre technique de laboratoire permettant de résoudre certains éléments de lastructure secondaire des protéines (hélices α etfeuillets β notamment). Lacryo-microscopie électronique permet d'obtenir des informations structurelles à plus faible résolution sur les très grosses protéines, notamment lesvirus. Lacristallographie électronique, technique issue de la précédente, permet dans certains cas de produire également des données à haute résolution, notamment pour les cristaux bidimensionnels deprotéines membranaires[20]. Les structures protéiques résolues sont généralement déposées dans laProtein Data Bank (PDB), unebase de données en accès libre donnant la structure d'un millier de protéines pour laquelle lescoordonnées cartésiennes de chaque atome sont disponibles[21].
Le nombre de protéines dont la structure a été résolue est bien plus faible que le nombre de gènes dont la séquence est connue. De plus, le sous-ensemble de protéines dont la structure a été résolue est biaisé en faveur des protéines qui peuvent être aisément préparées en vue d'une analyse par cristallographie aux rayons X, l'une des principales méthodes de détermination des structures protéiques. En particulier, lesprotéines globulaires sont comparativement les plus faciles à cristalliser en vue d'une cristallographie, tandis que les protéines membranaires sont plus difficiles à cristalliser et sont sous-représentées parmi les protéines disponibles dans la PDB[22]. Pour remédier à cette situation, des démarches degénomique structurale ont été entreprises afin de résoudre les structures représentatives des principales classes derepliement des protéines. Les méthodes deprédiction de la structure des protéines visent à fournir le moyen de générer la structure plausible d'une protéine à partir des structures qui ont pu être déterminées expérimentalement[23].
Lesacidesα-aminés protéinogènes sont assemblés enpolypeptides au sein descellules par lesribosomes à partir de l'information génétique transmise par lesARN messagers depuis l'ADN constituant lesgènes. C'est laséquence nucléotidique de l'ADN,transcrite à l'identique dans l'ARN messager, qui porte l'information lue par les ribosomes pour produire les protéines selon laséquence peptidique spécifiée par les gènes. La correspondance entre la séquence nucléotidique de l'ADN et de l'ARN messager d'une part et la séquence peptidique des protéines synthétisées d'autre part est déterminée par lecode génétique, qui est essentiellement le même pour tous les êtres vivants connus hormis un certain nombre de variantes assez limitées.
Lecode génétique établit la correspondance entre un triplet debases nucléiques, appelécodon, sur l'ARN messager et un acideα-aminé protéinogène. Cette correspondance est réaliséein vivo par lesARN de transfert, qui sont desARN comptant une centaine denucléotides tout au plus et portant un acide aminéestérifiant leur extrémité 3’-OH. Chacun des acides aminés est lié à des ARN de transfert spécifiques, portant des codons eux aussi spécifiques, de sorte que chacun des64 codons possibles ne peut coder qu'un seul acide aminé. En revanche, chacun des22 acides aminés protéinogènes peut être codé par plusieurs codons différents. Ce sont lesenzymes réalisant l'estérification des ARN messagers avec les acides aminés — lesaminoacyl-ARNt synthétases — qui maintiennent le code génétique : en effet, ces enzymes se lient spécifiquement à la fois à un ARN de transfert donné et à un acide aminé donné, de sorte que chaque type d'ARN de transfert n'est estérifié que par un acide aminé spécifique.
Les gènes codés dans l'ADN sont tout d'abord transcrits enARN pré-messager par desenzymes telles que lesARN polymérases. La plupart des êtres vivants modifient cet ARN pré-messager à travers un ensemble de processus appelésmodifications post-transcriptionnelles conduisant à l'ARN messager mature. Ce dernier est alors utilisable par les ribosomes pour servir de modèle lors de labiosynthèse des protéines. Chez lesprocaryotes, l'ARN messager peut être utilisé dès qu'il est synthétisé ou être traduit en protéines après avoir quitté lenucléoïde. En revanche, chez leseucaryotes, l'ARN messager est produit dans lenoyau de la cellule tandis que les protéines sont synthétisées dans lecytoplasme, de sorte que l'ARN messager doit traverser lamembrane nucléaire.
La biosynthèse d'une protéine à partir d'un ARN messager est latraduction de cet ARNm. L'ARN messager se lie au ribosome, qui le lit séquentiellement à raison de trois nucléotides à chaque étape de la synthèse. Chaque triplet de nucléotides constitue un codon sur l'ARN messager, auquel peut se lier l'anticodon d'un ARN de transfert apportant l'acide aminé correspondant. L'appariement entre le codon et l'anticodon repose sur lacomplémentarité de leursséquences respectives. C'est cette complémentarité qui assure la reconnaissance entre l'ARN de transfert et le codon de l'ARN messager. L'acide aminé apporté par l'ARN de transfert sur le ribosome établit uneliaison peptidique avec l'extrémitéC-terminale de la chaîne naissante, ce qui permet de l'allonger d'un résidu d'acide aminé. Le ribosome se déplace alors de trois nucléotides sur l'ARN messager pour faire face à un nouveau codon, qui suit exactement le codon précédent. Ce processus se répète jusqu'à ce que le ribosome soit en face d'uncodon stop, auquel cas la traduction s'arrête.
Les petites protéines peuvent également être synthétiséesin vitro par un ensemble de méthodes appeléessynthèse peptidique, qui reposent sur des techniques desynthèse organique telles que laligature chimique(en) pour produire efficacement des peptides[29]. La synthèse chimique permet d'introduire desacides aminés non naturels dans la chaîne polypeptidique, en posant par exemple des sondesfluorescentes sur lachaîne latérale de certains d'entre eux[30]. Ces méthodes sont utiles au laboratoire enbiochimie et enbiologie cellulaire mais ne sont généralement pas employées pour des applications commerciales. La synthèse chimique n'est pas efficace pour synthétiser des peptides de plus de300résidus d'acides aminés environ, et les protéines ainsi produites peuvent ne pas adopter facilement leurstructure tertiaire native. La plupart des méthodes de synthèse chimique des protéines procèdent de l'extrémitéC-terminale vers l'extrémitéN-terminale, c'est-à-dire dans le sens inverse de labiosynthèse des protéines par lesribosomes[31].
Parmi tous les constituants de la cellule, les protéines sont les éléments les plus actifs. Hormis certainsARN, la plupart des autres molécules biologiques sont chimiquement assez peu réactives et ce sont les protéines qui agissent sur elles. Les protéines constituent environ la moitié de la matière sèche d'une cellule d'E. coli tandis que l'ARN et l'ADN en constituent respectivement un cinquième et 3 %. L'ensemble des protéines exprimées dans une cellule constitue sonprotéome.
Les protéines peuvent se lier selon les cas à d'autres protéines ou à depetites molécules commesubstrats. Lorsqu'elles se lient spécifiquement à d'autres protéines identiques à elles-mêmes, elles peuventpolymériser pour former desfibrilles. Ceci est fréquent pour les protéines structurelles, formées demonomères globulaires qui s'auto-assemblent pour former des fibres rigides. Desinteractions protéine-protéine régulent également leur activitéenzymatique, l'avancement ducycle cellulaire et l'assemblage de grands complexes protéiques réalisant des réactions étroitement apparentées partageant une fonction biologique commune. Les protéines peuvent également se lier à la surface desmembranes cellulaires et même fréquemment en faire partie intégrante. La capacité de certaines protéines à changer de conformation lorsqu'elles se lient à des molécules spécifiques permet de construire des réseaux designalisation cellulaire extrêmement complexes. D'une manière générale, l'étude des interactions entre protéines spécifiques est un élément clé de notre compréhension du fonctionnement des cellules et de leur faculté à échanger de l'information[33],[34].
Les molécules qui se lient aux enzymes et sont modifiées chimiquement par elles sont appeléessubstrats. Bien que les enzymes soient parfois constituées de plusieurs centaines de résidus d'acides aminés, seuls quelques-uns d'entre eux entrent en contact avec le ou les substrats de l'enzyme, et un très petit nombre — généralement trois ou quatre — sont impliqués directement dans la catalyse. On appellesite actif la région d'une enzyme impliquée dans la réaction chimique catalysée par cette protéine : il regroupe les résidus qui se lient au substrat ou contribuent à son positionnement, ainsi que les résidus qui catalysent directement la réaction.
De nombreuses protéines sont impliquées dans les mécanismes designalisation cellulaire et detransduction de signal. Certaines protéines telles que l'insuline appartiennent aumilieu extracellulaire et transmettent un signal de lacellule où elles sont synthétisées vers d'autres cellules parfois situées dans destissus éloignés. D'autres sont desprotéines membranaires qui agissent commerécepteurs dont la fonction principale est de se lier aux molécules porteuses de signaux et d'induire une réponse biochimique dans la cellule cible. De nombreux récepteurs membranaires ont un site de liaison exposé à l'extérieur de la cellule et un domaineeffecteur(en) en contact avec le milieu intracellulaire. Ce domaine effecteur peut être porteur d'une activitéenzymatique ou peut subir des changements conformationnels agissant sur d'autres protéines intracellulaires.
Lesanticorps sont les constituants protéiques dusystème immunitaire dont la fonction principale est de se lier auxantigènes ou auxxénobiotiques afin de les marquer pour élimination par l'organisme. Les anticorps peuvent être sécrétés dans le milieu extracellulaire ou bien ancrés dans lamembrane plasmique delymphocytes B spécialisés appelésplasmocytes. Là où les enzymes sont très spécifiques de leurs substrats afin d'accélérer des réactions chimiques très précises, les anticorps n'ont pas cette contrainte ; en revanche, leur affinité pour leur cible est extrêmement élevée.
De nombreuses protéines transporteuses deligands se lient spécifiquement à depetites molécules et les transportent à destination à travers les cellules et les tissus desorganismes multicellulaires. Ces protéines doivent posséder une forte affinité pour leur ligand lorsque la concentration de celui-ci est élevée, mais doivent également pouvoir le libérer lorsque sa concentration est faible dans les tissus cibles. L'exemple canonique de la protéine porteuse de ligand est l'hémoglobine, qui transporte l'oxygène despoumons vers les autresorganes et tissus chez tous lesvertébrés et a deshomologues apparentés dans tous lesrègnes du vivant. Leslectines sont des protéines qui se lient réversiblement à certainsglucides avec une très grande spécificité. Elles jouent un rôle dans les phénomènes de reconnaissance biologique impliquant cellules et protéines[38].
Lesprotéines transmembranaires peuvent également jouer le rôle de protéines transporteuses de ligands susceptibles de modifier la perméabilité de lamembrane plasmique aux petites moléculespolaires et auxions. La membrane elle-même possède un cœurhydrophobe à travers lequel les molécules polaires ouélectriquement chargées ne peuvent pas diffuser. Les protéines membranaires peuvent ainsi contenir un ou plusieurs canaux à travers la membrane cellulaire et permettant à ces molécules et à ces ions de la traverser. De nombreuxcanaux ioniques sont très spécifiques de l'ion dont ils permettent la circulation. Ainsi, lescanaux potassiques et lescanaux sodiques sont souvent spécifiques de l'un des deux ionspotassium etsodium à l'exclusion de l'autre.
Les protéines structurelles confèrentraideur et rigidité à des constituants biologiques qui, sans elles, seraient fluides. La plupart des protéines structurelles sont fibreuses. C'est par exemple le cas ducollagène et de l'élastine qui sont des constituants essentiels detissus conjonctifs tels que lecartilage, et de lakératine présente dans les structures dures ou filamenteuses telles que lespoils, lesongles, lesplumes, lessabots et l'exosquelette de certainsanimaux. Certainesprotéines globulaires peuvent également jouer un rôle structurel, par exemple l'actine et latubuline dont lesmonomères sont globulaires et solubles maispolymérisent pour former de longs filaments rigides constituant lecytosquelette, ce qui permet à la cellule de maintenir sa forme et sa taille.
Lesprotéines motrices sont des protéines structurelles particulières qui sont capables de générer des forces mécaniques. Ce sont par exemple lamyosine, lakinésine et ladynéine. Ces protéines sont essentielles à lamotilité des organismesunicellulaires ainsi qu'auxspermatozoïdes des organismesmulticellulaires. Elles permettent également de générer les forces à l'œuvre dans lacontraction musculaire et jouent un rôle essentiel dans le transport intracellulaire.
Lesmannoprotéines semblent pourtant avoir des rôles-clé au sein des cellules, notamment en y contrôlant la porosité de la paroi cellulaire[39],[40],[41].
Récapitulatif de fonctions assurées par les protéines
Les protéines remplissent ainsi des fonctions très diverses au sein de la cellule et de l'organisme[42] :
lesprotéines structurelles, qui permettent à la cellule de maintenir son organisation dans l'espace, et qui sont les constituants ducytosquelette ;
lesprotéines de transport, qui assurent le transfert des différentes molécules dans et en dehors des cellules ;
lesprotéines régulatrices, qui modulent l'activité d'autres protéines ou qui contrôlent l'expression des gènes ;
lesprotéines de signalisation, qui véhiculent les signaux extérieurs à des récepteurs, et assurent leur transmission dans la cellule ou l'organisme ; il en existe plusieurs sortes, par exemple lesprotéines hormonales, qui contribuent à coordonner les activités d'un organisme en agissant comme des signaux entre les cellules ;
lesprotéines réceptrices, qui détectent les molécules messagères et les autres signaux pour que la cellule agisse en conséquence :
lesrécepteurs d'hormone détectent leshormones et envoient des signaux à la cellule pour qu'elle agisse en conséquence (ex. : l'insuline est une hormone qui, lorsqu'elle est captée, signale à la cellule d'absorber et d'utiliser leglucose) ;
lesprotéines motrices, permettant aux cellules ou organismes ou à certains éléments (cils) de se mouvoir ou se déformer (ex. : l'actine et lamyosine permettent aumuscle de secontracter) ;
lesprotéines de stockage, qui permettent la mise en réserve d'acides aminés pour pouvoir biosynthétiser d'autres protéines (ex. : l'ovalbumine, la principale protéine dublanc d'œuf permet leur stockage pour le développement desembryons depoulet) ;
lesenzymes, qui modifient la vitesse de presque toutes lesréactions chimiques dans la cellule sans être transformées dans la réaction.
La structure et les fonctions des protéines peuvent être étudiéesin vivo,in vitro etin silico. Les étudesin vivo permettent d'explorer le rôlephysiologique d'une protéine au sein d'unecellule vivante ou même au sein d'unorganisme dans son ensemble. Les étudesin vitro de protéines purifiées dans des environnements contrôlés sont utiles pour comprendre la façon dont une protéine fonctionnein vivo : par exemple, l'étude de lacinétique d'uneenzyme permet d'analyser lemécanisme chimique de son activitécatalytique et de sonaffinité relative vis-à-vis de différentssubstrats. Les étudesin silico utilisent desalgorithmesinformatiques pourmodéliser des protéines.
Pour pouvoir être analyséein vitro, une protéine doit préalablement avoir été purifiée des autres constituants chimiques de la cellule. Ceci commence généralement par lalyse de la cellule, au cours de laquelle lamembrane plasmique est rompue afin d'en libérer le contenu dans une solution pour donner un lysat. Ce mélange peut être purifié parultracentrifugation, ce qui permet d'en séparer les constituants en fractions contenant respectivement les protéines solubles, leslipides etprotéines membranaires, lesorganites cellulaires, et lesacides nucléiques. Laprécipitation des protéines parrelargage permet de les concentrer à partir de ce lysat. Il est alors possible d'utiliser plusieurs types dechromatographie pour isoler les protéines que l'on souhaite étudier en fonction de leurs propriétésphysico-chimiques telles que leurmasse molaire, leurcharge électrique, ou encore leur affinité de liaison. Le degré de purification peut être suivi à l'aide de plusieurs types d'électrophorèse sur gel si la masse moléculaire et lepoint isoélectrique des protéines étudiées sont connus, parspectroscopie si la protéine présente des caractéristiques spectroscopiques identifiables, ou pardosage enzymatique(en) si la protéine est porteuse d'une activité enzymatique. Par ailleurs, les protéines peuvent être isolées en fonction de leur charge électrique parfocalisation isoélectrique[43].
Les protéines naturelles requièrent éventuellement une série d'étapes de purification avant de pouvoir être étudiées en laboratoire. Afin de simplifier ce procédé, legénie génétique est souvent utilisé pour modifier les protéines en les dotant de caractéristiques qui les rendent plus faciles à purifier sans pour autant altérer leur structure ni leur activité. On ajoute ainsi des « étiquettes » reconnaissables sur les protéines sous forme deséquences d'acides aminés identifiées, souvent une série derésidus d'histidine — étiquette poly-histidine, ouHis-tag — à l'extrémitéC-terminale ou à l'extrémitéN-terminale de lachaîne polypeptidique. De ce fait, lorsque le lysat est placé dans une colonne chromatographique contenant dunickel, les résidus d'histidine se complexent au nickel et restent liées à la colonne tandis que les constituants dépourvus d'étiquette la traversent sans être arrêtés. Plusieurs types d'étiquettes ont été développés afin de permettre aux chercheurs de purifier des protéines particulières à partir de mélanges complexes[44].
L'étudein vivo des protéines implique souvent de savoir précisément où elles sont synthétisées et où elles se trouvent dans les cellules. Bien que la plupart des protéines intracellulaires soient produites dans lecytoplasme et que la plupart des protéines membranaires ou sécrétées dans le milieu extracellulaire sont produites dans leréticulum endoplasmique, il est rare qu'on comprenne précisément comment les protéines ciblent spécifiquement certaines structures cellulaires ou certainsorganites. Legénie génétique offre des outils utiles pour se faire une idée de la localisation de certaines protéines, par exemple en liant la protéine étudiée à une protéine permettant de la repérer, c'est-à-dire en réalisant uneprotéine de fusion entre la protéine étudiée et une protéine utilisée comme marqueur, telle que laprotéine fluorescente verte[45]. La localisation intracellulaire de la protéine de fusion résultante peut être facilement et efficacement visualisée parmicroscopie[46].
D'autres méthodes de localisation intracellulaire des protéines impliquent l'utilisation de marqueurs connus pour certainscompartiments cellulaires tels que leréticulum endoplasmique, l'appareil de Golgi, leslysosomes, lesmitochondries, leschloroplastes, lamembrane plasmique, etc. Il est par exemple possible de localiser des protéines marquées avec une étiquette fluorescente ou ciblées avec desanticorps contre ces marqueurs. Les techniques d'immunofluorescence permettent ainsi de localiser des protéines spécifiques. Des pigments fluorescents sont également utilisés pour marquer des compartiments cellulaires dans un but similaire[47].
L'immunohistochimie utilise généralement un anticorps ciblant une ou plusieurs protéines étudiées qui sont conjugués à desenzymes émettant des signaux luminescents ouchromogènes pouvant être comparés à divers échantillons, ce qui permet d'en déduire des informations sur la localisation des protéines étudiées. Il est également possible d'utiliser des techniques de cofractionnement dans un gradient desaccharose (ou d'une autre substance) à l'aide d'une centrifugation isopycnique.
La microscopie immunoélectronique combine l'utilisation d'unemicroscopie électronique classique à l'utilisation d'un anticorps dirigé contre la protéine étudiée, cet anticorps étant préalablement conjugué à un matériau à forte densité électronique telle que l'or. Ceci permet de localiser des détails ultrastructurels ainsi que la protéine étudiée[48].
L'ensemble des protéines d'unecellule ou d'un type de cellule constitue sonprotéome, et la discipline scientifique qui l'étudie est laprotéomique. Ces deux termes ont été forgés par analogie avec legénome et lagénomique. Si le protéome dérive du génome, il n'est cependant pas possible de prédire exactement quel sera le protéome d'une cellule à partir de la simple connaissance de son génome. En effet, l'expression d'ungène varie d'une cellule à l'autre au sein d'un même organisme en fonction de ladifférenciation cellulaire, voire dans la même cellule en fonction ducycle cellulaire. Par ailleurs, un même gène peut donner plusieurs protéines (par exemple lespolyprotéinesvirales), et desmodifications post-traductionnelles sont souvent nécessaires pour rendre une protéine active.
Il existe à présent tout un ensemble de méthodes informatiques permettant d'analyser la structure, la fonction et l'évolution des protéines. Le développement de tels outils a été rendu nécessaire par la grande quantité de donnéesgénomiques etprotéomiques disponibles pour un très grand nombre d'êtres vivants, à commencer par legénome humain. Il est impossible d'étudier toutes les protéines expérimentalement, de sorte que seules un petit nombre d'entre elles font l'objet d'études au laboratoire tandis que les outils de calcul permettent d'extrapoler les résultats ainsi obtenus à d'autres protéines qui leur sont semblables. De telles protéineshomologues sont efficacement identifiées par les techniques d'alignement de séquences. Des outils de profilage desséquences peptidiques permettent de localiser les sitesclivés par lesenzymes de restriction, lescadres de lecture dans lesséquences nucléotidiques, et de prédire lesstructures secondaires. Il est également possible de construire desarbres phylogénétiques et d'élaborer des hypothèses relatives à l'évolution à l'aide delogiciels tels queClustalW(en) permettant de remonter aux ancêtres des organismes modernes et à leurs gènes. Les outils bio-informatiques sont devenus indispensables à l'étude des gènes et des protéines exprimées par ces gènes.
En plus de la génomique structurelle, la prédiction de la structure des protéines vise à développer des moyens permettant d'élaborer efficacement des modèles plausibles décrivant la structure de protéines qui n'ont pu être résolues expérimentalement[55]. Le mode de prédiction de structure le plus efficace, appelémodélisation par homologie, se fonde sur l'existence de structures modèles connues dont la séquence présente des similitudes avec celle de la protéine étudiée. Le but de la génomique structurelle est de fournir suffisamment de données sur les structures résolues afin de permettre l'élucidation de celles qui restent à résoudre[56]. Bien qu'il demeure malaisé de modéliser précisément des structures lorsqu'il n'existe que des modèles structurels éloignés auxquels se référer, on pense que le nœud du problème se trouve au niveau de l'alignement des séquences car des modèles très exacts peuvent être établis dès lors qu'un alignement de séquences très exact est connu[57]. De nombreuses prédictions de structures ont été utiles au domaine émergent dugénie protéique(en), qui a notamment élaboré de nouveaux modes derepliement[58]. Un problème plus complexe à résoudre par le calcul est la prédiction des interactions intermoléculaires, comme la prédiction de l'ancrage des molécules et desinteractions protéine-protéine[59].
Le plan de fabrication des protéines dépend donc en premier lieu dugène. Or les séquences des gènes ne sont pas strictement identiques d'un individu à l'autre. De plus, dans le cas des êtres vivantsdiploïdes, il existe deux exemplaires de chaque gène. Et ces deux exemplaires ne sont pas nécessairement identiques. Un gène existe donc en plusieurs versions d'un individu à l'autre et parfois chez un même individu. Ces différentes versions sont appeléesallèles. L'ensemble des allèles d'un individu forme legénotype.
Puisque les gènes existent en plusieurs versions, les protéines vont également exister en différentes versions. Ces différentes versions de protéines vont provoquer des différences d'un individu à l'autre : tel individu aura les yeux bleus mais tel autre aura les yeux noirs,etc. Ces caractéristiques, visibles ou non, propres à chaque individu sont appelées lephénotype. Chez un même individu, un groupe de protéines àséquence similaire et fonction identique est ditisoforme. Les isoformes peuvent être le résultat de l'épissage alternatif d'un même gène, l'expression de plusieurs allèles d'un gène, ou encore la présence de plusieursgènes homologues dans le génome.
Au cours de l'évolution, les accumulations demutations ont fait diverger lesgènes au sein des espèces et entreespèces. De là provient la diversité des protéines qui leur sont associées. On peut toutefois définir desfamilles de protéines, elles-mêmes correspondant à des familles de gènes. Ainsi, dans une espèce peuvent coexister des gènes, et par conséquent des protéines, très similaires formant une famille. Deux espèces proches ont de fortes chances d'avoir des représentants de même famille de protéines.
On parle d'homologie entre protéines lorsque différentes protéines ont une origine commune, ungène ancestral commun.
La comparaison des séquences de protéines permet de mettre en évidence le degré de« parenté » entre différentes protéines, on parle ici de similarité de séquence. La fonction des protéines peut diverger au fur et à mesure que la similarité diminue, donnant ainsi naissance à des familles de protéines ayant une origine commune mais ayant des fonctions différentes.
L'analyse desséquences et des structures de protéine a permis de constater que beaucoup s'organisaient endomaines, c'est-à-dire en parties acquérant une structure et remplissant une fonction spécifique. L'existence de protéines à plusieurs domaines peut être le résultat de la recombinaison en un gène unique de plusieurs gènes originellement individuels, et réciproquement des protéines composés d'un unique domaine peuvent être le fruit de la séparation en plusieurs gènes d'un gène originellement codant une protéine à plusieurs domaines.
La digestion des protéines a surtout lieu dans leduodénum. Elles sont principalement absorbées quand elles arrivent dans lejéjunum et seules 1 % des protéines ingérées se retrouvent dans lesfèces. Certains acides aminés restent dans lescellules épithéliales de l'intestin, utilisés pour la biosynthèse de nouvelles protéines, y compris des protéinesintestinales constamment digérées, recyclées et absorbées par l'intestin grêle.
La digestibilité des protéines varie considérablement selon leur nature et la préparation de l'aliment.
Selon l'American Heart Association, il n'est pas nécessaire de consommer des protéines animales pour avoir suffisamment de protéines dans son alimentation : les protéines végétales peuvent fournir suffisamment d'acides aminés essentiels et non essentiels, pourvu que les sources de protéines alimentaires soient variées et que l'apport calorique suffise à répondre aux besoins énergétiques. Il n'est pas nécessaire de les combiner dans un même repas[65]. L'Association américaine de diététique rappelle elle aussi que les protéines végétales peuvent répondre aux exigences en matière de protéines si l'alimentation végétale est variée et répond aux besoins en énergie. De plus,« un assortiment d'aliments végétaux consommés au cours d'une journée peut fournir tous les acides aminés essentiels et assurer une rétention et une utilisation suffisantes de l'azote chez les adultes en bonne santé, de sorte que la combinaison de protéines au cours d'un même repas n'est pas nécessaire »[66].
Les protéines animales sont toujours accompagnées delipides saturés dont la consommation est souvent excessive, et parfois d'additifs alimentaires (tels lesnitrites descharcuteries, soupçonnés d'être cancérigènes par leCentre international de recherche sur le cancer (CIRC), et qui provoquent la formation de deux produits cancérogènes avérés en milieu acide, comme c'est le cas dans l'estomac). Les protéines animales, ou des produits associés comme lesamines hétérocycliques seraient également un facteur de risque pour certains cancers (côlon,vessie)[67]. Depuis 2015, l'OMS et le CIRC ont classé la viande rouge (porc, boeuf, mouton, cheval et chèvre)cancérigène probable et laviande transformée commecancérigène avéré (34 000 décès/an dans le monde, selon une étude duGlobal Burden of Disease Project ; selon l'OMS, manger cinquante grammes de viande transformée par jour augmente le risque decancer colorectal de 18 % (une viande est dite« transformée » si elle a subi une salaison, maturation, fermentation, fumaison ou d'autres processus visant à améliorer sa saveur ou sa conservation)[68]. Faute de données, le groupe de travail du CIRC n'a pas pu classer laviande crue vis à vis du risque de cancer, mais il rappelle qu'elle présente unrisque infectieux[68]. Les animaux risquent plus d'avoir bioconcentré des polluants via lachaine alimentaire.
Les protéines végétales ont des effets positifs associés aux végétaux riches en protéines[69]. Leslégumes secs sont riches en protéines, mais aussi enfibres, en minéraux et apportent un sentiment de satiété pour un indice glycémique faible. Consommer des haricots contribue à diminuer le taux decholestérol[70],[71] et le risque d'accident cardio-vasculaire[72] et de certains cancers (colorectal, de laprostate, et dupancréas)[67]. Elles sont bien évidemment une alternative pour les végans ou végétariens. Les noix, les légumes, les haricots, le quinoa et les céréales contiennent de grandes quantités de protéines mais aussi d'énergie.
Protéines fongiques : les champignons comestibles sont souvent riches en protéines et, comme les plantes, ils sont sources de fibres alimentaires et de minéraux. Par contre, récoltés dans la nature ou cultivés sur des substrats pollués, ils tendent à fortement accumuler de nombreuxmétaux lourds,métalloïdes voire desradionucléides.
La totalité des acides aminés nécessaires doit être apportée par la nourriture, sous peine d'être carencé, ce qui implique des sources diversifiés de protéines.
La recommandation decombiner les protéines animale et végétales dans chaque repas est invalidée depuis 1994 à la suite d'un article de Vernon Young et Peter Pellett devenu une référence sur le métabolisme des protéines chez l'homme, confirmant que la combinaison de protéines dans les repas est totalement inutile. Les personnes ne souhaitant pas manger de protéines animales ne risquent pas de déséquilibre d'amino-acides des protéines végétales de leur régime alimentaire[73]. De nombreuses protéines végétales contiennent un peu moins d'un ou de plusieurs des acides aminés essentiels (lysine surtout et moindrementméthionine etthréonine), sans pour autant que la consommation exclusive de sources de protéines végétales empêche d'avoir une alimentation équilibrée en acides aminés essentiels[73].
Les conclusions de l'article de Young et Pellet sont seulement à considérer dans le cas très général où les céréales ne sont pas la source exclusive de l'alimentation, ce qu'ils prennent soin de préciser d'ailleurs, où qu'ils explicitent dans d'autres articles[74]. Ainsi dans certaines régions défavorisées, les rations alimentaires peuvent ne comporter que des céréales, ce qui entraîne de graves problèmes de santé pour les jeunes enfants, par exemple dans les foyers pauvres de l'État duMadhya Pradesh en Inde (blé et riz)[75].
Par ailleurs, des firmes semencières cherchent à obtenir ou ont déjà obtenu des variétés de céréales à contenu en acides aminés modifié (OGM), par exemple des maïs enrichis en lysine[76],[77].
Les autorités françaises de santé (AFSSA/ANSES) refusent encore de trancher cette question[78].
Lescompléments alimentaires protéinés existent, pour les sportifs souhaitant développer leur volume musculaire, et pour les personnes en carences de protéines. Les protéines utilisées sont souvent des protéines issues de la luzerne (luzerne sous forme d'extrait foliaire, EFL) de laféverolle, dupois ou dulactosérum également connu sous le nom de « whey », qui est un complément nutritionnel apprécié, disponible sous différentes formes[79] : concentré, isolat, hydrolysat, et native.
Elles existent également sous forme d'acides aminés ramifiés ou essentiels désignés sous le nom de « BCAA » ou « EAA ». Ce sont ces acides aminés que l'on retrouve dans l'aminogramme d'une protéine en poudre, et qui déterminent son niveau de qualité pour les adeptes de la musculation[80].
Leschampignons ont des teneurs en protéines difficiles à mesurer avec précision (teneurs autrefois surestimées de 70 à 200 % parfois[81]) mais souvent relativement élevées (15 à 35 % du poids sec du champignon[82],[83]), beaucoup plus élevées que des céréales telles que le blé et le maïs, d'intérêt alimentaire[84]. Ces teneurs sont comparables à celle delégumineuses telles que pois et lentilles.
↑K. Forchhammer et A. Bock, « Selenocysteine synthase from Escherichia coli. Analysis of the reaction sequence »,J. Biol. Chem.,vol. 266,no 10,,p. 6324–8(PMID2007585)
↑Il est difficile de mesurer précisément la teneur en protéines des champignons car leurchitine et d'autres composés azotés interfèrent avec l'analyse de l'azote total (par exemple laméthode de Kjeldahl) autrefois utilisée. Source : Danell E. et Eaker D. (1992),Amino acid and total protein content of the edible mushroom Cantharellus cibarius (Fries),Journal of the Science of Food and Agriculture, 60(3), 333-337.
↑Dıez V.A. et Alvarez A. (2001),Compositional and nutritional studies on two wild edible mushrooms from northwest Spain,Food Chemistry, 75(4), 417-422 (résumé)
↑a etbChang S.T. et Buswell J.A. (1996),Mushroom nutriceuticals,World Journal of Microbiology and biotechnology, 12(5), 473-476 (résumé).
↑Peter C.K. Cheung (2009),Nutritional Value and Health Benefits of Mushrooms, Mushrooms as Functional Foods, (71-109).
↑Chang S.T. et Miles P.G. (1991),Recent trends in world production of edible mushrooms,The Mushroom Journal, 503, 15–18.
↑Shah H., Khalil I.A. et Jabeen S. (1997),Nutritional composition and protein quality of Pleurotus mushroom,Sarhad Journal of Agriculture (Pakistan) (résumé Agris/FAO).
↑Hsieh, K. Y., Hsu, C. I., Lin, J. Y., Tsai, C. C. et Lin, R. H. (2003),Oral administration of an edible‐mushroom‐derived protein inhibits the development of food‐allergic reactions in mice,Clinical & Experimental Allergy, 33(11), 1595-1602 (résumé)
↑Lin, J. Y., Lin, Y. J., Chen, C. C., Wu, H. L., Shi, G. Y. et Jeng, T. W. (1974),Cardiotoxic protein from edible mushrooms,Nature, 252(5480), 235 (résumé).
Gregory Petsko, Dagmar Ringe (trad. Chrystelle Sanlaville, Dominique Charmot-Bensimon),Structure et fonction des protéines, De Boeck, Bruxelles, 2009(ISBN978-2-8041-5888-0).
Lubert Stryer, Jeremy Mark Berg, John L. Tymoczko (trad. Serge Weinman),Biochimie, Flammarion, « Médecine-Sciences », Paris, 2008,6eéd.(ISBN978-2-257-00003-3).
Carl-Ivar Brändén, John Tooze (trad. Bernard Lubochinsky, préf. Joël Janin),Introduction à la structure des protéines, De Boeck Université, Bruxelles, 1996(ISBN978-2-8041-2109-9).
(en)Serveur MRS, un serveur de banques de données biologiques, où l'identification d'une entrée dans la banque PDB permet de visualiser la structure à l'écran, en mode dynamique (voir par exemple ce que produit une recherche dans la banque PDB des entrées correspondant à la trypsine).
(en)Proteins@home, un projet à grande échelle pour étudier le repliement des protéines, auquel on peut participer avec un ordinateur.