Les proteines sont les macromolécules cellulaires les plus abondantes constituant 60% du poids sec des cellules.
Elles sont constituées d'une ou plusieurs chaînes polypeptidiques et ont un poids moléculaire supérieur à 10.000. Elles ont une structure particulière et diversifiée. Les chaînes polypeptidiques se replient plus ou moins fortement sur elles-mêmes induisant un grand nombre de structures tridimensionnelles différentes.
C'est ceci qui est à l'origine d'une diversité de fonction leur permettant d'être responsables de milliers de réactions différentes dans la cellule. Leur nom de "nanomachines" cellulaires est ainsi justifié.
Par la très grande diversité de réactions cellulaires, on imagine facilement que le nombre de protéines différentes connues à ce jour est très important: 60 000. Les protéines sont issues de la traduction et transcription des gènes, leur synthèse est donc sous contrôle génétique.
Toutes les protéines sont donc constituées d'acides aminés (les 20 acides aminés, cf cours : Les Acides Aminés) mais ceux-ci ne possèdent pas d'activité biologique. Les acides aminés sont l'alphabet de la structure protéique. L'enchaînement de ces acides aminés peut être réalisé selon un nombre presque infini de séquences pour constituer un nombre tout aussi infini de protéines différentes.
Les chaînes polypeptidiques sont allongées et enroulées autour d'un axe sous une forme hélicoïdale. Ce sont des protéines de structure.
Elles peuvent être extracellulaires et seront alors insolubles dans l'eau et auront une fonction de protection :
Elles peuvent également être intracellulaires, citons par exemple la myosine et la tropomyosine des cellules musculaires.
Attention à ne pas confondre fibreuses et filamenteuses (protéines globulaires attachées les unes aux autres).
Solubles dans l'eau, elles sont de forme sphérique. Elles ont une structure beaucoup plus complexe que les protéines fibreuses mais elles présentent une bien plus grande variété d'activités biologiques.
Elles peuvent être membranaires et auront alors des rôles comme :
Elles peuvent être solubles et donc être des protéines circulantes plasmatiques comme l'albumine, des hormones protéiques comme la LH, des protéines cytosoliques comme la calmoduline.
Elles peuvent intervenir dans:
On distingue deux grands types de protéines. Celles ne contenant que des acides aminés sont des holoprotéines.
Celles contenant une partie protéique (l'apoprotéine) et une partie non protéique sont des hétéroprotéines.
Ces deux parties sont liées de différentes façons: liaisons covalente, ionique, hydrogène, hydrophobe. Cette partie non protéique peut être un groupement prosthétique (induisant l'apparition de nouvelles propriétés biologiques en fixant, comme pour l'hème de l'hémoglobine).
Si ce sont des glucides qui sont ajoutés selon une proportion comprise entre 5 et 40% de la molécule, la protéine est dite glycoprotéines ou protéines glycosylée.
Si cette proportion de glucides passe à plus de 90% de la molécule, on pale de peptidoglycanne, ils ont un rôle passif de protection.
L'élément ajouté peut être un ou plusieurs cofacteurs métalliques (Cu, Zn ...) donnant une métalloprotéine.
Une chromoprotéine contient un pigment et une phosphoprotéine comporte un ou plusieurs phosphates inorganiques.
Il existe aussi des nucléoprotéines par l'ajout d'acides nucléiques, et des lipoprotéines par ajout de lipides.
Ces liaisons solides résultent du partage d'électrons entre deux atomes. Il en existe 4 types différents.
Les liaisons ioniques sont des liaisons faibles résultant de l'attraction entre deux groupes polaires de charges opposées.
On rencontrera donc ces liaisons entre le groupe carboxylique d'un acide aminé acide (glutamate ou aspartate) et le groupe azoté d'un acide aminé basique (lysine, histidine, arginine).
Ces liaisons peuvent s'effectuer au sein d'une même chaîne, repliant le polypeptide. Ces liaisons sont les plus fortes après les liaisons covalentes.
Elles dépendent du pH et des concentrations en sel. Elles ont une importance certaine dans les liaisons entre la protéine et d'autres molécules.
Deux atomes électro-négatifs se partagent inégalement un atome d'hydrogène. Un atome est lié par covalence à l'H, c'est l'atome donneur. L'autre atome est l'atome accepteur. Généralement on observe cette liaison entre les éléments de deux liaisons peptidiques. On les trouve également associant les radicaux des acides aminés polaires. Elles sont faibles et instables mais ces défauts sont compensés par leur très grand nombre qui leur permet d'avoir un rôle essentiel dans le maintien de la structure secondo-tertiaire. Les liaisons hydrogènes gagnent en puissance quand les trois atomes sont alignés sur un même axe.
Cette liaison se fait pour n'importe quel atome mais nécessite une distance entre atomes faible : moins de 5 angström. Chaque atome présente des fluctuations électroniques temporaires faisant de lui un dipôle transitoire. Ceci explique que deux atomes, même neutres, peuvent développer une interaction faible, la force d'attraction de Van der Walls. Leur faiblesse est compensée par leur nombre considérable, notamment lors de l'ajustement de deux surfaces macro-moléculaires.
Elles s'effectuent entre deux molécules non polaires. En présence d'eau, celles-ci auront tendance à s'associer pour exclure l'eau. Par exemple dans les protéines globulaires solubles, la zone hydrophobe (les groupements apolaires) est enfouie à l'intérieur de la molécule, excluant l'eau. Ce phénomène stabilise les structures tertiaires.
Elles naissent toutes de la grosse sous-unité 60S d'un ribosome sous la forme d'un enchaînement linéaire d'acides aminés. C'est la structure primaire dûe aux liaisons peptidiques. Par la diversité des forces attractives et répulsives des éléments de la chaîne, cette structure va évoluer en structure secondaire (aboutissement des protéines fibreuses), en structure tertiaire (obligatoire pour les protéines globulaires), voire en structure quaternaire.
In fine, cette évolution tridimensionnelle amène à une conformation spatiale spécifique : la protéine native.
La liaison peptidique, forte, en est responsable. Elle présente des atomes adjacents dans un même plan d'où le fait qu'elle soit coplanaire. Elle possède un caractère de double liaison partielle par résonance entre deux formes. Ceci lui confére une rigidité presque complète. Les rotations sont absentes et il existe donc deux conformations possibles pour la liaison: cis ou trans. C'est la conformation trans qui est observée car favorisée énergétiquement.
Les mouvements de rotation restent possibles entre le carbone α et N et entre le carbone α et le C.
On comprend donc aisément que le squelette axial est non spécifique d'une protéine mais que c'est une structure commune. Ce qui confère son identité à une protéine est l'ensemble des chaînes latérales des acides aminés protéinogènes la composant. Cet ensemble constitue la signature de la protéine.
Elle est présente aussi bien dans les protéines fibreuses que dans les protéines globulaires. Elle caractérise la kératine α ainsi que le fibrinogène et la myosine.
Cette forme hélicoïdale est le résultat de liaisons chimiques intra-moléculaires conduisant à cette structure d'escalier en spirale. Cette forme hélicoïdale a un pas à droite de 0,54 nm.
Sa stabilité est assurée par :
En un tour d'hélice on dénombre 3,66 aminocides soit 18 acides aminés en 5 tours. En général, une hélice α est constituée de 5 à plus de 40 acides aminés.
Les acides aminés favorisant la formation d'hélice α sont Ala, Glu, Leu, Met.
Les acides aminés mauvais formateurs sont Pro, Gly, Tyr, Ser.
Les hélices α peuvent être hydrophiles, amphipathique ou encore hydrophobe. Cela dépend de la composition en acides aminés de l'hélice. En effet les radicaux des acides aminés sont tournés en dehors de l'axe de l'hélice, définisant leur réaction à leur environnement. Ainsi, si l'hélice α ne comporte que des aminoacides hydrophobes, elle va se placer en contact avec des surfaces hydrophobes, comme la bicouche lipidique.
Si les résidus hydrophobes sont sur une face et les résidus hydrophiles sur l'autre face, l'hélice α sera amphipatique (ou amphiphile). C'est-à-dire qu'on le trouvera à l'interface de zones hydrophiles et hydrophobes.
Il est constitué de la juxtaposition de brins β, chaîne de conformation très étirée. Les chaînes sont présentées en "feuillet plissé" (à prendre au premier sens topographique), succession de "toits". Les liaisons peptidiques participent à cette réticulation et il existe de très nombreuses liaisons hydrogènes entre les brins.Les brins, au sein d'un feuillet, peuvent être parallèles ou antiparallèles. Ce dernier type de feuillet est plus stable car les liaisons hydrogènes sont dans un alignement parfait. Après les hélices α, ils dominent dans les structures secondaires des protéines.
Sont très souvent présents dans les feuillets β : Gly, Val, Ile (3 acides aminés apolaires).
In vivo, les feuillets β ne possèdent pas une structure 3D vraiment plate. Ils sont soumis à une torsion dans les protéines. Ils sont donc représentés par un bouquet de flèches indiquant le sens du brin : de l'extrémité amino terminale vers la carboxy terminale, et la torsion. On les trouvera fréquemment enfouis dans la structure tertiaire des protéines globulaires.
A peu près un tiers des acides aminés d'une protéines font partie de boucles ou coudes permettant les demi-tours de la chaîne peptidique.
Les coudes lient généralement deux brins β antiparalléles. Ils comportent 2 à 4 aminoacides, sont donc courts. Plus ils sont courts, moins nombreuses sont les conformations spatiales possibles. Pour les stabilisés, il peut y avoir un pont hydrogène entre le premier et le quatrième acide aminé. Les acides aminés bons formateurs de coudes sont Gly et Pro.
Les boucles sont plus longues et conmportent donc plus de 4 acides aminés. Elles permettent donc plus de conformations possibles. Tous les aminoacides des boucles ne participent pas à des liaisons hydrogène intramoléculaires. Cela leur permet une interaction plus facile avec le solvant.
Généralement, on trouve des boucles entre : des hélices α, des hélices α et des brins β, des brins β parallèles ou de feuillets différents.
Les facteurs de transcription comportent un motif très particulier : hélice-boucle-hélice.
Poly-pro et poly-gly sont des polymères synthètiques de proline et glycine.
En solvant aqueux poly-pro a une conformation d'hélice gauche, poly-gly oscille entre hélice gauche et feuillet β.
Les chaînes contenant naturellement ces deux acides aminés peuvent donc avoir une structure en hélice gauche, comme le collagène. Les hélices gauches sont plus petites que les hélices α, elles ne comptent que trois acides aminés par tour d'hélice.
Elles ne concernent facultativement que les protéines globulaires. Celles-ci sont souples et possèdent des activités très diverses. Les structures (ou motifs) super-secondaires correspondent à des associations caractéristiques de feuillets et hélices fréquentes.
Le motif de "main EF" de la calmoduline est un motif supersecondaire hélice-boucle-hélice. La boucle va loger un atome de calcium. Certaines propriétés biologiques sont liées à ces structures.
Citons également: le motif de clé grecque (4 brins β), la fermeture éclair de Leucine (2 hélices α), le motif doigt de zinc (1 boucle, un atome de zinc, 2 Cys + 2His ou 4 Cys), le motif brin β- hélice α- brin β.
Elle ne s'applique obligatoirement qu'aux protéines globulaires.
Cette structure tridimensionnelle très compacte, enroulée comporte les structures secondaires précédemment vues et des segments sans structure secondaire.
On retrouve donc également les interactions ioniques, les interactions hydrophobes (fortes au centre de la protéine), les liaisons hydrogènes stabilisant les repliements, les forces de Van der Walls, les ponts disulfures. Ces derniers se créent après achèvement du repliement tridimensionnel de la protéine et ont un rôle prépondérant dans le maintien de la structure tertiaire.
La structure tertiaire d'une protéine globulaire est sa conformation tridimensionnelle biologiquement active.
Le repliement d'une protéine est ce qui relie le génome à la fonction
Ceci nous amène à définir la notion de domaines. Les domaines sont des sous-unités compactes. Elles sont liées par des séquences peptidiques généralement courtes et sans structure secondaire. Ces domaines sont presque "indépendants" du reste de la structure tertiaire de la protéine globulaire. En effet ils ont leur propre structure tertiaire et sont stables indépendamment du reste de la chaîne polypeptidique. Leur correspond une fonction spécifique de la protéine.
Cela introduit la notion de stéréospécificité. Ces domaines peuvent topographiquement se présenter comme des crevasses, des zones particulières. Cette configuration spatiale doit répondre à celles d'autres structures d'autres molécules.
Structure tridimensionnelle, stéréospécificité et rôle biologique sont donc nécessairement liés. C'est ce qui définit la notion de site actif : la conformation spatiale de protéine rapproche des acides aminés normalement éloignés et forme le site actif, site actif souvent logé dans la crevasse.
On observera donc la reconnaissance ligand-protéine. Cette reconnaissance s'effectue par complémentarité puis établissement de liaisons non covalentes ne nécessitant pas l'intervention d'un catalyseur.
Ce type de structure ne concerne que facultativement les protéines globulaires. Il s'agit de l'association de sous-unités dans une même molécule protéique. Ces sous-unités sont toujours reliées par des liaisons faibles et jamais par des liaisons covalentes. Une sous-unité à l'état libre est un monomère. La protéine est un oligomère. L'élément de symétrie se répétant n fois est un protomère. Si toutes les sous-unités sont identiques le protomère prend le nom du monomère (exemple : protéine α4). Si la protéine est constituée de 2 monomères α et 2 monomères β alors le protomère est [ αβ ] et la protéine contient 2 fois le protomère, elle est dite " α2 β 2". C'est par exemple le cas de l'hémoglobine.
La cristallographie aux rayons X est la première méthode d'étude a avoir permis la description de la structure d'une protéine. Cette technique est difficile car la première étape, l'obtention d'un cristal à partir d'une protéine pure, nécessite une quantité importante de protéines. Le cristal obtenu est ensuite passé aux rayons X sous différents angles et donne des spectres de diffraction.
Ultime étape: on effectue un relevé des courbes d'égale densité électronique du cristal et on reconstitue une carte de densité électronique en 3D.
Et, est réalisé en paralléle le séquençage de la protéine pour avoir des résultats se complétant.
La résonance magnétique nucléaire étudie la structure de la protéine solubilisée.
Les études les plus importantes déterminant ces modes sont les travaux de Anfinsen.
Dogme de Anfinsen : "La structure secondaire des polypeptides comme l'hélice α ou la configuration β est le résultat spontané et automatique de son contenu et de sa séquence en acides aminés. La structure secondaire d'une protéine est sa forme la plus stable dans des conditions biologiques données."
Donc à retenir, selon Anfinsen :
Depuis, d'autres recherches permettent aujourd'hui de dire que ce dogme doit être nuancé.
En effet certaines protéines nécessitent l'aide de protéines chaperonnes pour accéder à un repliement correct. Deux raisons possibles à cela
Les chaperonines vont donc agir en entourant les chaînes polypeptidiques, les protégeant du milieu cytoplasmique, de la polarité et des autoaggrégations. Il peut arriver que pour le repliement correct d'une protéine, plusieurs chaperones soient nécessaires. (cf HSP cours histo-cyto)
Le paradoxe de Levinthal énonce que pour un polypeptide de 100 résidus, il y a 2100 conformations possibles mais une seule existe au sein de la cellule. S'ajoute en plus de ce paradoxe des modèles théoriques différents.
Actuellement, il est dit que l'enroulement des protéines globulaires commence par la formation locale de structure secondaire. Celles-ci intéragissent et s'ajustent afin d'aboutir à la structure tertiaire finale. Tout ceci est influencé par les résidus hydrophobes souhaitant vivement exclure l'eau, la formation d'hélice α de certaines chaînes polypeptidiques et la nécessité de stabilité en développant le plus de liaisons hydrogènes et ioniques.
Deux méthodes pour prédire la structure d'une protéine séquencée :
La rupture de liaisons secondaires stabilisant la conformation peut mener à une structure désordonnée caractérisant l'état dénaturé. La protéine est alors insoluble en milieu aqueux par perte de ses propriétés enzymatiques.
Les liaisons peptidiques, donc la structure primaire, ne sont pas atteintes par la dénaturation.