Cours-Medecine.info : Structure des protéines

Structure des protéines

Classification en protéines fibreuses, globulaires. Composition, liaisons internes (covalente, ionique). Structure des protéines, dénaturation Print

Sommaire

1. Modes de classification des protéines
2. Liaisons et intéractions chimiques des protéines
3. Structure de protéines

Les proteines sont les macromolécules cellulaires les plus abondantes constituant 60% du poids sec des cellules.
Elles sont constituées d'une ou plusieurs chaînes polypeptidiques et ont un poids moléculaire supérieur à 10.000. Elles ont une structure particulière et diversifiée. Les chaînes polypeptidiques se replient plus ou moins fortement sur elles-mêmes induisant un grand nombre de structures tridimensionnelles différentes.
C'est ceci qui est à l'origine d'une diversité de fonction leur permettant d'être responsables de milliers de réactions différentes dans la cellule. Leur nom de "nanomachines" cellulaires est ainsi justifié.
Par la très grande diversité de réactions cellulaires, on imagine facilement que le nombre de protéines différentes connues à ce jour est très important: 60 000. Les protéines sont issues de la traduction et transcription des gènes, leur synthèse est donc sous contrôle génétique.
Toutes les protéines sont donc constituées d'acides aminés (les 20 acides aminés, cf cours : Les Acides Aminés) mais ceux-ci ne possèdent pas d'activité biologique. Les acides aminés sont l'alphabet de la structure protéique. L'enchaînement de ces acides aminés peut être réalisé selon un nombre presque infini de séquences pour constituer un nombre tout aussi infini de protéines différentes.

1. Modes de classification des protéines

1.1. Selon leurs formes

1.1.1. Protéines fibreuses

Les chaînes polypeptidiques sont allongées et enroulées autour d'un axe sous une forme hélicoïdale. Ce sont des protéines de structure.
Elles peuvent être extracellulaires et seront alors insolubles dans l'eau et auront une fonction de protection :

kératine α des cheveux,
fibroïne de la soie,
élastine de la peau,
collagène des tendons.

Elles peuvent également être intracellulaires, citons par exemple la myosine et la tropomyosine des cellules musculaires.
Attention à ne pas confondre fibreuses et filamenteuses (protéines globulaires attachées les unes aux autres).

1.1.2. Protéines globulaires

Solubles dans l'eau, elles sont de forme sphérique. Elles ont une structure beaucoup plus complexe que les protéines fibreuses mais elles présentent une bien plus grande variété d'activités biologiques.
Elles peuvent être membranaires et auront alors des rôles comme :

transporteur,
récepteurs,
canaux ioniques,
liaisons GAP,
protéines d'adhésion cellulaire ...

Elles peuvent être solubles et donc être des protéines circulantes plasmatiques comme l'albumine, des hormones protéiques comme la LH, des protéines cytosoliques comme la calmoduline.

1.2. Selon leurs fonctions

Elles peuvent intervenir dans:

la structure et le soutien, c'est le cas du collagène, de l'élastine, des glycoprotéines membranaires...
la contraction : actine, myosine...
l'adhésion cellulaire comme les protéines des GAP junctions et les protéines telles que la cadhérine,
la réception de signaux tels les récepteurs membranaires de l'insuline ou les récepteurs intracellulaire des stéroïdes,
la transduction de signaux, l'exemple type étant constitué par les protéines G membranaires (cf cours : La Communication Cellulaire),
un signal: elles peuvent être la molécule informative comme des facteurs de croissance (EGF) ou des hormones protéiques (FSH),
l'immunité, c'est le rôle des immunoglobulines,
le transport comme l'hémoglobine (O₂) et la transferrine (fer),
les catalyses : ces protéines joueront donc également un rôle dans le métabolisme, la réplication et transcription de l'ADN, la contraction musculaire, la signalisation cellulaire...

1.3. Selon leur composition

On distingue deux grands types de protéines. Celles ne contenant que des acides aminés sont des holoprotéines.
Celles contenant une partie protéique (l'apoprotéine) et une partie non protéique sont des hétéroprotéines.
Ces deux parties sont liées de différentes façons: liaisons covalente, ionique, hydrogène, hydrophobe. Cette partie non protéique peut être un groupement prosthétique (induisant l'apparition de nouvelles propriétés biologiques en fixant, comme pour l'hème de l'hémoglobine).

Si ce sont des glucides qui sont ajoutés selon une proportion comprise entre 5 et 40% de la molécule, la protéine est dite glycoprotéines ou protéines glycosylée.
Si cette proportion de glucides passe à plus de 90% de la molécule, on pale de peptidoglycanne, ils ont un rôle passif de protection.

L'élément ajouté peut être un ou plusieurs cofacteurs métalliques (Cu, Zn ...) donnant une métalloprotéine.
Une chromoprotéine contient un pigment et une phosphoprotéine comporte un ou plusieurs phosphates inorganiques.
Il existe aussi des nucléoprotéines par l'ajout d'acides nucléiques, et des lipoprotéines par ajout de lipides.

2. Liaisons et intéractions chimiques des protéines

2.1. Les liaisons de covalence

Ces liaisons solides résultent du partage d'électrons entre deux atomes. Il en existe 4 types différents.

La liaison peptidique -CO-NH- est la liaison responsable de la formation du squelette carboné, de la structure primaire des protéines. C'est une liaison amide formée entre la fonction α carboxylique d'un acide aminé et la fonction α aminée d'un autre aminoacide.
La liaison carbone-carbone -CH-CO existe dans les acides aminés composant la protéine mais joue un rôle dans la formation du squelette.
Les ponts disulfures sont retrouvés en abondance dans les protéines et sont caractéristiques de la structure tertiaire des protéines globulaires. On les rencontre fréquemment dans les protéines fibreuses. Le pont s'établit (facultativement) entre deux cystéines et est rompu sous l'action du mercapto-éthanol.
Les ponts desmosines relient 4 molécules de lysine. Caractéristiques de l'élastine, ils se forment grâce à la lysyl-oxydase.

2.2.Les liaisons ioniques

Les liaisons ioniques sont des liaisons faibles résultant de l'attraction entre deux groupes polaires de charges opposées. On rencontrera donc ces liaisons entre le groupe carboxylique d'un acide aminé acide (glutamate ou aspartate) et le groupe azoté d'un acide aminé basique (lysine, histidine, arginine).
Ces liaisons peuvent s'effectuer au sein d'une même chaîne, repliant le polypeptide. Ces liaisons sont les plus fortes après les liaisons covalentes.
Elles dépendent du pH et des concentrations en sel. Elles ont une importance certaine dans les liaisons entre la protéine et d'autres molécules.

2.3. Les liaisons hydrogènes

Deux atomes électro-négatifs se partagent inégalement un atome d'hydrogène. Un atome est lié par covalence à l'H, c'est l'atome donneur. L'autre atome est l'atome accepteur. Généralement on observe cette liaison entre les éléments de deux liaisons peptidiques. On les trouve également associant les radicaux des acides aminés polaires. Elles sont faibles et instables mais ces défauts sont compensés par leur très grand nombre qui leur permet d'avoir un rôle essentiel dans le maintien de la structure secondo-tertiaire. Les liaisons hydrogènes gagnent en puissance quand les trois atomes sont alignés sur un même axe.

2.4. Forces de Van der Walls

Cette liaison se fait pour n'importe quel atome mais nécessite une distance entre atomes faible : moins de 5 angström. Chaque atome présente des fluctuations électroniques temporaires faisant de lui un dipôle transitoire. Ceci explique que deux atomes, même neutres, peuvent développer une interaction faible, la force d'attraction de Van der Walls. Leur faiblesse est compensée par leur nombre considérable, notamment lors de l'ajustement de deux surfaces macro-moléculaires.

2.5. Interactions hydrophobes

Elles s'effectuent entre deux molécules non polaires. En présence d'eau, celles-ci auront tendance à s'associer pour exclure l'eau. Par exemple dans les protéines globulaires solubles, la zone hydrophobe (les groupements apolaires) est enfouie à l'intérieur de la molécule, excluant l'eau. Ce phénomène stabilise les structures tertiaires.

3. Structure de protéines

Elles naissent toutes de la grosse sous-unité 60S d'un ribosome sous la forme d'un enchaînement linéaire d'acides aminés. C'est la structure primaire dûe aux liaisons peptidiques. Par la diversité des forces attractives et répulsives des éléments de la chaîne, cette structure va évoluer en structure secondaire (aboutissement des protéines fibreuses), en structure tertiaire (obligatoire pour les protéines globulaires), voire en structure quaternaire.
In fine, cette évolution tridimensionnelle amène à une conformation spatiale spécifique : la protéine native.

3.1.Structure primaire

La liaison peptidique, forte, en est responsable. Elle présente des atomes adjacents dans un même plan d'où le fait qu'elle soit coplanaire. Elle possède un caractère de double liaison partielle par résonance entre deux formes. Ceci lui confére une rigidité presque complète. Les rotations sont absentes et il existe donc deux conformations possibles pour la liaison: cis ou trans. C'est la conformation trans qui est observée car favorisée énergétiquement.
Les mouvements de rotation restent possibles entre le carbone α et N et entre le carbone α et le C.

On comprend donc aisément que le squelette axial est non spécifique d'une protéine mais que c'est une structure commune. Ce qui confère son identité à une protéine est l'ensemble des chaînes latérales des acides aminés protéinogènes la composant. Cet ensemble constitue la signature de la protéine.

3.2. Structure secondaire

3.2.1. L'hélice α droite

Elle est présente aussi bien dans les protéines fibreuses que dans les protéines globulaires. Elle caractérise la kératine α ainsi que le fibrinogène et la myosine.
Cette forme hélicoïdale est le résultat de liaisons chimiques intra-moléculaires conduisant à cette structure d'escalier en spirale. Cette forme hélicoïdale a un pas à droite de 0,54 nm.
Sa stabilité est assurée par :

des liaisons hydrogène qui se constituent entre des groupements C=O et NH distants de 4 acides aminés. ces liaisons ont une inclinaison de 30°.
des interactions de Van der Walls.
sa longueur: plus une hélice α est longue, plus elle est stable par une très forte coopérativité.

En un tour d'hélice on dénombre 3,66 aminocides soit 18 acides aminés en 5 tours. En général, une hélice α est constituée de 5 à plus de 40 acides aminés.
Les acides aminés favorisant la formation d'hélice α sont Ala, Glu, Leu, Met.
Les acides aminés mauvais formateurs sont Pro, Gly, Tyr, Ser.

Les hélices α peuvent être hydrophiles, amphipathique ou encore hydrophobe. Cela dépend de la composition en acides aminés de l'hélice. En effet les radicaux des acides aminés sont tournés en dehors de l'axe de l'hélice, définisant leur réaction à leur environnement. Ainsi, si l'hélice α ne comporte que des aminoacides hydrophobes, elle va se placer en contact avec des surfaces hydrophobes, comme la bicouche lipidique.
Si les résidus hydrophobes sont sur une face et les résidus hydrophiles sur l'autre face, l'hélice α sera amphipatique (ou amphiphile). C'est-à-dire qu'on le trouvera à l'interface de zones hydrophiles et hydrophobes.

3.2.2. Le feuillet plissé β

Il est constitué de la juxtaposition de brins β, chaîne de conformation très étirée. Les chaînes sont présentées en "feuillet plissé" (à prendre au premier sens topographique), succession de "toits". Les liaisons peptidiques participent à cette réticulation et il existe de très nombreuses liaisons hydrogènes entre les brins.Les brins, au sein d'un feuillet, peuvent être parallèles ou antiparallèles. Ce dernier type de feuillet est plus stable car les liaisons hydrogènes sont dans un alignement parfait. Après les hélices α, ils dominent dans les structures secondaires des protéines.
Sont très souvent présents dans les feuillets β : Gly, Val, Ile (3 acides aminés apolaires).
In vivo, les feuillets β ne possèdent pas une structure 3D vraiment plate. Ils sont soumis à une torsion dans les protéines. Ils sont donc représentés par un bouquet de flèches indiquant le sens du brin : de l'extrémité amino terminale vers la carboxy terminale, et la torsion. On les trouvera fréquemment enfouis dans la structure tertiaire des protéines globulaires.

3.2.3. Les boucles et les coudes (ou tours)

A peu près un tiers des acides aminés d'une protéines font partie de boucles ou coudes permettant les demi-tours de la chaîne peptidique. Les coudes lient généralement deux brins β antiparalléles. Ils comportent 2 à 4 aminoacides, sont donc courts. Plus ils sont courts, moins nombreuses sont les conformations spatiales possibles. Pour les stabilisés, il peut y avoir un pont hydrogène entre le premier et le quatrième acide aminé. Les acides aminés bons formateurs de coudes sont Gly et Pro.
Les boucles sont plus longues et conmportent donc plus de 4 acides aminés. Elles permettent donc plus de conformations possibles. Tous les aminoacides des boucles ne participent pas à des liaisons hydrogène intramoléculaires. Cela leur permet une interaction plus facile avec le solvant.
Généralement, on trouve des boucles entre : des hélices α, des hélices α et des brins β, des brins β parallèles ou de feuillets différents.
Les facteurs de transcription comportent un motif très particulier : hélice-boucle-hélice.

3.2.4. Poly-gly, poly-pro, hélice gauche du collagène

Poly-pro et poly-gly sont des polymères synthètiques de proline et glycine.
En solvant aqueux poly-pro a une conformation d'hélice gauche, poly-gly oscille entre hélice gauche et feuillet β.
Les chaînes contenant naturellement ces deux acides aminés peuvent donc avoir une structure en hélice gauche, comme le collagène. Les hélices gauches sont plus petites que les hélices α, elles ne comptent que trois acides aminés par tour d'hélice.

3.3. Structures super-secondaires

Elles ne concernent facultativement que les protéines globulaires. Celles-ci sont souples et possèdent des activités très diverses. Les structures (ou motifs) super-secondaires correspondent à des associations caractéristiques de feuillets et hélices fréquentes.
Le motif de "main EF" de la calmoduline est un motif supersecondaire hélice-boucle-hélice. La boucle va loger un atome de calcium. Certaines propriétés biologiques sont liées à ces structures.
Citons également: le motif de clé grecque (4 brins β), la fermeture éclair de Leucine (2 hélices α), le motif doigt de zinc (1 boucle, un atome de zinc, 2 Cys + 2His ou 4 Cys), le motif brin β- hélice α- brin β.

3.4. Structure tertiaire

Elle ne s'applique obligatoirement qu'aux protéines globulaires.

Cette structure tridimensionnelle très compacte, enroulée comporte les structures secondaires précédemment vues et des segments sans structure secondaire.
On retrouve donc également les interactions ioniques, les interactions hydrophobes (fortes au centre de la protéine), les liaisons hydrogènes stabilisant les repliements, les forces de Van der Walls, les ponts disulfures. Ces derniers se créent après achèvement du repliement tridimensionnel de la protéine et ont un rôle prépondérant dans le maintien de la structure tertiaire. La structure tertiaire d'une protéine globulaire est sa conformation tridimensionnelle biologiquement active.

Le repliement d'une protéine est ce qui relie le génome à la fonction

Ceci nous amène à définir la notion de domaines. Les domaines sont des sous-unités compactes. Elles sont liées par des séquences peptidiques généralement courtes et sans structure secondaire. Ces domaines sont presque "indépendants" du reste de la structure tertiaire de la protéine globulaire. En effet ils ont leur propre structure tertiaire et sont stables indépendamment du reste de la chaîne polypeptidique. Leur correspond une fonction spécifique de la protéine.
Cela introduit la notion de stéréospécificité. Ces domaines peuvent topographiquement se présenter comme des crevasses, des zones particulières. Cette configuration spatiale doit répondre à celles d'autres structures d'autres molécules.
Structure tridimensionnelle, stéréospécificité et rôle biologique sont donc nécessairement liés. C'est ce qui définit la notion de site actif : la conformation spatiale de protéine rapproche des acides aminés normalement éloignés et forme le site actif, site actif souvent logé dans la crevasse. On observera donc la reconnaissance ligand-protéine. Cette reconnaissance s'effectue par complémentarité puis établissement de liaisons non covalentes ne nécessitant pas l'intervention d'un catalyseur.

3.5. Structure quaternaire

Ce type de structure ne concerne que facultativement les protéines globulaires. Il s'agit de l'association de sous-unités dans une même molécule protéique. Ces sous-unités sont toujours reliées par des liaisons faibles et jamais par des liaisons covalentes. Une sous-unité à l'état libre est un monomère. La protéine est un oligomère. L'élément de symétrie se répétant n fois est un protomère. Si toutes les sous-unités sont identiques le protomère prend le nom du monomère (exemple : protéine α4). Si la protéine est constituée de 2 monomères α et 2 monomères β alors le protomère est [ αβ ] et la protéine contient 2 fois le protomère, elle est dite " α2 β 2". C'est par exemple le cas de l'hémoglobine.

3.6. Mode d'étude de la structure des protéines

La cristallographie aux rayons X est la première méthode d'étude a avoir permis la description de la structure d'une protéine. Cette technique est difficile car la première étape, l'obtention d'un cristal à partir d'une protéine pure, nécessite une quantité importante de protéines. Le cristal obtenu est ensuite passé aux rayons X sous différents angles et donne des spectres de diffraction.
Ultime étape: on effectue un relevé des courbes d'égale densité électronique du cristal et on reconstitue une carte de densité électronique en 3D.
Et, est réalisé en paralléle le séquençage de la protéine pour avoir des résultats se complétant.
La résonance magnétique nucléaire étudie la structure de la protéine solubilisée.

3.7. Modes de repliement des protéines

Les études les plus importantes déterminant ces modes sont les travaux de Anfinsen.

Dogme de Anfinsen : "La structure secondaire des polypeptides comme l'hélice α ou la configuration β est le résultat spontané et automatique de son contenu et de sa séquence en acides aminés. La structure secondaire d'une protéine est sa forme la plus stable dans des conditions biologiques données."

Donc à retenir, selon Anfinsen :

le repliement des protéines est sous contrôle thermodynamique,
le seul déterminant est la séquence,
la forme pliée est celle qui présente l'énergie libre la plus basse.

Depuis, d'autres recherches permettent aujourd'hui de dire que ce dogme doit être nuancé.
En effet certaines protéines nécessitent l'aide de protéines chaperonnes pour accéder à un repliement correct. Deux raisons possibles à cela

soit parce que la séquence ne contient pas les informations nécessaires,
soit parce que la séquence contient des informations ne pouvant s'exprimer dans un milieu aqueux salin tel que le cytoplasme.

Les chaperonines vont donc agir en entourant les chaînes polypeptidiques, les protégeant du milieu cytoplasmique, de la polarité et des autoaggrégations. Il peut arriver que pour le repliement correct d'une protéine, plusieurs chaperones soient nécessaires. (cf HSP cours histo-cyto)

Le paradoxe de Levinthal énonce que pour un polypeptide de 100 résidus, il y a 2¹⁰⁰ conformations possibles mais une seule existe au sein de la cellule. S'ajoute en plus de ce paradoxe des modèles théoriques différents.

Le modèle de la condensation hydrophobe dit que les résidus hydrophobes s'enfouissent et ensuite la chaîne évolue en structure secondaire puis tertiaire.
Le modèle de diffusion-collision évoque la naissance de microdomaines diffusant et entrant en collision créant des structures secondaires transitoires, celles-ci menant aux structures tertiaires.

Actuellement, il est dit que l'enroulement des protéines globulaires commence par la formation locale de structure secondaire. Celles-ci intéragissent et s'ajustent afin d'aboutir à la structure tertiaire finale. Tout ceci est influencé par les résidus hydrophobes souhaitant vivement exclure l'eau, la formation d'hélice α de certaines chaînes polypeptidiques et la nécessité de stabilité en développant le plus de liaisons hydrogènes et ioniques.

3.8. Prédiction de la structure d'une protéine à partir de sa séquence

Deux méthodes pour prédire la structure d'une protéine séquencée :

la comparaison : actuellement la plus utilisée, compare le résultat du séquençage (séquences théoriques d'acides aminés et pourcentage : 10% d'Ala, 30% de Glu...) avec le contenu d'une banque de données de protéines connues et ayant un rapport avec celle étudiée. On obtient une homologie supérieure à 50%.
la modélisation mathématique pure : les séquences d'acides aminés sont traitées selon l'hypothèse thermodynamique. Elle est utilisé suite à une recherche par homologie infructeuse.

3.9. Dénaturation

La rupture de liaisons secondaires stabilisant la conformation peut mener à une structure désordonnée caractérisant l'état dénaturé. La protéine est alors insoluble en milieu aqueux par perte de ses propriétés enzymatiques.
Les liaisons peptidiques, donc la structure primaire, ne sont pas atteintes par la dénaturation.

3.9.1. Agents dénaturants physiques

la chaleur : son action est irréversible à 100°C. Dès 60°C, beaucoup de protéines sensibles à la chaleur sont dénaturées.
l'agitation mécanique : irréversible, elle peut-être illustrée par les ultra sons.

3.9.2. Agents dénaturants chimiques

les solvants organiques miscibles à l'eau (éthanol, acétone): les protéines sont précipitées car insolubles dans ces milieux. Effectuée à température ambiante, la dénaturation sera irréversible. Si la précipitation se fait à moins de 0°C, la dénaturation sera réversible et la protéine retrouvera ses propriétés biologiques après élimination du solvant.
les sels (sulfate d'ammonium : SO₄ (NH₄)₂ ) : précipitant les protéines, leur action sera irréversible sauf si réalisée à froid ( > 0°C). On trouve leur utilisation dans le fractionnement des protéines.
les acides forts (acide perchlorique, acide trichloracétique) : ils dénaturent irréversiblement les protéines en les précipitant suite à la rupture des laisons salines.
détergents anioniques (Sodium-Dodecyl-Sulfate) : ils perturbent les liaisons ioniques dans un milieu dissociant, ce qui a pour fin de séparer les sous-unités des structures quaternaires. Leur action est réversible.
urée : comme le SDS, c'est un milieu dissociant à action réversible après élimination. Elle rompt les liaisons hydrogènes.