Prédire l'Interaction des Protéines de la Superfamille du MHC avec la Beta2-Microglobuline en Combinant Classifieur Bayesien et Alignement Multiple - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2005

Prédire l'Interaction des Protéines de la Superfamille du MHC avec la Beta2-Microglobuline en Combinant Classifieur Bayesien et Alignement Multiple

Résumé

Motivations: Les protéines du complexe majeur d’histocompatibilité (MHC) assurent une fonction essentielle au sein du système immunitaire, en présentant des peptides du soi ou des peptides antigéniques aux récepteurs T. La liaison non covalente de la beta2-microglobuline aux protéines du MHC de classe I est nécessaire à leur expression à la surface cellulaire et à la présentation des peptides. La superfamille du MHC regroupe les protéines de structure homologue aux protéines MHC-I. Ces protéines sont impliquées dans une grande variété de processus biologiques et interagissent ou non avec la beta2-microglobuline. La prédiction de la liaison (ou de l'absence de liaison) à la beta2-microglobuline, pour des protéines de la superfamille du MHC nouvellement identifiées, permettrait d’une part d’indiquer leur mécanisme de reconnaissance moléculaire, et d’autre part de détecter des mutants pathologiques dont l’expression à la surface cellulaire est affectée. La description standardisée des domaines et la méthode d'alignement (pour partie structurale) mises en place au sein d'IMGT s’appliquent avec succès aux protéines de la superfamille du MHC malgré leur faible similarité de séquence, et fournissent une numérotation unique des résidus qui favorise le développement d'une telle approche prédictive.
Résultats: La méthode proposée combine un classifieur Bayesien dit naïf et la numérotation unique IMGT. Elle est composée de deux étapes : un ensemble de descripteurs binaires discriminants (associant une position dans l’alignement et un groupe d’acides aminés) est tout d’abord extrait des données ; les fréquences de ces descripteurs sont ensuite estimées conditionnellement aux classes que l’on cherche à séparer, pour construire le classifieur. Nous appliquons cette approche à un jeu de données composé de 807 séquences alignées, correspondant aux allèles de 47 gènes de la superfamille du MHC. 18 descripteurs sont sélectionnés pour leur capacité à discriminer les protéines selon qu’elles se lient ou non à la beta2-microglobuline. L’analyse structurale des protéines du jeu de données montre que ces descripteurs correspondent à des sites potentiels de contact à la beta2-microglobuline ou à des sites impliqués dans le maintien d’une conformation favorable au contact. La performance du classifieur est évaluée par la procédure de ''leave-one-out'', déclinée en 3 modes qui distinguent les cas où la prédiction concerne un nouveau gène, une espèce non référencée au sein des données ou un nouveau type de récepteur, avec respectivement 98%, 93% et 79% de succès. Ces taux élevés de bonne prédiction mettent en évidence l’efficacité de l’approche proposée, qui devrait trouver des applications dans d’autres problématiques biologiques.
Données complémentaires: Les séquences alignées de la superfamille du MHC qui composent le jeu de données sont accessibles dans les sections MHC et RPI d’IMGT Repertoire ; les structures actuellement résolues sont accessibles sous forme de fichiers de coordonnées annotés dans IMGT/3Dstructure-DB (http://imgt.cines.fr).

Domaines

Autre [cs.OH]
Fichier principal
Vignette du fichier
D584.PDF (331.43 Ko) Télécharger le fichier
Loading...

Dates et versions

lirmm-00106496 , version 1 (16-10-2006)

Identifiants

  • HAL Id : lirmm-00106496 , version 1

Citer

Élodie Duprat, Marie-Paule Lefranc, Olivier Gascuel. Prédire l'Interaction des Protéines de la Superfamille du MHC avec la Beta2-Microglobuline en Combinant Classifieur Bayesien et Alignement Multiple. JOBIM: Journées Ouvertes Biologie, Informatique, Mathématiques, Jul 2005, Lyon, France. pp.405-416. ⟨lirmm-00106496⟩
94 Consultations
137 Téléchargements

Partager

Gmail Facebook X LinkedIn More