Prédire l'Interaction des Protéines de la Superfamille du MHC avec la Beta2-Microglobuline en Combinant Classifieur Bayesien et Alignement Multiple

Élodie Duprat 1 Marie-Paule Lefranc 1 Olivier Gascuel 2
2 MAB - Méthodes et Algorithmes pour la Bioinformatique
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : Motivations: Les protéines du complexe majeur d’histocompatibilité (MHC) assurent une fonction essentielle au sein du système immunitaire, en présentant des peptides du soi ou des peptides antigéniques aux récepteurs T. La liaison non covalente de la beta2-microglobuline aux protéines du MHC de classe I est nécessaire à leur expression à la surface cellulaire et à la présentation des peptides. La superfamille du MHC regroupe les protéines de structure homologue aux protéines MHC-I. Ces protéines sont impliquées dans une grande variété de processus biologiques et interagissent ou non avec la beta2-microglobuline. La prédiction de la liaison (ou de l'absence de liaison) à la beta2-microglobuline, pour des protéines de la superfamille du MHC nouvellement identifiées, permettrait d’une part d’indiquer leur mécanisme de reconnaissance moléculaire, et d’autre part de détecter des mutants pathologiques dont l’expression à la surface cellulaire est affectée. La description standardisée des domaines et la méthode d'alignement (pour partie structurale) mises en place au sein d'IMGT s’appliquent avec succès aux protéines de la superfamille du MHC malgré leur faible similarité de séquence, et fournissent une numérotation unique des résidus qui favorise le développement d'une telle approche prédictive.
Résultats: La méthode proposée combine un classifieur Bayesien dit naïf et la numérotation unique IMGT. Elle est composée de deux étapes : un ensemble de descripteurs binaires discriminants (associant une position dans l’alignement et un groupe d’acides aminés) est tout d’abord extrait des données ; les fréquences de ces descripteurs sont ensuite estimées conditionnellement aux classes que l’on cherche à séparer, pour construire le classifieur. Nous appliquons cette approche à un jeu de données composé de 807 séquences alignées, correspondant aux allèles de 47 gènes de la superfamille du MHC. 18 descripteurs sont sélectionnés pour leur capacité à discriminer les protéines selon qu’elles se lient ou non à la beta2-microglobuline. L’analyse structurale des protéines du jeu de données montre que ces descripteurs correspondent à des sites potentiels de contact à la beta2-microglobuline ou à des sites impliqués dans le maintien d’une conformation favorable au contact. La performance du classifieur est évaluée par la procédure de ''leave-one-out'', déclinée en 3 modes qui distinguent les cas où la prédiction concerne un nouveau gène, une espèce non référencée au sein des données ou un nouveau type de récepteur, avec respectivement 98%, 93% et 79% de succès. Ces taux élevés de bonne prédiction mettent en évidence l’efficacité de l’approche proposée, qui devrait trouver des applications dans d’autres problématiques biologiques.
Données complémentaires: Les séquences alignées de la superfamille du MHC qui composent le jeu de données sont accessibles dans les sections MHC et RPI d’IMGT Repertoire ; les structures actuellement résolues sont accessibles sous forme de fichiers de coordonnées annotés dans IMGT/3Dstructure-DB (http://imgt.cines.fr).
Type de document :
Communication dans un congrès
G. Perrière; A. Guénoche; A. Geourjon. JOBIM: Journées Ouvertes Biologie, Informatique, Mathématiques, Jul 2005, Lyon, France. 6e Journées Ouvertes Biologie, Informatique, Mathématiques, pp.405-416, 2005
Liste complète des métadonnées

Littérature citée [34 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00106496
Contributeur : Christine Carvalho de Matos <>
Soumis le : lundi 16 octobre 2006 - 08:29:49
Dernière modification le : jeudi 11 janvier 2018 - 06:26:12
Document(s) archivé(s) le : mardi 6 avril 2010 - 19:45:54

Fichier

Identifiants

  • HAL Id : lirmm-00106496, version 1

Collections

Citation

Élodie Duprat, Marie-Paule Lefranc, Olivier Gascuel. Prédire l'Interaction des Protéines de la Superfamille du MHC avec la Beta2-Microglobuline en Combinant Classifieur Bayesien et Alignement Multiple. G. Perrière; A. Guénoche; A. Geourjon. JOBIM: Journées Ouvertes Biologie, Informatique, Mathématiques, Jul 2005, Lyon, France. 6e Journées Ouvertes Biologie, Informatique, Mathématiques, pp.405-416, 2005. 〈lirmm-00106496〉

Partager

Métriques

Consultations de la notice

112

Téléchargements de fichiers

70