CAT : Un Modèle Phylogénétique Bayésien permettant de prendre en compte l'Hétérogénéité des Processus de Substitution entre Sites dans les Alignements Protéiques

Nicolas Lartillot 1 Hervé Philippe 2
1 MAB - Méthodes et Algorithmes pour la Bioinformatique
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : We propose a Bayesian mixture model, accounting for across-site heterogeneities of the substi- tutional processes in protein sequences. Our model, CAT, is based on the formalism of the Dirichlet processes, in which the total number of classes of the underlying mixture is not specified a priori, but rather, is considered an unknown of the problem, and is directly inferred from the available data. In this paper, we describe the model, and show its connections with the Bayesian non-parametric approach for modeling hetero- geneity. We apply it to a series of alignments of real proteins, and uncover a significant level of heterogene- ity across sites. Finally, by the evaluation of the Bayes factor, we show that the CAT model yields a signifi- cant improvement of the statistical fit over the standard models, based on one single substitution process describing all the sites of the alignment.
Type de document :
Chapitre d'ouvrage
Biosystema 22, 22, pp.97-104, 2004, Avenir et pertinence des méthodes d’analyse en phylogénie moléculaire, 2-9068922-22-X
Liste complète des métadonnées

Littérature citée [22 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-00108548
Contributeur : Christine Carvalho de Matos <>
Soumis le : lundi 23 octobre 2006 - 07:43:10
Dernière modification le : jeudi 11 janvier 2018 - 06:26:12
Document(s) archivé(s) le : mardi 6 avril 2010 - 20:27:47

Fichier

Identifiants

  • HAL Id : lirmm-00108548, version 1

Collections

Citation

Nicolas Lartillot, Hervé Philippe. CAT : Un Modèle Phylogénétique Bayésien permettant de prendre en compte l'Hétérogénéité des Processus de Substitution entre Sites dans les Alignements Protéiques. Biosystema 22, 22, pp.97-104, 2004, Avenir et pertinence des méthodes d’analyse en phylogénie moléculaire, 2-9068922-22-X. 〈lirmm-00108548〉

Partager

Métriques

Consultations de la notice

109

Téléchargements de fichiers

256