CAT : Un Modèle Phylogénétique Bayésien permettant de prendre en compte l'Hétérogénéité des Processus de Substitution entre Sites dans les Alignements Protéiques - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Chapitre D'ouvrage Année : 2004

CAT : Un Modèle Phylogénétique Bayésien permettant de prendre en compte l'Hétérogénéité des Processus de Substitution entre Sites dans les Alignements Protéiques

Herve Philippe

Résumé

We propose a Bayesian mixture model, accounting for across-site heterogeneities of the substi- tutional processes in protein sequences. Our model, CAT, is based on the formalism of the Dirichlet processes, in which the total number of classes of the underlying mixture is not specified a priori, but rather, is considered an unknown of the problem, and is directly inferred from the available data. In this paper, we describe the model, and show its connections with the Bayesian non-parametric approach for modeling hetero- geneity. We apply it to a series of alignments of real proteins, and uncover a significant level of heterogene- ity across sites. Finally, by the evaluation of the Bayes factor, we show that the CAT model yields a signifi- cant improvement of the statistical fit over the standard models, based on one single substitution process describing all the sites of the alignment.

Domaines

Autre [cs.OH]
Fichier principal
Vignette du fichier
D389.PDF (215.11 Ko) Télécharger le fichier
Loading...

Dates et versions

lirmm-00108548 , version 1 (23-10-2006)

Identifiants

  • HAL Id : lirmm-00108548 , version 1

Citer

Nicolas Lartillot, Herve Philippe. CAT : Un Modèle Phylogénétique Bayésien permettant de prendre en compte l'Hétérogénéité des Processus de Substitution entre Sites dans les Alignements Protéiques. Biosystema 22, 22, pp.97-104, 2004, Avenir et pertinence des méthodes d’analyse en phylogénie moléculaire, 2-9068922-22-X. ⟨lirmm-00108548⟩
143 Consultations
323 Téléchargements

Partager

More