Données génomiques massives : applications, enjeux computationnels et perspectives
Abstract
De nombreux aspects du fonctionnement biologique peuvent être étudiés grâce aux nouvelles technologies de séquençage à haut débit (SHD) : de l'échelle moléculaire (ex. épigénomique ou épitranscriptomique) jusqu'à celle d'un système écologique (structure et dynamique des interactions entre espèces d'un environnement). Le SHD est devenu indispensable aux avancées des recherches fondamentales aussi bien qu'aux développements industriels-par ex. en agronomie. Bien évidement, la médecine de précision (aussi nommée médecine personnalisée) s'appuie sur ces technologies qui commencent à s'implanter dans les hôpitaux. Les caractéristiques principales des données de séquençage sont d'une part le volume de données pro-duites par séquençage (volume qui augmente exponentiellement), d'autre part la capacité d'exploration exhaustive (du génome, du transcriptome, des interactions dans leur ensemble). L'enjeu computation-nel majeur devient alors d'analyser avec précision, efficacité et robustesse ces données génomiques. Après quelques exemples d'applications, j'aborderai le rôle clef de l'indexation de données dans les algorithmes d'analyse de SHD. Les données génomiques codent une part cruciale de ce qui déter-mine un individu et contiennent des informations sur sa vie et son histoire. Je conclurai sur les enjeux globaux pour la recherche et la société que posent la disponibilité de ces informations.
Origin | Files produced by the author(s) |
---|