Data integration challenges for plant functional genomics - Archive ouverte HAL Access content directly
Theses Year : 2007

Data integration challenges for plant functional genomics

Mutualiser et partager, un défi pour la génomique fonctionnelle végétale

(1, 2, 3)
1
2
3

Abstract

In this document, we present research topic developed in the context of heterogeneous data integration in plant functional genomic. Plant functional genomic is a biological framework where several disciplines and techniques take part in the discover of genes function. It generates a large quantity of data which the scientists manage in various ways. However, many data sources, complementary or overlapping, are necessary to enrich information about genes function. The problem comes from the distribution, the autonomy and the heterogeneity of these sources. That drags biologists seeking information, to integrate results manually. The objective of this thesis is to make easier the scientists searches and to reach in a transparent way information resulting from several data sources. For that, we propose two approaches in order to evaluate the advantages and the disadvantages of them. Firstly we propose the integration of sources through the adaptation of a mediation system : Select. Successor of DISCO, Le Select allows the integration of heterogeneous and distributed data sources through a relationnal integration model. Secondly, we propose the creation of a user personalized environment that integrate data sources through workflows of Web services. This system is based on BioMOBY system and its Central Registry. To conclude, we propose a methodology adapted to the needs for similar integration projects.
Les recherches que nous présentons dans ce mémoire s’inscrivent dans le cadre des problématiques d’intégration de données hétérogènes en génomique fonctionnelle végétale. La génomique fonctionnelle se définit en biologie comme un cadre dans lequel plusieurs disciplines et techniques participent à la découverte de la fonction des gènes. Elle génère un volume important de données que les scientifiques gèrent de manières diverses. Or de nombreuses sources de données, qu’elles soient complémentaires ou chevauchantes, sont nécessaires pour enrichir les informations sur la fonction des gènes. Le problème est qu’elles sont stockées de manière distribuées, autonomes avec plusieurs niveaux d’hétérogénéité, laissant le biologiste chercher l’information et intégrer les résultats manuellement. L’objectif de cette thèse est de permettre aux scientifiques d’accéder de manière transparente aux informations issues de plusieurs sources de données de génomique fonctionnelle. Pour cela nous nous proposons d’aborder deux approches afin d’en évaluer les avantages et les inconvénients. Premièrement nous proposons l’intégration de sources à travers l’adaptation d’un système de médiation de données et de programmes : Le Select. Successeur de DISCO, Le Select permet l’intégration de sources de données hétérogènes et distribuées avec un modèle pivot relationnel. Deuxièmement, nous proposons la création d’un environnement utilisateur personnalisé intégrant les sources à travers des enchaînements de services Web. Ce système est basé sur l’application BioMOBY et son annuaire de services bioinformatiques. Pour conclure, fort de l’expérience menée sur l’intégration et le partage, nous proposons une méthodologie adaptée aux besoins d’intégration pour des projets analogues.
Fichier principal
Vignette du fichier
Larmande_these_versionFinale.pdf (4.5 Mo) Télécharger le fichier
Loading...

Dates and versions

tel-01401210 , version 1 (23-11-2016)

Licence

Attribution - NonCommercial - CC BY 4.0

Identifiers

  • HAL Id : tel-01401210 , version 1

Cite

Pierre Larmande. Mutualiser et partager, un défi pour la génomique fonctionnelle végétale. Bio-informatique [q-bio.QM]. Universite Montpellier 2, 2007. Français. ⟨NNT : ⟩. ⟨tel-01401210⟩
397 View
616 Download

Share

Gmail Facebook Twitter LinkedIn More