Data Mining et Big Data

Eric Rivals 1, 2
1 MAB - Méthodes et Algorithmes pour la Bioinformatique
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier
Résumé : De par son comportement, ses déplacements, ses communications, chaque individu laisse des traces digitales qui sont aujourd'hui de plus en plus souvent mémorisées par des systèmes informatiques. Cette masse d'information peu structurées, diverses, réparties géographiquement renferme dans les relations entre ces informations des connaissances sur ces individus. Explorer ces informations par traitement informatique pour en extraire ces connaissances est le rôle de la fouille de données – ou de l'extraction de connaissances. Les techniques utilisées sont pluridisciplinaires : statistique classique, analyse de données, et divers domaines de l'informatique tels que l'apprentissage automatique, les bases de données et l'algorithmique. Aujourd'hui les applications les plus visibles de la fouille de données concerne l'analyse des requêtes internet pour élaborer de la publicité ciblée ou l'analyse des comportements internet pour inférer le profil des visiteurs ou des clients à des fins de gestion ou de marketing. Clairement, ce type de méthodes et d'analyse s'appliquent au domaine médical et aux sciences de la vie. L'hétérogénéité des données et la complexité du domaine rendent leur application plus délicate. En revanche, l'intérêt et les avantages potentiels de ces applications sont énormes : potentiel en médecine personnalisée ou de précision, inférence de règles pour l'aide thérapeutique, économies dues à une meilleure prise en charge. Cette présentation contient une introduction à la fouille de données et sa variante concernant les très grands volumes de données, le « Big Data », liste quelques applications au domaine médical, et donne quelques intuitions sur les méthodes informa-tiques utilisées.
Keywords : Medecine epidemiology
Complete list of metadatas

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01286788
Contributor : Eric Rivals <>
Submitted on : Friday, March 11, 2016 - 1:55:14 PM
Last modification on : Friday, March 15, 2019 - 1:15:07 AM
Long-term archiving on : Monday, June 13, 2016 - 9:09:43 AM

File

Rivals-dm-intro-res.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-01286788, version 1

Collections

Citation

Eric Rivals. Data Mining et Big Data. Rencontres Eveline Markiewicz sur les Urgences et Complications Sévères chez Patient Cancéreux, European Lung Cancer Working Party & Institut Jules Bordet Nov 2015, Bruxelles, Belgique. ⟨lirmm-01286788⟩

Share

Metrics

Record views

596

Files downloads

390