Data Mining et Big Data
Abstract
De par son comportement, ses déplacements, ses communications, chaque individu laisse des traces digitales qui sont aujourd'hui de plus en plus souvent mémorisées par des systèmes informatiques. Cette masse d'information peu structurées, diverses, réparties géographiquement renferme dans les relations entre ces informations des connaissances sur ces individus. Explorer ces informations par traitement informatique pour en extraire ces connaissances est le rôle de la fouille de données – ou de l'extraction de connaissances. Les techniques utilisées sont pluridisciplinaires : statistique classique, analyse de données, et divers domaines de l'informatique tels que l'apprentissage automatique, les bases de données et l'algorithmique. Aujourd'hui les applications les plus visibles de la fouille de données concerne l'analyse des requêtes internet pour élaborer de la publicité ciblée ou l'analyse des comportements internet pour inférer le profil des visiteurs ou des clients à des fins de gestion ou de marketing. Clairement, ce type de méthodes et d'analyse s'appliquent au domaine médical et aux sciences de la vie. L'hétérogénéité des données et la complexité du domaine rendent leur application plus délicate. En revanche, l'intérêt et les avantages potentiels de ces applications sont énormes : potentiel en médecine personnalisée ou de précision, inférence de règles pour l'aide thérapeutique, économies dues à une meilleure prise en charge. Cette présentation contient une introduction à la fouille de données et sa variante concernant les très grands volumes de données, le « Big Data », liste quelques applications au domaine médical, et donne quelques intuitions sur les méthodes informa-tiques utilisées.
Origin | Files produced by the author(s) |
---|