Image Analysis and Understanding
Analyse et Compréhension de l’Image
Résumé
As one of the most active research areas in computer vision, image analysis and understanding attempts to detect low-level and high-level features, to locate, recognize objects, to detect anomalies and to classify them into classes and categories from images and videos. This dissertation focuses on the automation of visual feature extraction, selection and fusion for image classification. The main contribution presented in this manuscript is the fully automation of the process of local feature extraction and aggregation using genetic programming with different applications ranging from texture classification to breast cancer diagnosis including facial expression recognition. More precisely, low-level texture features are defined based on edge arrangements and automatically aggregated for texture image classification under different changes. The same framework is used to extract texture cues from human faces and fuse them with geometric features representing face landmark distances in order to capture wrinkles and face distortions to detect human affects. Facial expression recognition from 3D/4D facial images is also performed based on mesh-local binary pattern difference descriptor representing a unified set of geometric and appearance features of different facial regions. Texture is explored more intensely in breast tissue from mammography images to diagnosis cancer. A more powerful texture description is proposed to detect malignant tumor in breast tissue. A fully automated framework based on genetic programming for feature extraction, selection and fusion is also presented to perform content based retrieval and breast cancer diagnosis. For all the investigated applications, the presented frameworks perform training with small number of instances and tackle the problem of the unavailability of labeled data.
L’analyse et la compréhension d’images est un domaine actif de la vision par ordinateur qui vise à détecter des caractéristiques de bas niveau et de haut niveau, à localiser et à reconnaître des objets, à détecter des anomalies et à les classer en classes et catégories à partir d’images et de vidéos. Cette dissertation porte sur l’automatisation de l’extraction, de la sélection et de la fusion de caractéristiques visuelles pour la classification d’images. La principale contribution présentée dans ce manuscrit est l’automatisation complète du processus d’extraction et d’agrégation de caractéristiques locales à l’aide de la programmation génétique. L’apport de cette contribution a été exploré dans diverses applications, allant de la classification de texture à la détection du cancer du sein en passant par la reconnaissance des expressions faciales. Plus précisément, des caractéristiques de texture de bas niveau sont définies à partir des dispositions des contours et sont par la suite agrégées de manière automatique pour la classification d’images de texture. Le même Framework est utilisé pour extraire des indices de texture locaux à partir de visages humains. Ces indices sont automatiquement fusionnés avec des caractéristiques géométriques, représentant les distances des points de repère du visage, pour capturer les rides et les distorsions du visage, afin de détecter les émotions humaines. La reconnaissance des expressions faciales à partir d’images faciales 3D/4D est également abordée en proposant un
descripteur basé sur la différence de motif binaire local de maillage définissant un ensemble unifié de caractéristiques géométriques ainsi que d’apparence de différentes régions faciales. La texture est étudiée de manière plus approfondie dans les tissus mammaires des images de mammographie pour le diagnostic du cancer du sein. Une description de texture plus robuste est proposée pour détecter les tumeurs malignes dans les tissus mammaires. Un Framework entièrement automatisé basé sur la programmation génétique pour l’extraction, la sélection et la fusion de caractéristiques est également présenté pour réaliser une recherche par le contenu ainsi que le diagnostic de cancer du sein. Pour toutes les applications explorées dans ces travaux, les algorithmes présentés effectuent la phase d’entraînement avec un nombre réduit d’exemples pour aborder le problème de l’indisponibilité de données étiquetées.
Origine | Fichiers produits par l'(les) auteur(s) |
---|