Exploiting Diversification in Distributed Recommendation

Maximilien Servajean 1 Esther Pacitti 1 Miguel Liroz-Gistau 1 Sihem Amer-Yahia 2 Amr El Abbadi 3
1 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
2 LIG Laboratoire d'Informatique de Grenoble - HADAS
LIG - Laboratoire d'Informatique de Grenoble
Résumé : Les utilisateurs du Web 2.0 sont de gros producteurs de données. Ces dernières sont stockées sur des systèmes très variés, allant des plateformes de partage aux réseaux sociaux. Le fait que l'espace de stockage soit distribué sur ces nombreuses et diverses plateformes rend le partage des données particulièrement difficile. Dans ce contexte de distribution a grande echelle des utilisateurs et des données, une solution pour le partage de ces dernières est offerte par la recherche et recommandation distribuée. En particulier, les approches à base de bavardages (i.e. gossip) offrent le passage à l'échelle, la dynamicité, l'autonomie et un contrôle décentralisé. Généralement, dans la recherche et recommandation à base de bavardages, chaque utilisateur s'emploie a construire un cluster des utilisateurs "pertinents" qui seront utilisés ultérieurement pour traiter les requêtes. Cependant, le fait même que ces utilisateurs soient choisis en terme de "pertinence" introduit une redondance significative au sein de chaque cluster. Ainsi, lorsqu'une requête est soumise, puisque les utilisateurs de chaque cluster sont très similaires, la probabilité que chacun d'entre eux renvoie le même résultat augmente, et le rappel (i.e. recall) devient limité. Dans ce papier, nous proposons une approche de recherche et recommandation à base de bavardages s’appuyant sur un nouveau score de clustering, appelé usefulness, combinant la pertinence avec la diversité et nous présenterons l’algorithme de clustering correspondant. Notre évaluation expérimentale valide notre proposition et s’appuie sur trois jeux de données différents issus du web : MovieLens, Flickr and LastFM. En comparant avec des solutions de l’état de l’art, les gains en terme de recall sont considérables en étant jusqu’à trois fois supérieur lorsque la notion de usefulness est prise en compte, et ce, quelque soit le score de pertinence utilisé
Type de document :
Communication dans un congrès
BDA: Bases de Données Avancées, Oct 2014, Grenoble-Autrans, France. INRIA-SILICONVALLEY, 2014, Gestion de Données – Principes, Technologies et Applications. 〈http://bda2014.imag.fr〉
Liste complète des métadonnées

Littérature citée [15 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01177564
Contributeur : Maximilien Servajean <>
Soumis le : vendredi 17 juillet 2015 - 09:22:07
Dernière modification le : jeudi 24 mai 2018 - 15:59:21
Document(s) archivé(s) le : mercredi 26 avril 2017 - 06:54:14

Fichier

BDA_2014.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : lirmm-01177564, version 1

Citation

Maximilien Servajean, Esther Pacitti, Miguel Liroz-Gistau, Sihem Amer-Yahia, Amr El Abbadi. Exploiting Diversification in Distributed Recommendation. BDA: Bases de Données Avancées, Oct 2014, Grenoble-Autrans, France. INRIA-SILICONVALLEY, 2014, Gestion de Données – Principes, Technologies et Applications. 〈http://bda2014.imag.fr〉. 〈lirmm-01177564〉

Partager

Métriques

Consultations de la notice

366

Téléchargements de fichiers

621