Exploiting Diversification in Distributed Recommendation - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier Accéder directement au contenu
Communication Dans Un Congrès Année : 2014

Exploiting Diversification in Distributed Recommendation

Exploitation de la Diversité dans les Systèmes de Recommandation Distribués

Maximilien Servajean
Esther Pacitti
Miguel Liroz-Gistau
  • Fonction : Auteur
  • PersonId : 901689

Résumé

Les utilisateurs du Web 2.0 sont de gros producteurs de données. Ces dernières sont stockées sur des systèmes très variés, allant des plateformes de partage aux réseaux sociaux. Le fait que l'espace de stockage soit distribué sur ces nombreuses et diverses plateformes rend le partage des données particulièrement difficile. Dans ce contexte de distribution a grande echelle des utilisateurs et des données, une solution pour le partage de ces dernières est offerte par la recherche et recommandation distribuée. En particulier, les approches à base de bavardages (i.e. gossip) offrent le passage à l'échelle, la dynamicité, l'autonomie et un contrôle décentralisé. Généralement, dans la recherche et recommandation à base de bavardages, chaque utilisateur s'emploie a construire un cluster des utilisateurs "pertinents" qui seront utilisés ultérieurement pour traiter les requêtes. Cependant, le fait même que ces utilisateurs soient choisis en terme de "pertinence" introduit une redondance significative au sein de chaque cluster. Ainsi, lorsqu'une requête est soumise, puisque les utilisateurs de chaque cluster sont très similaires, la probabilité que chacun d'entre eux renvoie le même résultat augmente, et le rappel (i.e. recall) devient limité. Dans ce papier, nous proposons une approche de recherche et recommandation à base de bavardages s’appuyant sur un nouveau score de clustering, appelé usefulness, combinant la pertinence avec la diversité et nous présenterons l’algorithme de clustering correspondant. Notre évaluation expérimentale valide notre proposition et s’appuie sur trois jeux de données différents issus du web : MovieLens, Flickr and LastFM. En comparant avec des solutions de l’état de l’art, les gains en terme de recall sont considérables en étant jusqu’à trois fois supérieur lorsque la notion de usefulness est prise en compte, et ce, quelque soit le score de pertinence utilisé
Fichier principal
Vignette du fichier
BDA_2014.pdf (630.53 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-01177564 , version 1 (17-07-2015)

Identifiants

  • HAL Id : lirmm-01177564 , version 1

Citer

Maximilien Servajean, Esther Pacitti, Miguel Liroz-Gistau, Sihem Amer-Yahia, Amr El Abbadi. Exploiting Diversification in Distributed Recommendation. BDA: Gestion de Données — Principes, Technologies et Applications, IMAG, Oct 2014, Autrans, France. ⟨lirmm-01177564⟩
198 Consultations
555 Téléchargements

Partager

Gmail Facebook X LinkedIn More