Exploiting Diversification in Distributed Recommendation - Archive ouverte HAL Access content directly
Conference Papers Year : 2014

Exploiting Diversification in Distributed Recommendation

Exploitation de la Diversité dans les Systèmes de Recommandation Distribués

(1) , (1) , (1) , (2) , (3)
1
2
3
Maximilien Servajean
Esther Pacitti
Miguel Liroz-Gistau
  • Function : Author
  • PersonId : 901689

Abstract

Les utilisateurs du Web 2.0 sont de gros producteurs de données. Ces dernières sont stockées sur des systèmes très variés, allant des plateformes de partage aux réseaux sociaux. Le fait que l'espace de stockage soit distribué sur ces nombreuses et diverses plateformes rend le partage des données particulièrement difficile. Dans ce contexte de distribution a grande echelle des utilisateurs et des données, une solution pour le partage de ces dernières est offerte par la recherche et recommandation distribuée. En particulier, les approches à base de bavardages (i.e. gossip) offrent le passage à l'échelle, la dynamicité, l'autonomie et un contrôle décentralisé. Généralement, dans la recherche et recommandation à base de bavardages, chaque utilisateur s'emploie a construire un cluster des utilisateurs "pertinents" qui seront utilisés ultérieurement pour traiter les requêtes. Cependant, le fait même que ces utilisateurs soient choisis en terme de "pertinence" introduit une redondance significative au sein de chaque cluster. Ainsi, lorsqu'une requête est soumise, puisque les utilisateurs de chaque cluster sont très similaires, la probabilité que chacun d'entre eux renvoie le même résultat augmente, et le rappel (i.e. recall) devient limité. Dans ce papier, nous proposons une approche de recherche et recommandation à base de bavardages s’appuyant sur un nouveau score de clustering, appelé usefulness, combinant la pertinence avec la diversité et nous présenterons l’algorithme de clustering correspondant. Notre évaluation expérimentale valide notre proposition et s’appuie sur trois jeux de données différents issus du web : MovieLens, Flickr and LastFM. En comparant avec des solutions de l’état de l’art, les gains en terme de recall sont considérables en étant jusqu’à trois fois supérieur lorsque la notion de usefulness est prise en compte, et ce, quelque soit le score de pertinence utilisé
Fichier principal
Vignette du fichier
BDA_2014.pdf (630.53 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

lirmm-01177564 , version 1 (17-07-2015)

Identifiers

  • HAL Id : lirmm-01177564 , version 1

Cite

Maximilien Servajean, Esther Pacitti, Miguel Liroz-Gistau, Sihem Amer-Yahia, Amr El Abbadi. Exploiting Diversification in Distributed Recommendation. BDA: Gestion de Données — Principes, Technologies et Applications, IMAG, Oct 2014, Autrans, France. ⟨lirmm-01177564⟩
188 View
534 Download

Share

Gmail Facebook Twitter LinkedIn More