Skip to Main content Skip to Navigation
Conference papers

Exploiting Diversification in Distributed Recommendation

Maximilien Servajean 1 Esther Pacitti 1 Miguel Liroz-Gistau 1 Sihem Amer-Yahia 2 Amr El Abbadi 3
1 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
2 LIG Laboratoire d'Informatique de Grenoble - HADAS
LIG - Laboratoire d'Informatique de Grenoble
Résumé : Les utilisateurs du Web 2.0 sont de gros producteurs de données. Ces dernières sont stockées sur des systèmes très variés, allant des plateformes de partage aux réseaux sociaux. Le fait que l'espace de stockage soit distribué sur ces nombreuses et diverses plateformes rend le partage des données particulièrement difficile. Dans ce contexte de distribution a grande echelle des utilisateurs et des données, une solution pour le partage de ces dernières est offerte par la recherche et recommandation distribuée. En particulier, les approches à base de bavardages (i.e. gossip) offrent le passage à l'échelle, la dynamicité, l'autonomie et un contrôle décentralisé. Généralement, dans la recherche et recommandation à base de bavardages, chaque utilisateur s'emploie a construire un cluster des utilisateurs "pertinents" qui seront utilisés ultérieurement pour traiter les requêtes. Cependant, le fait même que ces utilisateurs soient choisis en terme de "pertinence" introduit une redondance significative au sein de chaque cluster. Ainsi, lorsqu'une requête est soumise, puisque les utilisateurs de chaque cluster sont très similaires, la probabilité que chacun d'entre eux renvoie le même résultat augmente, et le rappel (i.e. recall) devient limité. Dans ce papier, nous proposons une approche de recherche et recommandation à base de bavardages s’appuyant sur un nouveau score de clustering, appelé usefulness, combinant la pertinence avec la diversité et nous présenterons l’algorithme de clustering correspondant. Notre évaluation expérimentale valide notre proposition et s’appuie sur trois jeux de données différents issus du web : MovieLens, Flickr and LastFM. En comparant avec des solutions de l’état de l’art, les gains en terme de recall sont considérables en étant jusqu’à trois fois supérieur lorsque la notion de usefulness est prise en compte, et ce, quelque soit le score de pertinence utilisé
Complete list of metadatas

Cited literature [15 references]  Display  Hide  Download

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01177564
Contributor : Maximilien Servajean <>
Submitted on : Friday, July 17, 2015 - 9:22:07 AM
Last modification on : Friday, October 25, 2019 - 1:21:26 AM
Document(s) archivé(s) le : Wednesday, April 26, 2017 - 6:54:14 AM

File

BDA_2014.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : lirmm-01177564, version 1

Citation

Maximilien Servajean, Esther Pacitti, Miguel Liroz-Gistau, Sihem Amer-Yahia, Amr El Abbadi. Exploiting Diversification in Distributed Recommendation. BDA: Gestion de Données — Principes, Technologies et Applications, IMAG, Oct 2014, Autrans, France. ⟨lirmm-01177564⟩

Share

Metrics

Record views

459

Files downloads

863