Exploiting Diversification in Distributed Recommendation
Exploitation de la Diversité dans les Systèmes de Recommandation Distribués
Résumé
Les utilisateurs du Web 2.0 sont de gros producteurs de données. Ces dernières sont stockées sur des systèmes très variés, allant des plateformes de partage aux réseaux sociaux. Le fait que l'espace de stockage soit distribué sur ces nombreuses et diverses plateformes rend le partage des données particulièrement difficile. Dans ce contexte de distribution a grande echelle des utilisateurs et des données, une solution pour le partage de ces dernières est offerte par la recherche et recommandation distribuée. En particulier, les approches à base de bavardages (i.e. gossip) offrent le passage à l'échelle, la dynamicité, l'autonomie et un contrôle décentralisé. Généralement, dans la recherche et recommandation à base de bavardages, chaque utilisateur s'emploie a construire un cluster des utilisateurs "pertinents" qui seront utilisés ultérieurement pour traiter les requêtes. Cependant, le fait même que ces utilisateurs soient choisis en terme de "pertinence" introduit une redondance significative au sein de chaque cluster. Ainsi, lorsqu'une requête est soumise, puisque les utilisateurs de chaque cluster sont très similaires, la probabilité que chacun d'entre eux renvoie le même résultat augmente, et le rappel (i.e. recall) devient limité. Dans ce papier, nous proposons une approche de recherche et recommandation à base de bavardages s’appuyant sur un nouveau score de clustering, appelé usefulness, combinant la pertinence avec la diversité et nous présenterons l’algorithme de clustering correspondant. Notre évaluation expérimentale valide notre proposition et s’appuie sur trois jeux de données différents issus du web : MovieLens, Flickr and LastFM. En comparant avec des solutions de l’état de l’art, les gains en terme de recall sont considérables en étant jusqu’à trois fois supérieur lorsque la notion de usefulness est prise en compte, et ce, quelque soit le score de pertinence utilisé
Domaines
Informatique [cs]Origine | Fichiers produits par l'(les) auteur(s) |
---|
Loading...