Sur l'utilisation de LDA en RI Pair à Pair - LIRMM - Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier
Communication Dans Un Congrès Année : 2013

Sur l'utilisation de LDA en RI Pair à Pair

Résumé

We revisit the problem of defining a peer-to-peer system for Information Retrieval when each peer’s topic-based profile is obtained using Latent Dirichlet Allocation. This method, defined for a centralized collection, provides a rich representation of the topics and of the doc- uments. We describe two ways of using it in a distributed system and analyze their advantages and drawbacks. Then, we illustrate the use of the obtained topic-based profiles within two systems. The first one is unstructured and uses a gossip-based algorithm to obtain dynamic overlays of topically related peers. This requires defining a similarity between profiles. The second one uses super-peers and maintains a topic-based index of the peers, which is recorded in a distributed Hash table. The keys are derived from the topic-based profiles.
Nous revisitons la problématique de définition d’un système de Recherche d’Informa- tion pair-à-pair lorsque le profil thématique associé à chaque pair est obtenu par l’Allocation Latente de Dirichlet. Cette méthode, pensée pour une collection centralisée, offre une représen- tation riche des thèmes et des documents. Nous décrivons deux façons de la mettre en oeuvre dans un système distribué et analysons leurs avantages et inconvénients. Puis nous illustrons l’utilisation de ces profils thématiques dans deux systèmes différents. L’un, non structuré, se base sur l’utilisation d’un algorithme épidémique pour regrouper dynamiquement les pairs proches d’un point de vue thématique. Cela nécessite de définir une mesure de similarité entre profils. L’autre utilise des super-pairs et maintient un index thématique des pairs du système, mémorisé dans une table de hachage distribuée. Les clés sont calculées à partir des profils thématiques.
Fichier principal
Vignette du fichier
2013_1a_4 Cazalens.pdf (171.66 Ko) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

lirmm-01088735 , version 1 (26-06-2016)

Identifiants

  • HAL Id : lirmm-01088735 , version 1

Citer

Sylvie Cazalens, Esther Pacitti, Sylvie Calabretto, Yulian Yang. Sur l'utilisation de LDA en RI Pair à Pair. INFORSID, May 2013, Paris, France. ⟨lirmm-01088735⟩
342 Consultations
257 Téléchargements

Partager

More