Sur l'utilisation de LDA en RI Pair à Pair - Archive ouverte HAL Access content directly
Conference Papers Year : 2013

Sur l'utilisation de LDA en RI Pair à Pair

(1) , (2) , (3) , (3)
1
2
3

Abstract

We revisit the problem of defining a peer-to-peer system for Information Retrieval when each peer’s topic-based profile is obtained using Latent Dirichlet Allocation. This method, defined for a centralized collection, provides a rich representation of the topics and of the doc- uments. We describe two ways of using it in a distributed system and analyze their advantages and drawbacks. Then, we illustrate the use of the obtained topic-based profiles within two systems. The first one is unstructured and uses a gossip-based algorithm to obtain dynamic overlays of topically related peers. This requires defining a similarity between profiles. The second one uses super-peers and maintains a topic-based index of the peers, which is recorded in a distributed Hash table. The keys are derived from the topic-based profiles.
Nous revisitons la problématique de définition d’un système de Recherche d’Informa- tion pair-à-pair lorsque le profil thématique associé à chaque pair est obtenu par l’Allocation Latente de Dirichlet. Cette méthode, pensée pour une collection centralisée, offre une représen- tation riche des thèmes et des documents. Nous décrivons deux façons de la mettre en oeuvre dans un système distribué et analysons leurs avantages et inconvénients. Puis nous illustrons l’utilisation de ces profils thématiques dans deux systèmes différents. L’un, non structuré, se base sur l’utilisation d’un algorithme épidémique pour regrouper dynamiquement les pairs proches d’un point de vue thématique. Cela nécessite de définir une mesure de similarité entre profils. L’autre utilise des super-pairs et maintient un index thématique des pairs du système, mémorisé dans une table de hachage distribuée. Les clés sont calculées à partir des profils thématiques.
Fichier principal
Vignette du fichier
2013_1a_4 Cazalens.pdf (171.66 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

lirmm-01088735 , version 1 (26-06-2016)

Identifiers

  • HAL Id : lirmm-01088735 , version 1

Cite

Sylvie Cazalens, Esther Pacitti, Sylvie Calabretto, Yulian Yang. Sur l'utilisation de LDA en RI Pair à Pair. INFORSID, May 2013, Paris, France. ⟨lirmm-01088735⟩
297 View
179 Download

Share

Gmail Facebook Twitter LinkedIn More