Extending CloudMdsQL with MFR for Big Data Integration *

Carlyna Bondiombouy 1 Boyan Kolev 1 Patrick Valduriez 1 Oleksandra Levchenko 1
1 ZENITH - Scientific Data Management
LIRMM - Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier, CRISAM - Inria Sophia Antipolis - Méditerranée
Abstract : In this short paper (see [2] for the long version), we propose a functional SQL-like query language (based on Cloud-MdsQL) and query engine to retrieve data from two different kinds of data stores - an RDBMS and a distributed data processing framework such as Apache Spark or Hadoop MapReduce on top of HDFS - and combine them by applying data integration operators (mostly joins). However, users need to be aware of how data are organized across the data stores, so that they write valid queries. The query therefore contains embedded invocations to the underlying data stores, expressed as subqueries. As our query language is functional, it introduces a tight coupling between data and functions.
Type de document :
Communication dans un congrès
BDA: Bases de Données Avancées, Nov 2016, Poitiers, France. 32ème Conférence sur la Gestion de Données - Principes, Technologies et Applications, 2016, 〈https://bda2016.ensma.fr〉
Liste complète des métadonnées

Littérature citée [5 références]  Voir  Masquer  Télécharger

https://hal-lirmm.ccsd.cnrs.fr/lirmm-01409104
Contributeur : Patrick Valduriez <>
Soumis le : lundi 5 décembre 2016 - 16:34:19
Dernière modification le : jeudi 11 janvier 2018 - 17:01:55
Document(s) archivé(s) le : lundi 20 mars 2017 - 20:33:54

Fichier

MFR-BDA2016.pdf
Fichiers produits par l'(les) auteur(s)

Licence


Distributed under a Creative Commons Paternité - Pas d'utilisation commerciale - Pas de modification 4.0 International License

Identifiants

  • HAL Id : lirmm-01409104, version 1

Collections

Citation

Carlyna Bondiombouy, Boyan Kolev, Patrick Valduriez, Oleksandra Levchenko. Extending CloudMdsQL with MFR for Big Data Integration *. BDA: Bases de Données Avancées, Nov 2016, Poitiers, France. 32ème Conférence sur la Gestion de Données - Principes, Technologies et Applications, 2016, 〈https://bda2016.ensma.fr〉. 〈lirmm-01409104〉

Partager

Métriques

Consultations de la notice

415

Téléchargements de fichiers

110