Apache Sqoop
Apache Sqoop (SQL to Hadoop) est un outil Big Data utilisé pour transférer des données non structurées Hadoop (bulk data) vers des données structurées comme les bases de données relationnelles. Le processus inverse est également possible.
Sqoop est utilisé pour son traitement rapide grâce à la parallélisation du processus d'importation et d'exportation. En revanche, le projet est en arrêt de développement depuis juin 2021.
- En savoir plus
- Site officiel
Articles associés
Le futur de l'orchestration de workflows dans Hadoop : Oozie 5.x
Catégories : Big Data, DataWorks Summit 2018 | Tags : REST, Hadoop, Hive, Oozie, Sqoop, CDH, HDP
Au DataWorks Summit Europe 2018 de Berlin, j’ai eu l’occasion d’assister à une session sur Apache Oozie. La présentation se concentre sur les caractéristiques du prochain Oozie 5.0 et celles à venir…
Par SCHOUKROUN Leo
23 mai 2018
Synchronisation Oracle vers Hadoop avec un CDC
Catégories : Data Engineering | Tags : CDC, GoldenGate, Oracle, Hive, Sqoop, Entrepôt de données (Data Warehouse)
Cette note résulte d’une discussion autour de la synchronisation de données écrites dans une base de données à destination d’un entrepôt stocké dans Hadoop. Merci à Claude Daub de GFI qui la rédigea…
Par WORMS David
13 juil. 2017