MongoDB
MongoDB est une base de données open source qui utilise un modèle de données orienté document.
MongoDB est l'un des nombreux types de bases de données apparus sous le slogan NoSQL. Contrairement aux bases de données relationnelles, qui utilisent des tables, des colonnes et des lignes, MongoDB est basé sur une architecture de collections de documents. Les documents comprennent plusieurs paires clé-valeur et forment l'unité de base des données dans MongoDB. Les collections contiennent plusieurs documents et agissent comme l'équivalent des tables de bases de données relationnelles.
MongoDB prend en charge la conception de schémas dynamiques afin que les documents d'une collection puissent avoir différents champs et structures. Pour le stockage de documents et l'échange de données, la base de données utilise le format dit BSON, qui offre une représentation binaire des documents de type JSON. À mesure que le volume de données augmente, le sharding automatique (partitionnement de base de données) peut être utilisé pour distribuer les données d'une collection sur plusieurs noeuds afin d'obtenir une distribution horizontale.
Articles associés
Stage de fin d'étude printemps 2022 - construction d'un Data Lab
Catégories : Data Science, Formation | Tags : Spark, Argo CD, Elasticsearch, Internship, Keycloak, Kubernetes, MongoDB, OpenID Connect, PostgreSQL
Descriptif du stage Au cours des dernières années, nous avons développé la capacité d’utiliser les ordinateurs pour traiter une grande quantité de données. L’écosystème a évolué vers une offre étendue…
Par WORMS David
24 nov. 2021
Comparaison de différents formats de fichier en Big Data
Catégories : Big Data, Data Engineering | Tags : Business Intelligence, Data structures, Avro, HDFS, ORC, Parquet, Traitement par lots, Big Data, CSV, JavaScript Object Notation (JSON), Kubernetes, Protocol Buffers
Dans l’univers du traitement des données, il existe différents types de formats de fichiers pour stocker vos jeu de données. Chaque format a ses propres avantages et inconvénients selon les cas d…
Par NGOM Aida
23 juil. 2020
Apache Apex : l'analytique Big Data nouvelle génération
Catégories : Data Science, Évènements, Tech Radar | Tags : Apex, Storm, Tools, Flink, Hadoop, Kafka, Data Science, Machine Learning
Ci-dessous une compilation de mes notes prises lors de la présentation d’Apache Apex par Thomas Weise de DataTorrent, l’entreprise derrière Apex. Introduction Apache Apex est un moteur de traitements…
Par BEREZOWSKI César
17 juil. 2016
Node.js, JavaScript côté serveur
Catégories : Front End, Node.js | Tags : HTTP, Serveur, JavaScript, Node.js
En attente du prochain grand language (NBL pour Next Big Language), cela fait maintenant 3 ans que je prédis à mes clients un bel avenir au JavaScript comme langue de programmation pour les…
Par WORMS David
12 juin 2010