CSV
CSV (Comma Separated Values) est un format de fichier orienté lignes utilisé principalement pour stocker des données qui peuvent être décomposées en lignes et en colonnes. Il y a diverses spécifications et implémentations pour le format CSV, mais un format commun pour les fichiers CSV est défini dans RFC 4180.
Dans un fichier CSV, une ligne correspond à un enregistrement de données. Dans un enregistrement de données, chaque champ (colonnes) est séparé par un caractère. L'implémentation courante du format CSV utilise le caractère Comma comme délimiteur de champ. Mais selon l'implémentation, les deux points, les points-virgules, les espaces, les tabulations ou d'autres caractères peuvent être utilisés.
Avantages du format CSV :
- Il est sous une forme lisible par l'homme.
- Il possède un schéma plat et simple, facile à mettre en oeuvre.
- Il peut être traité par presque toutes les applications existantes.
Inconvénients du format CSV :
- Il n'est pas universellement normalisé et peut être mis en oeuvre de différentes manières.
- Doit être lu séquentiellement, peut prendre du temps pour trouver les informations à l'intérieur.
- Ce n'est pas le format de fichier le plus efficace en termes de mémoire.
- Pas de prise en charge de divers types de données.
Articles associés
Version 6 du package CSV pour Node.js
Catégories : Node.js | Tags : Data Engineering, Refactoring, CSV, Format de fichier, Versions et évolutions
La dernière version du package pour Node.js vient d’être publiée ainsi que celles de ses sous-projects. Voici les versions publiées : version , précédente version NPM version , précédente version…
Par WORMS David
15 nov. 2021
H2O en pratique : un protocole combinant AutoML et les approches de modélisation traditionnelles
Catégories : Data Science, Formation | Tags : Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python, XGBoost
H20 est livré avec de nombreuses fonctionnalités. La deuxième partie de la série H2O en pratique propose un protocole pour combiner la modélisation AutoML avec des approches de modélisation et d…
12 nov. 2021
H2O en pratique: retour d'expérience d'un Data Scientist
Catégories : Data Science, Formation | Tags : Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python
Les plates-formes d’apprentissage automatique (AutoML) gagnent en popularité et deviennent un outil puissant à disposition des data scientists. Il y a quelques mois, j’ai présenté H2O, une plate-forme…
29 sept. 2021
Développement accéléré de modèles avec H2O AutoML et Flow
Catégories : Data Science, Formation | Tags : Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python
La construction de modèles de Machine Learning (ML) est un processus très consommateur de temps. De plus, il requière de bonne connaissance en statistique, en algorithme de ML ainsi qu’en…
10 déc. 2020
Comparaison de différents formats de fichier en Big Data
Catégories : Big Data, Data Engineering | Tags : Business Intelligence, Data structures, Avro, HDFS, ORC, Parquet, Traitement par lots, Big Data, CSV, JavaScript Object Notation (JSON), Kubernetes, Protocol Buffers
Dans l’univers du traitement des données, il existe différents types de formats de fichiers pour stocker vos jeu de données. Chaque format a ses propres avantages et inconvénients selon les cas d…
Par NGOM Aida
23 juil. 2020
Node.js CSV version 4 - réécriture et performances
Catégories : Node.js | Tags : CLI, Data Engineering, Refactoring, CSV, Versions et évolutions
Nous publions aujourd’hui une nouvelle version majeure du projet CSV Parser pour Node.js. La version 4 est une réécriture complète du projet axée sur la performance. Il comporte également de nouvelles…
Par WORMS David
19 nov. 2018
Node CSV version 0.2.1
Catégories : Node.js | Tags : CoffeeScript, CSV, Versions et évolutions, Streaming
Faisant suite à l’annonce de la version 0.2.0 du parser CSV pour Node.js début octobre, aujourd’hui sort la nouvelle version 0.2.1. Il s’agit essentiellement d’une distribution corrigeant des bugs…
Par WORMS David
24 juil. 2012
Node CSV version 0.2 incluant le support de l'API streaming
Catégories : Node.js | Tags : CSV, Markdown, Node.js, Streaming
Annoncé en Août, le parser CSV pour Node.js dans sa version 0.2 est sorti hier. Cette version est une mise à jour majeure dans le sens ou elle aligne l’API de la librairie avec les meilleures…
Par WORMS David
2 juil. 2012
Node CSV parser à la rescousse
Catégories : Hack | Tags : Bash, Hack, CSV, Node.js
Vendredi dernier, une heure avant la fermeture des portes de mon client pour le week-end, un collègue est venu me voir. Il vient juste de finir d’exporter 9 fichiers CSV à partir d’une base de données…
Par WORMS David
13 déc. 2011