Learning

The sharing of knowledge at Adaltas is reflected in the transfer of skills to our clients, the implementation of tailor-made training, our frequent publications of articles, our Open Source contributions as well as teaching in several schools and universities.

Related articles

CDP partie 6 : cas d'usage bout en bout d'un Data Lakehouse avec CDP

CDP partie 6 : cas d'usage bout en bout d'un Data Lakehouse avec CDP

Categories: Big Data, Data Engineering, Formation | Tags: NiFi, Business Intelligence, Data Engineering, Iceberg, Spark, Big Data, Cloudera, CDP, Analyse de donnƩes, Data Lake, EntrepƓt de donnƩes (Data Warehouse)

Dans cet exercice pratique, nous montrons comment construire une solution big data complĆØte avec la Cloudera Data Platform (CDP) Public Cloud, en se basant sur lā€™infrastructure qui a Ć©tĆ© dĆ©ployĆ©e toutā€¦

CHAVARRIA Tobias

By CHAVARRIA Tobias

Jul 24, 2023

Ordinateur portable Framework avec NixOS, un retour d'expƩrience

Ordinateur portable Framework avec NixOS, un retour d'expƩrience

Categories: Formation, Tech Radar | Tags: CLI, DevOps, Enseignement et tutorial, Linux, Packaging, NixOS, Open source

Un nouveau travail commence avec un nouvel ordinateur portable. ƀ ce titre, on mā€™a donnĆ© un Framework Laptop DIY Edition avec pour mission de lā€™installer et de le configurer entiĆØrement avec NixOS. Jeā€¦

JESUS CARO Carlos

By JESUS CARO Carlos

Aug 22, 2022

Stockage objet Ceph dans un cluster Kubernetes avec Rook

Stockage objet Ceph dans un cluster Kubernetes avec Rook

Categories: Big Data, Gouvernance des donnƩes, Formation | Tags: Amazon S3, Big Data, Ceph, Cluster, Data Lake, Kubernetes, Storage

Ceph est un systĆØme tout-en-un de stockage distribuĆ©. Fiable et mature, sa premiĆØre version stable est parue en 2012 et a Ć©tĆ© depuis la rĆ©fĆ©rence pour le stockage open source. Lā€™avantage principal deā€¦

BIGOT Luka

By BIGOT Luka

Aug 4, 2022

Stockage objet avec MinIO dans un cluster Kubernetes

Stockage objet avec MinIO dans un cluster Kubernetes

Categories: Big Data, Gouvernance des donnƩes, Formation | Tags: Amazon S3, Big Data, Cluster, Data Lake, Kubernetes, Storage

MinIO est une solution de stockage objet populaire. Souvent recommandĆ© pour sa simplicitĆ© dā€™utilisation et dā€™installation, MinIO nā€™est pas seulement quā€™un bon moyen pour dĆ©buter avec le stockage objetā€¦

BIGOT Luka

By BIGOT Luka

Jul 9, 2022

TDP Workshop : devenir un power-user de TDP depuis son terminal

TDP Workshop : devenir un power-user de TDP depuis son terminal

Categories: ƉvĆØnements, Formation | Tags: DevOps, Ansible, Hadoop, Open source, TDP

La CLI de TDP est utilisĆ©e pour dĆ©ployer et exploiter vos services TDP. Elle sā€™appuie sur tdp-lib pour vous offrir contrĆ“le et flexibilitĆ©. Il y a quelques temps, nous annoncions la sortie publique deā€¦

FARAULT Paul

By FARAULT Paul

Jun 17, 2022

NixOS : Activer le support des machines virtuelles de LXD avec Flakes

NixOS : Activer le support des machines virtuelles de LXD avec Flakes

Categories: Hack, Formation | Tags: GitHub, Enseignement et tutorial, Linux, LXD, Packaging, VM, NixOS, Open source

Nixpkgs est une collection grandissante de packages pour Nix et NixOS. MĆŖme avec plus de 80,000 packages, il est pourtant commun dā€™avoir besoin dā€™une fonctionnalitĆ© qui nā€™existe pas encore. Cetteā€¦

COTTART Kellian

By COTTART Kellian

May 13, 2022

Installation fiable et reproductible de Linux avec NixOS

Installation fiable et reproductible de Linux avec NixOS

Categories: Infrastructure, Formation | Tags: Linux, Packaging, VM, NixOS, TDP

Lors de lā€™utilisation dā€™un systĆØme dā€™exploitation, la mise Ć  jour ou lā€™installation de packages sont des opĆ©rations courantes qui prĆ©sentent un risque pour la stabilitĆ© du systĆØme. NixOS est uneā€¦

MOUAFFO Florent

By MOUAFFO Florent

Feb 8, 2022

Introduction Ć  Nix, concepts fondateurs et principales commandes

Introduction Ć  Nix, concepts fondateurs et principales commandes

Categories: Infrastructure, Formation | Tags: Arch Linux, CentOS, Linux, OS X, Packaging, Ubuntu, NixOS, TDP

Nix est un gestionnaire de packages fonctionnel pour Linux et dā€™autres systĆØmes Unix, rendant la gestion des packages plus fiable et reproductible. Avec un gestionnaire de packages traditionnel, lorsā€¦

MOUAFFO Florent

By MOUAFFO Florent

Feb 1, 2022

La blockchain pour les nuls 1 : blockchains et mƩcanismes de consensus

La blockchain pour les nuls 1 : blockchains et mƩcanismes de consensus

Categories: Adaltas Summit 2021, Infrastructure, Formation | Tags: Cryptographie, Infrastructure, Blockchain, Consensus

Les crypto-monnaies sont en plein essor en 2021, avec une capitalisation boursiĆØre passant de 750 Ć  plus de 3 000 milliards de dollars. Soyons honnĆŖtes, cela est principalement dĆ» Ć  la spĆ©culationā€¦

LEONARD Gauthier

By LEONARD Gauthier

Jan 18, 2022

Stage de fin d'Ć©tude printemps 2022 - construction d'un Data Lab

Stage de fin d'Ć©tude printemps 2022 - construction d'un Data Lab

Categories: Data Science, Formation | Tags: Spark, Argo CD, Elasticsearch, Internship, Keycloak, Kubernetes, MongoDB, OpenID Connect, PostgreSQL

Descriptif du stage Au cours des derniĆØres annĆ©es, nous avons dĆ©veloppĆ© la capacitĆ© dā€™utiliser les ordinateurs pour traiter une grande quantitĆ© de donnĆ©es. Lā€™Ć©cosystĆØme a Ć©voluĆ© vers une offre Ć©tendueā€¦

WORMS David

By WORMS David

Nov 24, 2021

H2O en pratique : un protocole combinant AutoML et les approches de modƩlisation traditionnelles

H2O en pratique : un protocole combinant AutoML et les approches de modƩlisation traditionnelles

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python, XGBoost

H20 est livrĆ© avec de nombreuses fonctionnalitĆ©s. La deuxiĆØme partie de la sĆ©rie H2O en pratique propose un protocole pour combiner la modĆ©lisation AutoML avec des approches de modĆ©lisation et dā€¦

Stage en infrastructure Big Data avec TDP

Stage en infrastructure Big Data avec TDP

Categories: Infrastructure, Formation | Tags: CybersƩcuritƩ, DevOps, Java, Ansible, Hadoop, Internship, TDP

Le Big Data et lā€™informatique distribuĆ©e sont au cœur dā€™Adaltas. Nous accompagnons nos partenaires dans le dĆ©ploiement, la maintenance et lā€™optimisation de certains des plus grands clusters de Franceā€¦

HARTY Daniel

By HARTY Daniel

Oct 25, 2021

Stage de fin d'Ć©tude printemps 2022 en Data Engineering

Stage de fin d'Ć©tude printemps 2022 en Data Engineering

Categories: Front End, Formation | Tags: MĆ©triques, Supervision, Hadoop, Hive, Kafka, Delta Lake, Elasticsearch, IaC, Internship, Kubernetes, MLflow, Prometheus, Streaming, TFX

Descriptif du stage La donnĆ©e est un actif prĆ©cieux des entreprises. Le data engineer collecte, convertit et valorise la donnĆ©e brute en une information exploitable par les business analysts et lesā€¦

WORMS David

By WORMS David

Oct 25, 2021

Stage Web Technologies

Stage Web Technologies

Categories: Front End, Formation | Tags: DevOps, LDAP, React.js, CI/CD, Docker, GraphQL, IaC, Internship, Kubernetes, Node.js, OAuth2

Descriptif du stage Dans le cadre de ses activitĆ©s Big Data, Adaltas Academy est une plateforme de partage dā€™information regroupant des articles, des contenus de formation et une base de connaissanceā€¦

WORMS David

By WORMS David

Oct 14, 2021

H2O en pratique: retour d'expƩrience d'un Data Scientist

H2O en pratique: retour d'expƩrience d'un Data Scientist

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python

Les plates-formes dā€™apprentissage automatique (AutoML) gagnent en popularitĆ© et deviennent un outil puissant Ć  disposition des data scientists. Il y a quelques mois, jā€™ai prĆ©sentĆ© H2O, une plate-formeā€¦

Adaltas Summit 2021, seconde Ć©dition sur l'Ǝle de BeautĆ©

Adaltas Summit 2021, seconde Ć©dition sur l'Ǝle de BeautĆ©

Categories: Adaltas Summit 2021, Formation | Tags: Ansible, Hadoop, Spark, Azure, Blockchain, Deep Learning, Docker, Terraform, Kubernetes, Node.js

Pour sa seconde Ć©dition, lā€™ensemble de lā€™Ć©quipe Adaltas se rĆ©unit en Corse pour une semaine avec 2 jours dĆ©diĆ©s Ć  parler tech les 23 et 24 septembre 2021. AprĆØs une annĆ©e et demi de restrictionā€¦

WORMS David

By WORMS David

Sep 21, 2021

Guide d'apprentissage pour vous former au Big Data & Ć  L'IA avec la plateforme Databricks

Guide d'apprentissage pour vous former au Big Data & Ć  L'IA avec la plateforme Databricks

Categories: Data Engineering, Formation | Tags: Cloud, Data Lake, Databricks, Delta Lake, MLflow

Databricks Academy propose un programme de cours sur le Big Data, contenant 71 modules, que vous pouvez suivre Ć  votre rythme et selon vos besoins. Il vous en coĆ»tera 2000 $ US pour un accĆØs illimitĆ©ā€¦

KNYAZEVA Anna

By KNYAZEVA Anna

May 26, 2021

TensorFlow Extended (TFX) : les composants et leurs fonctionnalitƩs

TensorFlow Extended (TFX) : les composants et leurs fonctionnalitƩs

Categories: Big Data, Data Engineering, Data Science, Formation | Tags: Beam, Data Engineering, Pipeline, CI/CD, Data Science, Deep Learning, DĆ©ploiement, Machine Learning, MLOps, Open source, Python, TensorFlow

La mise en production des modĆØles de Machine Learning (ML) et de Deep Learning (DL) est une tĆ¢che difficile. Il est reconnu quā€™elle est plus sujette Ć  lā€™Ć©chec et plus longue que la modĆ©lisationā€¦

DĆ©veloppement accĆ©lĆ©rĆ© de modĆØles avec H2O AutoML et Flow

DĆ©veloppement accĆ©lĆ©rĆ© de modĆØles avec H2O AutoML et Flow

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python

La construction de modĆØles de Machine Learning (ML) est un processus trĆØs consommateur de temps. De plus, il requiĆØre de bonne connaissance en statistique, en algorithme de ML ainsi quā€™enā€¦

Suivi d'expƩriences avec MLflow sur Databricks Community Edition

Suivi d'expƩriences avec MLflow sur Databricks Community Edition

Categories: Data Engineering, Data Science, Formation | Tags: Spark, Databricks, Deep Learning, Delta Lake, Machine Learning, MLflow, Notebook, Python, Scikit-learn

Introduction au Databricks Community Edition et MLflow Chaque jour, le nombre dā€™outils permettant aux Data Scientists de crĆ©er des modĆØles plus rapidement augmente. Par consĆ©quent, la nĆ©cessitĆ© deā€¦

Importer ses donnƩes dans Databricks : tables externes et Delta Lake

Importer ses donnƩes dans Databricks : tables externes et Delta Lake

Categories: Data Engineering, Data Science, Formation | Tags: Parquet, AWS, Amazon S3, Azure Data Lake Storage (ADLS), Databricks, Delta Lake, Python

Au cours dā€™un projet dā€™apprentissage automatique (Machine Learning, ML), nous devons garder une trace des donnĆ©es test que nous utilisons. Cela est important Ć  des fins dā€™audit et pour Ć©valuer laā€¦

Optimisation d'applicationS Spark dans Hadoop YARN

Optimisation d'applicationS Spark dans Hadoop YARN

Categories: Data Engineering, Formation | Tags: Performance, Hadoop, Spark, Python

Apache Spark est un outil de traitement de donnĆ©es in-memory trĆØs rĆ©pandu en entreprise pour traiter des problĆ©matiques Big Data. Lā€™exĆ©cution dā€™une application Spark en production nĆ©cessite desā€¦

DE BAECQUE Ferdinand

By DE BAECQUE Ferdinand

Mar 30, 2020

MLflow tutorial : une plateforme de Machine Learning (ML) Open Source

MLflow tutorial : une plateforme de Machine Learning (ML) Open Source

Categories: Data Engineering, Data Science, Formation | Tags: AWS, Azure, Databricks, Deep Learning, DĆ©ploiement, Machine Learning, MLflow, MLOps, Python, Scikit-learn

Introduction et principes de MLflow Avec une puissance de calcul et un stockage de moins en moins chers et en mĆŖme temps une collecte de donnĆ©es de plus en plus importante dans tous les domaines, deā€¦

Installation de TensorFlow avec Docker

Installation de TensorFlow avec Docker

Categories: Orchestration de conteneurs, Data Science, Formation | Tags: CPU, Jupyter, Linux, IA, Deep Learning, Docker, TensorFlow

TensorFlow est un logiciel open source de Google pour le calcul numĆ©rique utilisant une reprĆ©sentation en graphĀ : Vertex (nodes) reprĆ©sentent des opĆ©rations mathĆ©matiques Edges reprĆ©sentent un tableauā€¦

SAUVAGE Pierre

By SAUVAGE Pierre

Aug 5, 2019

Spark Streaming partie 4 : clustering avec Spark MLlib

Spark Streaming partie 4 : clustering avec Spark MLlib

Categories: Data Engineering, Data Science, Formation | Tags: Apache Spark Streaming, Spark, Big Data, Clustering, Machine Learning, Scala, Streaming

Spark MLlib est une bibliothĆØque Spark dā€™Apache offrant des implĆ©mentations performantes de divers algorithmes dā€™apprentissage automatique supervisĆ©s et non supervisĆ©s. Ainsi, le framework Spark peutā€¦

RYNKIEWICZ Oskar

By RYNKIEWICZ Oskar

Jun 27, 2019

Spark Streaming Partie 2 : traitement d'une pipeline Spark Structured Streaming dans Hadoop

Spark Streaming Partie 2 : traitement d'une pipeline Spark Structured Streaming dans Hadoop

Categories: Data Engineering, Formation | Tags: Apache Spark Streaming, Spark, Python, Streaming

Spark est conƧu pour traiter des donnĆ©es streaming de maniĆØre fluide sur un cluster Hadoop multi-nœuds, utilisant HDFS pour le stockage et YARN pour lā€™orchestration de tĆ¢ches. Ainsi, Spark Structuredā€¦

RYNKIEWICZ Oskar

By RYNKIEWICZ Oskar

May 28, 2019

Spark Streaming partie 1Ā : construction de data pipelines avec Spark Structured Streaming

Spark Streaming partie 1Ā : construction de data pipelines avec Spark Structured Streaming

Categories: Data Engineering, Formation | Tags: Apache Spark Streaming, Kafka, Spark, Big Data, Streaming

Spark Structured Streaming est un nouveau moteur de traitement stream introduit avec Apache Spark 2. Il est construit sur le moteur Spark SQL et utilise le modĆØle Spark DataFrame. Le moteur Structuredā€¦

RYNKIEWICZ Oskar

By RYNKIEWICZ Oskar

Apr 18, 2019

Les fonctions de premiĆØre classe en Python

Les fonctions de premiĆØre classe en Python

Categories: Hack, Formation | Tags: Programmation, Python

Jā€™ai rĆ©cemment regardĆ© une confĆ©rence de Dave Cheney sur les fonctions de premiĆØre classe en Go. Sachant que Python est Ć©galement capable de les prendre en charge, sont-elles utilisables de la mĆŖmeā€¦

BUSSER Arthur

By BUSSER Arthur

Apr 15, 2019

CodaLab - Concours de Data Science

CodaLab - Concours de Data Science

Categories: Data Science, Adaltas Summit 2018, Formation | Tags: Base de donnƩes, Infrastructure, Machine Learning, MySQL, Node.js, Python

CodaLab Competition est une plateforme servant Ć  lā€™exĆ©cution de code dans le domaine de la Data Science. Elle se prĆ©sente sous la forme dā€™une interface web sur laquelle un utilisateur peut soumettreā€¦

SOARES Robert Walid

By SOARES Robert Walid

Dec 17, 2018

Une semaine Ơ discuter techno isolƩs dans un riad Marocain

Une semaine Ơ discuter techno isolƩs dans un riad Marocain

Categories: Adaltas Summit 2018, Formation | Tags: CDSW, Gatsby, React.js, Flink, Hadoop, Knox, Data Science, Deep Learning, Kubernetes, Node.js

Adaltas organise sa premiĆØre confĆ©rence entre les 22 et 26 Octobre. Au programme de ces 5 jours de confĆ©renceĀ : discuter de technologie dans lā€™un des plus beau riad de Marrakech. MĆ©langer lā€™utile Ć  lā€¦

WORMS David

By WORMS David

Oct 11, 2018

LandoĀ : rĆ©sumĆ© de conversation en Deep Learning

LandoĀ : rĆ©sumĆ© de conversation en Deep Learning

Categories: Data Science, Formation | Tags: Micro Services, Open API, Deep Learning, Internship, Kubernetes, RĆ©seau de neurones, Node.js

LandoĀ : Les derniers maĆ®tres des mots Lando est une application de rĆ©sumĆ© de rĆ©union qui utilise les technologies de Speech To Text pour transcrire de lā€™audio en Ć©crit et les technologies de Deepā€¦

HATI Yliess

By HATI Yliess

Sep 18, 2018

Notes sur Katacoda relatives Ć  l'orchestrateur de conteneur Kubernetes

Notes sur Katacoda relatives Ć  l'orchestrateur de conteneur Kubernetes

Categories: Orchestration de conteneurs, Formation | Tags: Helm, Ingress, Kubeadm, CNI, Micro Services, Minikube, Kubernetes

Il y a quelques semaines, jā€™ai consacrĆ© deux jours pour suivre les cours relatifs Ć  la solution dā€™orchestration de *container Kubernetes mis Ć  disposition sur la plateforme Katacoda. Je partage cesā€¦

WORMS David

By WORMS David

Dec 14, 2017

Passage Ơ l'Ʃchelle de larges pipelines de donnƩes en temps rƩel avec Go

Passage Ơ l'Ʃchelle de larges pipelines de donnƩes en temps rƩel avec Go

Categories: Open Source Summit Europe 2017, Formation | Tags: Algorithme, Data structures, Go Lang, Pipeline, Protocols, RĆ©seau

Il y a quelques semaines, Ć  lā€™Open Source Summit Ć  Prague, Jean de Klerk a tenu une confĆ©rence intitulĆ©e ā€œPassage Ć  lā€™Ć©chelle en temps rĆ©el de pipelines de donnĆ©es avec Goā€. Cet article passe en revueā€¦

BUSSER Arthur

By BUSSER Arthur

Nov 21, 2017

Installation d'Hadoop et d'HBase sous OSX en mode pseudo-distribuƩ

Installation d'Hadoop et d'HBase sous OSX en mode pseudo-distribuƩ

Categories: Big Data, Formation | Tags: Hue, Infrastructure, Hadoop, HBase, Big Data, DĆ©ploiement

Le systĆØme dā€™exploitation choisi est OSX mais la procĆ©dure nā€™est pas si diffĆ©rente pour tout environnement Unix car lā€™essentiel des logiciels est tĆ©lĆ©chargĆ© depuis Internet, dĆ©compressĆ© et paramĆ©trĆ©ā€¦

WORMS David

By WORMS David

Dec 1, 2010

Canada - Morocco - France

We are a team of Open Source enthusiasts doing consulting in Big Data, Cloud, DevOps, Data Engineering, Data Scienceā€¦

We provide our customers with accurate insights on how to leverage technologies to convert their use cases to projects in production, how to reduce their costs and increase the time to market.

If you enjoy reading our publications and have an interest in what we do, contact us and we will be thrilled to cooperate with you.

Support Ukrain