Cloud Computing

Achieving agility, efficiency, cost control and better analytics by deploying a cloud big data infrastructure while taking the security and legacy imperatives into account is not a trivial task. Managing an elastic pool of resources in a multi-tenant environment while respecting the SLAs and data integrity and keeping the bills under control is not either.

We architect, deploy and operate hybrid public and private cloud solutions based on multiple offerings on a daily basis. We’ve been involved in different approaches to cloud migration, from ā€œLift & Shiftā€ to complete re-platform. These experiences provide our consultants with the depth and breadth of skills needed to help you navigate, customize and operate the new normal.

Our consultants intervene on all the project life cycle, from the feasibility study to the project delivery

Cloud migration

  • Gather and document the requirements (functional and nonfunctional)
  • Architect the solution based on those requirements
  • Roadmap definition and project planning
  • Test, optimize, cut-off processes
  • Public cloud services comparison

Cloud operation and optimization

  • Audit infrastructure, processes and costs
  • Infrastructure deployment automation
  • Define and achieve desired state and processes (SLOs, SLAs)
  • Infrastructure, networking and service operation
  • Cost analysis and optimization

Cloud integration and development

  • Technology and services qualification and validation
  • Data ingestion/preparation pipelines
  • Data loading and connections
  • Machine Learning algorithms
  • Stream and batch processing

Articles related to Cloud

CDP partie 5 : gestion des permissions utilisateurs sur CDP

CDP partie 5 : gestion des permissions utilisateurs sur CDP

Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: Ranger, Cloudera, CDP, EntrepƓt de donnƩes (Data Warehouse)

Lorsqu’un utilisateur ou un groupe est crƩƩ dans CDP, des permissions doivent leur ĆŖtre attribuĆ©es pour accĆ©der aux ressources et utiliser les Data Services. Cet article est le cinquiĆØme d’une sĆ©rie…

CHAVARRIA Tobias

By CHAVARRIA Tobias

Jul 18, 2023

CDP partie 4 : gestion des utilisateurs sur CDP avec Keycloak

CDP partie 4 : gestion des utilisateurs sur CDP avec Keycloak

Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: EC2, Big Data, CDP, Docker Compose, Keycloak, SSO

Les articles prĆ©cĆ©dents de la sĆ©rie couvrent le dĆ©ploiement d’un environnement CDP Public Cloud. Tous les composants sont prĆŖts Ć  ĆŖtre utilisĆ©s et il est temps de mettre l’environnement Ć  la…

CHAVARRIA Tobias

By CHAVARRIA Tobias

Jul 4, 2023

CDP partie 3 : activation des Data Services en environnment CDP Public Cloud

CDP partie 3 : activation des Data Services en environnment CDP Public Cloud

Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloudera, CDP

L’un des principaux arguments de vente de Cloudera Data Platform (CDP) est la maturitĆ© de son offre de services. Ceux-ci sont faciles Ć  dĆ©ployer sur site, dans le cloud public ou dans le cadre d’une…

KONRAD Albert

By KONRAD Albert

Jun 27, 2023

CDP partie 2 : dƩploiement d'un environnement CDP Public Cloud sur AWS

CDP partie 2 : dƩploiement d'un environnement CDP Public Cloud sur AWS

Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloud, Cloudera, CDP, Cloudera Manager

La Cloudera Data Platform (CDP) Public Cloud constitue la base sur laquelle des lacs de donnĆ©es (Data Lake) complets sont crƩƩs. Dans un article prĆ©cĆ©dent, nous avons prĆ©sentĆ© la plateforme CDP. Cet…

KONRAD Albert

By KONRAD Albert

Jun 19, 2023

CDP partie 1 : introduction Ć  l'architecture Data Lakehouse avec CDP

CDP partie 1 : introduction Ć  l'architecture Data Lakehouse avec CDP

Categories: Cloud computing, Data Engineering, Infrastructure | Tags: Data Engineering, Iceberg, AWS, Azure, Big Data, Cloud, Cloudera, CDP, Cloudera Manager, EntrepƓt de donnƩes (Data Warehouse)

Cloudera Data Platform (CDP) est une data platform hybride pour l’intĆ©gration de donnĆ©e, le machine learning et l’analyse de la data. Dans cette sĆ©rie d’articles nous allons dĆ©crire comment installer…

BAUM Stephan

By BAUM Stephan

Jun 8, 2023

DƩploiement de Keycloak sur EC2

DƩploiement de Keycloak sur EC2

Categories: Cloud computing, Data Engineering, Infrastructure | Tags: EC2, sƩcuritƩ, Authentification, AWS, Docker, Keycloak, SSL/TLS, SSO

Pourquoi utiliser Keycloak Keycloak est un fournisseur d’identitĆ© open source (IdP) utilisant l’authentification unique SSO. Un IdP est un outil permettant de crĆ©er, de maintenir et de gĆ©rer les…

BAUM Stephan

By BAUM Stephan

Mar 14, 2023

Collecte de logs Databricks vers Azure Monitor Ơ l'Ʃchelle d'un workspace

Collecte de logs Databricks vers Azure Monitor Ơ l'Ʃchelle d'un workspace

Categories: Cloud computing, Data Engineering, Adaltas Summit 2021 | Tags: MƩtriques, Supervision, Spark, Azure, Databricks, Log4j

Databricks est une plateforme optimisĆ©e d’analyse de donnĆ©es, basĆ©e sur Apache Spark. La surveillance de la plateforme Databricks est cruciale pour garantir la qualitĆ© des donnĆ©es, les performances du…

PLAYE Claire

By PLAYE Claire

May 10, 2022

Utilisation de Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud

Utilisation de Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud

Categories: Big Data, Cloud computing | Tags: Ansible, Cloudera, CDP, Cluster, EntrepƓt de donnƩes (Data Warehouse), Vagrant, IaC

Suite Ć  notre rĆ©cente prĆ©sentation de CDP, passons dĆ©sormais au dĆ©ploiement CDP private Cloud sur votre infrastructure locale. Le deploiement est entiĆØrement automatisĆ© avec les cookbooks Ansible…

HOFFMANN Alexander

By HOFFMANN Alexander

Jul 23, 2021

PrƩsentation de Cloudera Data Platform (CDP)

PrƩsentation de Cloudera Data Platform (CDP)

Categories: Big Data, Cloud computing, Data Engineering | Tags: SDX, Big Data, Cloud, Cloudera, CDP, CDH, Analyse de donnƩes, Data Hub, Data Lake, Lakehouse, EntrepƓt de donnƩes (Data Warehouse)

Cloudera Data Platform (CDP) est une plateforme de cloud computing pour les entreprises. CDP fournit des outils intĆ©grĆ©s et multifonctionnels en libre-service afin d’analyser et de centraliser les…

HOFFMANN Alexander

By HOFFMANN Alexander

Jul 19, 2021

Les certifications Microsoft Azure associƩes aux donnƩes

Les certifications Microsoft Azure associƩes aux donnƩes

Categories: Cloud computing, Data Engineering | Tags: Gouvernance des donnƩes, Azure, Data Science

Microsoft Azure a des parcours de certification pour de nombreux postes techniques tels que dĆ©veloppeur, Data Engineers, Data Scientists et architect solution, entre autres. Chacune de ces…

NGOM Barthelemy

By NGOM Barthelemy

Apr 14, 2021

Connexion Ć  ADLS Gen2 depuis Hadoop (HDP) et NiFi (HDF)

Connexion Ć  ADLS Gen2 depuis Hadoop (HDP) et NiFi (HDF)

Categories: Big Data, Cloud computing, Data Engineering | Tags: NiFi, Hadoop, HDFS, Authentification, Autorisation, Azure, Azure Data Lake Storage (ADLS), OAuth2

Alors que les projets Data construits sur le cloud deviennent de plus en plus rĆ©pandus, un cas d’utilisation courant consiste Ć  interagir avec le stockage cloud Ć  partir d’une plateforme Big Data on…

LEONARD Gauthier

By LEONARD Gauthier

Nov 5, 2020

Automatisation d'un workflow Spark sur GCP avec GitLab

Automatisation d'un workflow Spark sur GCP avec GitLab

Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: Enseignement et tutorial, Airflow, Spark, CI/CD, GitLab, GitOps, GCP, Terraform

Un workflow consiste Ć  automiatiser une succĆ©ssion de tĆ¢che qui dont ĆŖtre menĆ©e indĆ©pendemment d’une intervention humaine. C’est un concept important et populaire, s’appliquant particuliĆØrement Ć  un…

DE BAECQUE Ferdinand

By DE BAECQUE Ferdinand

Jun 16, 2020

Premier pas avec Apache Airflow sur AWS

Premier pas avec Apache Airflow sur AWS

Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: PySpark, Enseignement et tutorial, Airflow, Oozie, Spark, AWS, Docker, Python

Apache Airflow offre une solution rĆ©pondant au dĆ©fi croissant d’un paysage de plus en plus complexe d’outils de gestion de donnĆ©es, de scripts et de traitements d’analyse Ć  gĆ©rer et coordonner. C’est…

COINTEPAS Aargan

By COINTEPAS Aargan

May 5, 2020

Snowflake, le Data Warehouse conƧu pour le cloud, introduction et premiers pas

Snowflake, le Data Warehouse conƧu pour le cloud, introduction et premiers pas

Categories: Business Intelligence, Cloud computing | Tags: Cloud, Data Lake, Data Science, EntrepƓt de donnƩes (Data Warehouse), Snowflake

Snowflake est une plateforme d’entrepĆ“t de donnĆ©es en mode SaaS qui centralise, dans le cloud, le stockage et le traitement de donnĆ©es structurĆ©es et semi-structurĆ©es. La gĆ©nĆ©ration croissante de…

HAMELIN-BOYER Jules

By HAMELIN-BOYER Jules

Apr 7, 2020

Cloudera CDP et migration Cloud de votre Data Warehouse

Cloudera CDP et migration Cloud de votre Data Warehouse

Categories: Big Data, Cloud computing | Tags: Azure, Cloudera, Data Hub, Data Lake, EntrepƓt de donnƩes (Data Warehouse)

Alors que l’un de nos clients anticipe un passage vers le Cloud et avec l’annonce rĆ©cente de la disponibilitĆ© de Cloudera CDP mi-septembre lors de la confĆ©rence Strata, il semble que le moment soit…

WORMS David

By WORMS David

Dec 16, 2019

Migration Big Data et Data Lake vers le Cloud

Migration Big Data et Data Lake vers le Cloud

Categories: Big Data, Cloud computing | Tags: DevOps, AWS, Azure, Cloud, CDP, Databricks, GCP

Est-il impĆ©ratif de suivre tendance et de migrer ses donnĆ©es, workflow et infrastructure vers l’un des Cloud providers tels que GCP, AWS ou AzureĀ ? Lors de la Strata Data Conference Ć  New-York, un…

RUMMENS Joris

By RUMMENS Joris

Dec 9, 2019

InsƩrer des lignes dans une table BigQuery avec des colonnes complexes

InsƩrer des lignes dans une table BigQuery avec des colonnes complexes

Categories: Cloud computing, Data Engineering | Tags: GCP, BigQuery, SchƩma, SQL

Le service BigQuery de Google Cloud est une solution data warehouse conƧue pour traiter d’énormes volumes de donnĆ©es avec un certain nombre de fonctionnalitĆ©s disponibles. Parmi toutes celles-ci, nous…

BEREZOWSKI CƩsar

By BEREZOWSKI CƩsar

Nov 22, 2019

ExƩcuter des workloads d'entreprise dans le Cloud avec Cloudbreak

ExƩcuter des workloads d'entreprise dans le Cloud avec Cloudbreak

Categories: Big Data, Cloud computing, DataWorks Summit 2018 | Tags: Cloudbreak, Exploitation, Hadoop, AWS, Azure, GCP, HDP, OpenStack

Cet article se base sur la confĆ©rence de Peter Darvasi et Richard Doktorics ā€œRunning Enterprise Workloads in the Cloudā€ au DataWorks Summit 2018 Ć  Berlin. Il prĆ©sentera l’outil de dĆ©ploiement…

RUMMENS Joris

By RUMMENS Joris

May 28, 2018

Micro Services

Micro Services

Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Mesos, DNS, Chiffrement, gRPC, Istio, Linkerd, Micro Services, MITM, Service Mesh, CNCF, Kubernetes, Proxy, SPOF, SSL/TLS

Historiquement, les applications Ć©taient monolithiques et nous pouvions utiliser une adresse IP pour accĆ©der Ć  un service. Avec les machines virtuelles (VM), plusieurs hĆ“tes commencent Ć  apparaĆ®tre…

WORMS David

By WORMS David

Nov 14, 2017

MƩthodes de stockage persistƩes dans Kubernetes

MƩthodes de stockage persistƩes dans Kubernetes

Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Container Storage Interface (CSI), PVC, Azure, Docker, GCE, Kubernetes, Storage

Cet article est basĆ© sur la prĆ©sentation ā€œIntroduction to Kubernetes Storage Primitives for Stateful Workloadsā€ par the {Code} team Ć  la confĆ©rence OSS 2017 Ć  Prague. CommenƧons par qu’est-ce que…

SAUVAGE Pierre

By SAUVAGE Pierre

Oct 28, 2017

IntƩgration continue et "gating" multi-repo Ơ grand Ʃchelle

IntƩgration continue et "gating" multi-repo Ơ grand Ʃchelle

Categories: Cloud computing, DevOps & SRE, Open Source Summit Europe 2017 | Tags: Infrastructure, Jenkins, Red Hat, Zuul, Ansible, CI/CD, OpenStack

Cet article est un rĆ©capitulatif avec nos impressions de la prĆ©sentation de l’outil d’intĆ©gration continue d’OpenStack Zuul Ć  la confĆ©rence Open Source Summit 2017 Ć  Prague par Monty Taylor (Ć  ne pas…

RUMMENS Joris

By RUMMENS Joris

Oct 28, 2017

Node.js intƩgrƩ Ơ la plateforme cloud Microsoft Azure

Node.js intƩgrƩ Ơ la plateforme cloud Microsoft Azure

Categories: Cloud computing, Tech Radar | Tags: Linux, Azure, Cloud, Node.js

Node est dĆ©sormais un citoyen de premier ordre dans l’environnement cloud de Microsoft Azure au cĆ“tĆ© de .Net, Java et PHP. Cette intĆ©gration est la consĆ©quence logique de l’implication de Microsoft…

WORMS David

By WORMS David

Dec 11, 2011

Canada - Morocco - France

We are a team of Open Source enthusiasts doing consulting in Big Data, Cloud, DevOps, Data Engineering, Data Science…

We provide our customers with accurate insights on how to leverage technologies to convert their use cases to projects in production, how to reduce their costs and increase the time to market.

If you enjoy reading our publications and have an interest in what we do, contact us and we will be thrilled to cooperate with you.

Support Ukrain