Cloud Computing

Achieving agility, efficiency, cost control and better analytics by deploying a cloud big data infrastructure while taking the security and legacy imperatives into account is not a trivial task. Managing an elastic pool of resources in a multi-tenant environment while respecting the SLAs and data integrity and keeping the bills under control is not either.

We architect, deploy and operate hybrid public and private cloud solutions based on multiple offerings on a daily basis. Weā€™ve been involved in different approaches to cloud migration, from ā€œLift & Shiftā€ to complete re-platform. These experiences provide our consultants with the depth and breadth of skills needed to help you navigate, customize and operate the new normal.

Our consultants intervene on all the project life cycle, from the feasibility study to the project delivery

Cloud migration

  • Gather and document the requirements (functional and nonfunctional)
  • Architect the solution based on those requirements
  • Roadmap definition and project planning
  • Test, optimize, cut-off processes
  • Public cloud services comparison

Cloud operation and optimization

  • Audit infrastructure, processes and costs
  • Infrastructure deployment automation
  • Define and achieve desired state and processes (SLOs, SLAs)
  • Infrastructure, networking and service operation
  • Cost analysis and optimization

Cloud integration and development

  • Technology and services qualification and validation
  • Data ingestion/preparation pipelines
  • Data loading and connections
  • Machine Learning algorithms
  • Stream and batch processing

Articles related to Cloud

CDP partie 5 : gestion des permissions utilisateurs sur CDP

CDP partie 5 : gestion des permissions utilisateurs sur CDP

Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: Ranger, Cloudera, CDP, EntrepƓt de donnƩes (Data Warehouse)

Lorsquā€™un utilisateur ou un groupe est crĆ©Ć© dans CDP, des permissions doivent leur ĆŖtre attribuĆ©es pour accĆ©der aux ressources et utiliser les Data Services. Cet article est le cinquiĆØme dā€™une sĆ©rieā€¦

CHAVARRIA Tobias

By CHAVARRIA Tobias

Jul 18, 2023

CDP partie 4 : gestion des utilisateurs sur CDP avec Keycloak

CDP partie 4 : gestion des utilisateurs sur CDP avec Keycloak

Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: EC2, Big Data, CDP, Docker Compose, Keycloak, SSO

Les articles prĆ©cĆ©dents de la sĆ©rie couvrent le dĆ©ploiement dā€™un environnement CDP Public Cloud. Tous les composants sont prĆŖts Ć  ĆŖtre utilisĆ©s et il est temps de mettre lā€™environnement Ć  laā€¦

CHAVARRIA Tobias

By CHAVARRIA Tobias

Jul 4, 2023

CDP partie 3 : activation des Data Services en environnment CDP Public Cloud

CDP partie 3 : activation des Data Services en environnment CDP Public Cloud

Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloudera, CDP

Lā€™un des principaux arguments de vente de Cloudera Data Platform (CDP) est la maturitĆ© de son offre de services. Ceux-ci sont faciles Ć  dĆ©ployer sur site, dans le cloud public ou dans le cadre dā€™uneā€¦

KONRAD Albert

By KONRAD Albert

Jun 27, 2023

CDP partie 2 : dƩploiement d'un environnement CDP Public Cloud sur AWS

CDP partie 2 : dƩploiement d'un environnement CDP Public Cloud sur AWS

Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloud, Cloudera, CDP, Cloudera Manager

La Cloudera Data Platform (CDP) Public Cloud constitue la base sur laquelle des lacs de donnĆ©es (Data Lake) complets sont crĆ©Ć©s. Dans un article prĆ©cĆ©dent, nous avons prĆ©sentĆ© la plateforme CDP. Cetā€¦

KONRAD Albert

By KONRAD Albert

Jun 19, 2023

CDP partie 1 : introduction Ć  l'architecture Data Lakehouse avec CDP

CDP partie 1 : introduction Ć  l'architecture Data Lakehouse avec CDP

Categories: Cloud computing, Data Engineering, Infrastructure | Tags: Data Engineering, Iceberg, AWS, Azure, Big Data, Cloud, Cloudera, CDP, Cloudera Manager, EntrepƓt de donnƩes (Data Warehouse)

Cloudera Data Platform (CDP) est une data platform hybride pour lā€™intĆ©gration de donnĆ©e, le machine learning et lā€™analyse de la data. Dans cette sĆ©rie dā€™articles nous allons dĆ©crire comment installerā€¦

BAUM Stephan

By BAUM Stephan

Jun 8, 2023

DĆ©ploiement de Keycloak sur EC2

DĆ©ploiement de Keycloak sur EC2

Categories: Cloud computing, Data Engineering, Infrastructure | Tags: EC2, sƩcuritƩ, Authentification, AWS, Docker, Keycloak, SSL/TLS, SSO

Pourquoi utiliser Keycloak Keycloak est un fournisseur dā€™identitĆ© open source (IdP) utilisant lā€™authentification unique SSO. Un IdP est un outil permettant de crĆ©er, de maintenir et de gĆ©rer lesā€¦

BAUM Stephan

By BAUM Stephan

Mar 14, 2023

Collecte de logs Databricks vers Azure Monitor Ć  l'Ć©chelle d'un workspace

Collecte de logs Databricks vers Azure Monitor Ć  l'Ć©chelle d'un workspace

Categories: Cloud computing, Data Engineering, Adaltas Summit 2021 | Tags: MĆ©triques, Supervision, Spark, Azure, Databricks, Log4j

Databricks est une plateforme optimisĆ©e dā€™analyse de donnĆ©es, basĆ©e sur Apache Spark. La surveillance de la plateforme Databricks est cruciale pour garantir la qualitĆ© des donnĆ©es, les performances duā€¦

PLAYE Claire

By PLAYE Claire

May 10, 2022

Utilisation de Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud

Utilisation de Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud

Categories: Big Data, Cloud computing | Tags: Ansible, Cloudera, CDP, Cluster, EntrepƓt de donnƩes (Data Warehouse), Vagrant, IaC

Suite Ć  notre rĆ©cente prĆ©sentation de CDP, passons dĆ©sormais au dĆ©ploiement CDP private Cloud sur votre infrastructure locale. Le deploiement est entiĆØrement automatisĆ© avec les cookbooks Ansibleā€¦

HOFFMANN Alexander

By HOFFMANN Alexander

Jul 23, 2021

PrƩsentation de Cloudera Data Platform (CDP)

PrƩsentation de Cloudera Data Platform (CDP)

Categories: Big Data, Cloud computing, Data Engineering | Tags: SDX, Big Data, Cloud, Cloudera, CDP, CDH, Analyse de donnƩes, Data Hub, Data Lake, Lakehouse, EntrepƓt de donnƩes (Data Warehouse)

Cloudera Data Platform (CDP) est une plateforme de cloud computing pour les entreprises. CDP fournit des outils intĆ©grĆ©s et multifonctionnels en libre-service afin dā€™analyser et de centraliser lesā€¦

HOFFMANN Alexander

By HOFFMANN Alexander

Jul 19, 2021

Les certifications Microsoft Azure associƩes aux donnƩes

Les certifications Microsoft Azure associƩes aux donnƩes

Categories: Cloud computing, Data Engineering | Tags: Gouvernance des donnƩes, Azure, Data Science

Microsoft Azure a des parcours de certification pour de nombreux postes techniques tels que dĆ©veloppeur, Data Engineers, Data Scientists et architect solution, entre autres. Chacune de cesā€¦

NGOM Barthelemy

By NGOM Barthelemy

Apr 14, 2021

Connexion Ć  ADLS Gen2 depuis Hadoop (HDP) et NiFi (HDF)

Connexion Ć  ADLS Gen2 depuis Hadoop (HDP) et NiFi (HDF)

Categories: Big Data, Cloud computing, Data Engineering | Tags: NiFi, Hadoop, HDFS, Authentification, Autorisation, Azure, Azure Data Lake Storage (ADLS), OAuth2

Alors que les projets Data construits sur le cloud deviennent de plus en plus rĆ©pandus, un cas dā€™utilisation courant consiste Ć  interagir avec le stockage cloud Ć  partir dā€™une plateforme Big Data onā€¦

LEONARD Gauthier

By LEONARD Gauthier

Nov 5, 2020

Automatisation d'un workflow Spark sur GCP avec GitLab

Automatisation d'un workflow Spark sur GCP avec GitLab

Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: Enseignement et tutorial, Airflow, Spark, CI/CD, GitLab, GitOps, GCP, Terraform

Un workflow consiste Ć  automiatiser une succĆ©ssion de tĆ¢che qui dont ĆŖtre menĆ©e indĆ©pendemment dā€™une intervention humaine. Cā€™est un concept important et populaire, sā€™appliquant particuliĆØrement Ć  unā€¦

DE BAECQUE Ferdinand

By DE BAECQUE Ferdinand

Jun 16, 2020

Premier pas avec Apache Airflow sur AWS

Premier pas avec Apache Airflow sur AWS

Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: PySpark, Enseignement et tutorial, Airflow, Oozie, Spark, AWS, Docker, Python

Apache Airflow offre une solution rĆ©pondant au dĆ©fi croissant dā€™un paysage de plus en plus complexe dā€™outils de gestion de donnĆ©es, de scripts et de traitements dā€™analyse Ć  gĆ©rer et coordonner. Cā€™estā€¦

COINTEPAS Aargan

By COINTEPAS Aargan

May 5, 2020

Snowflake, le Data Warehouse conƧu pour le cloud, introduction et premiers pas

Snowflake, le Data Warehouse conƧu pour le cloud, introduction et premiers pas

Categories: Business Intelligence, Cloud computing | Tags: Cloud, Data Lake, Data Science, EntrepƓt de donnƩes (Data Warehouse), Snowflake

Snowflake est une plateforme dā€™entrepĆ“t de donnĆ©es en mode SaaS qui centralise, dans le cloud, le stockage et le traitement de donnĆ©es structurĆ©es et semi-structurĆ©es. La gĆ©nĆ©ration croissante deā€¦

HAMELIN-BOYER Jules

By HAMELIN-BOYER Jules

Apr 7, 2020

Cloudera CDP et migration Cloud de votre Data Warehouse

Cloudera CDP et migration Cloud de votre Data Warehouse

Categories: Big Data, Cloud computing | Tags: Azure, Cloudera, Data Hub, Data Lake, EntrepƓt de donnƩes (Data Warehouse)

Alors que lā€™un de nos clients anticipe un passage vers le Cloud et avec lā€™annonce rĆ©cente de la disponibilitĆ© de Cloudera CDP mi-septembre lors de la confĆ©rence Strata, il semble que le moment soitā€¦

WORMS David

By WORMS David

Dec 16, 2019

Migration Big Data et Data Lake vers le Cloud

Migration Big Data et Data Lake vers le Cloud

Categories: Big Data, Cloud computing | Tags: DevOps, AWS, Azure, Cloud, CDP, Databricks, GCP

Est-il impĆ©ratif de suivre tendance et de migrer ses donnĆ©es, workflow et infrastructure vers lā€™un des Cloud providers tels que GCP, AWS ou AzureĀ ? Lors de la Strata Data Conference Ć  New-York, unā€¦

RUMMENS Joris

By RUMMENS Joris

Dec 9, 2019

InsƩrer des lignes dans une table BigQuery avec des colonnes complexes

InsƩrer des lignes dans une table BigQuery avec des colonnes complexes

Categories: Cloud computing, Data Engineering | Tags: GCP, BigQuery, SchƩma, SQL

Le service BigQuery de Google Cloud est une solution data warehouse conƧue pour traiter dā€™Ć©normes volumes de donnĆ©es avec un certain nombre de fonctionnalitĆ©s disponibles. Parmi toutes celles-ci, nousā€¦

BEREZOWSKI CĆ©sar

By BEREZOWSKI CĆ©sar

Nov 22, 2019

ExƩcuter des workloads d'entreprise dans le Cloud avec Cloudbreak

ExƩcuter des workloads d'entreprise dans le Cloud avec Cloudbreak

Categories: Big Data, Cloud computing, DataWorks Summit 2018 | Tags: Cloudbreak, Exploitation, Hadoop, AWS, Azure, GCP, HDP, OpenStack

Cet article se base sur la confĆ©rence de Peter Darvasi et Richard Doktorics ā€œRunning Enterprise Workloads in the Cloudā€ au DataWorks Summit 2018 Ć  Berlin. Il prĆ©sentera lā€™outil de dĆ©ploiementā€¦

RUMMENS Joris

By RUMMENS Joris

May 28, 2018

Micro Services

Micro Services

Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Mesos, CNCF, DNS, Chiffrement, gRPC, Istio, Linkerd, Micro Services, MITM, Service Mesh, Kubernetes, Proxy, SPOF, SSL/TLS

Historiquement, les applications Ć©taient monolithiques et nous pouvions utiliser une adresse IP pour accĆ©der Ć  un service. Avec les machines virtuelles (VM), plusieurs hĆ“tes commencent Ć  apparaĆ®treā€¦

WORMS David

By WORMS David

Nov 14, 2017

IntƩgration continue et "gating" multi-repo Ơ grand Ʃchelle

IntƩgration continue et "gating" multi-repo Ơ grand Ʃchelle

Categories: Cloud computing, DevOps & SRE, Open Source Summit Europe 2017 | Tags: Infrastructure, Jenkins, Red Hat, Zuul, Ansible, CI/CD, OpenStack

Cet article est un rĆ©capitulatif avec nos impressions de la prĆ©sentation de lā€™outil dā€™intĆ©gration continue dā€™OpenStack Zuul Ć  la confĆ©rence Open Source Summit 2017 Ć  Prague par Monty Taylor (Ć  ne pasā€¦

RUMMENS Joris

By RUMMENS Joris

Oct 28, 2017

MƩthodes de stockage persistƩes dans Kubernetes

MƩthodes de stockage persistƩes dans Kubernetes

Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Container Storage Interface (CSI), PVC, Azure, Docker, GCE, Kubernetes, Storage

Cet article est basĆ© sur la prĆ©sentation ā€œIntroduction to Kubernetes Storage Primitives for Stateful Workloadsā€ par the {Code} team Ć  la confĆ©rence OSS 2017 Ć  Prague. CommenƧons par quā€™est-ce queā€¦

SAUVAGE Pierre

By SAUVAGE Pierre

Oct 28, 2017

Node.js intƩgrƩ Ơ la plateforme cloud Microsoft Azure

Node.js intƩgrƩ Ơ la plateforme cloud Microsoft Azure

Categories: Cloud computing, Tech Radar | Tags: Linux, Azure, Cloud, Node.js

Node est dĆ©sormais un citoyen de premier ordre dans lā€™environnement cloud de Microsoft Azure au cĆ“tĆ© de .Net, Java et PHP. Cette intĆ©gration est la consĆ©quence logique de lā€™implication de Microsoftā€¦

WORMS David

By WORMS David

Dec 11, 2011

Canada - Morocco - France

We are a team of Open Source enthusiasts doing consulting in Big Data, Cloud, DevOps, Data Engineering, Data Scienceā€¦

We provide our customers with accurate insights on how to leverage technologies to convert their use cases to projects in production, how to reduce their costs and increase the time to market.

If you enjoy reading our publications and have an interest in what we do, contact us and we will be thrilled to cooperate with you.

Support Ukrain