Cloud Computing
Achieving agility, efficiency, cost control and better analytics by deploying a cloud big data infrastructure while taking the security and legacy imperatives into account is not a trivial task. Managing an elastic pool of resources in a multi-tenant environment while respecting the SLAs and data integrity and keeping the bills under control is not either.
We architect, deploy and operate hybrid public and private cloud solutions based on multiple offerings on a daily basis. Weāve been involved in different approaches to cloud migration, from āLift & Shiftā to complete re-platform. These experiences provide our consultants with the depth and breadth of skills needed to help you navigate, customize and operate the new normal.
Our consultants intervene on all the project life cycle, from the feasibility study to the project delivery
Cloud migration
- Gather and document the requirements (functional and nonfunctional)
- Architect the solution based on those requirements
- Roadmap definition and project planning
- Test, optimize, cut-off processes
- Public cloud services comparison
Cloud operation and optimization
- Audit infrastructure, processes and costs
- Infrastructure deployment automation
- Define and achieve desired state and processes (SLOs, SLAs)
- Infrastructure, networking and service operation
- Cost analysis and optimization
Cloud integration and development
- Technology and services qualification and validation
- Data ingestion/preparation pipelines
- Data loading and connections
- Machine Learning algorithms
- Stream and batch processing
Articles related to Cloud
CDP partie 5 : gestion des permissions utilisateurs sur CDP
Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: Ranger, Cloudera, CDP, EntrepƓt de donnƩes (Data Warehouse)
Lorsquāun utilisateur ou un groupe est crĆ©Ć© dans CDP, des permissions doivent leur ĆŖtre attribuĆ©es pour accĆ©der aux ressources et utiliser les Data Services. Cet article est le cinquiĆØme dāune sĆ©rieā¦
Jul 18, 2023
CDP partie 4 : gestion des utilisateurs sur CDP avec Keycloak
Categories: Big Data, Cloud computing, Gouvernance des donnƩes | Tags: EC2, Big Data, CDP, Docker Compose, Keycloak, SSO
Les articles prĆ©cĆ©dents de la sĆ©rie couvrent le dĆ©ploiement dāun environnement CDP Public Cloud. Tous les composants sont prĆŖts Ć ĆŖtre utilisĆ©s et il est temps de mettre lāenvironnement Ć laā¦
Jul 4, 2023
CDP partie 3 : activation des Data Services en environnment CDP Public Cloud
Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloudera, CDP
Lāun des principaux arguments de vente de Cloudera Data Platform (CDP) est la maturitĆ© de son offre de services. Ceux-ci sont faciles Ć dĆ©ployer sur site, dans le cloud public ou dans le cadre dāuneā¦
Jun 27, 2023
CDP partie 2 : dƩploiement d'un environnement CDP Public Cloud sur AWS
Categories: Big Data, Cloud computing, Infrastructure | Tags: Infrastructure, AWS, Big Data, Cloud, Cloudera, CDP, Cloudera Manager
La Cloudera Data Platform (CDP) Public Cloud constitue la base sur laquelle des lacs de donnĆ©es (Data Lake) complets sont crĆ©Ć©s. Dans un article prĆ©cĆ©dent, nous avons prĆ©sentĆ© la plateforme CDP. Cetā¦
Jun 19, 2023
CDP partie 1 : introduction Ć l'architecture Data Lakehouse avec CDP
Categories: Cloud computing, Data Engineering, Infrastructure | Tags: Data Engineering, Iceberg, AWS, Azure, Big Data, Cloud, Cloudera, CDP, Cloudera Manager, EntrepƓt de donnƩes (Data Warehouse)
Cloudera Data Platform (CDP) est une data platform hybride pour lāintĆ©gration de donnĆ©e, le machine learning et lāanalyse de la data. Dans cette sĆ©rie dāarticles nous allons dĆ©crire comment installerā¦
By BAUM Stephan
Jun 8, 2023
DĆ©ploiement de Keycloak sur EC2
Categories: Cloud computing, Data Engineering, Infrastructure | Tags: EC2, sƩcuritƩ, Authentification, AWS, Docker, Keycloak, SSL/TLS, SSO
Pourquoi utiliser Keycloak Keycloak est un fournisseur dāidentitĆ© open source (IdP) utilisant lāauthentification unique SSO. Un IdP est un outil permettant de crĆ©er, de maintenir et de gĆ©rer lesā¦
By BAUM Stephan
Mar 14, 2023
Collecte de logs Databricks vers Azure Monitor Ć l'Ć©chelle d'un workspace
Categories: Cloud computing, Data Engineering, Adaltas Summit 2021 | Tags: MĆ©triques, Supervision, Spark, Azure, Databricks, Log4j
Databricks est une plateforme optimisĆ©e dāanalyse de donnĆ©es, basĆ©e sur Apache Spark. La surveillance de la plateforme Databricks est cruciale pour garantir la qualitĆ© des donnĆ©es, les performances duā¦
By PLAYE Claire
May 10, 2022
Utilisation de Cloudera Deploy pour installer Cloudera Data Platform (CDP) Private Cloud
Categories: Big Data, Cloud computing | Tags: Ansible, Cloudera, CDP, Cluster, EntrepƓt de donnƩes (Data Warehouse), Vagrant, IaC
Suite Ć notre rĆ©cente prĆ©sentation de CDP, passons dĆ©sormais au dĆ©ploiement CDP private Cloud sur votre infrastructure locale. Le deploiement est entiĆØrement automatisĆ© avec les cookbooks Ansibleā¦
Jul 23, 2021
PrƩsentation de Cloudera Data Platform (CDP)
Categories: Big Data, Cloud computing, Data Engineering | Tags: SDX, Big Data, Cloud, Cloudera, CDP, CDH, Analyse de donnƩes, Data Hub, Data Lake, Lakehouse, EntrepƓt de donnƩes (Data Warehouse)
Cloudera Data Platform (CDP) est une plateforme de cloud computing pour les entreprises. CDP fournit des outils intĆ©grĆ©s et multifonctionnels en libre-service afin dāanalyser et de centraliser lesā¦
Jul 19, 2021
Les certifications Microsoft Azure associƩes aux donnƩes
Categories: Cloud computing, Data Engineering | Tags: Gouvernance des donnƩes, Azure, Data Science
Microsoft Azure a des parcours de certification pour de nombreux postes techniques tels que dĆ©veloppeur, Data Engineers, Data Scientists et architect solution, entre autres. Chacune de cesā¦
Apr 14, 2021
Connexion Ć ADLS Gen2 depuis Hadoop (HDP) et NiFi (HDF)
Categories: Big Data, Cloud computing, Data Engineering | Tags: NiFi, Hadoop, HDFS, Authentification, Autorisation, Azure, Azure Data Lake Storage (ADLS), OAuth2
Alors que les projets Data construits sur le cloud deviennent de plus en plus rĆ©pandus, un cas dāutilisation courant consiste Ć interagir avec le stockage cloud Ć partir dāune plateforme Big Data onā¦
Nov 5, 2020
Automatisation d'un workflow Spark sur GCP avec GitLab
Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: Enseignement et tutorial, Airflow, Spark, CI/CD, GitLab, GitOps, GCP, Terraform
Un workflow consiste Ć automiatiser une succĆ©ssion de tĆ¢che qui dont ĆŖtre menĆ©e indĆ©pendemment dāune intervention humaine. Cāest un concept important et populaire, sāappliquant particuliĆØrement Ć unā¦
Jun 16, 2020
Premier pas avec Apache Airflow sur AWS
Categories: Big Data, Cloud computing, Orchestration de conteneurs | Tags: PySpark, Enseignement et tutorial, Airflow, Oozie, Spark, AWS, Docker, Python
Apache Airflow offre une solution rĆ©pondant au dĆ©fi croissant dāun paysage de plus en plus complexe dāoutils de gestion de donnĆ©es, de scripts et de traitements dāanalyse Ć gĆ©rer et coordonner. Cāestā¦
May 5, 2020
Snowflake, le Data Warehouse conƧu pour le cloud, introduction et premiers pas
Categories: Business Intelligence, Cloud computing | Tags: Cloud, Data Lake, Data Science, EntrepƓt de donnƩes (Data Warehouse), Snowflake
Snowflake est une plateforme dāentrepĆ“t de donnĆ©es en mode SaaS qui centralise, dans le cloud, le stockage et le traitement de donnĆ©es structurĆ©es et semi-structurĆ©es. La gĆ©nĆ©ration croissante deā¦
Apr 7, 2020
Cloudera CDP et migration Cloud de votre Data Warehouse
Categories: Big Data, Cloud computing | Tags: Azure, Cloudera, Data Hub, Data Lake, EntrepƓt de donnƩes (Data Warehouse)
Alors que lāun de nos clients anticipe un passage vers le Cloud et avec lāannonce rĆ©cente de la disponibilitĆ© de Cloudera CDP mi-septembre lors de la confĆ©rence Strata, il semble que le moment soitā¦
By WORMS David
Dec 16, 2019
Migration Big Data et Data Lake vers le Cloud
Categories: Big Data, Cloud computing | Tags: DevOps, AWS, Azure, Cloud, CDP, Databricks, GCP
Est-il impĆ©ratif de suivre tendance et de migrer ses donnĆ©es, workflow et infrastructure vers lāun des Cloud providers tels que GCP, AWS ou AzureĀ ? Lors de la Strata Data Conference Ć New-York, unā¦
Dec 9, 2019
InsƩrer des lignes dans une table BigQuery avec des colonnes complexes
Categories: Cloud computing, Data Engineering | Tags: GCP, BigQuery, SchƩma, SQL
Le service BigQuery de Google Cloud est une solution data warehouse conƧue pour traiter dāĆ©normes volumes de donnĆ©es avec un certain nombre de fonctionnalitĆ©s disponibles. Parmi toutes celles-ci, nousā¦
Nov 22, 2019
ExƩcuter des workloads d'entreprise dans le Cloud avec Cloudbreak
Categories: Big Data, Cloud computing, DataWorks Summit 2018 | Tags: Cloudbreak, Exploitation, Hadoop, AWS, Azure, GCP, HDP, OpenStack
Cet article se base sur la confĆ©rence de Peter Darvasi et Richard Doktorics āRunning Enterprise Workloads in the Cloudā au DataWorks Summit 2018 Ć Berlin. Il prĆ©sentera lāoutil de dĆ©ploiementā¦
May 28, 2018
Micro Services
Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Mesos, DNS, Chiffrement, gRPC, Istio, Linkerd, Micro Services, MITM, Service Mesh, CNCF, Kubernetes, Proxy, SPOF, SSL/TLS
Historiquement, les applications Ć©taient monolithiques et nous pouvions utiliser une adresse IP pour accĆ©der Ć un service. Avec les machines virtuelles (VM), plusieurs hĆ“tes commencent Ć apparaĆ®treā¦
By WORMS David
Nov 14, 2017
IntĆ©gration continue et "gating" multi-repo Ć grand Ć©chelle
Categories: Cloud computing, DevOps & SRE, Open Source Summit Europe 2017 | Tags: Infrastructure, Jenkins, Red Hat, Zuul, Ansible, CI/CD, OpenStack
Cet article est un rĆ©capitulatif avec nos impressions de la prĆ©sentation de lāoutil dāintĆ©gration continue dāOpenStack Zuul Ć la confĆ©rence Open Source Summit 2017 Ć Prague par Monty Taylor (Ć ne pasā¦
Oct 28, 2017
MƩthodes de stockage persistƩes dans Kubernetes
Categories: Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags: Container Storage Interface (CSI), PVC, Azure, Docker, GCE, Kubernetes, Storage
Cet article est basĆ© sur la prĆ©sentation āIntroduction to Kubernetes Storage Primitives for Stateful Workloadsā par the {Code} team Ć la confĆ©rence OSS 2017 Ć Prague. CommenƧons par quāest-ce queā¦
Oct 28, 2017
Node.js intĆ©grĆ© Ć la plateforme cloud Microsoft Azure
Categories: Cloud computing, Tech Radar | Tags: Linux, Azure, Cloud, Node.js
Node est dĆ©sormais un citoyen de premier ordre dans lāenvironnement cloud de Microsoft Azure au cĆ“tĆ© de .Net, Java et PHP. Cette intĆ©gration est la consĆ©quence logique de lāimplication de Microsoftā¦
By WORMS David
Dec 11, 2011