Passionné d’informatique depuis sa plus tendre enfance, et pratiquant la programmation en loisir depuis l’adolescence, Pierre rejoint une école d’ingénieur avec spécialisation en Système d’Information, option Big Data.
Il a commencé sa carrière en laboratoire de recherche sur IoT, où il a pu étudier les systèmes distribués, tant sur un plan théorique que pratique. Pierre a ensuite rejoint Adaltas. Il est aujourd’hui un architecte solution Big Data & Hadoop et un Data Engineer avec plus de 4 ans d’expérience sur Hadoop et 5 ans d’expérience avec les systèmes distribués. Il a conçu, développé et opéré des workflows d’ingestion de données et des services temps réels tout en accompagnant ses clients dans la définition de leurs besoins et dans leur mise en application.
Il est polyvalent sur les plateformes Big Data, de la planification, la conception et l’architecture du déploiement de clusters, l’administration, la maintenance ainsi que le prototypage et l’industrialisation d’application en collaboration avec les utilisateurs métiers, les analystes, les data scientists, les ingénieurs et les équipes d’exploitation.
Il est aussi doté d’une forte expérience en tant que formateur (il donne régulièrement des cours et formations autour du Big Data pour diverses écoles ingénieur et master) facilitant le transfert de connaissance et la formation des équipes.
Articles publiés
Installation de TensorFlow avec Docker
Catégories : Orchestration de conteneurs, Data Science, Formation | Tags : IA, CPU, Deep Learning, Docker, Jupyter, Linux, TensorFlow
TensorFlow est un logiciel open source de Google pour le calcul numérique utilisant une représentation en graph : Vertex (nodes) représentent des opérations mathématiques Edges représentent un tableau…
5 août 2019
Intégration de Druid et Hive
Catégories : Big Data, Business Intelligence, Tech Radar | Tags : Druid, Hive, Analyse de données, LLAP, OLAP, SQL
Nous allons dans cet article traiter de l’intégration entre Hive Interactive (LLAP) et Druid. Cet article est un complément à l’article Ultra-fast OLAP Analytics with Apache Hive and Druid.…
13 juin 2019
Méthodes de stockage persistées dans Kubernetes
Catégories : Cloud computing, Orchestration de conteneurs, Open Source Summit Europe 2017 | Tags : Docker, GCE, Kubernetes, Container Storage Interface (CSI), PVC, Azure, Storage
Cet article est basé sur la présentation “Introduction to Kubernetes Storage Primitives for Stateful Workloads” par the {Code} team à la conférence OSS 2017 à Prague. Commençons par qu’est-ce que…
28 oct. 2017
Administration Hadoop multitenant avancée - protection de Zookeeper
Catégories : Big Data, Infrastructure | Tags : Zookeeper, Partitionnement, DoS, iptables, Exploitation, Passage à l'échelle
Zookeeper est un composant critique au fonctionnement d’Hadoop en haute disponibilité. Ce dernier se protège en limitant le nombre de connexions max (maxConns=400). Cependant Zookeeper ne se protège…
5 juil. 2017
Apache Apex avec Apache SAMOA
Catégories : Data Science, Évènements, Tech Radar | Tags : Apex, Flink, Samoa, Storm, Machine Learning, Tools, Hadoop
Le Machine learning Orienté batch Supervisé - plus courant Training et Scoring Construction préliminaire du modèle Training : Construction du modèle Holdout : tuning du paramétrage Test : précision…
17 juil. 2016
Namespace réseau sans Docker
Catégories : Hack | Tags : DNS, Docker, Linux, Namespaces, Réseau, VLAN
Imaginons le cas suivant : Je suis connecté à plusieurs réseaux (wlan0, eth0, usb0). Je veux choisir le réseau que je vais utiliser au lancement de mon application. Mon application ne permet pas de…
6 juil. 2016