Introduction à Apache Flink
Introduction
Dans un monde de traitement où Apache Spark capte la plus grande partie de la lumière mais il ne faudrait pas oublier le projet Apache Flink.
- Intervenant : César BEREZOWSKI
- Durée: 6h
- Format: discussion
Présentation
En tant que Data Engineer dans le domaine du Big Data, vous devez connaître vos technologies et choisir celle qui convient le mieux à votre cas d’utilisation. Le moteur de traitement de Flink conçu pour les flux de données est à bien des égards le meilleur dans son domaine, mais il est également généralement négligé par les clients en raison de la présence de Spark sur le marché. Apache Flink excelle dans le traitement des ensembles de données non liés et délimités et fournit des API prêtes à l'emploi pour développer des applications de streaming avec gestion de l'état, couvrant divers cas d'uages tels que de la surveillance des logs, au backend de site Web, à l'apprentissage automatique et à la recommandation de contenu.
A la fin de cette discussion, vous serez en capacité de bien comprendre les composants internes de Flink (et les différences avec Spark) et de savoir comment le configurer et l'utiliser rapidement.
Author
César est un architecte de solutions Big Data & Hadoop et un ingénieur en données avec 3 ans d'expérience dans les systèmes distribués. Il a conçu et construit des flux d’ingestion de données et des services en temps réel tout en accompagnant ses clients dans l’identification de leurs besoins.
Récemment, il travaille chez Renault Digital pour construire une plate-forme de transmission de données en streaming avec Spark, et se tient au courant de Flink dans l’espoir de travailler dans le future avec ce projet.