Data Science

Data science, and more generally Artificial Intelligence (AI), differs from traditional programming and analysis in its ability to extract knowledge from data and modify its behavior and learn without specific programming. While traditional software predefines the logic that governs their processes, Data Science's algorithms build and discover models and are able to continually improve them.

Data science brings together a set of skills including Machine Learning, Natural Language Processing (NLP), speech, images and faces recognition (among other applications). In some applications, the algorithms go so far as to simulate human intelligence.

STATISTICSBUSINESSDATA

Key Takeaways

  • Data scientists build, train, and validate models to drive critical business decisions.
  • Data scientists are concerned with data access, reproducibility, and collaboration in order to make models quickly at scale.
  • Adaltas enable Data scientists to easily build, scale, and deploy machine learning models in minutes, helping drive innovation across the business.
alien science

Articles related to data science

Deployez vos aplications IA conteneurisƩes avec nvidia-docker

Deployez vos aplications IA conteneurisƩes avec nvidia-docker

Categories: Orchestration de conteneurs, Data Science | Tags: containerd, DevOps, Enseignement et tutorial, NVIDIA, Docker, Keras, TensorFlow

De plus en plus de produits et services prennent avantage des capacitĆ©s de modĆ©lisation et prĆ©diction des IA. Cet article prĆ©sente lā€™outil nvidia-docker permettant dā€™intĆ©grer des briques logiciels IAā€¦

SOARES Robert Walid

By SOARES Robert Walid

Mar 24, 2022

Stage de fin d'Ć©tude printemps 2022 - construction d'un Data Lab

Stage de fin d'Ć©tude printemps 2022 - construction d'un Data Lab

Categories: Data Science, Formation | Tags: Spark, Argo CD, Elasticsearch, Internship, Keycloak, Kubernetes, MongoDB, OpenID Connect, PostgreSQL

Descriptif du stage Au cours des derniĆØres annĆ©es, nous avons dĆ©veloppĆ© la capacitĆ© dā€™utiliser les ordinateurs pour traiter une grande quantitĆ© de donnĆ©es. Lā€™Ć©cosystĆØme a Ć©voluĆ© vers une offre Ć©tendueā€¦

WORMS David

By WORMS David

Nov 24, 2021

H2O en pratique : un protocole combinant AutoML et les approches de modƩlisation traditionnelles

H2O en pratique : un protocole combinant AutoML et les approches de modƩlisation traditionnelles

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python, XGBoost

H20 est livrĆ© avec de nombreuses fonctionnalitĆ©s. La deuxiĆØme partie de la sĆ©rie H2O en pratique propose un protocole pour combiner la modĆ©lisation AutoML avec des approches de modĆ©lisation et dā€¦

H2O en pratique: retour d'expƩrience d'un Data Scientist

H2O en pratique: retour d'expƩrience d'un Data Scientist

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python

Les plates-formes dā€™apprentissage automatique (AutoML) gagnent en popularitĆ© et deviennent un outil puissant Ć  disposition des data scientists. Il y a quelques mois, jā€™ai prĆ©sentĆ© H2O, une plate-formeā€¦

Apache Liminal, quand le MLOps rencontre le GitOps

Apache Liminal, quand le MLOps rencontre le GitOps

Categories: Big Data, Orchestration de conteneurs, Data Engineering, Data Science, Tech Radar | Tags: Data Engineering, CI/CD, Data Science, Deep Learning, DĆ©ploiement, Docker, GitOps, Kubernetes, Machine Learning, MLOps, Open source, Python, TensorFlow

Apache Liminal propose une solution clĆ©s en main permettant de dĆ©ployer un pipeline de Machine Learning. Cā€™est un projet open-source, qui centralise lā€™ensemble des Ć©tapes nĆ©cessaires Ć  lā€™entrainementā€¦

COINTEPAS Aargan

By COINTEPAS Aargan

Mar 31, 2021

Espace de stockage et temps de gƩnƩration des formats de fichiers

Espace de stockage et temps de gƩnƩration des formats de fichiers

Categories: Data Engineering, Data Science | Tags: Avro, HDFS, Hive, ORC, Parquet, Big Data, Data Lake, Format de fichier, JavaScript Object Notation (JSON)

Le choix dā€™un format de fichier appropriĆ© est essentiel, que les donnĆ©es soient en transit ou soient stockĆ©es. Chaque format de fichier a ses avantages et ses inconvĆ©nients. Nous les avons couvertsā€¦

NGOM Barthelemy

By NGOM Barthelemy

Mar 22, 2021

TensorFlow Extended (TFX) : les composants et leurs fonctionnalitƩs

TensorFlow Extended (TFX) : les composants et leurs fonctionnalitƩs

Categories: Big Data, Data Engineering, Data Science, Formation | Tags: Beam, Data Engineering, Pipeline, CI/CD, Data Science, Deep Learning, DĆ©ploiement, Machine Learning, MLOps, Open source, Python, TensorFlow

La mise en production des modĆØles de Machine Learning (ML) et de Deep Learning (DL) est une tĆ¢che difficile. Il est reconnu quā€™elle est plus sujette Ć  lā€™Ć©chec et plus longue que la modĆ©lisationā€¦

DĆ©veloppement accĆ©lĆ©rĆ© de modĆØles avec H2O AutoML et Flow

DĆ©veloppement accĆ©lĆ©rĆ© de modĆØles avec H2O AutoML et Flow

Categories: Data Science, Formation | Tags: Automation, Cloud, H2O, Machine Learning, MLOps, On-premises, Open source, Python

La construction de modĆØles de Machine Learning (ML) est un processus trĆØs consommateur de temps. De plus, il requiĆØre de bonne connaissance en statistique, en algorithme de ML ainsi quā€™enā€¦

Versionnage des donnƩes et ML reproductible avec DVC et MLflow

Versionnage des donnƩes et ML reproductible avec DVC et MLflow

Categories: Data Science, DevOps & SRE, ƉvĆØnements | Tags: Data Engineering, Databricks, Delta Lake, Git, Machine Learning, MLflow, Storage

Notre prĆ©sentation sur la gestion de versions sur des donnĆ©es et le dĆ©veloppement reproductible dā€™algorithmes de Machine Learning proposĆ© au Data + AI Summit (anciennement Spark + AI) est acceptĆ©. Laā€¦

Suivi d'expƩriences avec MLflow sur Databricks Community Edition

Suivi d'expƩriences avec MLflow sur Databricks Community Edition

Categories: Data Engineering, Data Science, Formation | Tags: Spark, Databricks, Deep Learning, Delta Lake, Machine Learning, MLflow, Notebook, Python, Scikit-learn

Introduction au Databricks Community Edition et MLflow Chaque jour, le nombre dā€™outils permettant aux Data Scientists de crĆ©er des modĆØles plus rapidement augmente. Par consĆ©quent, la nĆ©cessitĆ© deā€¦

Gestion des versions de vos jeux de donnƩes avec Data Version Control (DVC) et Git

Gestion des versions de vos jeux de donnƩes avec Data Version Control (DVC) et Git

Categories: Data Science, DevOps & SRE | Tags: DevOps, Infrastructure, Exploitation, Git, GitOps, SCM

Lā€™utilisation dā€™un systĆØme de contrĆ“le de version tel que Git pour le code source est une bonne pratique et une norme de lā€™industrie. Ɖtant donnĆ© que les projets se concentrent de plus en plus sur lesā€¦

JOUET GrƩgor

By JOUET GrƩgor

Sep 3, 2020

Importer ses donnƩes dans Databricks : tables externes et Delta Lake

Importer ses donnƩes dans Databricks : tables externes et Delta Lake

Categories: Data Engineering, Data Science, Formation | Tags: Parquet, AWS, Amazon S3, Azure Data Lake Storage (ADLS), Databricks, Delta Lake, Python

Au cours dā€™un projet dā€™apprentissage automatique (Machine Learning, ML), nous devons garder une trace des donnĆ©es test que nous utilisons. Cela est important Ć  des fins dā€™audit et pour Ć©valuer laā€¦

MLflow tutorial : une plateforme de Machine Learning (ML) Open Source

MLflow tutorial : une plateforme de Machine Learning (ML) Open Source

Categories: Data Engineering, Data Science, Formation | Tags: AWS, Azure, Databricks, Deep Learning, DĆ©ploiement, Machine Learning, MLflow, MLOps, Python, Scikit-learn

Introduction et principes de MLflow Avec une puissance de calcul et un stockage de moins en moins chers et en mĆŖme temps une collecte de donnĆ©es de plus en plus importante dans tous les domaines, deā€¦

Introduction Ć  Ludwig et comment dĆ©ployer un modĆØle de Deep Learning via Flask

Introduction Ć  Ludwig et comment dĆ©ployer un modĆØle de Deep Learning via Flask

Categories: Data Science, Tech Radar | Tags: Enseignement et tutorial, Deep Learning, Machine Learning, Machine Learning, Python

Au cours de la derniĆØre dĆ©cennie, les modĆØles de Machine Learning et de Deep Learning se sont rĆ©vĆ©lĆ©s trĆØs efficaces pour effectuer une grande variĆ©tĆ© de tĆ¢ches tels que la dĆ©tection de fraudes, laā€¦

SOARES Robert Walid

By SOARES Robert Walid

Mar 2, 2020

Stage Data Science & Data Engineer - ML en production et ingestion streaming

Stage Data Science & Data Engineer - ML en production et ingestion streaming

Categories: Data Engineering, Data Science | Tags: DevOps, Flink, Hadoop, HBase, Kafka, Spark, Internship, Kubernetes, Python

Contexte Lā€™Ć©volution exponentielle des donnĆ©es a bouleversĆ© lā€™industrie en redĆ©finissant les mĆ©thodes de stockages, de traitement et dā€™acheminement des donnĆ©es. Maitriser ces mĆ©thodes faciliteā€¦

WORMS David

By WORMS David

Nov 26, 2019

Ɖviter les blocages dans les pipelines distribuĆ©s de Deep Learning avec Horovod

Ɖviter les blocages dans les pipelines distribuĆ©s de Deep Learning avec Horovod

Categories: Data Science | Tags: GPU, Deep Learning, Horovod, Keras, TensorFlow

Lā€™entraĆ®nement des modĆØles Deep Learning peut ĆŖtre grandement accĆ©lĆ©rĆ© en utilisant un cluster de GPUs. Lorsquā€™il sā€™agit de grandes quantitĆ©s de donnĆ©es, effectuer des calculs distribuĆ©s devientā€¦

JOUET GrƩgor

By JOUET GrƩgor

Nov 15, 2019

Innovation, culture projet vs culture produit en Data Science

Innovation, culture projet vs culture produit en Data Science

Categories: Data Science, Gouvernance des donnƩes | Tags: DevOps, Agile, Scrum

La Data Science porte en elle le mĆ©tier de demain. Elle est Ć©troitement liĆ©e Ć  la comprĆ©hension du mĆ©tier, des comportements et de lā€™intelligence quā€™on tirera des donnĆ©es existantes. Les enjeux sont Ć ā€¦

WORMS David

By WORMS David

Oct 8, 2019

Mise en production d'un modĆØle de Machine Learning

Mise en production d'un modĆØle de Machine Learning

Categories: Big Data, Data Engineering, Data Science, DevOps & SRE | Tags: DevOps, Exploitation, IA, Cloud, Machine Learning, MLOps, On-premises, SchƩma

ā€œLe Machine Learning en entreprise nĆ©cessite une vision globale [ā€¦] du point de vue de lā€™ingĆ©nierie et de la plateforme de donnĆ©esā€, a expliquĆ© Justin Norman lors de son intervention sur leā€¦

RYNKIEWICZ Oskar

By RYNKIEWICZ Oskar

Sep 30, 2019

Installation de TensorFlow avec Docker

Installation de TensorFlow avec Docker

Categories: Orchestration de conteneurs, Data Science, Formation | Tags: CPU, Jupyter, Linux, IA, Deep Learning, Docker, TensorFlow

TensorFlow est un logiciel open source de Google pour le calcul numĆ©rique utilisant une reprĆ©sentation en graphĀ : Vertex (nodes) reprĆ©sentent des opĆ©rations mathĆ©matiques Edges reprĆ©sentent un tableauā€¦

SAUVAGE Pierre

By SAUVAGE Pierre

Aug 5, 2019

Spark Streaming partie 4 : clustering avec Spark MLlib

Spark Streaming partie 4 : clustering avec Spark MLlib

Categories: Data Engineering, Data Science, Formation | Tags: Apache Spark Streaming, Spark, Big Data, Clustering, Machine Learning, Scala, Streaming

Spark MLlib est une bibliothĆØque Spark dā€™Apache offrant des implĆ©mentations performantes de divers algorithmes dā€™apprentissage automatique supervisĆ©s et non supervisĆ©s. Ainsi, le framework Spark peutā€¦

RYNKIEWICZ Oskar

By RYNKIEWICZ Oskar

Jun 27, 2019

Introduction Ć  Cloudera Data Science Workbench

Introduction Ć  Cloudera Data Science Workbench

Categories: Data Science | Tags: Azure, Cloudera, Docker, Git, Kubernetes, Machine Learning, MLOps, Notebook

Cloudera Data Science Workbench est une plateforme qui permet aux Data Scientists de crĆ©er, gĆ©rer, exĆ©cuter et planifier des workflows de Data Science Ć  partir de leur navigateur. Cela leur permetā€¦

ELALAMI Mehdi

By ELALAMI Mehdi

Feb 28, 2019

Apprentissage par renforcement appliquƩ au jeu de Poker

Apprentissage par renforcement appliquƩ au jeu de Poker

Categories: Data Science | Tags: Algorithme, Jeu, Q-learning, Deep Learning, Machine Learning, RĆ©seau de neurones, Python

Dans cet article, nous prĆ©senterons le ā€œDeep Reinforcement Learningā€, et plus particuliĆØrement lā€™algorithme de Deep Q Learning introduit par DeepMind il y a quelques annĆ©es. Dans une seconde partieā€¦

BLAZEJEWSKI Oscar

By BLAZEJEWSKI Oscar

Jan 9, 2019

CodaLab - Concours de Data Science

CodaLab - Concours de Data Science

Categories: Data Science, Adaltas Summit 2018, Formation | Tags: Base de donnƩes, Infrastructure, Machine Learning, MySQL, Node.js, Python

CodaLab Competition est une plateforme servant Ć  lā€™exĆ©cution de code dans le domaine de la Data Science. Elle se prĆ©sente sous la forme dā€™une interface web sur laquelle un utilisateur peut soumettreā€¦

SOARES Robert Walid

By SOARES Robert Walid

Dec 17, 2018

Nvidia et l'IA embarquƩ

Nvidia et l'IA embarquƩ

Categories: Data Science | Tags: Caffe, GPU, NVIDIA, IA, Deep Learning, Edge computing, Keras, PyTorch, TensorFlow

Depuis un peu plus de quatre ans, beaucoup de sociĆ©tĆ©s investissent dans lā€™intelligence artificielle et plus particuliĆØrement dans le Deep Learning et le Edge Computing. Alors que la thĆ©orie avance Ć ā€¦

HATI Yliess

By HATI Yliess

Oct 10, 2018

LandoĀ : rĆ©sumĆ© de conversation en Deep Learning

LandoĀ : rĆ©sumĆ© de conversation en Deep Learning

Categories: Data Science, Formation | Tags: Micro Services, Open API, Deep Learning, Internship, Kubernetes, RĆ©seau de neurones, Node.js

LandoĀ : Les derniers maĆ®tres des mots Lando est une application de rĆ©sumĆ© de rĆ©union qui utilise les technologies de Speech To Text pour transcrire de lā€™audio en Ć©crit et les technologies de Deepā€¦

HATI Yliess

By HATI Yliess

Sep 18, 2018

Deep learning sur YARNĀ : lancer Tensorflow et ses amis sur des clusters Hadoop

Deep learning sur YARNĀ : lancer Tensorflow et ses amis sur des clusters Hadoop

Categories: Data Science | Tags: GPU, Hadoop, MXNet, Spark, Spark MLlib, YARN, Deep Learning, PyTorch, TensorFlow, XGBoost

Avec lā€™arrivĆ©e de Hadoop 3, YARN offre plus de possibilitĆ©s dans la gestion des ressources. Il est dĆ©sormais possible de lancer des traitements de Deep Learning sur des GPUs dans des espaces dĆ©diĆ©s duā€¦

BIANCHERIN Louis

By BIANCHERIN Louis

Jul 24, 2018

YARN et le calcul distribuƩ sur GPU pour le machine learning

YARN et le calcul distribuƩ sur GPU pour le machine learning

Categories: Data Science, DataWorks Summit 2018 | Tags: GPU, YARN, Machine Learning, RĆ©seau de neurones, Storage

Dans cet article nous verrons les principes fondamentaux du Machine Learning et les outils actuellement utilisĆ©s pour exĆ©cuter ce type dā€™algorithmes, puis nous expliquerons comment un gestionnaire deā€¦

JOUET GrƩgor

By JOUET GrƩgor

May 30, 2018

TensorFlow avec Spark 2.3Ā : Le Meilleur des Deux Mondes

TensorFlow avec Spark 2.3Ā : Le Meilleur des Deux Mondes

Categories: Data Science, DataWorks Summit 2018 | Tags: Mesos, C++, CPU, GPU, Performance, Spark, YARN, JavaScript, Keras, Kubernetes, Machine Learning, Python, TensorFlow

Lā€™intĆ©gration de Tensorflow dans Spark apporte de nombreux bĆ©nĆ©fices et crĆ©e de nombreuses opportunitĆ©s. Cet article est basĆ© sur une confĆ©rence du DataWorks Summit 2018 Ć  Berlin. Cette confĆ©renceā€¦

HATI Yliess

By HATI Yliess

May 29, 2018

Apache Apex avec Apache SAMOA

Apache Apex avec Apache SAMOA

Categories: Data Science, ƉvĆØnements, Tech Radar | Tags: Apex, Samoa, Storm, Tools, Flink, Hadoop, Machine Learning

Le Machine learning OrientĆ© batch SupervisĆ© - plus courant Training et Scoring Construction prĆ©liminaire du modĆØle TrainingĀ : Construction du modĆØle HoldoutĀ : tuning du paramĆ©trage TestĀ : prĆ©cisionā€¦

SAUVAGE Pierre

By SAUVAGE Pierre

Jul 17, 2016

Apache ApexĀ : l'analytique Big Data nouvelle gĆ©nĆ©ration

Apache ApexĀ : l'analytique Big Data nouvelle gĆ©nĆ©ration

Categories: Data Science, ƉvĆØnements, Tech Radar | Tags: Apex, Storm, Tools, Flink, Hadoop, Kafka, Data Science, Machine Learning

Ci-dessous une compilation de mes notes prises lors de la prĆ©sentation dā€™Apache Apex par Thomas Weise de DataTorrent, lā€™entreprise derriĆØre Apex. Introduction Apache Apex est un moteur de traitementsā€¦

BEREZOWSKI CĆ©sar

By BEREZOWSKI CĆ©sar

Jul 17, 2016

Installation de PostgreSQL et Madlib sur OSX

Installation de PostgreSQL et Madlib sur OSX

Categories: Data Science | Tags: Base de donnƩes, Greenplum, Statistiques, PostgreSQL, SQL

Nous couvrons lā€™installation et lā€™utilisation de PostgreSQL et de MADlib sur OSX et Ubuntu. Les instructions pour les autres environnements doivent ĆŖtre similaires. PostgreSQL est une base de donnĆ©esā€¦

WORMS David

By WORMS David

Jul 7, 2012

Canada - Morocco - France

We are a team of Open Source enthusiasts doing consulting in Big Data, Cloud, DevOps, Data Engineering, Data Scienceā€¦

We provide our customers with accurate insights on how to leverage technologies to convert their use cases to projects in production, how to reduce their costs and increase the time to market.

If you enjoy reading our publications and have an interest in what we do, contact us and we will be thrilled to cooperate with you.

Support Ukrain