Business Intelligence
La Business Intelligence (BI) est une vaste catégorie d'applications et de technologies permettant de capturer, de stocker et d'analyser des données. La prise de décisions stratégiques repose sur des informations précises et à jour plutôt que sur des intuitions. Les outils d'analyse, de création de rapports et de requêtage peuvent aider les utilisateurs à gérer de grandes quantités de données et à extraire des informations précieuses.
Les applications de BI incluent l'aide à la décision, les systèmes de requête et de génération de rapports, le traitement analytique en ligne (OLAP), l'analyse statistique, les prévisions et l'exploration de données (Data Mining).
Planification BI
Defining and contributing to:
- Établir les exigences métiers
- Planifier et gérer les projets
- Sélectionner des outils optimaux de traitement analytique en ligne (OLAP)
- Spécifiez la stratégie cataloguage et de métadonnées
Architecture et design
Impliqué et responsable de:
- Concevoir des modèles de données dimensionnelles et des data marts
- Assurer la conformité aux politiques de sécurité et de gouvernance
- Concevoir des algorithmes de traitement, de nettoyage, de structuration et d'exploration de données
- Concevoir, sécuriser et déployer des plateformes
Déploiement et optimisation
Collaborer avec les développeurs d'applications:
- Mettre en œuvre les traitements analytiques
- Mettre en œuvre les KPI, construire des systèmes de reporting et d'analyse statistique
- Gérez l'évolutivité et l'interrogation à grande échelle
- Données de pré-agrégation pour une analyse plus approfondie
Articles associés à la Business Intelligence
Snowflake, the Data Warehouse for the Cloud, introduction and tutorial
Catégories : Business Intelligence, Cloud Computing | Tags : Cloud, Data Lake, Data Science, Data Warehouse, Snowflake
Snowflake is a SaaS-based data-warehousing platform that centralizes, in the cloud, the storage and processing of structured and semi-structured data. The increasing generation of data produced over…
7 avr. 2020
Running Apache Hive 3, new features and tips and tricks
Catégories : Big Data, Business Intelligence, DataWorks Summit 2019 | Tags : JDBC, LLAP, Druid, Hadoop, Hive, Kafka, Release and features
Apache Hive 3 brings a bunch of new and nice features to the data warehouse. Unfortunately, like many major FOSS releases, it comes with a few bugs and not much documentation. It is available since…
Par Gauthier LEONARD
25 juil. 2019
Auto-scaling Druid with Kubernetes
Catégories : Big Data, Business Intelligence, Containers Orchestration | Tags : Helm, Metrics, OLAP, Operation, Container Orchestration, EC2, Druid, Cloud, CNCF, Data Analytics, Kubernetes, Prometheus, Python
Apache Druid is an open-source analytics data store which could leverage the auto-scaling abilities of Kubernetes due to its distributed nature and its reliance on memory. I was inspired by the talk…
Par Leo SCHOUKROUN
16 juil. 2019
Druid and Hive integration
Catégories : Big Data, Business Intelligence, Tech Radar | Tags : LLAP, OLAP, Druid, Hive, Data Analytics, SQL
This article covers the integration between Hive Interactive (LDAP) and Druid. One can see it as a complement of the Ultra-fast OLAP Analytics with Apache Hive and Druid article. Tools description…
Par Pierre SAUVAGE
17 juin 2019
Accelerating query processing with materialized views in Apache Hive
Catégories : Business Intelligence, DataWorks Summit 2018 | Tags : Calcite, OLAP, Druid, Hive, Release and features, SQL
The new materialized view feature is coming in Apache Hive 3.0. Jesus Camacho Rodriguez from Hortonworks held a talk ”Accelerating query processing with materialized views in Apache Hive” about it…
31 mai 2018
Oracle to Apache Hive with the Oracle SQL Connector
Catégories : Business Intelligence | Tags : Oracle, HDFS, Hive, Network
In a previous article published last week, I introduced the choices available to connect Oracle and Hadoop. In a follow up article, I covered the Oracle SQL Connector, its installation and integration…
Par David WORMS
27 mai 2013
Apache Hive Essentials How-to by Darren Lee
Catégories : Business Intelligence, Learning | Tags : UDF, Hadoop, Hive, File Format, SQL
Recently, I’ve been ask to review a new book on Apache Hive called “Apache Hive Essentials How-to” (edit: the second edition is now available) written by Darren Lee and published by Packt Publishing…
Par David WORMS
23 avr. 2013
Hadoop and R with RHadoop
Catégories : Business Intelligence, Data Science | Tags : Thrift, Learning and tutorial, R, Hadoop, HBase, HDFS, MapReduce, Data Analytics
RHadoop is a bridge between R, a language and environment to statistically explore data sets, and Hadoop, a framework that allows for the distributed processing of large data sets across clusters of…
Par David WORMS
19 juil. 2012