Dans l’environnement hyper concurrentiel d’aujourd’hui, où les données sont omniprésentes, les entreprises ont besoin de collecter des informations pertinentes et de prendre des décisions stratégiques le plus rapidement possible. Cette exigence d’agilité nécessite une réduction drastique des délais entre la collecte des données et la génération des informations directement utiles à la prise de décision. Or les processus des solutions traditionnelles d’analytics ne sont pas conçus pour délivrer des résultats avec une telle rapidité. Ces délais obligent souvent les décisionnaires en entreprise à attendre le déploiement de ressources informatiques supplémentaires pour les projets d’analytics, ce qui compromet l’agilité et la performance des organisations.
Une nouvelle infrastructure de data analytics basée dans le cloud, connue outre atlantique sous le nom de Modern Data Stack, préserve la compétitivité des entreprises en automatisant l’intégration des données et en fournissant des fonctionnalités d’analytics de nouvelle génération. Jusqu’à récemment, ces fonctionnalités restaient hors de portée de beaucoup d’entreprises. Mais de plus en plus d’entre elles adoptant aujourd’hui ce modèle, passons en revue les différences entre les infrastructures de data analytics traditionnelles et celles de nouvelle génération.
Les limites des solutions traditionnelles
Quels facteurs empêchent les fonctions traditionnelles de business intelligence et de data analytics de répondre aux nouveaux besoins de rapidité et d’agilité ? Une dépendance envers des piles technologique traditionnelles, souvent gérés par des équipes disparates et en silos, dont la mission est de construire des pipelines de données et d’administrer des infrastructures de stockage et de traitement informatique sur site. Ces équipes doivent consacrer énormément de temps et d’efforts au codage manuel, à la conception et la maintenance d’ETL basé sur SQL, à la construction de couches sémantiques et à l’élaboration de schémas complexes en étoile.
Toutes ces tâches retardent la génération des résultats de business intelligence, qui apparaissent à l’extrême droite du diagramme ci-dessous.
En bref, ces équipes gaspillent un temps précieux à gérer une infrastructure traditionnelle d’intégration de données, au lieu de générer des informations stratégiques à partir des données.
En plus de son coût humain, une infrastructure de données traditionnelle est :
● Difficile à obtenir
● Complexe à utiliser
● Coûteuse à l’achat et en maintenance
● Longue à installer et à configurer (un processus qui prend souvent plusieurs mois).
La plus grande faiblesse des infrastructures de données traditionnelles réside dans leur incapacité à s’adapter aux nouveaux besoins des entreprises. De nouveaux besoins de reporting apparaissent constamment ; les schémas de sources de données et les API changent fréquemment ; des sources de données sont ajoutées, modifiées et supprimées régulièrement ; et les décisionnaires interrogent régulièrement les données stockées pour permettre à l’entreprise de se positionner sur des sujets clés. Ces problèmes peuvent interrompre des cycles de développement qui couvrent souvent de 12 à 18 mois.
Les avantages des data analytics de nouvelle génération : le Modern Data Stack
En adoptant un Modern Data Stack, les équipes Analytics peuvent rapidement fournir aux décisionnaires les données et les informations dont ils ont besoin, et les délais nécessaires à leur génération étant raccourcis, les entreprises peuvent mieux répondre aux évolutions rapides du marché.
Un Modern Data Stack repose sur un environnement data warehouse ou data lake dans le cloud. Il comprend des outils basés dans le cloud qui prennent en charge le développement des pipelines de données, ainsi que le reporting et la visualisation des analytics.
Le diagramme ci-dessous donne un bon exemple d’un Modern Data Stack, qui réunit les sources de données, les connecteurs de données, une data warehouse et un outil de business intelligence.
Ce principe permet aux équipes Analytics – ingénieurs, analystes et architectes de données, de se concentrer sur des projets stratégiques qui créent de la valeur, les services dans le cloud se chargeant de toutes les tâches de base d’ingénierie des données telles que la maintenance des pipelines et la conception des schémas.
Tribune de Jesse McCabe, Director of Product Marketing, Fivetran