La pandémie aura contraint toutes les organisations et bouscule toutes nos habitudes. Certaines entités choisissent le «full remote », d’autres ont des difficultés pour trouver l’architecture organisationnelle qui permettra de retrouver de nouveaux niveaux de performances. En même temps, il s’agit de garder en ligne de mire la transformation digitale et l’ensemble de ses enjeux. La donnée étant au centre de tout … il s’agit clairement de la laisser accessible à toutes et tous où que l’on soit, sécurisée par les meilleures pratiques pour que les décisions puissent être prises, continuer à opérer et conserver le lien avec ses clients, fournisseurs et partenaires.
Ci-dessous, je vous présente l’actualité de 6 solutions innovantes qui me tiennent particulièrement à cœur !
Laisser accessible la donnée à toutes et tous où que l’on soit !
Dremio
Dremio sait rendre la donnée toujours aussi proche des utilisateurs. Dans leur toute dernière version la 4.8, il est désormais possible d’exploiter directement une requête spécifique d’une base d’une source de données (faisant appel à des fonctions ou procédures propres et intrinsèques à la source). Dremio exploite cette requête en l’état en la transmettant à la source. Cette requête devient un jeu de données virtuel (VDS) comme un autre. Cette fonctionnalité facilite l’adoption de Dremio pour la gestion de cette couche d’abstraction utile pour une accessibilité de la donnée à toutes et tous.
Tout le monde attend une manière simple de gérer les couches de données, ici le versionning de données ! Et bien l’un des cofondateurs de Dremio, lance Nessie, une gestion de version de données. A partir des formats de table Apache Iceberg, DeltaLake, il s’agit de rendre le data lake « liquide » ! Il devient as code… Avec ce mécanisme inspiré de git, il est possible de travailler avec différentes branches de données, valider une couche avant de la passer en production devient simple.
Nessie apporte le versionning de données que l’on attendait dans Dremio. C’est un projet open source qui ouvre de nouvelle possibilité dans le monde de la gestion de données. Si le DataOps est en train de bouleverser le cadre des projets de données… Nessie se place comme l’un des grands socles d’une telle pratique.
Le Trust Score ! Si les entreprises veulent s’appuyer sur leurs données pour exécuter leur stratégie, autant qu’elles le fassent avec une donnée fiable et de qualité. Et bien le Trust Score va vraiment faciliter la quête de cette valeur !
Talend, reconnue par tous les grands cabinets (Gartner, Forrester…) comme leader innovant de la gestion de la donnée. Il permet à toute organisation de savoir à tout moment sur tout son patrimoine de données quel est le niveau de la qualité de données !
La data preparation n’est sans doute pas ce que l’on s’imagine. Trifacta avec Flow 2.0 et les nouvelles possibilités de connexions qui sont offerts, transforme l’approche de la data préparation et la rend beaucoup plus industrielle. Finalement ce sont les data engineers qui commencent à adopter la data preparation…
Attention, vous serez donc prévenu, ce n’est plus juste l’outil qui s’adresse au métier… C’est bien une solution qui s’articule pour toute la gestion de vos données depuis toutes les sources jusqu’à votre data warehouse par exemple et l’orchestration de tous ces flux… Mêlant autant DSI, Ingénieur des données, et les Métiers… Le tout visuellement et la qualité de données directement observée…
Oui, vos données peuvent être accessibles avec des outils open source ! C’est le cas de Knowage… La version 7.2 vous fournit la capacité d’embarquer des graphiques personnalisés (widget). En s’appuyant sur vos jeux de données référencées dans Knowage, il est possible de construire des algorithmes de data mining ou de machine learning en R ou en Python et de les exécuter au sein de Knowage.
Cette solution open source se place bien dans la fédération de toutes les équipes gérant vos projets de données depuis la collecte en passant par l’exploration jusqu’à la valorisation sous toute leur forme.