L’Actualité de la donnée de Novembre 2021

Futur is open

Ces dernières années quoi qu’on en dise l’open source a bousculé les codes établis et devient la manière de soutenir l’innovation. Bien sûr qu’il faut aller plus loin pour que l’innovation ouverte, l’innovation croisée devienne la norme. Et c’est pour cette raison que Databricks réclame que cette clause – qui empêche de mener des tests comparatifs – doit disparaître des licences de bases de données pour favoriser un choix averti des utilisateurs.

Tout comme Dremio qui milite pour que les formats du stockage des données restent ouverts, ce qui est d’autant plus vrai pour l’architecture elle-même pour éviter de s’enfermer dans un écosystème d’un et d’un fournisseur.






Un monde ouvert

John Burn-Murdoch s’occupe de Data Visualisation au Financial Times. Il célèbre la donnée et rappelle toute son importance pour aider à ce que le monde puisse aller mieux. Cela nous renvoie à une autre actualité. L’algorithme, les mathématiques et le Big Data ne sont pas mauvais ! Ce ne sont que des outils qui aident à la prise de décisions. Nos (l’Humain) choix, nos arbitrages, nos intentions sont sans doute mauvais !

La #SynalTeam salue le travail qu’elle mène aux côtés du Ministère de la Vie Associative où toutes les données consolidées autour de Data-Asso participent aujourd’hui au succès de Pass’Sport avec près d’un million de jeunes qui auront été aidés.







Open Data Architecture

Le goulot d’étranglement consistant à s’appuyer sur une équipe humaine lente et centrale pour rendre de nouveaux ensembles de données disponibles est un problème qui a désespérément besoin de solution. Le Data Fabric et le Data Mesh sont deux approches différentes pour résoudre ce même problème.

En considérant le développement d’applications, la pénurie de main-d’œuvre fait beaucoup progresser l’adoption du low-code, du no-code. Tous ceux qui travaillent dans l’informatique savent que de telles solutions ont toujours existé. En intégration de données, le phénomène est similaire, Michel Tricot, d’Airbyte, nous rappelle à quel point nous devons changer notre modèle de pensée autour de l’ETL.






logiciel
Tableau 2021.4

Des nouveautés très appréciables ! Sécurité des données à la ligne, connexions virtuelles pour faciliter l’accès aux données, l’intégration avec Slack pour interroger les données en langage naturel.

https://www.tableau.com/fr-fr/products/coming-soon


Talend

Talend  introduit le concept de Data Health pour mieux expliquer encore  l’importance de la qualité des données et son traitement au plus tôt.

https://www.talend.com/blog/data-health-from-prognosis-to-treatment/


Announcing the Dremio October 2021 Release

Une meilleure couverture du standard SQL avec des clauses PIVOT / UNPIVOT. La prise en charge du format de table, Apache Iceberg via Apache Hive.

https://www.dremio.com/announcing-the-dremio-october-2021-release