L’Actualité de la donnée d’Octobre 2021

Introduction

A l’heure de la COP26, comment ne pas s’interroger sur son propre quotidien en tant qu’acteur dans ce marché de la donnée en plein boom ? C’est un peu l’exercice auquel Tristan Nitot (Fondateur de Mozilla Europe, ancien CEO de Qwant…) s’est essayé durant BBoost à La Rochelle.

Si l’informatique, pardon, on parle à présent de “Numérique”, fait partie de la solution, il faut aussi que ce marché prenne sa part. Ce n’est pas une démarche simple ! Si la sécurité informatique et la culture de la donnée sont des sujets à promouvoir, une utilisation maîtrisée, raisonnée, sobre de l’informatique doit également faire partie du chemin de chaque employé.



Le numérique, un marché en mouvement

L’actualité du numérique est très riche en ce mois d’octobre. Atos est au plus mal, n’ayant pas su engager une stratégie plus clairvoyante quant au cloud. Justement, parce que nous véhiculons tous ce mythe ; celui des entreprises françaises qui craignent d’y mettre leurs données !

Alors que dans le même temps, les acteurs comme Salesforce ou Teams font circuler toutes les données des organisations sans même que les DSI sachent contrôler toutes les fonctionnalités que déversent régulièrement Microsoft !

Pendant ce temps, OVHcloud fait son entrée en bourse ; Scaleway innove avec un Kubernetes multicloud, et 23 entreprises européennes de technologie du cloud forment l’Alliance industrielle européenne du cloud (EUCLIDIA)…

« La crise sanitaire, en accélérant le basculement vers le nouvel âge informatique du cloud, a stoppé net la croissance d’Atos »

OVHcloud réussit son entrée en Bourse, deux jours après sa grosse panne

Scaleway lance Kosmos, un gestionnaire managé de clusters Kubernetes multicloud



Votre cloud est-il de confiance ?

Si la France se cherche encore quant à obtenir des champions du cloud, fussent-ils souverains ou de confiance, vous êtes-vous jamais demandé comment mettre en œuvre votre propre processus pour garantir la confiance dans toute votre chaîne de la donnée ? En tout cas si Kubernetes apporte la standardisation de la livraison, il est certain que nous allons avancer vers une “certification” de chacune de nos livraisons apportant ainsi la garantie d’une impossibilité de falsification et ce jusqu’à la donnée qui est, au passage, devenu un produit.







Edge computing ou résoudre des problèmes localement

Plus d’une fois, nous avons évoqué Debezium pour transformer vos bases de données classiques en des systèmes émetteur d’événements : capter vos données dès leur création vous donne une capacité d’action quasi immédiate ! Debezium est une “toute petite” librairie mais sa capacité de transformation est sans commune mesure… Debezium est désormais systématiquement embarqué dans les architectures microservices et les nouvelles plateformes analytiques. Il est également en train de gagner le terrain du edge computing. Oui, on apporte des solutions localement dont on centralise les résultats. Ici aussi, l’idée est d’employer que l’informatique utile : uniquement ce qu’il faut.







logiciel

KNOWAGE 8 is now available!

Cette nouvelle version arrive avec son lot de nouvelles fonctionnalités : librairies de widgets pour des tableaux de bord toujours plus personnalisés, un référentiel d’artefacts qui regroupe aussi bien des modèles de machine learning, des processus ETL (talend). Cette version intègre aussi des bibliothèques riches de fonctions R et Python pour plus rapidement mettre en œuvre ses traitements analytiques.

https://www.knowage-suite.com/site/knowage-8-is-out/


Windowing in DuckDB

Le nouveau chouchou des Data Scientist et des connaisseurs de bases de données. DuckDB est de fait le “SqlLite de l’analytique”. Une base de données OLAP, interrogeable via SQL, qui vient tourner à même les processus du programme qui les embarquent… pas de communication réseau donc… Cette base de données renferme toutes les dernières innovations apportées dans le secteur ces dernières années ! Elle est européenne et open source !

https://duckdb.org/2021/10/13/windowing.html


zingg-0.3.0-SNAPSHOT-spark-3.0.3

Nous vivons à une époque où les entreprises ont leurs données dans des systèmes disparates. Dans ce contexte, les systèmes évolutifs de résolution d’entités et de gestion des données de référence apportent des avantages considérables aux applications d’analyse et d’apprentissage automatique en aval. Zingg est une nouvelle bibliothèque open source pour la résolution d’entités à grande échelle. Il est construit sur Apache Spark.

https://github.com/zinggAI/zingg/releases/tag/v0.3.0