L’actualité de la donnée de Janvier 2026

Le monde est sans dessus dessous ! Le monde est illisible ! L’IA, selon certains, est en train de franchir un cap ! Qu’est-ce que l’intelligence ?

En France, la souveraineté, l’open source, tiennent les devants de la scène. On parle d’autonomie numérique au Tosit Data IA Day.

Nous venons de clôturer Janvier 2026, votre belle et heureuse année démarre sur les chapeaux de roues. L’omniprésence de l’IA dans les médias ne brouille-t-elle pas votre perception de la réalité ?

Qui dans votre organisation a réellement pris en main ces nouveaux outils ? N’est-ce pas les jeunes qui ont aidé dans l’émergence du web, du mobile, du cloud au sein de votre organisation ? Le Data Engineering n’est pas un métier que l’on apprend forcément à l’école. Pour vous en convaincre, posez-vous la question du statut de la culture des données dans votre entité. Yoshua Bengio, un des pères fondateurs du deep learning tel notre français Yann Lecun, pense que l’on doit dès aujourd’hui mettre les gardes fou ou sinon… Et nous y serions ! Un nouvel ordre mondial ! Ho ! L’Intelligence artificielle générale ! Notre définition de l’intelligence en Europe s’opposera à cette cible que nous aurions atteint ! Néanmoins, ces outils résolvent vraiment des problèmes et par eux-mêmes…

Les organisations ont surtout des données dans les bases de données. L’IA générative s’est surtout concentrée sur le texte. Elle ne s’est pas confrontée à toutes nos données tabulaires. Les LLM vont devoir s’y intéresser.











Avez-vous réellement besoin de tableaux de bord ?

Nombre d’organisations n’ont toujours pas entamé leur mue vers une approche orientée données. La culture de la donnée manque à se faire une place au sein des valeurs des entreprises. Et l’IA est en train de faire exploser la manière dont l’analytique s’est érigée ces trente dernières années.

Oui, vous n’accéderez plus à vos données de la même manière. Certains pensent que : “le tableau de bord est mort”.

Est-ce que tous vos collègues pourront, un jour, et par eux même interroger les données sans même connaître le sous-jacent  (C’est-à-dire SQL, la structuration des données, voire la culture même des données) ? A mon humble avis vous devriez investir dans les formations en SQL ! Vous devriez investir dans la culture des données ! Même avec une IA générale, connaître le langage d’interrogation des données constitue votre véritable tremplin et cela même si la tendance de la future interface de la donnée est l’agent conversationnel.






La base de données se cherche encore

J’ai ouï dire que Oracle vous visite pour s’assurer que vous utilisez correctement les licences qui vous sont octroyées. De ce point vue rien a changé.

Oracle encore ! Oracle coupe dans les budgets… Et c’est MySQL, le projet open source qui trinque ! Plus de commits ! Aucun changement depuis des mois.

MySQL ! C’est le protocole qu’à choisi Alibaba pour construire une nouvelle base de données qui fusionne IA et SQL pour répondre aux nouveaux besoins des organisations.

La communauté Apache Iceberg sort la version 4 des spécifications et une réécriture complète et tellement plus efficace de la gestion des métadonnées. Ainsi, les performances des tables Apache Iceberg bousculent l’architecture des bases de données classiques.

J’aime à croire que nous pourrions avoir véritablement un format de table universel. Certes PostgreSQL, MySQL, Oracle et tous les autres existeraient encore. Mais leur format de stockage par défaut sinon optionnel ne pourrait-il pas être Apache Iceberg ?

Le zéro copie deviendrait la norme. Qui plus est, notre base de données finirait aussi par intégrer directement des métadonnées sémantiques ! Un numéro de plaque minéralogique est un numéro de plaque minéralogique ! Cette tautologie nous rappelle que l’on aurait besoin de ce type de métadonnées depuis le transactionnel jusqu’à l’analytique et même pour réinjecter des données vers la source. Vous imaginez tout ce que l’on pourrait faire de telles métadonnées couplées à une intelligence artificielle ?







MinIO hébergera encore les données de nos data lakehouses

MinIO est partout. Il a été embarqué dans toutes les solutions qui nécessitaient un module de stockage objets sur site !

MinIO a cessé de maintenir sa version open source. Plusieurs solutions sont possibles. Toutefois, je vous invite vraiment à regarder les nouvelles propositions de MinIO notamment Enterprise Lite. MinIO et son support sont maintenant très accessibles.

Et le lakehouse stocke bien plus que des données tabulaires ! Le métier de data engineer bouge : nous traiterons dans nos flux les images, les vidéos, le son, les archives de documents bureautiques. Nous y parviendrons, par exemple, grâce à l’intégration entre le catalogue Iceberg, Polaris et le format de données multi-modal : Lance.






Dremio, The Agentic Lakehouse

Dans cet épisode de DataNosco, nous analysons les nouveautés majeures de la version 26 de DREMIO et la nouvelle offre Cloud serverless qui transforment l’architecture data des entreprises.

Dans cette vidéo : l’intégration profonde de l’IA générative pour dialoguer avec vos données, des fonctions SQL natives pour traiter les fichiers non structurés (images, PDF) et la puissance du catalogue ouvert Polaris basé sur Apache Iceberg, …

  GOUVERNANCE : UN NOUVEAU CAS D’ECOLE !  

Le bad buzz autour du contrat passé entre une filiale américaine de Capgemini et l’agence fédérale ICE a révélé un double problème : une crise d’image majeure et une incapacité structurelle à assurer une gouvernance fiable des données entre les États‑Unis et la France. Les activités classifiées de Capgemini Government Solutions imposaient des règles strictes de souveraineté et de contrôle opérationnel… dont la maison‑mère française était dépossédée.

Capgemini ne maîtrisait plus suffisamment ce que faisait sa filiale, ni les implications éthiques, politiques et réputationnelles. Face à la combinaison explosive : bad buzz, gouvernance non assurée et contraintes juridiques américaines, le groupe a choisi la mise en vente immédiate de sa filiale américaine Capgemini Government Solutions.

Ce n’est pas seulement un scandale médiatique, c’est un cas d’école de défaillance de gouvernance dans un contexte transnational, où une maison‑mère européenne perd progressivement la maîtrise opérationnelle, juridique et éthique d’une filiale opérant sur des contrats classifiés américains.

Je vous raconte cela car il y’a quelques points clefs qui sont ici mis en lumière :

  1. La souveraineté ne se délègue pas. Une maison‑mère doit pouvoir auditer, superviser et comprendre les activités de ses filiales, même classifiées.

  2. Les cadres réglementaires américains peuvent neutraliser la gouvernance européenne. Les obligations de sécurité nationale US peuvent empêcher une entreprise européenne de respecter ses propres engagements éthiques et réglementaires. 

  3. Le risque réputationnel est désormais un risque de gouvernance. Un manque de visibilité interne peut se transformer en crise publique en quelques heures.

  4. Les engagements éthiques doivent être opérationnalisés. Il ne suffit pas d’avoir une charte éthique : il faut des mécanismes de contrôle effectifs, y compris transfrontaliers.

La gouvernance des données et des technologies devient un enjeu stratégique aussi important que la performance économique.


PLANIFIEZ VOS TâCHES AVEC xyOps™

xyOps™ est un système nouvelle génération pour la planification des tâches, l’automatisation des flux de travail, la surveillance des serveurs, les alertes et la gestion des incidents, le tout intégré dans une plateforme unique et cohérente.

Il est conçu pour les développeurs et les équipes d’exploitation qui souhaitent maîtriser leur infrastructure d’automatisation sans compromettre leurs données, leur liberté ni leur visibilité. xyOps ne masque aucune fonctionnalité derrière un abonnement payant et ne partage aucune donnée de télémétrie. Il est ouvert, extensible et conçu pour fonctionner sur tous les environnements.



LOGICIELS

 Talend Studio 8.0.1 R2026-01 

Mise à jour mensuelle cumulative incluant toutes les corrections précédentes, compatibilité Java 17 renforcée, amélioration du Runtime et consolidation des patches de sécurité.



 Debezium 3.4.1.Final 

Première mise à jour de maintenance de la branche 3.4 avec améliorations pour Oracle (Dynamic Archive Destination), corrections de stabilité multi-SGBD et optimisation du traitement des journaux de transactions.


 
   Dremio 26.1.3   
 

Version de maintenance de la branche 26.x incluant des correctifs de stabilité, des optimisations sur le moteur de requêtes et des améliorations de compatibilité pour les environnements distribués. Consolidation des correctifs introduits en 26.1.0.