L’Actualité de la donnée de Janvier 2025

M. Trump vient de prêter serment ! Est-ce que M. Trump influence la donnée ? Sans doute que “Oui” ! Et ce n’est pas que la donnée qui risque d’en pâtir.

L’IA Générative nous est désormais imposée autant chez Microsoft que chez Google ! Nous n’avons à priori pas notre mot à dire ! Une injonction d’utiliser l’IA. Pourtant, les algorithmes qui soutiennent ces systèmes ne sont pas encore tant explicables. Imposé ou non, il faut s’augmenter de ces nouvelles capacités : individuellement il est question que l’on soit plus productif.

Une belle année 2025 ! Nos vœux les meilleurs pour une bonne santé et de la réussite dans toutes vos initiatives. Beaucoup de courage pour 2025.

On change de monde ! Etes-vous prêt ?

Pour démarrer l’année, l’ADEME, critiquée, joue son rôle, émet des propositions pour nous aider à diminuer la facture carbone. L’ADEM met en avant le logiciel libre et open source pour mieux maîtriser son impact énergétique ! Oui, parce que vous ne subissez pas l’obsolescence ! Vous n’êtes pas obligé d’avoir toujours le dernier matériel pour faire tourner le dernier logiciel …










Dans 5 ans l’informatique ne sera plus la même. On change de mondE ! 

AWS refuse un contrat d’EDF, ils ne peuvent pas garantir que les USA n’y regardent pas ! Et bien, nous l’avions tant annoncé et là, c’est AWS qui l’a dit. Ouaar ! Et dire que NVidia nous promet une machine à 3000 € qui sait exécuter des IA avec 200 milliards de paramètres ! A ce prix là le “On Prem” va redevenir à la mode.

BNP Paribas fait justement le pari d’un Cloud Privé avec Oracle ! Les données sont trop compliquées à déplacer. Ça nous rappelle drôlement quelque chose ! Hadoop : “On ne déplace pas les données mais les programmes”. Ici, on déplace le cloud !

L’informatique va changer ! Et ça a déjà démarré… L’école de numérique soutenu par l’Etat passe la main et Salesforce ne recrute plus d’ingénieurs ! L’IA va faire le boulot…

Et vous, comment ça se passe dans votre organisation ? Etes-vous prêts ? Votre data Lakehouse ? Votre moteur de RAG ? Vous utilisez Mistral. AI ? Lucie ?










Le Match des cadres de développement de la couche de transformation : SQLMesh vs DBT

Tellement attaché à notre cher ETL, nous nous sommes beaucoup posés de questions quant aux outils pour le remplacer. Et l’ELT a refait son chemin ! “In Database” me rappelait on il y a 15 ans !

SQL fait son grand retour. SQLMesh et DBT les cadres pour développer les traitements ELT se font une course dantesque ! Performance et acquisitions ! Quel cadre pour bâtir vos “Data Products” et mettre en place le maillage des données qui sert votre stratégie.

SQLMesh montre plus de capacités que DBT. Néanmoins, celui-ci était le premier et est adopté en premier ! Dremio a mis à jour son extension DBT ! Synaltic a sorti son cours DBT orienté pour Dremio et le data lakehouse.










Madame Irma voit la data dans sa boule de cristal

Beaucoup de prévisions en ce début d’année 2025 ! Il est vrai que le début d’année est souvent le moment de remettre un peu ses idées au clair.

Lisez donc ces prévisions… En tout cas, il apparaît que Apache Iceberg va encore renforcer ses positions, L’IA ! L’IA. L’IA. Il va falloir des orchestrateurs pour soutenir tous ces workflows et créer tout ces Agent AI !

Enfin voilà la vision du CEO d’Oracle : « La dystopie de la surveillance alimentée par l’IA est déjà là !« . Non ce n’est pas 1984 ! Mais bien 2025 avec Larry Ellison.

Il aura fallu une bonne dizaine d’années pour enfin nous dire que le métier du 21ème siècle c’est le #DataEngineer !




LOGICIELS


Mage AI

Mage Pro, récemment lancé, propose une version gratuite de test. La version Pro intègre une IA captivante qui rend la génération de pipelines littéralement « magique”.
Note : Synaltic peut vous aider à le prendre en main !



IronCalc
IronCalc, un moteur de tableur écrit en Rust. La feuille de route pour la version 1.0 est en place, un MVP est testable. Vous pouvez aisément l’embarquer dans vos applications web.


n8n@1.74.0
Si vous n’avez jamais vu N8n ! Il est temps d’y aller. Il fait le café (ETL, API, Formulaires…). Et même des agents AI. La version 1.74.0 est un joli prétexte pour en parler. Au rendez vous de nombreuses performances de la productivité et l’intégration d’appels vers de LLM. Et c’est léger !

Lightdash
Solution de Dashboarding couplé à DBT… Il monte. Il monte doucement mais sûrement. Amélioration de l’expérience utilisateur et des composants.


BemiDB
BemiDB réplique les données de PostgreSQL en une version optimisée pour l’analyse. Il se compose d’un binaire unique qui se connecte de manière transparente à une base de données Postgres, réplique les données dans un format en colonnes compressé et vous permet d’exécuter des requêtes complexes à l’aide de son moteur de requête analytique compatible Postgres.

Rill 0.52
Rill Developer est un outil qui permet de transformer sans effort vos ensembles de données avec SQL et de créer des tableaux de bord rapides et exploratoires.