L’Actualité de la donnée d’Avril 2025

Il y a des moments dans nos vies qui ne sont pas simples à vivre. On sait que ces moments existent, qu’ils sont incontournables. En informatique, ce sera par exemple la décision inévitable de changer de fournisseur parce que la solution actuelle amène droit dans le mur, elle n’évolue plus. Et l’on sait déjà tout l’effort que ça va demander à tout le monde, à commencer par le changement d’état d’esprit qui devra être diffusé à tous les étages.

Une nouvelle expression a fait son apparition et se répand à une folle ! Le “ Vibe Coding ”. Je suis sûr que nous en reparlerons. Si l’expression vient d’un des cadre de OpenAI, Ben Stencil vous explique avec des termes économiques pourquoi Coder avec IA devient une obligation ! On va faire plus avec moins ( do more with less) . Cette nouvelle réalité pour les entreprises ne doit pas nous faire perdre de vue l’emprise que l’IA va avoir sur les plus jeunes, ou l’usage que certains vont clairement en faire.

Heureusement on a Apache Iceberg ! Le Iceberg Summit 2025 s’est achevé et le mouvement ne s’arrête pas ! Et si l’on remplaçait parquet par Vortex pour des requêtes 4 fois plus rapide ? Plus concrètement la version 26.0 de Dremio est là et elle mérite bien d’être citée ici : Dremio reste de loin ce qui se fait de mieux autour d’Apache Iceberg .

La BI est morte longue vie au ChatBI !

Ben Stencil nous indique que les consolidation en cours dans le secteur des nouvelles technologies rappelle que toutes les entreprises sont furieusement “Business Intelligence” compatible ! Jusqu’à Databricks qui nomme sa plateforme “ Data Intelligence Platform ” !

Revenons à ce fameux “Vibe Coding” parce que c’est le nouvel eldorado pour la Data ! Vous ne seriez plus dans l’obligation d’une maîtrise complète de la modélisation des structures de données, des cadres de développement ETL ! Tout en langage naturel ! Voilà votre projet en production.

C’est sûr c’est cette voie et la nouvelle orientation que les DSI prendront pour réduire les coûts ! Il faut juste que l’on déploient les outils à grande échelle… On est parti pour un nouveau cycle de diffusion de connaissances !

Et même le métier pourra “parler” aux données ! Le protocole MCP résoudrait tout ?


Apprendre des cas d’usage “Modèle”

Il y de nombreux usages de l’IA. Pour coder. Pour générer des images. Pour apprendre. Un sujet que vous ne comprenez pas ? Demander à une IA de “recherche” de vous dresser une synthèse et là… Vous êtes obligé de la lire ! Ce n’est pas un mal, vous apprenez ! C’est aussi pour ça que les retours d’expérience sont une bonne chose : pour apprendre de vos pairs.

Et bien connaissez vous le “ Shadow Table Strategy ”, l’usage des statistiques pour détecter des anomalies dans vos séries temporelles ou même de l’interopérabilité d’Apache Iceberg entre BigQuery et Snowflake !

On est tous fou d’Apache Iceberg !

Nombre d’éditeurs, de communautés intègrent, pour notre plus grande satisfaction à tous, Apache Iceberg à leur solutions. C’est une grande évolution : l’industrie de la donnée a réellement trouvé son standard ! Un seul format table pour l’analytique.

Au dernier Data Concil 2025, il paraît que tout le monde n’avait qu’un mot à la bouche : Apache Iceberg par ci, Apache Iceberg par là ! Crunchy Data transforme PostgreSQL, enfin, en data warehouse grâce à Iceberg. Snowflake est en train de proposer les mécanismes pour le change data capture au sein d’Apache Iceberg. Toujours plus de nouveaux types : variant, spatial, interval (de temps).

Dremio propose le clustering ! Toutes ces nouvelles fonctionnalités vont nous aider à résoudre toujours plus de cas d’usage et à rendre Iceberg toujours plus interopérables et plus performant !


À DÉCOUVRIR


Paraquery

Découvrez Paraquery, un outil puissant pour l’analyse et l’interrogation de données.


Feldera Batch Use Cases

Documentation détaillée sur les cas d’utilisation de Feldera pour le traitement batch.


Comment entraîner votre propre assistant de codage sur votre code

Guide détaillé sur la création et l’entraînement d’un assistant de codage personnalisé.


Consommation d’énergie et impact futur de l’IA

Article évaluant la consommation d’énergie due à l’IA et son impact futur sur la demande énergétique.


Évaluation des modèles de langage et biais des benchmarks

Les grands modèles de langage affichent des scores spectaculaires aux tests d’évaluation, mais cet article montre comment ils « trichent » en ayant déjà ingéré les questions utilisées.



LOGICIELS


Dremio 25.2.10
 

Optimisation des requêtes sur Delta Lake, correction des NPE et améliorations d’agrégation.


Apache Iceberg 1.2.4

Intégration améliorée avec Snowflake et optimisation des mises à jour transactionnelles.


Talend R2025-04

Mise à jour cumulative avec compatibilité Java 17 et corrections de bugs en transformation de données.


Superset 3.5.2
 

Amélioration des performances des dashboards et extension des connecteurs de données.


Apache Airflow 3.0.1
 
 

Nouvelle architecture client-serveur et introduction des Edge Executors dans l’orchestration des tâches.

 
Debezium 3.2.1

Nouveau mode LogMiner pour Oracle et support étendu de Kafka 4.x.


Elasticsearch 9.0.1

Optimisation des agrégations et corrections de bugs critiques dans le moteur de recherche.


Tableau 2025.1

Lancement de nouveaux outils de visualisation et amélioration des performances des analyses interactives.


MariaDB 10.11.12
 
 

Corrections de vulnérabilités et amélioration des performances en gestion de transactions.