Mark Zuckerberg a accordé un long entretien dans lequel il revient sur le rôle capital que joue l’open source dans le développement de l’IA générative ! Il insiste et indique que sans l’open source, atteindre des modèles robustes ne peut être possible. Par exemple, on perdrait les relations avec la recherche académique. C’est aussi un point de vue partagé par le MIT Technologie Review.
Tout compte fait, à y regarder de plus près, l’open source est bel et bien en train de combler son retard. Et de jour en jour, des entreprises avec des marques fortes et éditeur de logiciels open source deviennent de vraies licornes.
A noter que Microsoft sort Azure Linux… Pas si simple à prononcer quand on est dans l’informatique depuis 20 ans.
Le monde change.
Modèles de données, Cloud & Analytique
L’évolution de la gestion de données est en marche. Le Data Lakehouse pointe le bout de son nez et est tout juste en train de profondément transformer les mentalités.
L’organisation, la structuration, la gouvernance des données sont de vrais sujets. Il ne faut pas pour autant les rendre plus complexes qu’il ne le sont. Sans doute qu’en adoptant une démarche consensuelle de la gestion des données tout comme l’ont des personnes métiers… Au fond, elles ne font qu’employer des jeux de données… Elles ne gèrent pas des infocentres, des data warehouses, des datamarts, des data lakes ! Adopter une pratique Data Mesh plus pratique et pragmatique immergera mieux les métiers dans les données.
Un petit retour sur les concepts de modélisation de data warehouse ne vous fera pas trop de mal. Vous pourrez alors ré-imaginer votre MDM là aussi de manière pratique et pragmatique et ce avec le lac de données.
Streaming : Coup de projecteur !
Apache Flink a fini par s’imposer comme plateforme de référence pour construire des flux de traitements en temps réel. Oui, il y a Apache Spark. Il domine avant tout le traitement par lot. Notons que les toutes dernières versions d’Apache Spark gèrent mieux le event processing. Flink connaît surtout une meilleure reconnaissance depuis que Confluent à récupérer dans son giron, Immerok.
Ce même Confluent a compris qu’il fallait abaisser la barrière d’entrée à sa plateforme ! KSQLDB devait être la solution ! Du Streaming tout en SQL !
Decodable croit en Flink et pense que c’est une évidence et que c’est déjà un standard. Ce n’est pas ce que pense Risingwave, construit avec une approche plus cloud native, propose du streaming tout en SQL et avec une connectivité PostgreSQL. Le streaming semble facile comme ça !
CrowdSec est une solution de sécurité open source et participative offrant une protection participative contre les adresses IP malveillantes et un accès au CTI réel le plus avancé.
Cette solution présente l’avantage de constituer une base de données ouvertes et crowdsourcées dont les mises à jour bi-directionnelles profitent à toute la communauté… Et bien sûr à l’éditeur.
Kaoto
Apache Camel est le langage d’intégration de données, c’est un vrai standard. Trop peu le connaissent ! Il est à la base de Talend ESB, des solutions de Red Hat Data Integration et de Mulesoft !
Une communauté commence à partir de deux, trois ? Trois ingénieures du développement, ayant toutes les trois une fine connaissance d’Apache Camel ont mis sur pied une solution Low-Code, Kaoto pour Apache Camel. Construire les routes d’intégration de données va connaître une nouvelle jeunesse !