L’Actualité de la donnée de Novembre 2023

L’année se termine. Voilà notre avant-dernière lettre… Que dit-elle de 2024 ? Certainement un recentrage sur l’humain.

Des chercheurs approchent avec une rigueur scientifique la preuve de la Zoom Fatigue ! Se voir en vrai : c’est bien, n’est-ce pas ?

Et le télétravail en prend aussi un coût. La nouvelle normalité n’est pas le sans contact. Walmart, Tesco et d’autres de la grande distribution songent à abandonner la caisse en self service… trop d’erreurs et leurs clients n’aiment pas vraiment !

Dans notre métier la pénurie de talents et leurs coûts poussent certaines entreprises (jeunes) à tenter la transparence et justifier leur TJM. Quel est le TJM d’un Architecte Data qui définit la vision d’une plateforme de données avec une stratégie de liberté et de souveraineté ?







#30DayMapChallenge


Topi Tjukanov, un géographe finlandais qui défend l’open data, l’accès libre des données au bénéfice de tous a lancé en 2019, le #30DayMapChallenge.

Il s’agit de créer une carte par jour pendant un mois selon un thème différent. La liste des thèmes est défini sur le site de présentation du projet et les cartes sont publiées sur X/Twitter avec le hashtag #30DayMapChallenge.

Les publications permettent de mieux se rendre compte de ce qui est réalisable aujourd’hui et aussi, de se laisser aller à contempler certaines d’entres elles !






Une géographie du football amateur en France


C’est pour Le Point que Clara Dealberto « met en cartes » les données des clubs amateurs de football.

Quoi de mieux qu’une carte pour répondre à des questions « géographiques » : Où joue-t-on le plus au foot en France ? Comment sont géographiquement répartis les 14 000 clubs de football ? Qu’elles communes n’affichent aucun licencié de la @FFF ?

Ces visuels illustrent bien que l a pratique du football amateur est  généralisée et très rurale en France. Sur les 36 000 communes que compte la France, on trouve des licenciés dans 32 000 d’entre elles !

Le nombre de licenciés de football est disponible sur data.gouv, commune par commune, pour 2019. Pour synthétiser cette donnée, le territoire a été découpé en hexagones de 20 kilomètres de diamètre. Sur ce nouveau maillage de la France, le nombre de licenciés par commune a été rapporté à la population de chaque commune afin de calculer le nombre de licenciés pour 1 000 habitants.




Open Source, un modèle économique “rude” mais tellement engageant


Nous y sommes, Talend Open Studio c’est fini ! Après presque 20 ans de service, la  fin de Talend Open Studio est annoncé par Qlik qui laisse toute la place à Talend Entreprise. A coup sûr c’est Talend Cloud qui demeurera…

L’open source apporte cette liberté et cette souveraineté qui vont vous être nécessaire ces prochaines années. N’enfermez pas vos données !

Justement, nombre d’éditeurs défendent l’Open Source. Plébiscitons Paul Ramsay, développeur de PostGIS, qui rappelle avec ses mots pourquoi l’Open Source . Et imaginer un monde où les fournisseurs d’IA recherchent à “dominer” ! Qui sera l’assistant de qui ? L’Open Source est là encore une réponse ! Mettre à disposition des modèles d’IA interopérables, auditables, transparents.

Ce ne doit pas être une utopie et chez Synaltic, l’open source fait partie de nos valeurs. Imaginez-vous ne pas avoir eu l’open source ces 20 dernières années ? A quoi ressemblerait l’informatique d’aujourd’hui ?








L’analytique temps réel pullule  !

Si le mois dernier nous parlions de nouveaux concurrents de Confluent avec la volonté de simplifier le streaming grâce à SQL, nous ne nous attendions pas à une remise en cause de Confluent qui viendrait de la bourse !

Pour sûr, l’intégration de données va connaître de nouveaux jours, si Talend a ouvert la voie il y a bientôt 20 ans et arrête aujourd’hui ces studios open source, d’autres acteurs réinvente et réenchante la discipline.

Le temps réel, la norme, le batch une exception : vos données transitent par une solution de messagerie et sont ainsi immédiatement analysables.

Synaltic, début 2023, proposait un retour d’expérience des architectures de Streaming à la Conférence Subsurface de Dremio.

En 2024, c’est à vous de jouer !










Logiciels

GRIST

Grist est un tableur relationnel moderne. Il combine la flexibilité d’un tableur avec la robustesse d’une base de données pour organiser vos données et vous rendre plus productif.





Télécharger Talend Open Studio

Talend Open Studio for DI, Talend Open Studio for ESB, Talend Open Studio for Big Data sont diffusés sous licence Apache 2.

Depuis mars 2023, Synaltic propose une distribution de Talend Open Studio qui correspond aux versions « en amont  » (Upstream) des produits open source Talend, dont le code est disponible sur github