L’Actualité de la donnée de Février 2021

Il faut se féliciter que des fournisseurs d’infrastructures tel que OVHcloud ont fait de l’efficacité énergétique un pilier fort de leur stratégie. Premièrement pour des raisons purement économiques mais aujourd’hui, il s’agit très clairement d’une différenciation très forte face à la concurrence.

Fort d’une frugalité de ses architectures, vérifiée par sa technologie de refroidissement liquide, développée et industrialisée dès 2003, OVHcloud présente un PUE (Power Usage Effectiveness) qu’il sait optimiser jusqu’à 1,09 : c’est-à-dire une consommation énergétique très proche de celle utile aux serveurs eux-mêmes.

Cloud Souverain, le débat s’invite chez nous tous

Michel Paulin, Directeur Général d’OVHcloud poursuit le combat d’Octave Klaba, fondateur d’OVHcloud pour un cloud souverain. C’est également le cas de Scaleway, filiale cloud de Free. Force est de constater que porté par leur caractère innovant, ils se font entendre.

OVHcloud est un aimant, dans le même mois il y a eu pas loin de deux importantes annonces de partenariats stratégiques avec Atos et Capgemini : certes il est question de ce fameux cloud souverain, d’innovation mais OVHcloud apporte aussi cette sobriété énergétique…

Atos et OVHcloud signent un partenariat stratégique pour créer une solution cloud de confiance 100% européenne

Capgemini et OVHcloud vont bâtir ensemble des solutions clouds sécurisées

Entretien avec Yann Lechelle : Directeur Général @Scaleway

Pas si simple d’être Ingénieurs des données

Chez Synaltic, le mot polyvalence n’est pas un tabou ; nous savons qu’être Data Engineer, Data Analyst ou encore Data Scientist présente quelques particularités.

Toutefois, chacun de nous sait aussi que c’est un apprentissage quotidien qui s’étend de la connaissance des systèmes d’information, en passant par les processus métier avec bien entendu cette expertise technique. L’adaptabilité, c’est aussi pour nos experts et ceux de nos clients…

Tant de choses à découvrir, à maîtriser chacun : la co-création est aussi l’occasion d’avancer, de partager ensemble des idées et les concrétiser en solution.

Data Engineering Technology Tree

The Future of Data Engineering

Les data scientists peuvent mieux expliquer les résultats

Certains data scientists pourraient vouloir présenter leurs résultats sous des formes plus attrayantes. Il est vrai que les visualisations avec Tableau sont de meilleures factures que celles en Python.

Tableau offre un pont vers Python, ce qui ouvre de nouvelles perspectives en matière d’analyses. Toute la richesse des librairies Python pour l’analyse des données apportées sur un plateau.

Tableau Python

Tableau+Python: TabPy and geographical clustering

TabPy

Être pragmatique, avancer et agir vite

C’est aussi une proposition d’Esther Duflo, Prix Nobel d’Économie, donnant son point de vue sur la manière dont les États pourraient agir de concert sur le plan économique, et ce à l’échelle mondiale.

Mais c’est surtout des startups, elles-mêmes qui reconnaissent que des services de l’État (ministères de la santé) qui su faire preuve d’une agilité et d’une réactivité de circonstance. Une belle occasion de rappeler que l’agilité n’est pas qu’une méthode d’organisation des développements informatiques ; sa déclinaison contractuelle existe !

Synaltic propose de plus en plus cette forme de contractualisation à ses clients.

Prise de RDV en ligne pour la vaccination : Comment Doctolib, Maiia et Keldoc ont modifié leur produit en un temps record

Fédéric Bardolle : “Pour diffuser l’innovation, il faut changer de culture”

Contrat agile open-source

An Agile Software Development Solicitation

Prerequisites for modular contracting

Nouvel horizon pour les clients des bases de données : adieu ODBC, adieu JDBC

ODBC et JDBC sont devenus un goulot d’étranglement pour les cas d’utilisation de la science des données ou dans le cadre d’analyse de données sur des jeux de données volumineux.

Les normes ODBC et JDBC ont été élaborées au début des années 90 lorsque l’infrastructure était limitée et que la mise en réseau était beaucoup plus lente. Conçus pour transporter de petits ensembles de résultats à partir de bases de données, et non pour des ensembles de données à l’échelle d’un lac de données.

En tant qu’API client au niveau des enregistrements, ODBC et JDBC sont généralement à mono-traitement et nécessitent que les enregistrements soient sérialisés et désérialisés, ce qui limite le débit. Le débit est nettement inférieur à la capacité réseau moderne (~ 10 Gbit / s)

Arrow Flight à la rescousse :

Pas de sérialisation / désérialisation. La représentation de la mémoire Arrow est la même dans toutes les langues ainsi que sur le fil (dans Arrow Flight). Par conséquent, les données ne seront pas réorganisées dès lors qu’elles franchissent les limites du processus.

Opérations en masse. Flight fonctionne sur des lots d’enregistrement sans avoir à accéder à des colonnes, enregistrements ou cellules individuelles. À titre de comparaison, une interface ODBC consiste à demander chaque cellule individuellement. En supposant 1,5 million d’enregistrements, chacun avec 10 colonnes, cela représente 15 millions d’appels de fonction pour récupérer ces données…

Parallélisme infini. Arrow Flight est une technologie évolutive, donc à toutes fins pratiques, le débit n’est limité que par les capacités du client et du serveur, ainsi que par le réseau intermédiaire.

Si Apache Arrow est largement utilisé, Arrow Flight apporte à des technologies comme Dremio , Apache Spark ou même des bases de données comme Omnisci, de nouvelles capacités d’interactions des plus performantes aux analystes et data scientists. Une performance très utile pour retrouver plus de productivité.

Eliminating Data Exports for Data Science with Apache Arrow Flight

Data Microservices in Apache Spark using Apache Arrow Flight

Introducing Apache Arrow Flight: A Framework for Fast Data Transport

L’Actualité de la donnée de Février 2021

Cloud Souverain, le débat s’invite chez nous tous

Pas si simple d’être Ingénieurs des données

Dernières Publications :

L’Actualité de la donnée de Mars 2026

L’Actualité de la donnée de Février 2026

L’Actualité de la donnée de Janvier 2026

L’Actualité de la donnée de Décembre 2025

Interagissez avec nous !