Il faut se féliciter que des fournisseurs d’infrastructures tel que OVHcloud ont fait de l’efficacité énergétique un pilier fort de leur stratégie. Premièrement pour des raisons purement économiques mais  aujourd’hui, il s’agit très clairement d’une différenciation très forte  face à la concurrence.

Fort d’une frugalité de ses architectures,  vérifiée par sa technologie  de refroidissement liquide, développée et  industrialisée dès 2003, OVHcloud présente un PUE (Power Usage  Effectiveness) qu’il sait  optimiser jusqu’à 1,09 : c’est-à-dire une  consommation énergétique très  proche de celle utile aux serveurs  eux-mêmes.

Cloud Souverain, le débat s’invite chez nous tous 


Michel Paulin, Directeur Général d’OVHcloud poursuit le combat d’Octave Klaba, fondateur d’OVHcloud pour un cloud souverain. C’est également le cas de Scaleway, filiale cloud de Free. Force est de constater que porté par leur caractère innovant, ils se font entendre.

Toutefois,  chacun de nous sait aussi que c’est un apprentissage quotidien qui  s’étend de la connaissance des systèmes d’information, en passant par  les processus métier avec bien entendu cette expertise technique.  L’adaptabilité, c’est aussi pour nos experts et ceux de nos clients…

OVHcloud est un aimant, dans le même mois il y a eu pas loin de deux importantes annonces de partenariats stratégiques avec Atos et Capgemini : certes il est question de ce fameux cloud souverain, d’innovation mais OVHcloud apporte aussi cette sobriété énergétique…




Pas si simple d’être Ingénieurs des données 
 

Chez Synaltic, le mot polyvalence n’est pas un tabou ; nous savons qu’être Data Engineer, Data Analyst ou encore Data Scientist présente quelques particularités. 

Toutefois, chacun de nous sait aussi que c’est un apprentissage quotidien qui s’étend de la connaissance des systèmes d’information, en passant par les processus métier avec bien entendu cette expertise technique. L’adaptabilité, c’est aussi pour nos experts et ceux de nos clients…

Tant de choses à découvrir, à maîtriser chacun : la co-création est aussi l’occasion d’avancer, de partager ensemble des idées et les concrétiser en solution.



Les data scientists peuvent mieux expliquer les résultats

Certains data scientists pourraient vouloir présenter leurs résultats sous des formes plus attrayantes. Il est vrai que les visualisations avec Tableau sont de meilleures factures que celles en Python.


Tableau offre un pont vers Python, ce qui ouvre de nouvelles perspectives en matière d’analyses. Toute la richesse des librairies Python pour l’analyse des données apportées sur un plateau.


Tableau Python

Tableau+Python: TabPy and geographical clustering

TabPy


Être pragmatique, avancer et agir vite

C’est aussi une proposition d’Esther Duflo, Prix Nobel d’Économie, donnant son point de vue sur la manière dont les États pourraient agir de concert sur le plan économique, et ce à l’échelle mondiale.



Mais c’est surtout des startups, elles-mêmes qui reconnaissent que des services de l’État (ministères de la santé) qui su faire preuve d’une agilité et d’une réactivité de circonstance. Une belle occasion de rappeler que l’agilité n’est pas qu’une méthode d’organisation des développements informatiques ; sa déclinaison contractuelle existe !

Synaltic propose de plus en plus cette forme de contractualisation à ses clients.




Nouvel horizon pour les clients des bases de données : adieu ODBC, adieu JDBC 


ODBC et JDBC sont devenus un goulot d’étranglement pour les cas d’utilisation de la science des données ou dans le cadre d’analyse de données sur des jeux de données volumineux.

Les normes ODBC et JDBC ont été élaborées au début des années 90 lorsque l’infrastructure était limitée et que la mise en réseau était beaucoup plus lente. Conçus pour transporter de petits ensembles de résultats à partir de bases de données, et non pour des ensembles de données à l’échelle d’un lac de données.

En tant qu’API client au niveau des enregistrements, ODBC et JDBC sont généralement à mono-traitement et nécessitent que les enregistrements soient sérialisés et désérialisés, ce qui limite le débit. Le débit est nettement inférieur à la capacité réseau moderne (~ 10 Gbit / s)

Arrow Flight à la rescousse :

  • Pas de sérialisation / désérialisation. La représentation de la mémoire Arrow est la même dans toutes les langues ainsi que sur le fil (dans Arrow Flight). Par conséquent, les données ne seront pas réorganisées dès lors qu’elles franchissent les limites du processus.

  • Opérations en masse. Flight fonctionne sur des lots d’enregistrement sans avoir à accéder à des colonnes, enregistrements ou cellules individuelles. À titre de comparaison, une interface ODBC consiste à demander chaque cellule individuellement. En supposant 1,5 million d’enregistrements, chacun avec 10 colonnes, cela représente 15 millions d’appels de fonction pour récupérer ces données…

  • Parallélisme infini. Arrow Flight est une technologie évolutive, donc à toutes fins pratiques, le débit n’est limité que par les capacités du client et du serveur, ainsi que par le réseau intermédiaire.


Si Apache Arrow est largement utilisé, Arrow Flight apporte à des technologies comme 
Dremio  , Apache Spark ou même des bases de données comme Omnisci, de nouvelles capacités d’interactions des plus performantes aux analystes et data scientists. Une performance très utile pour retrouver plus de productivité.



Tags:

No responses yet

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *