L’Actualité de la donnée de Janvier 2021

Introduction

Pas très simple comme début d’année ! Nous vivons en pandémie ! Une belle et heureuse année à toutes et tous.
Heureusement nous avons les données !

Tout comme nous avons la météo qui nous aide à entrevoir le temps qu’il fera, tout comme les données et les algorithmes apportent un éclairage d’un futur à envisager !

Si le début d’année est propice aux tentatives d’identification de tendances, le rapport Bothorel dresse les lignes directrices pour le gouvernement sur la politique publique de la donnée, des algorithmes et des codes sources. Les instances du Logiciel Libre et de l’open source français lui emboîtent le pas pour proposer à l’Etat son aide face à ces défis de meilleure exploitation de l’open source et de l’open data par ses administrations. Synaltic soutient complètement cette initiative face à l’engagement qui est le sien depuis 20 ans avec l’open source et encore plus aujourd’hui avec le projet Data-Asso.

Thierry Breton, commissaire européen au Marché intérieur en charge du numérique et de la défense, affiche quant à lui, peu d’incertitude, en promouvant de nouveaux règlements européens pour apporter plus de cadre dans le secteur du digital.

Préparez-vous, ça va bouger cette année… Et vos projets de 2020, les ferez-vous en 2021, ou allez-vous savoir attendre 2022… Pas si sûr !



Attention dans l’IA, tout n’est pas à jeter

   

Un point de vue tout à fait intéressant sur l’intelligence artificielle qui est parfois malmené dans les médias. Il faut bien noter que c’est bien l’éthique que l’on associe à nos modèles de pensées qui seront mis en œuvre dans les algorithmes.

Nozha Boujemaa développe un point de vue qui remet l’accent sur l’intelligence artificielle et son apport réel dans les processus métier. Elle insiste sur la bonne mise en œuvre des projets de données avec : “Garantir et sécuriser ses sources de données. L’enjeu de la gouvernance et de l’accès équitable à ces données sera majeur dans les années à venir”.

Sommes-nous à l’aube d’un changement pour le développement de l’intelligence artificielle ?
EN SAVOIR PLUS


Les tendances du marché de la données pour 2021


En ce début d’année il y a de nombreux acteurs qui vont de leurs commentaires sur les tendances du marché et ce vers quoi il pourrait tendre. Nous retiendrons que l’on peut avoir des architectures de données sans data warehouse ! Le serverless est mort, vive le serverless ! Le streaming ! SQL qui continuera d’être le langage des analystes.


Predictions 2021: Five Big Data Trends You Should Know
EN SAVOIR PLUS

Les 10 tendances du développement logiciel en 2020
En savoir plus


AWS Lambda is winning, but first it had to die

EN SAVOIR PLUS




Réduire les délais d’Analyse (Time To Insight)

   
L’informatique décisionnelle a été parfois mise en concurrence avec le data science. Il s’avère que l’informatique décisionnelle peut énormément tirer partie du machine learning pour réduire le délai d’analyse (Time To Insight). C’est par exemple le cas pour toutes les automatisations des process ETL. Un autre impact important du machine learning sur la business intelligence est l’interface utilisateur pour encore mieux guider et accélérer les décisions.Analysts remain front and center in BI 3.0.

AI and Automation meet BI
EN SAVOIR PLUS

Business Intelligence vs Data Science? Here’s Why BI Needs AI
EN SAVOIR PLUS





L’analytique pour l’utilisateur métier vise de nouveaux horizons



Une jeune société, Einblick, dont les porteurs de projets sont issus du MIT, souhaite révolutionner le marché de l’analytique avec une approche complètement novatrice. Basée sur un apport certain de machine learning à chaque étape de la chaîne de traitement analytique, les interfaces utilisateurs s’organisent dans une interactivité inédite notamment grâce aux écrans tactiles. Les analyses directes et collaboratives trouvent une approche très innovante. A suivre…

Visual Data Computing Unleashed
EN SAVOIR PLUS

A radically faster approach to make data-driven decisions
EN SAVOIR PLUS



DataOps gagne du terrain et de la pratique


Mettre la qualité dans les process de données n’est pas nouveau, le terme DataOps réfère à cette notion maintenant. Un mot est mis sur une pratique. Sql, un langage décrié il y a quelques années, va continuer à rester une référence dans le marché analytique… Des outils viennent justement encadrer les projets où ce langage est largement employé notamment pour la construction de data warehouse ou de data lake. Le reproche de la complexité de larges requêtes sql incompréhensibles peut désormais être relativisées… Google vient de mettre la main sur Dataform, qui permet la construction de Data Warehouse  (Redshift, Bigquery, Snowflake…) avec un framework qu’à base de SQL ! De l’alimentation à la diffusion des données. Dataform assiste à chaque étape et permet d’avoir un processus où la qualité des données et des processus est gérée de bout en bout. LinkendIN a par ailleurs poussé un toolkit (un projet open source) Coral, pour accompagner la mise en œuvre de tel projet guidé par SQL.

Dataform is joining Google Cloud
EN SAVOIR PLUS

Coral: A SQL translation, analysis, and rewrite engine for modern data lakehouses #1
En savoir plus


Coral: A SQL translation, analysis, and rewrite engine for modern data lakehouses #2

EN SAVOIR PLUS



Etat de l’art de JavaScript en 2020


Comme chaque année vous pouvez retrouver où en est ce langage. Javascript est très pratique pour Synaltic dans le cadre de la mise en oeuvre de projet analytique à façon.

State of art of Javascript 2020
EN SAVOIR PLUS



Coté logiciels

Tableau 2021 : Toute l’interactivité de tableau depuis l’interface web La version full web de Tableau fait de très grands pas.

Talend mise sur Stich : support pour l’europe Talend, qui a investi dans Stich, l’ouvre pour l’Europe… Pensez-y pour vos projets de données.

Apache Airflow 2.0 est sorti ! L’interface graphique, les performances, de nombreuses améliorations sur cet outil d’orchestration de vos pipelines de données. https://airflow.apache.org/blog/airflow-two-point-oh-is-here/ https://www.astronomer.io/blog/introducing-airflow-2-0

Announcing Dremio December 2020 : Dans cette nouvelle version, on notera l’introduction du protocole Arrow Flight pour accélérer les échanges entre le serveur Dremio et les interrogations clients.

Announcing Harvester : Open Source Hyperconverged Infrastructure (HCI) Software Rancher sort une solution pour gérer tout votre cloud de bout en bout basé aussi sur Kubernetes, même on premise. Ici, les clients WMware, Nutanix, Openstack trouveront une alternative moderne.

Trino le nouveau nom de PrestoSQL : Le créateur de PrestoDB, qui avait monté le projet PrestoSQL, choisit de renommer le projet ! C’est désormais Trino !