Quelle Data Platform pour les Retailers ? From Jarvis to Tailer

Par Hélène Allouard
·
décembre 15, 2020

Début 2019, Fashion Data démarrait les développements d’une toute nouvelle plateforme technologique, Jarvis, combinant Big Data et IA afin d’accompagner la transformation data driven des enseignes de Fashion Cube (Pimkie, Jules, Orsay, Grain de Malice, Rougegorge et Bizzbee).

Créer de toute pièce une nouvelle stack technique est toujours risqué et chronophage. Mais ce fut finalement une évidence pour toute l’équipe tant les enjeux étaient importants pour le succès de notre mission.
Notre mission ? Mettre l’intelligence de la donnée au service des enseignes de la mode afin d’accélérer leur transformation vers un nouveau Fashion Business modèle Zero Waste.

En d’autres termes, cela consiste à concevoir, implémenter et déployer des solutions & applications métier boostées à la Data et à l’IA permettant aux équipes opérationnelles d’augmenter fortement l’efficacité économique et écologique de l’ensemble des processus de l’entreprise.

Trois exemples de challenges data à révéler pour qu’un retailer deviennent eco-rentables :

- - Anticiper les attentes des consommateurs et les accompagner dans un parcours d’achat omnicanal et responsable.
  - Ne fabriquer, n’acheter que ce qu’une enseigne est en mesure de vendre, sans gâcher, sans brader.
  - Piloter intelligemment les stocks de chaque magasin en tenant compte des spécificités locales du point de vente.

Ces challenges ne sont pas uniquement techniques, ils sont aussi fonctionnels (le retail et particulièrement la mode subit une mutation majeure) et organisationnels car il faut accompagner les nouveaux gestes métier et s’assurer qu’ils soient compris, adoptés et appliqués, conditions indispensables à la création de valeur additionnelle promise par la data.

MAIS POURQUOI CONCEVOIR UNE NOUVELLE PLATEFORME DATA ?

Développer et opérer ces nouvelles solutions data au service du business nécessite de croiser et combiner systématiquement toutes les données produites par chaque enseigne ce qui génère une véritable explosion combinatoire que seuls les Big Data et l’IA peuvent adresser correctement. Or, ces technologies qui n’étaient pas disponibles chez nos clients, nous ont contraint à démarrer par la conception et l’alimentation de 6 data lake le plus rapidement possible avant de pouvoir créer nos algorithmes et déployer nos premières applications métier.

Tous ceux qui ont déjà mis en place un data lake savent que le marché propose un très grand nombre de solutions et d’outils permettant de construire une plateforme Big Data et qu’il n’est pas toujours facile de s’y retrouver parmi toutes les promesses des éditeurs. Les experts pardonneront ce raccourci, mais une plateforme data complète nécessite :

- - Un ETL pour collecter, transformer, exporter les données au sein de l’entreprise. Les plus classiques sont Talend, ODI, Informatica ou Datastage
  - Un espace de stockage objet (S3, Bucket GCP) pour archiver toutes les données quelles soient structurées (fichiers, logs, etc.) ou non (images, vidéos, emails clients, etc.)
  - Une base de données haute performance pour requêter et analyser les données. On peut citer Big Query, Snowflake ou encore Redshift de AWS
  - De la puissance de calcul pour exécuter des algorithmes en python par exemple
  - Des outils de data visualisation type Tableau Software, Qlik, Looker ou Data Studio
  - Des environnements de conception d’algorithmes comme Dataiku, Databricks ou encore Alteryx
  - Mais aussi des outils pour cataloguer, profiler et corriger la qualité des données comme Collibra ou Zeena.

Cette liste étant déjà très longue, nous passerons sous silence les outils de monitoring, de supervision de la sécurité, des accès, de la gestion de la conformité RGDP, etc.

Bref, vous l’aurez compris, une plateforme Big Data ressemble souvent à un puzzle d’une centaine de pièces qu’il faut combiner patiemment et intelligemment afin de disposer d’un ensemble cohérent, fonctionnel et maîtrisé. De plus, construire un Data Lake nécessite un budget initial d’environ 150k€ (licences + Setup) et dure entre 6 et 8 mois pour être totalement opérationnel. N’espérez pas pouvoir charger des données avant ou même industrialiser un premier score en machine learning.

BUDGET ET TIMING

Ces investissements en temps et en argent n’étant pas compatibles avec les objectifs de Fashion Data, nous avons adopté une approche radicalement différente permettant de diviser par 5 le coût d’un Data Lake, par 10 la durée du setup et par 3 le temps nécessaire pour charger, transformer, enrichir et activer les données de chaque enseigne.

Pour atteindre cet objectif, nous avons fait les choix structurants suivants :

- - Travailler en mode Data Ops, c’est-à-dire en mode DevOps mais adapté aux problématiques de la Data
  - Faire du SQL notre langage de développement par défaut, tant pour charger, transformer, enrichir les données que pour les analyser, construire des modèles algorithmiques, mettre en qualité les données ou encore superviser la plateforme.
  - Réduire drastiquement la complexité d’intégration des briques techniques en n’utilisant que les services nativement disponibles dans le cloud de Google.
  - S’assurer que la plateforme soit scalable et très rapide, que ce soit pour développer un flux, tester les données, exécuter une transformation ou appliquer un modèle statistique.
  - Fonctionner uniquement par événement pour gérer de manière transparente les traitements en mode batch comme le streaming de données en temps réel.
  - Supprimer tous les risques de manipulation des PII en intégrant des mécanismes natifs de protection des données personnelles

JARVIS, pour Just A Retail Versatile Intelligent System, était née. Synthèse des nombreuses années d’expériences des experts de Fashion Data, nous disposions d’une plateforme Big Data et IA à même d’industrialiser rapidement toutes nos data pipelines mais aussi le contrôle sur la qualité des données, nos modèles algorithmiques, la construction d’un data catalogue et tout cela à très haute vitesse.

Durant ces 18 derniers mois, Jarvis n’a cessé de gagner de nouvelles fonctionnalités pour simplifier encore plus son utilisation, étendre la richesse fonctionnelle des traitements, ajouter des connecteurs IN/OUT, renforcer son intégration au sein des outils de supervision et de monitoring de nos clients.

Aujourd’hui, Jarvis exécute quotidiennement plus de 3000 flux et transforme plus de 100 To de données toutes les 24h. Il est le moteur au cœur de tous les algorithmes, de toutes les applications métiers et de tous les dashboards utilisés quotidiennement par nos clients.

Le challenge relevé début 2019 est désormais une arme redoutable pour accélérer la transformation Data Driven des enseignes. Mais nous voulons aller plus loin et faire qu’un maximum de Retailers puissent concevoir leur propre data platform sur mesure.

Pour incarner cette nouvelle étape, nous avons décidé de donner à Jarvis une nouvelle identité: Tailer. Anagramme de Retail et clin d’œil à l’univers du Fashion (My Tailor Is Rich !), ce nouveau nom traduit notre volonté de proposer la meilleure plateforme data conçue pour les retailers intégrant nativement toutes les problématiques du commerce et de la distribution.

Nous continuerons à faire évoluer Tailer afin de proposer des applications et des solutions retail toujours plus performantes et innovantes. Ce n’est donc que le début !

Vous avez aimé cet article ?

N’hésitez pas à le partager

Nous sommes sur Twitter

You currently have access to a subset of Twitter API v2 endpoints and limited v1.1 endpoints (e.g. media post, oauth) only. If you need access to this endpoint, you may need a different access level. You can learn more here: https://developer.twitter.com/en/portal/product

Voir tout nos tweets