Accueil Témoignages Comment le Club Med a repensé sa stratégie Data suite au Covid

Comment le Club Med a repensé sa stratégie Data suite au Covid

En 2021, la crise sanitaire estpour le secteur du voyage et du tourisme un véritable tsunami. Alors que ses 70 villages ferment, le Club Med décide de repenser sa stratégie Data. L’idée est de moderniser le Data Lake existant et surtout de passer au temps réel pour mieux profiter du redécollage du secteur.

Nom de code “Road 45, highway to business” : le projet de Data Factory du Club Med est initié en 2021, alors que la situation du Club et du secteur du tourisme dans son ensemble est au plus bas. Les 70 villages haut de gamme sont fermés du fait des mesures de confinement et l’arrêt des vols internationaux. Les équipes commerciales consacrent leur temps à gérer les annulations…

André Bourlat

« Nous nous sommes retrouvés dans une situation où tous les projets étaient arrêtés, nous n’avions pas de quoi occuper nos jeunes talents et ceux-ci commençaient à partir » se souvient André Bourlat, en charge de la Data Factory et de l’innovation du Club Med. « Il fallait rendre le Club Med aussi attractif pour nos GO (Gentils organisateurs) et donc développer de beaux projets. Nous avons profité de cette opportunité pour préparer l’avenir et réfléchir sur le futur de la Data et un gros projet d’entreprise que représentait la Data Factory. »

 

Objectif : passer au temps réel

Un nouveau Chief Data Officer est recruté, Siddhartha Chatterjee, et le projet de créer une Data Factory est lancé. L’investissement est majeur pour le Club Med, de l’ordre de 8 millions d’euros. André Bourlat ajoute : « Nous avons estimé qu’avec une meilleure compréhension et personnalisation des offres, une meilleure rétention des clients, nous pourrions augmenter les ventes de 2 à 3 %. » Le Club veut notamment mieux comprendre la “Customer Lifetime Value”, c’est-à-dire l’investissement consenti sur chaque client et le Payback, c’est-à-dire savoir ce que rapportent les budgets injectés dans la publicité et le marketing pour chaque client dans le cycle de vente.

Si l’entreprise collecte déjà énormément de données dans son Data Lake porté par Google Cloud Platform, beaucoup reste à faire : « Chaque Data contient une information donnée par nos clients. C’est une information que l’on doit gérer au plus vite car elle peut impacter notre business. Il faut absolument comprendre et gérer la data en temps réel. »

« Chaque Data contient
une information donnée par
nos clients. C’est une information que l’on doit gérer au plus vite car elle peut impacter notre business. »

Les équipes d’Octo Technology sont alors choisie afin d’aider le Club Med à mettre en place une Data Factory. Le premier semestre 2022 est consacré à la création du socle de la Data Factory. L’activité de l’entreprise repose sur une base de données relationnelle IBM DB2 déployée on-premise. Celle-ci porte l’ensemble des informations clients et tout ce qui porte sur les agences et surtout l’activité réservation, le « Booking ». Toutes ces données sont mise à jour en temps réel par les utilisateurs internes, par les agences. L’idée de la nouvelle architecture Data est de récupérer chaque événement dès qu’il survient dans la base de données et charger cette données sur GCP via Kafka. Les données sont envoyées en temps réel à la fois sur une base de données PostgreSQL et sur Big Query pour pouvoir les manipuler librement par la suite. Tout événement sur DB2 est répliqué sur GCP et une gestion des erreurs est mise en place, de même que toute modification d’une table DB2.

L’alimentation de la Data Factory est initiée fin juin 2022

D’autres interconnexions sont mises en place, notamment avec le service de téléphonie Cloud Verizon mis en œuvre par le Club, ainsi que les données produites avec toutes les informations relatives aux villages, stockées dans le PIM Quable. Le Club Med tire bien évidemment parti des connecteurs GCP pour Google Analytics. « Nous souhaitons implémenter d’autres données qui ne le sont pas encore, notamment les données RH issues de Workday, ainsi que des informations liées aux paiements » ajoute le responsable.

Une fois ces données chargées dans GCP sous forme de « Raw Data » (données brutes), celles-ci sont retravaillées, vérifiées. Le service Data réalise cette montée en qualité des données afin de les mettre à disposition des utilisateurs finaux, soit au moyen des outils de Self BI et DataViz de QlikView, soit au travers des modèles de Machine Learning conçus par les Data Scientists. L’équipe projet a fait le choix du catalogue de données Zeenea afin de répertorier l’ensemble de ses sources de données et des règles de gestion qui s’y appliquent. La solution fournit notamment un Data Lineage de chaque indicateur pour comprendre de quelles sources de données il provient. « C’était un point important car notre documentation consistait essentiellement en fichiers Word ou Excel. Nous avons profité de ce projet pour mettre en place ce catalogue de données. » L’alimentation de la Data Factory est initiée fin juin 2022. 2 milliards d’informations existantes sont chargées sur GCP, soit 75 To de données. Tous les jours, ce sont 5 millions de nouvelles données qui alimentent cette infrastructure en temps réel, des données issues de 12 domaines différents, dont le CRM, les interactions, le Booking, les activités produits, réseau, les appels téléphoniques, etc.

De la donnée enfin disponible en temps réel pour les métiers

Pour le Club Med, les données de Booking sont capitales, or, jusque-là, l’entreprise n’était pas capable d’afficher ses réservations en temps réel issues des agences, du site web, des agences en indirect et des autres canaux de vente. « Afficher ces réservations en temps réel est important, car quand nous faisons des ouvertures de vente, nous devons rapidement comprendre si cela fonctionne et si toutes les agences sont opérationnelles dans tous les pays. La Data Factory nous permet aujourd’hui d’afficher l’ensemble des bookings : c’est un indicateur très suivi par l’ensemble de la direction, par les pays, et même les agences qui sont en compétition les unes avec les autres. »

Le deuxième semestre 2022 voit la plateforme s’ouvrir aux utilisateurs finaux. La fonction de Self BI est ouverte aux utilisateurs avec la solution QlikView. Elle permet aux utilisateurs de réaliser leurs analyses de données. Celle-ci basculera à terme sur Microsoft PowerBI. En parallèle, l’autonomie des Business Units vis-à-vis de la Data est renforcée avec la mise en place de la solution Dataform qui permet à tous les utilisateurs de réaliser des requêtes sur Big Query et de créer de créer des tableaux de bord avec Looker Studio.

La Data Factory démarre ses activités dans une organisation agile comme prévu : « Les plannings ont été tenus et après 6 mois de travail, la Data Factory était « live » sur des projets excessivement complexes et ambitieux » explique le responsable. Une première application pilote d’IA est lancée sur la personnalisation en temps réel du site Web du Club Med. L’objectif est de délivrer en temps réel une information de prédiction sur le profil de la personne qui se connecte au site et d’afficher un contenu adapté à ce profil sur la home page du site. « Que le client soit connu ou pas, nous voulions déterminer rapidement un score en fonction de son comportement sur le site. Le temps de latence qui nous souhaitions ne devait pas dépasser 200 ms. Il s’est avéré de l’ordre de 50 ms » se félicite le responsable de la Data Factory.

« Avec la Data Factory, nous allons pouvoir explorer
de nouveaux Use Case que nous n’avions pas les moyens techniques de mettre en place jusqu’à maintenant. Grace
à l’IA, nous allons vers
la recommandation temps réel
et une meilleure optimisation
des offres en fonction
des attentes de nos clients. » 

Une gouvernance de la donnée plus décentralisée

Outre la création de la structure Data Factory et de la modernisation de l’infrastructure Data, un gros effort est réalisé quant à la gouvernance de la donnée. L’objectif est de redonner la propriété des données aux personnes qui gèrent cette Data au quotidien. Un gros travail d’analyse est alors mené avec Octo Technology afin de bien analyser le parcours client et les différents domaines impactés. Toutes les tâches sont soigneusement identifiées, les domaines découpés et des propriétaires de la donnée nommés pour chaque domaine. « Le Data Product Owners est propriétaire de sa donnée, il en est responsable, mais il doit aussi être à l’origine des KPI liées à son domaine. Nous avons souhaité redonner ce pouvoir aux utilisateurs alors qu’il était plutôt centralisé jusque-là. Cette démarche a été rendue possible grâce à Zeenea, notre outil de Data Catalog. »

En 2023, alors que l’activité touristique a repris, la Data Factory du Club Med est opérationnelle. 5 grands cas d’usage ont été identifiés, avec une personnalisation encore accrue du site Web, la mise en place d’un scoring de la prédiction d’achat, un travail sur les volets attribution et contribution et un cas d’usage sur l’analyse des appels téléphoniques entrants. Enfin, le Club Med veut exploiter la connexion entre GCP et la Google Marketing Platform (GMP) afin d’optimiser ses achats médias et notamment ne plus pousser des publicités ou une promotion vers un client dont on sait qu’il a déjà réalisé un achat offline en agence.

 

Alain Clapaud