Les projets big data en manque de compétences

Les compétences data sont très demandées par les entreprises du numérique mais aussi des autres secteurs, face à l’explosion des données et de leur traitement. Une très grande majorité rencontre des difficultés de recrutement.

Le marché du big data en France a atteint 2,3 milliards d’euros, soit une croissance de +22,1 % en 2022, après une croissance annuelle moyenne de 19 % entre 2015 et 2020, selon l’étude sur les besoins en compétences, emploi et formation réalisée en 2023 par l’OPIIEC, l’observatoire paritaire des métiers du numérique, de l’ingénierie, du conseil et de l’évènement. Il représente environ 80 000 emplois directs (data scientists, ingénieurs big data, analystes de données…) et indirects (consultants, développeurs, gestionnaires de bases de données…). L’OPIIEC estime que la part des effectifs du big data dans le secteur du numérique est de l’ordre de 12%. Selon ses estimations, le taux de croissance annuel moyen sur les métiers du big data seront dans les prochaines années de 8 %, contre 2,3 % dans l’ensemble du secteur du numérique.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

En 2021, les entreprises françaises prévoyaient d’investir en moyenne 4,4 millions d’euros dans les projets liés au big data et à l’intelligence artificielle (IA). La donnée est de plus en plus considérée comme un actif stratégique et un levier d’intelligence pour analyser les marchés et le fonctionnement des produits. Elle devient un outil d’aide à la décision, voire de prise de décision business et stratégiques. Mais la croissance de l’utilisation des données fait face à des obstacles techniques et relatifs aux compétences nécessaires.

L’obstacle de la qualité des données

Les projets big data sont quasi systématiquement confrontés à des problèmes de qualité des données. Elle est insuffisamment pilotée sur ses différents critères : clarté, exhaustivité, cohérence, validité, actualité, pertinence/précision, intégrité… Ce déficit retarde souvent, voire compromet l’aboutissement des projets big data dans les entreprises.

De plus, le poids important des infrastructures et systèmes existants limitent les marges de manœuvre des porteurs de projets big data. Des pratiques de non-partage de la donnée subsistent, pour des raisons métiers, techniques, juridiques ou organisationnelles.

L’obstacle des besoins en compétences difficilement pourvus

Frein majeur au développement du big data, les entreprises ont beaucoup de mal à pourvoir leurs besoins en compétences. Car le big data transforme les métiers techniques, comme le montre le graphique ci-dessous.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

L’OPIIEC a également modélisé les compétences techniques requises pour quatre métiers de la data. Les compétences du data engineer portent essentiellement sur la maîtrise des flux de données, les bases de données et les instruments/outils d’exploitation de la data. Les attributions de l’analyste de données sont larges et un haut niveau de compétence est attendu en datavisualisation, reporting et maîtrise des métriques, connaissances business, storytelling. Le data scientist est essentiellement attendu sur les compétences techniques de statistique, la modélisation de machine learning, l’inférence et l’expérimentation. Le machine learning engineer dispose d’un haut niveau de compétence en MLOps, en modélisation et déploiement de modèles.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

La donnée, compétence transverse

Plus largement, la data est devenue une compétence transverse. La culture de la donnée dans les entreprises concerne tous les salariés, en particulier les fonctions cadres qui doivent être accompagnées dans le développement de ces nouvelles compétences. Aujourd’hui il est demandé de manier les données et de prendre des décisions par rapport aux données. Pour que les organisations soient vraiment data-driven, il faut que la culture de la data soit diffusée à tous les niveaux de l’organisation, et que l’interface avec les données et les métiers soit assurée.

Dans ces conditions, disposer d’un socle de compétences de base liées à la donnée est devenu un prérequis dans le recrutement de profils techniques dans les entreprises du numérique :

– acculturation de base au big data : enjeux, concepts, notions…

– manipuler, utiliser et exploiter les données

– créer des modèles pour valoriser les données

– compétences de base en matière de sécurité des données.

Plusieurs compétences liées à la data et aux bases de données sont désormais considérées comme indispensables pour les entreprises : la programmation, les méthodologies agiles, la datavisualisation, la cybersécurité. Voici en détail les compétences techniques recherchées pour le big data.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

DevOps et IA, des compétence de plus en plus centrales

La compétence DevOps en matière de data est de plus en plus demandée. Elle se concentre sur la création, le déploiement et la gestion de flux automatisés de données qui permettent de collecter, stocker, transformer, analyser et diffuser des données. Aujourd’hui, les ESN sont confrontées à une demande croissance de profils DevOps de la part de leurs clients. Le DevOps fait désormais partie des formations les plus demandées auprès des organismes de formation. Le profil DevOps reste majoritairement pourvu par des profils scientifiques, dont de nombreux mathématiciens.

L’intelligence artificielle est devenue un axe fort de développement de l’offre de formation en matière de Big Data, notamment l’IA générative et les compétences de prompt engineer.

Une offre de formation plus axée tech que méthodes et business

D’après les entreprises, l’offre de formation est robuste en matière de maîtrise des outils, solutions et technologies. Elle est en revanche insuffisante en matière de méthodologie, et d’adaptabilité en fonction des produits ou de contextes métiers ou business différents.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

Importantes difficultés de recrutement

A compétences pointues, difficultés de recrutement. Selon une étude de Kantar pour la French Tech Corporate Community, 90% des grands groupes français ont réalisé au cours des trois dernières années des recrutements en externe sur des métiers en lien avec la data. Et 91% ont relevé des difficultés de recrutement.

78 % des entreprises du numérique interrogées par l’OPIIEC, déclarent avoir des difficultés de recrutement de profil big data et cloud computing. Elles recherchent avant tout des profils techniques et de développeurs.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

Les ingénieurs très demandés

Les difficultés de recrutement sont liées autant à la concurrence sur le marché de l’emploi qu’à la pénurie de talents. Les profils scientifiques ou informatiques sont logiquement les plus demandés en matière de big data. La plupart des entreprises du numérique interrogées recherchent prioritairement des profils d’ingénieurs en informatique, en data science ou télécoms, ou de formations équivalentes.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

Les profils junior ou intermédiaires font aussi l’objet d’un fort besoin de recrutement. Les entreprises du numérique sollicitées par l’étude donnent la priorité dans leur recrutement à des profils plutôt jeunes diplômés. Leur stratégie, dans un contexte de pénurie des talents et de forte concurrence sur le marché du travail, consiste à embaucher en priorité des profils à faible séniorité qu’ils vont ensuite faire grandir en interne, via le plan de formation et des certifications sur les compétences et outils clés.

L’ancienneté dans l’entreprise est ensuite vécue comme l’assurance de bien connaître les enjeux et les produits. Même relativement juniors, ces profils sont très majoritairement recrutés en CDI pour renforcer l’attractivité des postes dans le contexte de pénurie.

Toutefois, les entreprises appréhendent le niveau de diplôme de façon de plus en plus variable. La plupart des entreprises appliquent un haut niveau d’exigence dans le recrutement des profils ingénieurs en data science. Pour les niveaux juniors, c’est l’importance du niveau de diplôme qui prime. Plusieurs écoles d’ingénieurs et diplômes de haut niveau sont explicitement ciblés : Polytechnique, Centrale Supélec, Ecole des Ponts Paris Tech, Mines Paris Tech… Les ESN demandent un très haut niveau de prérequis, notamment des profils diplômés de moins de 30 ans, déjà compétents dans plusieurs spécialités et polyvalents.

Diversifier les profils pour répondre aux besoins en data

Toutefois, dans un nombre important d’entreprises du numérique, la demande de profils data est telle que le diplôme ne constitue plus un critère au moment de l’embauche. D’abord parce qu’identifier la valeur d’un diplôme et devenu complexe compte tenu du caractère pléthorique de l’offre disponible. Ensuite car les diplômes sont de moins en moins considérés comme gages de compétences, au regard des certifications ou de l’expérience. On estime que les connaissances techniques acquises lors de la formation vont être très rapidement dépassées : les entreprises savent qu’elles vont beaucoup devoir former leurs recrues « sur le tas ». Et face à la pénurie, il en résulte un appel plus important à une main d’œuvre étrangère de développeurs, sans critère de diplôme.

Turn-over important

Il est devenu rare qu’un profil technique reste plus de cinq ans dans une même entreprise. Or, il s’agit d’un motif de préoccupation majeur pour les entreprises, d’autant que les systèmes mis en place sont complexes et demandent une connaissance sur la durée pour pouvoir être maintenus.

Les causes de ces difficultés sont la frustration des profils techniques, qui doivent sous-utiliser leurs capacités en répondant souvent des tickets support ou en utilisant des outils sur étagère, le manque d’évolution vers d’autres fonctions, et la forte attractivité du freelancing.

Parmi les leviers envisagés ou mobilisés pour tenter de fidéliser ces profils data, l’amélioration de la qualité de vie au travail se traduit très fortement par un recours très élevé, fréquemment jusqu’à 100%, au télétravail. L’augmentation de la rémunération est également un levier majeur, alors que les niveaux de salaire à l’embauche sont déjà jugés (trop) importants. Les évolutions métiers sont à la fois un levier possible de fidélisation mais également de recrutement interne.

Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC
Source : étude sur les besoins en compétences, emploi et formation 2023, OPIIEC

10 recommandations pour attirer et former les talents

L’OPIIEC émet 10 recommandations pour résoudre, en termes de communication, de recrutement, d’attractivité et de formation :

– informer les entreprises de la branche sur les métiers du big data pour les aider dans leur processus de recrutement

– faire connaître les métiers du big data auprès d’un large public, valoriser leur attractivité pour élargir le vivier de recrutement

– valoriser, via une communication spécifique, les démarches écoresponsables en matière de big data et leurs impacts sur les métiers et les compétences

– créer et diffuser des outils pour inciter les entreprises à modifier ou élargir leurs critères de recrutement

– mener des actions de recrutement orientées vers les personnes en recherche d’emploi ou en reconversion, et valoriser les dispositifs déployés

– soutenir les entreprises dans leur recours à l’apprentissage comme dispositif de recrutement de profils big data

– faire connaitre l’intérêt de la GPEC pour les métiers du big data et outiller les entreprises pour faciliter sa mise en œuvre

– contribuer au développement de la formation sur les compétences en développement identifiées dans l’étude prospective

– lancer une étude permettant de valider l’opportunité de créer de nouvelles certifications dédiées aux compétences transverses identifiées comme manquantes ou insuffisantes à ce stade dans l’offre de formation

– repenser la formation du délégué à la protection des données (DPO) et envisager une nouvelle certification métier.

Concilier données et pratiques responsables

Un des grands enjeux selon l’OPIIEC est de concilier le pilotage de la qualité des données, l’optimisation des projets avec les pratiques responsables, les usages éthiques et la durabilité des données.

Avec l’essor des critères environnementaux, sociaux et de gouvernance (ESG) et le développement du numérique responsable ou du green IT, la prise en compte des préoccupations écologiques, énergétiques ou sociétales en matière de données devient un enjeu d’importance.

L’intégration des critères ESG dans la stratégie des entreprises passe en grande partie par la data. La mesurabilité des stratégies ESG implique l’utilisation de la data. Démontrer son statut d’organisation responsable mobilise des indicateurs et les données qui consolident les éléments de preuve de l’efficacité des stratégies ESG mises en place.

Assurer le reporting ESG des entreprises européennes et sur la performance extra-financière des entreprises repose en grande partie sur la data, qui permet d’obtenir une vision globale et consolidée des activités d’une entreprise.

Aujourd’hui, les entreprises et les organismes de formation rencontrés par l’OPIIEC considèrent que cet enjeu est insuffisamment traité dans l’offre de formation et dans le développement des compétences. Néanmoins, ils anticipent l’explosion de ce besoin dans les années à venir.