Avec Doctissimo, Reworld Media revendique une exploitation « industrialisée » des données issues des usages santé des internautes. Entre inférences sensibles, ciblage publicitaire à grande échelle et collecte via des chatbots IA, ces pratiques posent des questions de fond sur la frontière entre data marketing et données sensibles.
Une data « ultra-thématisée » devenue levier business
Derrière Doctissimo, Marmiton ou encore Les Numériques, le groupe Reworld Media ne cache plus son ambition qui consiste à transformer ses audiences en actifs data monétisables. Avec plusieurs dizaines de millions de visiteurs mensuels, l’éditeur affirme disposer d’un volume massif de données permettant de segmenter très finement les comportements et les moments de vie.
Sur le terrain, cela dépasse largement la simple analyse d’audience. Navigation, recherches, interactions avec des contenus ou des outils… Tout alimente des profils exploitables à des fins publicitaires, dans le but de permettre aux annonceurs de cibler des publics à grande échelle, y compris sur des canaux variés comme la télévision connectée.
Une enquête récente de Libération souligne l’ampleur du phénomène. Le quotidien décrit une exploitation à grande échelle de données issues de Doctissimo, utilisées pour affiner le ciblage publicitaire, y compris à partir d’informations pouvant révéler des situations de santé intimes. Et c’est là que la nature même des informations traitées change de dimension.
De la navigation à l’inférence de données sensibles
Le point de bascule est là. À partir de comportements en ligne, certaines plateformes ne se contentent plus d’observer, elles déduisent. Consulter des contenus liés à la grossesse, rechercher des symptômes ou interagir avec un assistant santé ne relève pas, en soi, d’une donnée médicale. Mais l’agrégation de ces signaux permet d’en tirer des conclusions sur l’état de santé ou la situation personnelle d’un individu.
C’est ce que l’on appelle l’inférence de données sensibles. Et c’est précisément ce type de mécanisme qui interroge aujourd’hui. Car même pseudonymisées, ces données peuvent, une fois croisées, révéler des informations intimes. Et plus le volume et la précision des données augmentent, plus le risque d’identification indirecte progresse.
Les chatbots IA, nouveaux points d’entrée de la donnée
Avec les assistants conversationnels, une nouvelle étape est franchie. Les plateformes média déploient désormais des chatbots capables de répondre aux questions des internautes, notamment sur des sujets santé. Ces échanges, souvent spontanés et détaillés, constituent une source de données particulièrement riche… et sensible.
Par ce fait, l’IA ne se limite plus à exploiter la donnée. Elle participe aussi à sa collecte. Le problème, c’est que les utilisateurs ne mesurent pas toujours la portée de ces interactions. Une question posée à un assistant peut alimenter, indirectement, des logiques de segmentation marketing.
Consentement, transparence : une conformité sous tension
Sur le papier, le cadre est strict. Le RGPD encadre fortement le traitement des données personnelles, et encore davantage lorsqu’il s’agit de données sensibles comme celles liées à la santé. Le Digital Services Act (DSA) vient également limiter le ciblage publicitaire basé sur ce type d’informations. Mais dans les faits, la situation est plus nuancée.
Les mécanismes de consentement restent souvent complexes, parfois difficilement refusables, et peu lisibles sur la nature exacte des données exploitées. La frontière entre données comportementales et données sensibles, elle, devient de plus en plus floue.
L’autre point de vigilance à ne pas négliger ce sont les dispositifs techniques comme les data clean rooms, censés protéger la confidentialité. En réalité, ils n’éliminent pas totalement les risques. Ils permettent un ciblage très fin sans exposer directement les données brutes certes, mais ils reposent sur des croisements de données toujours plus sophistiqués.
La data santé, nouveau terrain stratégique (et sensible)
Ce que révèle le cas Doctissimo dépasse largement un acteur ou un groupe, mais se montre révélateur d’une évolution majeure du marché. La donnée n’est plus seulement collectée, elle est structurée, enrichie et activée dans des logiques industrielles. Et les données liées à la santé, parce qu’elles sont particulièrement riches en signaux comportementaux, deviennent un levier stratégique.
Pour les entreprises, l’enjeu est double : exploiter ces données pour personnaliser leurs actions tout en maîtrisant les risques juridiques et réputationnels. Pour les régulateurs, la question est encore plus complexe. Comment encadrer des pratiques qui reposent moins sur des données explicites que sur des déductions issues d’algorithmes ? Une chose est sûre, à mesure que l’IA et les plateformes data gagnent en puissance, la frontière entre marketing et données sensibles devient de plus en plus difficile à tracer.








