Data clean room : les 5 questions que vous vous posez sans doute


  • Après la DMP et la CDP, enfin une technologie qui ne se réduit pas à un acronyme. Portée par des acteurs riches en données loguées, GAFA, retailers et broadcasters, la data clean room est la nouvelle martingale du marché publicitaire.
  • On vous explique pourquoi les marques (mais pas toutes) se jettent sur ce nouvel environnement qui leur permet d'optimiser la diffusion de leurs campagnes publicitaires... et de mieux les connecter au business. 

Après le sujet DMP, qui s’est essoufflé en même temps que le cookie tiers s’est raréfié, et la CDP, cet outil de marketing automation qui pâtit de l’absence de connexion au média, c’est la nouvelle martingale du marché pub : la data clean room.

Pourquoi le sujet de la data clean room a autant de hype ?

Le succès des data clean rooms tient d’abord à cette obsession qui anime le marché publicitaire depuis un peu plus de deux ans : remédier à la disparition annoncée des cookies tiers, pour continuer à afficher des publicités ciblées et à mesurer leurs performances avec (plus ou moins) le même niveau d’excellence. Il est aussi une réponse à l’apparition de deux phénomènes antinomiques : “l’explosion de la volumétrie de données que les annonceurs utilisent avant de prendre des décisions marketing et la fragmentation croissante des points de contacts et des bases de données”, estime Dominique Latourelle, associate director adtech solutions chez iProspect. 

La data clean room est l’occasion d’accéder aux données d’acteurs très bien pourvus en la matière : les walled gardens (Google, Meta et Amazon en tête) mais aussi les broadcasteurs et les retailers, eux aussi riches en données loguées. Des données qu’ils leur seraient impossible de mettre à disposition de tiers ailleurs que dans cet environnement hyper sécurisé. Des données “brutes” qui sont stockées au sein de la data clean room (emails, cookies, données CRM…), computées par des algorithmes de machine learning et restituées à l’annonceur de manière agrégée (de sorte qu’il est impossible, pour ce dernier, de revenir à l’état brut individuel). “On empêche, au passage, toute manipulation humaine de données sensibles”, ajoute Dominique Latourelle.

Quels sont les principaux acteurs du marché ?

C’est, sans surprise, du côté des GAFA qu’il faut d’abord regarder. Google a donné le “la”, en cantonnant l’accès à son ID publicitaire à l’utilisation de sa clean room, Ads Data Hub en 2018. Amazon a suivi, avec son Amazon Marketing Cloud, qui permet aux annonceurs de réconcilier les données issues d’Amazon Ads (on-site) et celles issues de son DSP Sizmek (off-site). “Meta n’a pas encore marketé la sienne mais s’attèle à proposer quelque chose de similaire”, précise Hugo Loriot, associé chez fifty-five.

Pour le trio, il s’agit de permettre à leurs clients d’accéder à un niveau d’information qu’ils n’auront pas dans leurs interfaces de reporting classiques. Sous réserve de connaître certains langages techniques. “Il est impératif de maîtriser le langage SQL pour pouvoir accéder à ces clean rooms”, prévient Dominique Latourelle. Un moyen pour le data scientist d’informer le serveur de la nature de l’information à laquelle il désire accéder. Pas (ou quasiment pas) d’interface utilisateur pour permettre à tout un chacun d’en profiter. 

Ce n’est pas le cas de Safe Heaven, l’offre de clean room de Liveramp “dont l’utilisation ne requiert aucune compétence technique particulière,” selon Dominique Latourelle. Ce spécialiste du CRM onboarding (le fait d’uploader une base de données CRM pour la retrouver sur le Web) est devenu le tiers de confiance du secteur. En France, des régies de retailers comme Carrefour Links ou Infinity Advertising en ont fait un passage obligé pour accéder à leurs données tickets de caisse. Seul acteur indépendant présent commercialement en France, Liveramp doit composer avec une concurrence plus vive outre-Atlantique. 

Citons Snowflake, dont la technologie propulse les clean rooms de NBC Universal et Disney outre-Atlantique. “Snowflake peut permettre à un annonceur qui héberge ses données 1st party chez lui de les mixer avec celles d’un éditeur qui les garde, lui aussi, chez Snowflake”, précise Hugo Loriot. Infosum et Habu permettent, eux, de créer des sur-couches à ces clean rooms, pour donner vie à une interface utilisateur facile d’utilisation, avec une dizaine de cas d’usage sur étagère. En France, Retency s’est récemment positionné sur le segment. Sa technologie d’anonymisation équipe la data clean room de Canal+. Enfin, on peut également citer le cas d’Appsflyer qui propose aux annonceurs de réconcilier Google Ads, Facebook Ads, Search Ads, Snap Ads et autres environnements mobile au sein de sa data clean room, avec des performances par cohortes sur le modèle du SKADnetwork.

Quels sont les principaux cas d’usage ?

Il s’agit d’optimiser la diffusion de ses campagnes en créant des segments sur-mesure et en en mesurant la performance grâce aux données d’acteurs qui, comme les GAFA ou les retailers, sont capables de remonter l’impact de la campagne sur le business. “Le cas d’usage le plus populaire est également le plus simple : la mesure du reach and frequency”, révèle Matthieu Tran-Van, chief media science officer de Dataiads. Soit le fait de déterminer le niveau de fréquence de diffusion optimale pour optimiser le taux de conversion. Ou encore de savoir, en passant par la data clean room de Meta, quel touchpoint, parmi Instagram, Facebook ou Messenger, a le plus contribué à la conversion. 

Du côté d’Amazon, c’est surtout la complémentarité entre les leviers médias maison qui est en jeu : l’inventaire CTV (Prime Video, Freevee, Fire TV), les formats sponsorisés au sein d’Amazon et les campagnes d'extension d’audience via le DSP. “Décloisonner retail media et programmatique, c’est le cas d’usage le plus populaire sur Amazon Marketing Cloud chez iProspect”, précise Dominique Latourelle.

Celle de Google, Ads Data Hub, ne permet pas de réconcilier search et Youtube. “Elle est basée sur le cookie tiers alors que l’on a des ID pour Youtube”, prévient Hugo Loriot. Mais l’outil permet aux annonceurs équipés du fullstack Google (ils sont nombreux) d’optimiser la gestion de la répétition entre l’inventaire Google (Adwords, Google Adex…) et les différentes régies et supports de l’Open Web (via Campaign Manager). “Ads Data Hub permet de mesurer l’overlap entre chacun, par exemple savoir dans quelle mesure la régie X a contribué à une montée en couverture sur cible”, illustre Paul Leperchey, head of data chez Publicis Media. 

“On se situe quelque part entre le temps long d’un post test, dont les résultats tombent plusieurs mois après, et le temps réel d’une interface de reporting, qui est à J+1”, explique Dominique Latourelle. Vous l’aurez peut-être compris, la data clean room d’un GAFA sera donc d’autant plus populaire que ses interfaces de reporting sont limitées, comme c’est le cas d’Amazon. 

C’est moins vrai pour Google qui propose déjà énormément de choses sur Campaign Manager et DV 360. “Google peine pour l’instant à trouver le killer use case qui lui permettrait de faire décoller ADH”, résume Hugo Loriot. C’est d’autant plus compliqué de faire décoller l’offre en Europe que, comme le rappelle Paul Leperchey, “le support est pour l’instant uniquement basé aux Etats-Unis.”

Ils sont de plus en plus nombreux, du côté de l’Open Web, à s’inspirer de ce que proposent les GAFA. Prenons le cas de NBC, maison-mère de chaînes comme NBC, CNBC, E!, et d’un service d’AVOD baptisé Peacock. “NBC peut connaître le comportement de visionnage d’une majorité d’Américains en CTV et sur le Web, explique Hugo Loriot. Cela permet aux annonceurs qui utilisent sa data clean room d’afficher des campagnes sur des critères de ciblage bien plus précis que ceux de Nielsen, de les enrichir avec de la donnée tierces en provenance d’Experian, Acxiom ou Merkle ou d’uploader leur 1st party pour faire du custom audience, voire du look-alike.”

“Les régies retailers comme Infinity Advertising  ou Carrefour Links utilisent, elles, la clean room de Liveramp pour onboarder des données de données transac offline et les faire matcher avec des données online, moyennant accord de l’industriel concerné”, explique Dominique Latourelle. L’occasion pour cet industriel de mieux comprendre son audience : qui achète sa catégorie ou ses concurrents ? Quelle est sa part de marché ? “On associe les données d’exposition média, via la pose d’un pixel Liveramp, avec les données transactionnelles obtenues via les encartés. On associe un cookie à un ID, via le Ramp ID”, détaille Paul Leperchey. En d’autres termes, on reconnecte le média au business. “On ne pilote plus sa campagne selon des indicateurs ad centric mais selon des indicateurs business, comme le niveau de marge”, poursuit Paul Leperchey.

Combien coûte une data clean room ?

Chez Amazon comme chez Google, la technologie est gratuite mais l’investissement est humain. Parce que l’expérience est plutôt “aride”, que les interfaces utilisateur ne sont pas toujours présentes et qu’il faut donc, pour pouvoir interroger le serveur, maîtriser des langages techniques comme SQL. Les annonceurs n’ayant pas forcément les compétences en interne, à l’exception d’acteurs très avancés comme P&G, ce coût est déporté chez le partenaire, comme iProspect, fifty-five ou Publicis Media, qui y consacre des ressources humaines… et les refacture à son client. A noter que la data science ayant besoin de cruncher suffisamment de data pour en ressortir des insights pertinents, il n’est pas pertinent de se lancer dans l’aventure “data clean room” si l’on est pas suffisamment gros. “Il faut être capable de débourser au moins 50 000 euros par mois de média”, estime Dominique Latourelle.

Chez les retailers ou broadcasters, l’addition est encore plus salée. Tout simplement parce que Liveramp leur facture des frais de licence et d’utilisation de data (on parle de plusieurs centaines de milliers d’euros l’année) et qu’ils n’ont pas d’autre choix, pour amortir ce poste de charges, que de le répercuter sur le ticket d’entrée des campagnes médias et le prix des études qu’ils facturent aux industriels. “Si pour un Carrefour, avoir une data clean room est un no brainer, pour des plus petites régies, ce sera moins évident”, prévient donc Hugo Loriot.

A quand un peu d’interopérabilité entre les différentes data clean rooms ?

Pouvoir mesurer la complémentarité entre les différentes solutions d’Amazon, c’est bien. Faire de même avec les différentes plateformes de Meta aussi. Mais réunir toutes les informations relatives à ce beau monde, pour pouvoir mesurer la contribution de chacun, de manière dédupliquée, c’est mieux. Mais c’est, tant que ces data clean rooms seront étanches les unes avec les autres, mission impossible. “On ne peut pas se satisfaire d’univers cloisonnés”, reconnaît Dominique Latourelle. Dès lors, une question : peut-on imaginer un jour trouver le moyen de réunir les données brutes rassemblées au sein de chacune de ces data clean rooms au sein d’une meta data clean room ? Sans transiger, pour autant, avec la volonté de chaque apporteur de datas de garder ces dernières dans des environnements sécurisés et d’empêcher tout acteur externe de remonter le fil, pour accéder à de la donnée individualisée. 

Matthieu Tran-Van n’y croit pas. “Les walled gardens vont le rester, c’est très difficile de faire bouger les lignes.” Quelques motifs d’espoirs néanmoins sur le front de l’interopérabilité entre ces data clean rooms. “Celles qui sont propulsées par la technologie de Liveramp, Safe Heaven, sont compatibles avec ADH sur certains cas d’usages liés à la mesure”, révèle Hugo Loriot. Idem pour AMC, ajoute Dominique Latourelle. “Cela n’est pas encore offert à tous, de la même façon, dans toutes les géographies et on parle d’offres en beta mais il nous semble assez naturel de penser qu’en 2023, un connecteur ou un ID Liveramp permettra de décloisonner ces univers.”