La première rubrique « Le saviez-vous ? » a rappelé le rôle de l’échantillon représentatif dans l’éventail élargi des méthodes utilisées par les professionnels des études et de l’insight. Cette nouvelle rubrique clarifie deux notions clés de la nouvelle data, celles des données secondaires et des mesures passives.
Philippe Guilbert, expert Etudes auprès des organisations professionnelles (SYNTEC Conseil, ESOMAR), nous résume l’essentiel avec les liens de référence pour aller plus loin sur le sujet.
L’explication de Philippe Guilbert
L’essor des études online a suscité de nombreux débats dans les années 2000 avec des confusions qui ont progressivement disparu, au moins parmi les professionnels, grâce à un effort de clarification et de terminologie notamment. L’ère de la data bouleverse à nouveau le métier des études, mais là encore les confusions sont fréquentes… Les données secondaires et les mesures passives peuvent concerner des dispositifs distincts dans leurs objectifs, avec des cadres réglementaires opposés : il est indispensable de savoir les différencier !
Les données secondaires sont ainsi définies dans les documents de référence :
- La norme ISO 20252 revue en 2019 « Études de marché, études sociales et d’opinion, y compris insights et analytique de données » indique qu’il s’agit de données déjà collectées et disponibles via une autre source.
- Le code international ICC / ESOMAR (révision de 2016, traduction SYNTEC Etudes 2017) les désignent comme données collectées dans un autre but que la recherche et utilisées ultérieurement en recherche.
Elles s’opposent aux données primaires collectées directement à des fins d’étude. Cette distinction primaire/secondaire se retrouve dans la catégorisation classique d’étude primaire (avec phase terrain) et étude secondaire (à partir de données et rapports existants). Les données secondaires ont souvent l’avantage d’être rapidement disponibles et bon marché, mais elles pouvaient être assez éloignées de l’information recherchée et trop anciennes pour couvrir les dernières tendances. Avec le big data et la transformation numérique des entreprises, ces données secondaires ont explosé en volume, variété et vitesse. Il ne s’agit plus de résultats publiés, mais de données individuelles et souvent non-structurées qui exigent de nouvelles compétences d’analyse. En devenant granulaire et en temps réel, cette data constitue un formidable base de recherche d’insights.
Les mesures passives sont une appellation plus récente et assez spécifique à notre secteur :
- la collecte de données passives et les méthodes passives concernent un processus de collecte de données qui évite ou minimise les interactions avec les participants (ISO 20252).
- la collecte passive de données désigne la collecte de données personnelles en observant, mesurant ou enregistrant les actions ou comportements d’une personne (code ICC / ESOMAR).
Si les formulations diffèrent, elles désignent bien une collecte souvent automatisée de données détaillées de suivi des comportements qui évitent les limites du déclaratif d’un questionnaire. Avec le mobile, Internet et les objets connectés, les mesures passives des comportements réels et digitaux se fortement accrues (géolocalisation, analytiques, tracking…) et leurs données peuvent être réutilisées à des fins d’étude : elles deviennent alors des données secondaires.
Cependant, les mesures passives peuvent aussi être utilisées pour fournir des données primaires lorsque les participants d’une enquête acceptent qu’un équipement, logiciel, capteur, cookie… collecte leurs données. Ces données primaires via mesure passive servent notamment à mesurer l’audience, suivre des déplacements ou des comportements digitaux. Confondre données secondaires et mesures passives revient à ignorer de nombreuses innovations de collecte automatisée des professionnels des études !
Certes, elles reposent généralement sur un nombre limité de participants (plusieurs centaines ou milliers), mais avec une diversité de profils. Une mesure passive sur échantillon représentatif peut combiner la granularité des mesures à la fiabilité des estimations. Les panels sont ainsi toujours utilisés pour l’audience Internet malgré l’importance des données secondaires et des analytiques dans ce domaine.
Qui plus est, ces données primaires disposent d’une base légale RGPD claire et simple à mettre en œuvre (contrat, consentement), alors que les données secondaires peuvent entraîner des mises en conformité complexes selon les cas (intérêt légitime, intérêt public, recherche scientifique…).
Chaque type de données et de mesure possède bien sûr ses avantages, ses limites, ses bonnes pratiques et contraintes légales maintenant. Les données secondaires sont en plein boom et sont de mieux en mieux exploitées grâce au progrès de l’IA, mais les biais des bases d’apprentissage et des algorithmes persistent et suscitent l’apparition d’une éthique de l’IA.
Pour obtenir tous les insights possibles, il vaut mieux ne pas se limiter à une source unique et hybrider la data en combinant les données primaires et secondaires, les mesures actives et passives. Un vrai challenge, mais les professionnels des études sont bien placés pour le relever !
Pour en savoir plus
Norme ISO 20252:2019 : https://www.iso.org/obp/ui/fr/#iso:std:iso:20252:ed-3:v1:en
Code ICC / ESOMAR : https://www.esomar.org/uploads/public/knowledge-and-standards/codes-and-guidelines/ICCESOMAR_Code_French_.pdf
Guideline ESOMAR / GRBN sur la collecte de données primaires (art 8.4 Passive data collection notamment) : https://www.esomar.org/what-we-do/code-guidelines/primary-data-collection-guideline. Ce guide est cours de consultation publique, et sera bientôt complété par un guide sur les données secondaires (en cours de rédaction par un groupe d’experts).
A propos d’éthique de l’IA
Dans les médias : https://www.lemonde.fr/blog/internetactu/2019/10/03/kate-crawford-les-biais-sont-devenus-le-materiel-brut-de-lia/
Les premiers guides sortent en 2019 :
https://ec.europa.eu/futurium/en/ai-alliance-consultation/guidelines#Top
https://www.oecd.org/going-digital/ai/principles/
POUR ACTION
• Echanger avec l’auteur : @ Philippe Guilbert