Redresser un échantillon, pour quoi faire ?

Dans le domaine des études marketing, le redressement d’échantillons a pour objectif d’améliorer la représentativité de l’échantillon interrogé, sur un certain nombre de critères de qualification. Le principe sous-jacent est que seul un échantillon ayant la même structure que la population-mère sur les critères que l’on connaît de cette population, permet de généraliser les réponses obtenues sur les autres critères, à l’ensemble de cette population. Le redressement cherche donc à appliquer des pondérations aux individus pour augmenter le poids de ceux appartenant à des groupes sous-représentés dans l’échantillon interrogé par rapport à la population-mère, et à réduire parallèlement le poids de ceux qui sont sur-représentés.

Mais pourquoi alors ne pas interroger directement un échantillon représentatif sur les critères souhaités ?

C’est ce que les chargés d’études cherchent à faire, lorsqu’ils établissent des quotas que les enquêteurs doivent respecter. Mais dans les faits, il est souvent difficile voire impossible de respecter parfaitement ces quotas en trouvant exactement le bon nombre de personnes dans chacune des catégories retenues. La pression économique et les délais généralement courts n’arrangent pas les choses. Les queues de quotas, cauchemar des chargés de terrain et superviseurs CATI finissent par faire l’objet de compromis.

Par ailleurs, dans beaucoup d’enquêtes, il n’est pas possible de contrôler a priori l’échantillon qui va répondre. C’est notamment le cas dans les enquêtes auto-administrées (questionnaires postaux, en libre service, placés sur un site internet, etc) qui fournissent systématiquement des échantillons non représentatifs (ceux qui ont bien voulu répondre). C’est également le cas des enquêtes de plus en plus fréquentes réalisées en utilisant le média Internet, même lorsqu’elles sont menées sur des internautes recherchés et sollicités nominativement par l’institut d’études. Dans ce cas, la structure actuelle de pénétration du média internet dans les ménages (sur-évaluation des jeunes et des CSP+) entraîne une difficulté à dénicher certains profils et, par conséquent, la nécessité d’appliquer a posteriori des pondérations sur l’échantillon obtenu.

Le redressement vient donc pallier ces difficultés. Mais il faut bien prendre garde à un élément fondamental : des pondérations trop importantes font courir un risque certain à la qualité des résultats. Ainsi, il semble aberrant de donner un poids 10 fois plus important, comme cela se pratique parfois, aux réponses de la seule personne que l’on a réussi à interroger dans une catégorie donnée. On comprend facilement que si les réponses d’un groupe de cadres supérieurs a des chances de refléter en moyenne l’opinion de l’ensemble de cette population, les opinions d’un seul d’entre eux a une probabilité beaucoup plus faible de permettre la même extrapolation. Il est donc important de chercher, autant que possible, à obtenir en amont des échantillons cohérents, en ne se disant pas que de toute manière, il suffira ensuite de redresser.

En substance, on pourrait dire que moins on a besoin de recourir aux redressements, meilleurs sont les résultats !