Hors-Série IA 2020

Réflexion sur le flou sémantique associé aux points des échelles de mesure

Réflexion sur le flou sémantique associé aux points des échelles de mesure

Interview

Alice Audrezet, Professeur à l’Institut Supérieur de Gestion de Paris

Survey-Magazine : Le recours aux échelles bipolaires est très fréquent. Que pouvez-vous nous dire sur leur usage ?

Alice Audrezet : Dans la cadre de ma thèse je me suis intéressée aux échelles bipolaires, ces échelles de mesure qui opposent à leur extrémité une paire d’adjectifs antonymes (insatisfait – satisfait ; mauvais – bon, etc.). Il se trouve que de nombreux sites de ecommerce (tels qu’Amazon ou PriceMinister) ou plateformes d’évaluation (telles que TripAdvisor ou Allociné) utilisent ce type d’échelles. Dans ce contexte il s’agit le plus souvent d’échelles de mesure composées de cinq étoiles. Une observation attentive des pratiques permet de mettre en évidence deux constats concernant les étiquettes sémantiques ou qualificatifs utilisés pour caractériser les différents points de ces échelles.

Le premier constat est celui de la rareté de ces étiquettes sémantiques, notamment pour les récepteurs de l’évaluation. En effet, lorsqu’un internaute est confronté par exemple à une note de 1/5 sur l’un des sites que nous avons évoqués, il ne dispose d’aucune indication pour savoir à quoi correspond cette note. Je prends cet exemple parce que je me suis rendu compte en réalisant des entretiens avec des consommateurs que la note de 1/5 peut être interprétée différemment d’une personne à l’autre. Pour les uns il s’agit d’une note négative, pour les autres d’une note légèrement positive. Il résulte donc de cette absence d’étiquette sémantique pour caractériser les points des échelles bipolaires que l’interprétation des notes varie d’un internaute à l’autre.

La situation est différente lorsqu’un client souhaite se prêter au jeu de l’évaluation d’un produit ou d’un service consommé. Dans la majorité des cas, les points des échelles mises à disposition sont alors accompagnés d’étiquettes sémantiques. Néanmoins – et il s’agit du deuxième constat – les qualificatifs utilisés pour ces étiquettes sémantiques sont extrêmement variés d’un site à l’autre. A titre d’exemple, Carrefour.fr, LeroyMerlin.fr et Auchan.fr utilisent les termes suivants : 1 = « mauvais » ; 2 = « passable » ; 3 = « moyen » ; 4 = « bon » et 5 = « excellent ». Dans ce cas, l’étoile située au centre de l’échelle est associée au qualificatif « moyen », alors que les 2 étoiles de gauche sont associées à des termes négatifs et celles de droite à des termes positifs. Le site Amazon.fr oppose également le négatif au positif, mais c’est le terme « j’aime » qui caractérise la note de 3 étoiles sur 5. Il n’en demeure pas moins que ces sites utilisent des échelles bipolaires qui opposent le négatif au positif. Au contraire, les sites RueduCommerce.fr et Cdiscount.com proposent des dispositifs qui s’apparentent davantage à des échelles unipolaires, c’est-à-dire des échelles qui évaluent uniquement la dimension positive, allant par exemple pour Cdiscount.com de « faible » à « excellent ». Enfin, sur les sites Fnac.com et PriceMinister.com, il n’y a tout simplement pas d’étiquette sémantique à destination des évaluateurs. Il y a donc un réel flou sémantique concernant l’interprétation des points des échelles pour les évaluateurs comme pour les récepteurs de cette évaluation.

Pour vérifier que ce flou sémantique se répercute bel et bien sur les internautes j’ai administré un questionnaire en ligne auprès de 118 personnes à qui j’ai demandé d’indiquer l’adjectif ou l’expression qu’elles attribuent à chaque point d’une échelle constituée de 5 étoiles (voir figure 1).

Lorsqu’on analyse de manière détaillée les termes proposés par les répondants (en effectuant point par point des regroupements par synonymie), il apparaît tout d’abord que la variété des termes est relativement faible lorsqu’il s’agit de caractériser les points situés à l’extrême droite de l’échelle, c’est-à-dire pour les évaluations les plus positives. Au contraire, lorsqu’il s’agit de qualifier leur insatisfaction, les répondants se sont montrés plus inspirés. Le terme « mauvais » a été proposé à hauteur de 42%. Il était suivi d’une variété de termes du registre de la recommandation négative (19%) : « à éviter », « déconseillé », « non recommandé », « à ne pas fréquenter ». Pour ce qui est de la deuxième et de la troisième étoile, le nombre de descripteurs proposés était bien plus important. De manière inattendue c’est plutôt la deuxième étoile que la troisième étoile, pourtant située au centre de l’échelle, qui marque le point de césure entre les évaluations négatives et positives. Les termes cités pour caractériser la deuxième étoile étaient donc prioritaire « moyen » et « bof » à hauteur de 21%, suivis de quelques termes négatifs, tels que « mauvais » (12%), ainsi que des étiquettes sémantiques positives comme « satisfaisant » et « bon » à hauteur de 9%. La troisième étoile a davantage été associée à des termes positifs. Les mots « bon » et « bien » étaient les plus fréquents, à hauteur de 41%. Arrivait ensuite le qualificatif « moyen », cité dans 21% des cas, suivi d’une variété de termes relevant de la comparaison aux attentes : « correct », « satisfaisant », « convenable », « acceptable » et « passable ». Le modèle Amazon proposant une échelle de mesure asymétrique avec le terme « moyen » associé à la deuxième et non la troisième étoile semble donc l’emporter.

Quoi qu’il en soit, cela a permis de localiser au centre de l’échelle la zone de flou sémantique précédemment évoquée. L’étude réalisée a permis de mettre en évidence un inquiétant décalage entre les étiquettes sémantiques employées par les sites de ecommerce lorsqu’un client souhaite laisser une évaluation et l’interprétation qui en est faite par les récepteurs de cette évaluation au niveau du deuxième et du troisième point des échelles proposées.

A quoi doit-on donc veiller dans l’utilisation des échelles de mesure ?

A court terme, pour garantir une mesure de qualité, il me semble donc prioritaire de rendre visibles les étiquettes sémantiques associées aux différents points des échelles bipolaires dans toutes les situations, qu’il s’agisse pour un internaute de donner son avis ou de s’enquérir de celui des autres consommateurs. En effet, certaines personnes ne se prêtent jamais au jeu de l’évaluation, l’interprétation qu’elles font des points de ces échelles leur est alors purement personnelle. Au contraire, pour les évaluateurs les plus aguerris, le sens qu’ils donnent à leur évaluation a été construit par les étiquettes sémantiques les plus souvent proposées sur les sites de e-commerce.

A plus long terme, il me semble important que les professionnels réfléchissent à une uniformisation des qualificatifs employés pour caractériser les points des échelles mises à disposition des consommateurs. En effet, face à la multiplication des comparateurs, ces sites qui agrègent les évaluations issues de plusieurs sources, il semble primordial de s’accorder sur des normes communes si l’on veut éviter de comparer des choux avec des carottes.