Data Marketing 2019



Que signifie Corrélation des rangs ?

La corrélation des rangs sert à valider l’existence d’un lien entre 2 variables. Généralement, la qualité du lien est mesurée à l’aide du coefficient de corrélation (de Pearson). Cependant ce dernier ne peut pas être appliqué si les variables sont ordinales, discrètes, si l’on a la présence de valeurs extrêmes ou si les valeurs ne suivent pas une loi normale : on a donc recours à la corrélation des rangs dans ces cas-là.

Le principe consiste à faire les calculs sur les rangs des observations et non plus sur les valeurs. Prenons comme exemple, les notes de satisfaction et d’efficacité données sur un produit par un groupe de testeurs : il faut dans un premier temps trier les notes de la première variable et lui affecter un numéro d’ordre croissant appelé rang et faire de même sur la seconde variable. Le but va être de savoir s’il existe une liaison entre ces 2 rangs. En revanche, la forme de cette lisaison, linéaire ou pas ne peut pas être connue.

Pour cela, on dénombre deux coeffcients qui se font concurrence : le coefficient de Spearman et le coefficient de Kendall.

Que ce soit pour l’une ou pour l’autre de ces deux méthodes, elle se déroule en deux phases : le calcul du coefficient suivi de son test afin de savoir si ce coefficient est significatif ou pas.