Qu'entend-on par Codage des réponses ?

Il existe différents types de codages des réponses pour les questionnaires. La première façon de coder les réponses se caractérise par l’attribution d’un chiffre à chaque réponse possible suivant l’ordre des réponses (1 pour la 1ère réponse…). Toutefois, lors de la phase d’exploitation économétrique des données, deux inconvénients seront à éviter : premièrement, si les réponses ne se présentent pas sous la forme d’une progression ordinale, il sera impossible d’effectuer une régression linéaire car cette méthode implique que les valeurs prises par chaque variable suivent une progression linéaire, autrement dit que les réponses soient progressives ; deuxièmement, si la personne interrogée a la possibilité de sélectionner plusieurs réponses pour une même question, une variable aléatoire ne pouvant prendre simultanément plusieurs valeurs, il faudra alors transformer chaque réponse en variable binaire : c’est le deuxième type de codage. La deuxième façon de coder les réponses se caractérise donc par l’assimilation de chaque réponse à une variable prenant pour valeur 1 ou 0 selon que la réponse a été cochée ou non. Ce type de codage possède deux avantages : d’une part il permet la prise en compte de plusieurs réponses pour une même question, et d’autre part il garantit que l’hypothèse de linéarité soit respectée (en limitant le nombre de valeurs possibles à deux valeurs, le passage d’une valeur à l’autre est nécessairement linéaire, c’est à partir de trois valeurs seulement que la question de la linéarité se pose). Ce codage est donc très efficace lorsque l’on envisage d’effectuer des régressions linéaires. Il comporte toutefois un inconvénient, qui est d’autant plus important que le nombre de personnes interrogées est faible : en transformant chaque réponse possible en variable binaire, on divise d’autant le nombre d’éléments par variable, autrement dit on disperse les données, ce qui a pour conséquence d’augmenter la variance de chaque variable (somme pondérée des écarts par rapport à la moyenne), c’est-à-dire de diminuer la précision des estimations et de rendre ainsi les estimations moins significatives statistiquement.