Dernier numéro de Survey Magazine



Qu'est-ce qu'une ACP (Analyse en Composantes Principales) ?

L’ACP s’applique à un ensemble de variables numériques. Elle permet de positionner les individus sur un plan en deux dimensions, en fonction de la proximité de leurs réponses aux questions sélectionnées. Les variables sont également représentées sur le mapping, mais de manière indépendante des points-individus.
L’ACP permet ainsi de mettre en évidence la structuration des réponses en montrant le regroupement des individus selon des combinaisons de réponses aux questions prises en compte.
Les axes du mapping ne correspondent généralement pas à l’une ou l’autre des variables mais à un regroupement optimal de plusieurs variables (ex : revenu et niveau d’études peuvent participer ensemble à la formation d’un axe dans la mesure où elles peuvent être fortement corrélées).

L’ACP est très pratique lorsque l’on travaille sur un ensemble limité et identifié d’individus statistiques. Ainsi, si l’on souhaite analyser des points de vente en fonction de différents critères numériques (surface, personnel, CA, nombre de pièces vendues…), l’ACP permet d’obtenir une cartographie intéressante, qui regroupe les points de vente selon tous les critères retenus et qui permet ainsi de les catégoriser et d’identifier notamment, d’un coup d’œil, les cas hors norme (ex : surface et personnel importants mais CA faible…).

Le tableau de départ de l’ACP comporte les individus en ligne et les variables en colonne, avec, dans chaque case, la réponse numérique de l’individu à la question correspondante. Les questions qualitatives ordinales, c’est-à-dire, celles dont les réponses peuvent être ordonnées entre elles (échelles, fréquences…) peuvent être recodifiées pour entrer dans le tableau de l’ACP.
Cette recodification doit être généralement préparée à l’avance. Toutefois, certains logiciels d’analyse statistique comme STAT’Mania, permettent de réaliser cette recodification en direct, lors du choix des variables à faire entrer dans l’ACP. L’algorithme de l’ACP effectue sur la matrice individus/variables différentes opérations (centrage-réduction desdonnées, diagonalisation de la matrice, extraction de valeurs propres et devecteurs propres…), en vue de passer du nombre de variables initial à un petit nombre de variables obtenues par combinaison des premières.
L’ACP s’applique à un ensemble de variables numériques. Elle permet de positionner les individus sur un plan en deux dimensions, en fonction de la proximité de leurs réponses aux questions sélectionnées. Les variables sont également représentées sur le mapping, mais de manière indépendante des points-individus. Ces nouvelles composantes forment les axes du mapping. La première composante est celle qui résume le mieux les informations contenues dans le tableau. La deuxième apporte un pourcentage inférieur mais complémentaire d’information, et ainsi desuite.

Le mapping d’ACP représente d’abord la première composante (axe horizontal) et la seconde (axe vertical). La somme des pourcentages d’explication des deux composantes renseigne sur le taux de déperdition d’information à partir des données de base. Ainsi, si la première composante résume 62% du tableau et la seconde 21%, l’information représentée sur le mapping est de 83%. L’information « perdue » est donc de 17%.
Les points-individus sont représentés sur le mapping en fonction de leur coordonnées sur les facteurs. Les points proches correspondent à des individus ayant des profils proches, a priori, quant aux réponses aux variables prises en compte dans l’analyse.
Les points-variables sont également représentés sur le mapping, mais de manière complètement indépendante des individus.
Leur représentation indique leur corrélation avec les facteurs, à l’intérieur d’un cercle de rayon 1 défini avec une échelle arbitraire (qui peut être changée à loisir sans affecter la représentation des points-individus).
Ces points variables renseignent sur le sens à donner aux axes. Ainsi, une variable proche du cercle de corrélation (corrélation forte) et proche d’un axe participe beaucoup à la formation de cet axe.
Les angles inter-variables (en partant de l’origine) renseignent sur les corrélations entre elles. Ainsi, deux variables formant un petit angle sont fortement corrélées, alors qu’un angle droit signifierait qu’elles sont indépendantes.