Que signifie L’étendue interquartile ?

Puisque l’étendue est toujours sensible aux valeurs extrêmes d’un échantillon, nous pouvons améliorer la technique en calculant une étendue différente qui prend le nom d’étendue interquartile. Au lieu de comparer la valeur la plus grande et la valeur la plus petite de l’échantillon, l’étendue interquartile compare la différence entre deux autres valeurs, qui, elles, sont plus stables. Nous savons que les observations tendent à être plus rares aux extrémités de la distribution et qu’elles sont plus fréquentes autour de la moyenne. Alors si nous calculons les étendue à partir des valeurs plus proches de la moyenne, le résultat obtenu aura tendance à être plus stable. Par convention, on définit « plus proche de la moyenne » 50% des observations qui se situent autour de la médiane (+25% et -25%). En principe, l’étendue interquartile se calcule en retirant de la distribution 25% des scores les plus faibles, 25% des scores les plus élevés, puis en calculant l’étendue sur les données restantes. En examinant les pourcentages cumulatifs des salaires de joueurs de football d’une ligue, nous voyons que 25% d’entre eux ont un salaire égal ou inférieur à 1 000 000 € et que 72% gagnent 4 000 000 € ou moins (72% est un pourcentage acceptable si l’on ne peut obtenir exactement un score de 75%). Nous pouvons claculer l’étendue interquartile avec ces chiffres, la différence entre ces deux quantités. L’étendue interquartile est proche de 3 000 000 € (4 000 000 – 1 000 000 = 3 000 000). L’étendue interquartile est plus stable que l’étendue, car l’ajout d’un joueur avec un salaire très élevé ou très faible ne la changera pas. Néanmoins, l’étendue interquartile n’est pas la statistique de dispertion la plus stable, car elle n’utilise qu’une petite partie de l’information disponible (seulement les deux valeurs qui définissent 50% des observations). Il faut trouver une façon de mesurer la dispersion des valeurs qui prenne en considération toutes les valeurs de la distribution. La variance autour de la moyenne est la statistique qui remplit cette condition.