représentation graphique d’un tableau croisé

 

On explique ici la construction de la représentation graphique des couples associés à des effectifs. Une autre application détaille les procédures de calcul du coefficient de corrélation et de la droite de régression.

1) On commence par calculer un tableau croisé (appelé aussi de corrélation ), en choisissant deux variables des données Euromarket. les valeurs de l’une (l’âge), en ligne, seront représentées en abscisse, et celles de l’autre (le revenu), en ordonnée. Cette procédure est une option du programme Statistiques sur un tableau croisé du menu Statistique Descriptive. On choisit le centre des classes pour les caractériser.

2) On édite les classes et des répartitions marginales, qui donnent les moyennes et les variances de chacune des deux variables. On vérifie à la calculatrice les valeurs trouvées.

3) On représente graphiquement le tableau de corrélation. La procédure proposée par le logiciel consiste à représenter pas à pas chaque classe ; on pourra effectuer quelques calculs de rayons des cercles représentés.

4) On recommence la même procédure en caractérisant les classes par la moyenne des observations qu’elles regroupent.

 

EXEMPLE

Nous choisissons les variables âge et revenu des données Euromarket. On fixe le nombre de classes d’âge à 5 et de revenu à 4, en les considérant de même amplitude pour plus de facilités, et nous choisissons ici les centres pour les caractériser. Voici le tableau que l’on obtient :

 

0

1

2

3

4

0

50

30

12

5

3

1

9

9

0

0

0

2

25

16

7

2

0

3

10

2

5

2

1

4

3

0

0

1

2

5

3

3

0

0

0

 

Les résultats donnés par l’option 2 du menu d’édition des résultats sont les suivants :

Classes en lignes (âge) :

Effectif

borne inférieure

borne supérieure

Ck

1

9

24

32.8

28.4

2

25

32.8

41.6

37.2

3

10

41.6

50.4

46

4

3

50.4

59.2

54.8

5

3

59.2

68

63.6

 

Moyenne marginale

40.016

 


 

Classes en colonnes (revenu)

Effectif

borne inférieure

borne supérieure

Dl

1

30

72999

103870.3

88434.63

2

12

103870.3

134741.5

119305.9

3

5

134741.5

165612.8

150177.1

4

3

165612.8

196484

181048.4

 

Moyenne marginale : 107574.8

 

L’intérêt de vérifier à la calculatrice les résultats numériques est de rappeler qu’il est indispensable de pondérer les centres des classes par leurs effectifs.

 

3) Chaque couple Ck,Dl, par exemple (C2, D1),  est représenté par un disque d’abscisse Ck et d’ordonnée Dl dont l’aire est proportionnelle à l’effectif nk,l (par exemple, n2,1=16). On place ensuite l’origine des axes au point moyen suivant la convention habituelle.

Pour fixer l’aire de chaque disque, il suffit de fixer la plus grande : c’est ce que fait le logiciel sans intervention de l’utilisateur.

On obtient le schéma ci-dessous, construit pas à pas.

On distingue clairement l’importance de l’effectif n2,1des classes C2, D1, et la particularité de l’effectif n5,1, qui indique un certain nombre d’observations s’opposant à la relation déjà mise en évidence dans le chapitre 3.

Représentation graphique du tableau de corrélation âge x revenu

4) En caractérisant les classes par la moyenne des observations qui leur appartiennent, on obtient des résultats numériques très voisins, et une représentation graphique analogue. Le choix de la valeur caractéristique d’une classe n’a finalement guère de conséquence sur les résultats obtenus.