Après avoir construit les tableaux de données (étape data), il reste à les visualiser et à
les analyser à l’aide de "procédures" (étape proc) :
-
print : affichage des données
-
means, univariate : calcul de statistiques élémentaires sur des
variables quantitatives (moyenne, écart-type, quartiles...)
-
freq : calcul de statistiques élémentaires sur des variables qualitatives
(tableaux de contingence, distribution de fréquences, test du chi-deux…)
-
gchart : histogrammes, camemberts…
-
...
Voici quelques exemples d'utilisation de ces procédures :
Les données |
Statistiques et graphiques |
/* Construction */
data Individu;
infile cards;
length metier$ 20;
input nom$ sexe$ metier$ taille poids;
output;
cards;
Amelie f medecin 1.65 50
Berthe f medecin 1.67 55
Dominique f infirmiere 1.55 45
Stephanie f infirmiere 1.70 65
Alfred m artisan 1.80 75
Cesar m medecin 1.78 73
Serge m artisan 1.85 81
Yannick m medecin 1.65 61
run;
/* Affichage avec options (title...) */
proc print data=Individu;
title "poids et taille des medecins";
var taille poids;
where (metier = "medecin") ;
run;
|
/* Variables quantitatives */
proc means data=Individu MEAN STD;
title "moyenne, ecart-type par sexe";
var poids;
by sexe;
run;
proc gchart data=Individu;
title "histogramme du poids des hommes";
vbar poids;
where (sexe = "m") ;
run;
/* Variables qualitatives */
proc freq data=Individu;
title "tableau de contingence et chi2";
tables sexe*metier / CHISQ;
run;
proc gchart data=Individu;
title "camembert";
pie metier / TYPE=pct;
run;
|