########################################################## # Chapitre 3 : rapports statistiques # Correction de l'exercice 1 (R2HTML) ########################################################## setwd("S:/WWW/iutenligne/InOutStatR/rapports/exercices") # repertoire de travail à changer med = read.table("medecine.txt", header=TRUE, sep="\t", na.strings="NA", dec=",", strip.white=TRUE) library(R2HTML) nomfichier = "ex1_corr" # à adapter HTMLInitFile(outdir=getwd(), filename=nomfichier, useLaTeX=FALSE, useGrid=FALSE) HTML.title("Les exercices du chapitre 2 avec R2HTML", HR=1) HTML.title("Exercice 1 : valeurs hors-norme", HR=2) HTML.title("1) Resume et poids maximum", HR=3) HTML(summary(med$poids)) phrase = paste("On constate sur le resume que le maximum est : ", max(med$poids,na.rm=T), "!") HTML(phrase) HTML.title("2) Histogramme du poids", HR=3) png("poidsHist.PNG") hist(med$poids, main="histogramme du poids", xlim=c(40,130)) dev.off() HTMLInsertGraph("poidsHist.PNG") HTML.title("3) Boite a moustaches du poids", HR=3) moins130 = med[med$poids<=130,] plus130 = med[med$poids>=130,] png("poidsMoustaches.PNG") boxplot(moins130$poids, main="Etude du poids") dev.off() HTMLInsertGraph("poidsMoustaches.PNG") HTML("On a oté du graphique les plus de 130 kg :") HTML(plus130) HTML.title("Exercice 2 : ajout de variables", HR=2) HTML.title("1) Histogramme de l'IMC", HR=3) med$IMC = med$poids / (med$taille*med$taille) png("ImcHist.PNG") classes = c(15,18.5,25,30,35,45) legendes = c("maigre","normal","surpoids","obesite_legere","obesite_forte") couleurs = c("yellow","green","orange","pink","red") moins45 = med[med$IMC<=45,] hist(moins45$IMC,main="Etude de l'IMC",breaks=classes,labels=legendes,xlim=c(15,45),col=couleurs) dev.off() HTMLInsertGraph("ImcHist.PNG") HTML.title("2) Camembert de l'IMC", HR=3) classes = c(15,18.5,25,30,35,45) legendes = c("maigre","normal","surpoids","obesite_legere","obesite_forte") med$libelleIMC = as.factor( cut(med$IMC,breaks=classes,labels=legendes) ) png("ImcCamembert.PNG") couleurs = c("yellow","green","orange","pink","red") pie(table(med$libelleIMC), main="Etude de l'IMC", col=couleurs) dev.off() HTMLInsertGraph("ImcCamembert.PNG") HTML.title("Exercice 3 : mise en forme des resultats", HR=2) HTML.title("1) Statistiques sur le poids par societe", HR=3) moyenne = by(med$poids, med$societe, mean, na.rm=T) mediane = by(med$poids, med$societe, median, na.rm=T) mat = cbind(moyenne, mediane) HTML(mat) HTML.title("2) Statistiques sur le poids et la taille", HR=3) mat = matrix(0, nrow=2 , ncol=2) mat[1,1] = mean(med$taille,na.rm=T) mat[1,2] = median(med$taille,na.rm=T) mat[2,1] = mean(med$poids,na.rm=T) mat[2,2] = median(med$poids,na.rm=T) colnames(mat) = c("moyenne","mediane") rownames(mat) = c("taille","poids") HTML(mat) HTML.title("Exercice 4 : valeurs manquantes", HR=2) HTML.title("1) Nombre de valeurs manquantes", HR=3) resultat = sapply(med, function(x)(sum(is.na(x)))) mat = matrix(resultat, nrow=1) colnames(mat) = names(resultat) rownames(mat) = "effectifs" HTML( mat ) HTML.title("2) Extractions", HR=3) HTML.title("a) Individus avec age et docteur manquants", HR=4) med3 = med[ which( is.na(med$age) & is.na(med$docteur) ) , ] HTML(med3) HTML.title("b) Individus avec age ou docteur manquant", HR=4) med4 = med[ which( is.na(med$age) | is.na(med$docteur) ) , ] HTML(med4) HTMLEndFile()