Professional Documents
Culture Documents
med=read.csv2(file.choose())
View(med)
reg1=lm(y~x1,data=med)
summary(reg1)
commentaire du summary :
L'ecart-type de l'erreur etant egale a (…………) et qui est egale a la variance residuel diviser par
son degrée de liberté (SCR/n-p-1) avec p:le nombre de variable et donc n-p-1 = 36-1-1 = 34 qui
est donnée dans le summary
La statistique de Fisher (F= ((SCE/p)/(SCR/n-p-1))=…………….) pour un degrée de liberté (ddl =
……..) et qui nous donne une p-value = ………. du modèle très inferieur a 5% et donc notre
modèle est très significatif Finalement, on a le coefficient de determination
R²=SCE/SCT=………et le coefficient de determination ajusté R(bar)²=((1-((n-1)/(n-p-1)))*(1-
R²))=………..qui est assez proche de 1 et donc une bonne qualité d'explication du modèle Et
donc, on a une bonne qualité et un modèle très significatif.
anova(reg1)
#Le tableau ANOVA est utilisé pour tester: H0 :b1 =b2 =…=bp-1 =0 versus H1: Ǝj=1…p-1: bj
#diffèrent de0
#H0 signifie que la relation observée entre Y et X est due au hasard, le modèle est alors: H0 :y=
#b0 +e . si >p-value, alors on rejette l’hypothèse que H0 : ‘b 1 =b 2 =…=b p-1=0’, donc on
#affirme que le modèle explique significativement la variation de Y.
#si les paramètres est appartient à l’intervalle de confiance on dit que le modèle est significatif
#sinon pas significatif.
par(mfrow=c(3,2))
plot(reg1)
hist(reg1$residuals)
boxplot(reg1$residuals)
#Normal QQ :doit être sous forme d’un droite pour dire qu’il y a une ajustement normale des
#résidus.
#Scale-location et residuals vs fited : la relation avec les résidus doivent etre aléatoire pas de
#relation linéaire sinon on a une variable qui manque dans le modèle.
require(car)
durbinWatsonTest
#Selection de modele:
#Par RegBest
attach(med)
require(FactoMineR)
rb=RegBest(y=med[,1],x=med[,-1])
rb$best
par ANOVA
reg2=lm(y~.,data=med)
summary(reg2)
par(mfrow=c(3,2))
plot(reg2)
hist(reg2$residuals)
boxplot(reg2$residuals)
#
reg3=lm(y~x1+x2,data=med)
summary(reg3)
par(mfrow=c(3,2))
plot(reg3)
hist(reg3$residuals)
boxplot(reg3$residuals)
anova(reg3,reg2) #on commence par le plus significatif
#on verifie la validation de modele par avona sous les hypotheses H0 :res3 est le meilleur------
#H1 :res2 est le meilleur
#si p-valu>0.05 ---on non rejette H0 sinon on RH0
#Region de confiance
reg10=aov(y~fac,data=med)
TukeyHSD(reg10)
Exemple : on a trois modalités 0 ; 1 et 2 et on doit verifier que les moyyenes des 3 echantillons sont
egaux ou pas.