You are on page 1of 15

SELECCIN DE

VARIABLES

MATRIZ DE CORRELACIONES
PROC CORR; VAR PH ST SV FND ...; RUN;

Beccaccia et al., 2015

SIGNIFICADO COEFICIENTE CORRELACIN


r = 0,9

r = -0,8

Lineal!!
R2
-1 a +1

r = -0,4

r = 0,6

r = 0,0

r = 0,0

PROC REG; MODEL Y=X; RUN;


Source

DF

Sum of
Squares

Model
Error
Corrected Total

1
4
5

78.22857
7.77143
86.00000

Mean
Square

Root MSE
1.39386
Dependent Mean 12.00000
Coeff Var
11.61553
Variable

DF

Parameter
Estimate

Intercept
X

1
1

4.60000
2.11429

F Value Pr > F

78.22857
1.94286

40.26

R-Square
Adj R-Sq

0.9096
0.8870

Standard
Error
t Value
1.29762
0.33320

3.54
6.35

0.0032

Pr > |t|

0.0239
0.0032

PREDICCIN EMAN AVES


Ingrediente

EMA
Media

EMA
Rango

DS
Media

R2
Ecuacin

DRS
Ecuacin

H. Soja 44

2457

444

157

0,45

128

H. Soja 47

12

2665

356

93

0,53

66

H. Soja 44-47

19

2588

591

155

0,60

104

Soja integral

3525

288

134

0,30

125

Sojas

28

2889

1438

468

0,96

121

Conc. Proteicos
+girasol, colza, palmiste

55

2284

2750

773

0,95

180

Losada et al. (2010) Anim. Feed Sci. Technol. 160, 62-72

ECUACIONES PREDICCIN EM SOJAS


4000

NS

kcal EMA/kg MS

3600

3200

R2 = 0,60
P = 0,001

2800

2400

2000
38

40

42

44

46

48

%PB/MS

habas

harinas

50

52

54

ECUACIONES PREDICCIN EM-SOJAS


4000

NS
kcal EMA/kg MS

3600

R2 = 0,965;
P< 0,0001

3200

R2 = 0,60
P = 0,001

2800

2400

2000

38

40

habas

42

44

harinas

46

%PB/MS

48

50

52

54

SELECCIN DE VARIABLES PASO A PASO (STEPWISE)


STEPWISE;
En un primer paso selecciona la variable independiente que genera el mejor modelo.
En pasos sucesivos va aadiendo variables que reducen la suma de cuadrados del error (aumentan
el R2).
Cada vez que incluye una nueva variable en el modelo, ste es examinado y si alguna de las
variables anteriormente incorporadas muestra un coeficiente con un valor elevado de P, es eliminada.

PROC REG;
Model y = x1 x2 x3 ... xn / SELECTION = stepwise
sle=0.05 sls=0.05;
RUN;

Anlisis de regresin por pasos para las variables dependientes EMAn/EB (%) y EMAn
(kcal/kg MS) usando la composicin qumica (% MS) como predictor (n = 96)

R2

RSD

EMAn /EB = 88.6 0.920 FND


(1.43)a (0.057)

0.736

5.76

EMAn /EB = 64.0 0.407 FND + 0.265 almidn


(3.69) (0.086) (0.038)

0.829

4.66

EMAn /EB

EMAn /EB = 58.3 0.341 FND + 0.322 almidn + 0.291 EE


(4.32) (0.089) (0.044)
(0.123)

0.839

4.55

EMAn

EMAn = 3840 32.1 FND


(66.0) (2.64)

0.616

265

EMAn

EMAn = 3810 36.5 FND + 28.2 EE


(58.1) (2.45) (5.25)

0.718

232

EMAn

EMAn = 3697 11.7 FND + 57.1 EE - 177 cenizas


(52.9) (4.63) (6.58) (29.7)

0.791

198

Variable
dependiente

Paso

EMAn /EB

EMAn /EB

Ecuacin de regresin.

Los valores entre parntesis son errores estndar.

Losada et al., 2009

CONSTRUCCION DE MODELOS

PCC, %PV

10
8
6

4
2
15

20

25

30

35 40 45
FND, %MS

50

55

60

PRESENTACIN DE RESULTADOS

PRESENTACIN DE RESULTADOS
Table III. Factors affecting caecal volatile fatty acid concentration (mmol/l)

Equation

1
2
3
4

y=

y=
y=

y=

NDF2

Intercept

NDF

ADLNDF

20.9 6.98

1.08
0.20

74.0 26.3

- 2.11
0.51

0.045
0.022

83.2 23.1

-1.90
0.46

0.042
0.017

-0.79
0.16

94.3 21.6

-1.72
0.42

0.041
0.016

-2.62
0.53

ADLNDF2

0.040
0.011

R2

78

0.27

78

0.31

78

0.48

78

0.56

rsd

14.1

< 0.001

13.8

< 0.001

12.1

< 0.001

11.2

< 0.001

NDF: Dietary NDF (% DM) (range: 19.3-55.0). ADLNDF: Dietary ADL*100/dietary NDF (range: 5.1-48.6).

Anim. Res. 2002. 51:165-173

FORWARD;
Sigue el mismo procedimiento que el STEPWISE pero una vez que ha incluido una variable en
el modelo ya no la retira.

BACKWARD;
En primer lugar calcula un modelo con todas las variables especificadas.
En un segundo paso selecciona la variable que aporta menos al modelo (coeficiente con mayor valor
de P, o menor valor relativo de F) y la retira.
En pasos sucesivos va retirando las variables menos significativas. Una vez que ha retirado una
variable del modelo no la vuelve a incluir.

MAXR;
Comienza seleccionando los mejores modelos con una y dos variables. En ese momento examina
si alguna sustitucin de estas dos variables por otra que no est en el modelo lo mejora y si es as la
sustituye. De esta forma se obtiene el mejor modelo formado por dos variables. Se selecciona una
tercera variable y de nuevo se examina si la sustitucin de alguna de las tres variables por otra que
no est en el modelo lo mejora, y si es as la sustituye.
El proceso se repite sucesivamente.
Este procedimiento suele obtener modelos ms optimizados (mejora mxima del R2).

SELECCIN DE VARIABLES: RSQUARE


PROC REG;
Model y = x1 x2 x3 ... xn / SELECTION = rsquare best=4 cp B;
RUN;
Es el procedimiento que permite la obtencin de modelos ms optimizados.
best=k especifica que nicamente muestre los k mejores modelos de 1, 2, 3 variables (etc).
cp: Es el estadstico de Mallows que ayudar a la seleccin del mejor modelo.
Cp = (SSEP/MSE) (N 2p) + 1
SSEP = SSE del modelo sin trmino independiente con p variables independientes.
MSE = MSE del modelo completo
Se recomienda, partiendo de los modelos con ms variables a los que tienen menos variables, elegir el modelo que
con menor valor de Cp antes se aproxime a (p+1), siendo p el nmero de variables independientes.
Cp > (p+1)..al modelo le faltan variables
Cp < (p+1)..al modelo le sobran variables

Si quito la B no me salen los coeficientes de las variables independientes.

proc reg;
model PCCpv= fnd fnd2 fadfnd ladfnd hemifnd celfnd cehefnd/selection=rsquare best=4 cp B;

N = 40

Regression Models for Dependent Variable: PCCPV


Parameter
Number in
R-square
C(p) Estimates
Model
Intercept
FND
FND2
FADFND
LADFND HEMIFND
CELFND CEHEFND
1
0.07166399
33.15157
3.3111
.
.
.
.
.
.
0.0285
1
0.07166399
33.15157
6.1615
.
.
. -0.0285
.
.
.
1
0.05017194
34.75251
6.5916 -0.0266
.
.
.
.
.
.
1
0.02616849
36.54052
4.8864
.
.
.
.
.
0.0161
.
-------------------------------------------------------------------------------------------------------2
0.45637622
6.49443
17.7290 -0.6621 0.00851
.
.
.
.
.
2
0.15339465
29.06347
4.0199 -0.0347
.
.
.
.
.
0.0350
2
0.15339465
29.06347
7.5172 -0.0347
.
. -0.0350
.
.
.
2
0.11617425
31.83601
3.3613
. -0.00034
.
.
.
.
0.0336
-------------------------------------------------------------------------------------------------------3
0.51986583
3.76510
15.2069 -0.6404 0.00813
.
.
.
.
0.0276
3
0.51986583
3.76510
17.9668 -0.6404 0.00813
. -0.0276
.
.
.
3
0.51089564
4.43329
20.0488 -0.7164 0.00922 -0.0206
.
.
.
.
3
0.51089564
4.43329
17.9869 -0.7164 0.00922
.
.
0.0206
.
.
-------------------------------------------------------------------------------------------------------4
0.53013705
5.00000
16.1227 -0.6767 0.00864
.
.
. -0.0113
0.0304
4
0.53013705
5.00000
17.2489 -0.6767 0.00864 -0.0113
.
.
.
0.0191
4
0.53013705
5.00000
16.1227 -0.6767 0.00864
.
.
0.0113
.
0.0191
4
0.53013705
5.00000
19.1608 -0.6767 0.00864
. -0.0304
. -0.0113
.
-------------------------------------------------------------------------------------------------------NOTE: Models of not full rank are not included.

Cp > (p+1)..al modelo le faltan variables


Cp < (p+1)..al modelo le sobran variables