You are on page 1of 48

Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

-CENGICAA-

Joel Morales, Jos Luis Quem y Mario Melgar.

Primera Edicin

Santa Lucia Cotz. Agosto 2009.

InfoStat
Contenido

Aspectos generales de InfoStat .......................................................................................................................................... 1 Aspecto de la base de datos: Video. ............................................................................................................................. 1 C mo importar una base de datos desde Excel? .................................................................................................. 1 C mo pegar una base de datos desde Excel? ....................................................................................................... 2 Transformacin de datos ................................................................................................................................................ 3 Prueba de hiptesis .............................................................................................................................................................. 4 Trminos de importancia al realizar una prueba de hiptesis .................................................................................. 4 Pasos para evaluar una hiptesis estadstica. .............................................................................................................. 5 Prueba de hiptesis acerca de una media poblacional normal. Video .................................................................... 5 Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video ................................................................ 8 Prueba de hiptesis acerca de dos medias independientes. Video ......................................................................... 9 Diseo completamente al azar ......................................................................................................................................... 10 Caractersticas generales............................................................................................................................................... 10 Utilizacin del d iseo.................................................................................................................................................... 10 Supuestos del modelo.................................................................................................................................................... 10 Diseo de bloques completos al azar .............................................................................................................................. 14 Hiptesis del modelo ..................................................................................................................................................... 14 Supuestos del modelo .................................................................................................................................................... 14 Serie de Experimentos....................................................................................................................................................... 19 Anlisis de experimentos factoriales .............................................................................................................................. 23 Arreglos combinatorios................................................................................................................................................. 24 Parcelas div ididas .......................................................................................................................................................... 28 Franjas divid idas ............................................................................................................................................................ 31 Anlisis de correlacin lineal simp le. ............................................................................................................................. 34 Regresin Lineal................................................................................................................................................................. 36 RL Simple ....................................................................................................................................................................... 36 Supuestos del modelo de regresin ........................................................................................................................ 37 RL M ltiple ..................................................................................................................................................................... 41 Bibliografa.......................................................................................................................................................................... 42 Anexos ................................................................................................................................................................................. 43

Manual de uso

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Aspectos generales de InfoStat


Aspecto de la base de datos: Video.
La base de datos es la matriz de informacin, sobre la que se trabaja. La forma de ingreso de la informacin es en base a los criterios de organizacin de datos, donde se colocan en las columnas las variables y en las filas las observaciones, por lo que cada fila es un individuo o unidad experimental y cada celda contiene el dato o el valor que pertenece a cada variable para cada observacin. Cmo importar una base de datos desde Excel? InfoStat posee grandes ventajas respecto a la facilidad en el manejo de datos, es muy verstil en la importacin de datos desde Excel (versin 2003 o anterior), esto es importante, pues este ltimo es muy utilizado en la generacin de bases de datos tomados en campo. Es posible importar directamente una base de datos desde Excel y otros formatos. Esto facilita el manejo y presentacin de los mismos. 1

Figura 1: S eleccin de la hoja de clculo importada desde Excel.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cmo pegar una base de datos desde Excel? Muchas veces poseemos la base de datos de tal forma, que no coincide la primera fila y la primera columna con informacin propia de la base , o se poseen objetos distintos como grficas o logotipos. Considerando esto, es relativamente fcil, el copiar la base de datos que se desea analizar de forma directa a la tabla de InfoStat. Para esto se puede incluir la primera fila como el nombre de las columnas o no. Se debe de presionar el botn derecho del ratn y seleccionar la opcin pegar o pegar incluyendo nombre de columnas. 2

Figura 2: Como pegar una base de datos en la tabla de InfoS tat.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Transformacin de datos
Muchas veces se trabaja con variables cualitativas o datos no paramtricos, los cuales no cumplen con el supuesto de normalidad. Por lo anterior es necesario realizar transformacin de estos datos. InfoStat ofrece una gran cantidad de transformaciones para una variable, y a la vez permite la operacin entre variables.

Figura 3: Men a seleccionar para realizar una transformacin

Para realizar la transformacin se debe de seleccionar la variable, luego de indicar que se desea realizar una transformacin.

Figura 4: Opciones de trasformacin

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis
Hiptesis Nula (Ho)

Esta es la que el investigador evala y est dispuesto a sostener como probable, a menos que la evidencia experimental en su contra sea sustancial. Hiptesis alternativa (Ha) 4

Es la negacin de la hiptesis nula.

Trminos de importancia al realizar una prueba de hiptesis


Error tipo I ()

Es la probabilidad de rechazar una Ho cuando es falsa. Error tipo II ()

Es la probabilidad de no rechazar una Ho Cundo es falsa .


Cuadro 1: Posibles errores.

Tomada de Anderson, E; Black, W. et al. 1999.

Nivel de significancia

Es el valor de probabilidad de error tipo I, que el investigador est dispuesto a aceptar.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Pasos para evaluar una hiptesis estadstica.


1.

Definir la hiptesis nula y alternativa adecuada para el caso de evaluacin .

Cuadro 2: Casos de hiptesis a evaluar

5 2. Seleccionar el estadstico de prueba, necesario para evaluar la hiptesis.


Cuadro 3: Estadsticos utilizados en la prueba de hiptesis

Tomado de Lpez, E. 2008.

3. Especificar el nivel de significancia. 4. Establecer la regla de decisin. 5. Establecer los valores del estadstico seleccionado de la prueba y comparar lo con el valor critico establecido. 6. Conclusin.

Prueba de hiptesis acerca de una media poblacional normal. Video


Ejemplo: En una regin caera se siembra predominantemente una variedad de caa de azcar que tiene un TCH promedio de 103.5 toneladas ha -1 . Un programa de mejoramiento ha desarrollado una nueva variedad, comnmente usada, con rendimientos mayores a la variedad predominante. Para probar esta aseveracin se siembran nueve lotes experimentales con la nueva variedad y se obtienen los siguientes rendimientos:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Cuadro 4: Rendimiento en toneladas de caa por hectrea, tomado de 9 lotes distintos.

Lote 1 2 3 4 5 6 7 8 9 Prom.

TCH 103.15 103.92 104.26 103.36 103.72 104.19 103.42 104.38 104.5 103.88

Identificacin del parmetro sobre el cual se desea inferir en base a la muestra: Media () Hiptesis a probar: Ho: 103.5 Ha: >103.5 Eleccin del modelo probabilstico bajo el cual se operar: La t de Student Especificacin del nivel de significancia. = 5% o 0.05 Establecer la regla de decisin: Se Rechaza la Ho si p

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Figura 5: Ubicacin de la prueba

Se debe de seleccionar la columna a analizar y se debe de indicar el parmetro con el cual se realizar la comparacin.
Prueba T para un parmetro Valor del parmetro probado: 103.5 Variable n Media DE LI(95) TCH 9 103.88 0.49 103.57 T 2.32 p(Unilateral D) 0.0246

La regla de desicin: En base a la prueba T, se observa una probabilidad de p = 0.0246. Este valor es menor a la probabilidad permitida (= 0.05), por lo que se rechaza Ho. Conclusin: La muestra apoya la aseverain del programa de mejoramiento.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hipotesis acerca de dos medias (parcelas apareadas). Video


Cuadro 5: Rendimientos en toneladas de caa por hectarea, de dos variedades tamados de 6 lotes.

NF 1 2 3 4 5 6 Prom.

CP72-2086 160 112 184 186 104 152 150

CG97-77 130 118 225 149 168 139 155

Es importante que se ingresen los datos en dos columnas, una para cada poblacin o conjunto de datos.

Figura 6: Ubicacin de la prueba

En este caso la hiptesis a evaluar es: Ho: la diferencia entre las medias es igual a cero, que es igual a decir que ambas medias son iguales 1 = 2. Ha: 1 2.
Prueba T (muestras apareadas)
Obs(1) Obs(2) CG97-77 CP72-2086 media(dif) 5.17 Media(1) 154.83 Media(2) 149.67 DE(dif) T 40.23 0.31 Bilateral 0.7658

Conclusin: En base a las evidencias se puede aseverar que los tonelajes de ambas variedades son semejantes.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Prueba de hiptesis acerca de dos medias independientes. Video


Cuadro 6: Rendimientos en toneladas de caa por hectrea, bajo dos tratamientos de aplicacin de fosforo.

Fosforo 0 P0 150 155 149 153

Fosforo 240 P240 165 167 168 167

Es necesario que para ingresar los datos en InfoStat, se debe de crear una columna donde se coloque el nombre o cdigo de la variable, til para la clasificacin, y una columna donde se ingrese el valor de la variable a estudiar.

Figura 7: Ubicacin de la prueba

Prueba T para muestras Independientes


Variab Grupo(1)Grupo(2) TCH {P0} {P240} media(1) 151.75 media(2) 166.75 p(Var.Hom.) T 0.2307-9.91 p 0.0001

Conclusin: Al observar la salida del anlisis, se puede decir que el rendimiento del tratamiento P240 es mayor que el rendimiento del tratamiento P0.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Diseo completamente al azar


Es importante que al momento de realizar un anlisis de varianza, se tenga bien claro las fuentes de variacin consideradas por dicho modelo.

10

Tomado de Lpez, E. 2008

Como la media general y el error experimental son trminos que poseen en comn todos los modelos, no es necesario el indicarlos entre las fuentes de variacin.

Caractersticas generales
Se usa cuando las unidades experimentales son homogneas Con el se puede probar cualquier nmero de tratamientos (ya sean niveles de un solo factor o combinaciones de nivel de varios factores) Los tratamientos se aplican a las unidades experimentales al azar. Cualquier nmero de repeticiones por tratamiento es posible.

Utilizacin del diseo


Este diseo se recomienda cuando existe homogeneidad entre unidades experimentales, esto quiere decir que no existe influencia de la ubicacin de la unidad experimental sobre el efecto del tratamiento, esto es muy utilizado en ensayos a nivel de laboratorio, cuando se utilizan macetas o medios de cultivos, donde las condiciones son las mismas para todas las unidades experimentales.

Supuestos del modelo.


Los errores son independientes. Los errores estn normalmente distribuidos con media cero y varianza constante Existe homogeneidad de varianzas entre los tratamientos El modelo es lineal y de efectos aditivos.
InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 7: Rendimiento (TCH), evaluando 3 frecuencias de riego.

Tratamientos Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das
Tomado de M artnez, A. (1998).

Repeticin 1 123 175 199 179

Repeticin 2 133 167 203 188

Repeticin 3 131 192 166 203

11

En este caso los datos se deben de ingresar en la Tabla de InfoStat, indicando en una columna el tratamiento evaluado y en la columna de la par la variable de respuesta correspondiente a cada tratamiento.
Cuadro 8: Tabla de datos como se debe de ingresar a InfoS tat.

Tratamientos Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das Testigo (prctica regional) Riego cada 21 das Riego cada 28 das Riego cada 35 das

TCH 123 175 199 179 133 167 203 188 131 192 166 203

En la pestaa estadsticas se encuentra la opcin anlisis de varianza, al aceptar aparece un cuadro donde se debe de indicar las variables dependientes (TCH) y las variables de clasificacin (Tratamientos). Para esto se debe de utilizar los botones de accin .

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

12

Figura 8: S eleccin de las variables.

Al aceptar aparecer otro recuadro, donde se debe indicar las fuentes de variacin del modelo, como ya se mencion la media general y el error no se indican. Esto se realiza en la pestaa . A un lado se encuentra la pestaa donde se puede indicar la prueba de media que se desea realizar, donde se encuentran varias opciones.

Figura 9: S eleccin del mtodo de comparacin de medias.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza Variable TCH N 12 R 0.83 R Aj CV 0.77 7.98

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 7526.25 3 2508.75 13.37 0.0018 Tratamientos 7526.25 3 2508.75 13.37 0.0018 Error 1500.67 8 187.58 Total 9026.92 11 Test:LSD Fisher Alfa=0.05 DMS=25.78763 Error: 187.5833 gl: 8 Tratamientos Medias Riego cada 35 das 190.00 Riego cada 28 das 189.33 Riego cada 21 das 178.00 Testigo (prctica regional.. 129.00

13
n 3 3 3 3 A A A B

Letras distintas indican diferencias significativas(p<= 0.05)

201.35

A
182.40

A A

TCH

163.45

144.50

B
125.56 Riego cada 28 das Testigo (prctica regional) Riego cada 35 dias Riego cada 21 dias

Tratamientos

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Diseo de bloques completos al azar

14

Tomado de Lpez, E. 2008.

Hiptesis del modelo


= i (todos los tratamientos producen el mismo efecto) i para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos distintos).

Supuestos del modelo


ij ~ NID (0,2) Los errores son independientes y normalmente distribuidos, con media cero y varianza constante (homogeneidad de varianzas). No existe interaccin entre bloque y tratamiento (*) (*) Significa que un tratamiento no debe modificar su accin (o efecto) por estar en uno u otro bloque.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video
Cuadro 9: Rendimiento en Toneladas de caa por hectrea, caa plantilla, finca Margaritas.

Bloques

Variedad
CGSP98-08 CG00-032 CGSP-98-05 CGSP-98-16 CG00-120 CG00-129 CG00-001 CG00-092 CG99-045 CG00-028 CG00-044 CG-99-014 PR75-2002 CP72-2086

I
177 136 166 195 231 175 170 190 164 199 188 210 249 161

II
182 158 193 213 213 172 171 206 163 189 181 203 217 165

III
182 141 158 176 216 168 179 208 179 226 208 191 227 194

IV
166 156 186 185 188 155 185 196 175 208 192 210 231 179

15

Para este anlisis la base de datos se debe de ordenar de tal forma que se tenga una columna donde se indique el tratamiento aplicado y a la par en otra columna a que bloque pertenece y en una tercera el valor de la variable medida.
Cuadro 10: Forma de ingresar los datos a la base de datos.

Variedad
CGSP98-08 CG00-032 CP72-2086

Bloque
I I

TCH
177 136 179

IV

Para realizar el anlisis de varianza se debe de ir a la pestaa estadsticas, se despliega un men, donde se debe seleccionar la opcin anlisis de varianza. Se debe de seleccionar en el apartado variables dependientes la columna del tonelaje (TCH) y en el apartado variable de clasificacin la columna que indica el tratamiento aplicado y la columna donde se indica a que bloque pertenece.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

16

Figura 10: S eleccin de los trminos del modelo.

Para indicar el modelo de bloques completos al azar, se observan las fuentes de variacin en el recuadro trminos del modelo, y debajo de este se observa un botn de accin llamado agregar interaccin en este caso no se debe de agregar, de esta forma se cumple con uno de los supuestos del modelo.

No activar

Figura 11: Especificaci n del modelo.

Luego de elegir el mtodo de comparacin de medias, se debe de seleccionar en base a que agrupacin se desea la comparacin.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

17
Figura 12: Agrupamiento de las medias para su comparacin.

Anlisis de la varianza Variable TCH N 56 R 0.79 R Aj CV 0.71 6.80

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 24459.00 16 1528.69 9.40 <0.0001 Bloque 82.07 3 27.36 0.17 0.9172 Variedad 24376.93 13 1875.15 11.53 <0.0001 Error 6340.93 39 162.59 Total 30799.93 55 Test:LSD Fisher Alfa=0.05 DMS=18.23722 Error: 162.5879 gl: 39 Variedad Medias n PR75-2002 231.00 4 A CG00-120 212.00 4 B CG00-028 205.50 4 B CG-99-014 203.50 4 B CG00-092 200.00 4 B CG00-044 192.25 4 CGSP-98-16 192.25 4 CGSP98-08 176.75 4 CG00-001 176.25 4 CGSP-98-05 175.75 4 CP72-2086 174.75 4 CG99-045 170.25 4 CG00-129 167.50 4 CG00-032 147.75 4

C C C C C

D D D D D D

E E E E E E F

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

En la pestaa donde se selecciona el mtodo de comparacin de medias, tambin existe una opcin que devuelve un grfico de barras con la jerarqua del test seleccionado.
241.86 A

217.21

B BC BC BC CD CD

TCH

192.56

DE 167.92

DE

DE

18
DE E E

CG00-120

CG00-028

CG00-092

CG00-044

CG00-001

CG99-045

CG00-129

CG-99-014

CGSP-98-16

CGSP98-08

CGSP-98-05

PR75-2002

Variedad

Figura 13: Evaluacin de tres distintos ciclos de riego.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

CP72-2086

CG00-032

143.27

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Serie de Experimentos
Es comn que se realicen experimentos con la misma estructura, pero en distintas localidades. Con esto se desea obtener conclusiones vlidas para toda una regin, esto suponiendo aleatorizacin de las localidades. Para esto es necesario el analizar por separado las localidades y luego realizar un anlisis que integre todas las localidades. Estos ensayos se pueden realizar no solo para localidades distribuidas en el espacio, si no tambin ensayos distribuidos en el tiempo, por ejemplo el realizar un ensayo de herbicidas para verano y otro en invierno con la misma estructura, y concluir para todo el ao. Tambin es importante que se cumpla con el supuesto de homocedasticidad entre ensayos, esto se puede probar por medio de la prueba de Hartley.

19

Siendo: Yijk = toneladas de caa por hectrea referentes al i-simo producto madurante en el jsimo bloque o repeticin de la k-sima localidad; = media general i = efecto del i-simo producto madurante j / k = efecto del j-simo bloque en la k-sima localidad, lk = efecto de la k-sima localidad, (l)ik = efecto de la interaccin entre el i-simo producto madurante y la k-sima localidad, ijk = error experimental asociado a la observacin Yijk.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 11: Toneladas de caa por hectrea, plantilla, en tres localidades.

Las Margaritas
Bloque

San Bonifacio
Bloque

Tulul
Bloque

Variedad
CGSP98-08 CG00-032 CGSP-98-05 CGSP-98-16 CG00-120 CG00-129 CG00-001 CG00-092 CG99-045 CG00-028 CG00-044 CG-99-014 PR75-2002 CP72-2086

I
177 136 166 195 231 175 170 190 164 199 188 210 249 161

II
182 158 193 213 213 172 171 206 163 189 181 203 217 165

III
182 141 158 176 216 168 179 208 179 226 208 191 227 194

IV
166 156 186 185 188 155 185 196 175 208 192 210 231 179

I
148 115 153 153 162 153 164 171 162 172 157 144 169 130

II
152 124 140 117 164 127 158 133 117 103 150 152 162 123

III
168 104 104 111 153 144 157 157 149 109 90 156 175 155

IV
175 141 145 179 158 99 153 181 153 107 92 151 190 153

I
111 95 99 125 107 105 81 50 96 131 137 108 123 83

II
110 90 127 82 112 117 82 99 85 122 109 99 112 100

III
115 68 130 119 113 115 103 97 111 135 111 127 128 106

IV
103 125 132 107 110 119 122 92 93 100 94 136 129 112

20

En este caso, como se puede observar, en el modelo el efecto del bloque se encuentra anidado en la localidad, por lo que se debe de indicar en las fuentes de variacin, para esto se utiliza el smbolo > para indicar que el efecto del bloque se encuentra dentro de la localidad (Localidad>Bloque) y teniendo en cuenta que el error de la localidad es Localidad>Repeticin, como se ha mencionado en ejemplos anteriores.

Figura 14: Fuentes de variacin del modelo

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza Variable TCH N 168 R 0.88 R Aj CV 0.83 11.08


gl 50 2 9 13 26 117 167 CM 4555.74 88741.54 442.12 1952.19 805.64 263.88 F 17.26 200.72 1.68 7.40 3.05 p-valor (Error) <0.0001 <0.0001 (Loc>Rep) 0.1025 <0.0001 <0.0001

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V. Modelo Localidad Localidad>Repeticin Variedad Localidad*Variedad Error Total SC 227787.23 177483.08 3979.12 25378.43 20946.58 30873.63 258660.85

21

Test:LSD Fisher Alfa=0.05 DMS=8.98910 Error: 442.1250 gl: 9 Localidad Medias n San Bonifacio 187.54 56 A Las Margaritas 144.36 56 Tulul 108.02 56

B C

Letras distintas indican diferencias significativas(p<= 0.05)

Test:LSD Fisher Alfa=0.05 DMS=13.13374 Error: 263.8771 gl: 117 Variedad Medias n PR75-2002 176.00 12 A CG00-120 160.58 12 B CG-99-014 157.25 12 B CG00-028 150.08 12 B CGSP98-08 149.08 12 B CG00-092 148.33 12 B CGSP-98-16 146.83 12 CGSP-98-05 144.42 12 CG00-001 143.75 12 CG00-044 142.42 12 CP72-2086 138.42 12 CG00-129 137.42 12 CG99-045 137.25 12 CG00-032 121.08 12

C C C C C C

D D D D D D D D D D E

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

193.79 A

171.33

TCH

148.86

22

126.40

C 103.93 San Bonifacio Las Margaritas Tulul

Localidad

183.67 A

167.28 B BC

TCH

150.89

BCD

BCD

BCD

CD

CD

D D D D

134.49

CG00-120

CG00-028

CG00-092

CG00-001

CG00-044

CG00-129

CG99-045

CG-99-014

CGSP98-08

CGSP-98-16

CGSP-98-05

PR75-2002

Variedad

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

CP72-2086

CG00-032

118.10

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de experimentos factoriales


Cuando se habla de experimentos factoriales, es cuando evaluamos simultneamente el efecto de dos o ms valores. Dependiendo del arreglo y las interacciones entre los factores se pueden generar diversos diseos adecuados a distintas condiciones en campo.

Ventajas a. Se logra una gran eficiencia en el uso de los recursos experimentales disponibles. b. Se obtiene informacin respecto a las diversas interacciones. c. Los resultados experimentales son aplicables a un rango de condiciones ms amplio debido a las combinaciones de los diversos factores en un solo experimento. Los resultados son de naturaleza ms comprensiva. d. Los experimentos factoriales son ms eficientes que los experimentos simples.

23

Inconvenientes a. El resultado del experimento y el anlisis estadstico resultante son ms complejos. b. Con un gran nmero de combinaciones de tratamientos, la relacin de unidades experimentales homogneas es ms difcil. c. Convencidos de que algunas de las combinaciones de tratamientos pueden ser de muy poco o ningn inters, algunos de los recursos experimentales pueden ser malgastados. d. El nmero de tratamientos o combinaciones aumentan rpidamente.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Arreglos combinatorios
El modelo que se describe corresponde a un experimento bifactorial, en arreglo combinatorio dispuesto en un diseo en bloques completos al azar, debido a que es el ms usado.

24
Tomado de Lpez, E. 2008.

Siendo que: Yijk = Variable de respuesta observada o medida en la ijk - sima unidad experimental = Media general i = Efecto del i - simo nivel del factor "A" j = Efecto del j - simo nivel del factor "B" ()ij = Efecto de la interaccin entre el i - simo nivel del factor "A" y el j - simo nivel del factor "B" k = Efecto del k - simo bloque ijk = Error experimental asociado a la ijk - sima unidad experimental

Ejemplo: Video

Cuadro 12: Rendimiento en toneladas de caa por hectrea, evaluando distintas concentraciones de tres elementos.

Tratamientos N (Kg/ha) P (Kg/ha) K (Kg/ha) 50 0 0 150 0 0 50 100 0 150 100 0 50 0 100 150 0 100 50 100 100 150 100 100
Tomado de Prez, O. (2002)

Bloque I 147.88 129.79 148.61 148.12 126.82 135.96 160.48 178.69 II 160.41 136.2 160.53 163.32 141.77 142.43 160.53 159.99 III 129.54 124.1 135.84 161.08 124.09 135.96 136.02 163.81 IV 105.21 111.44 130.03 151.28 127.18 129.6 141.89 148.13

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Es importante que se cree una columna para indicar los distintos niveles de cada factor y otra columna para indicar la repeticin o el bloque como tambin la variable de respuesta.
Cuadro 13: Ejemplo de cmo se debe de ingresar datos en la tabla de InfoS tat.

Nivel N Nivel P
50 150 50 150 0 0 100 100

Nivel K
0 0 0

Bloque
I I I IV

TCH
147.88 129.79 148.61 148.13

100

25

Figura 15: Variables de clasificacin a seleccionar.

Se debe de agregar la interaccin de todos los elementos por medio del botn de accin , se agregar todas las combinaciones posibles, y se debe de eliminar las interacciones donde se relacione con el bloque. Tambin existe la opcin de agregar contrastes en el anlisis, para esto se debe de indicar el contraste deseado en la pestaa contrastes. Se debe de seleccionar entre que agrupaciones se desean los contrastes y que tratamientos se desean realizar. Para esto se encuentran dos botones, el botn , sirve para indicar que tratamiento se desea contrastar al seleccionar indica contra que se ingresa el el tratamiento y luego presionar el botn de accin. Y el botn tratamientos se realiza el contraste, es importante activar la casilla cuando se realizan ms de un contraste. Por ltimo con el botn contraste deseado.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

26

Figura 16: Fuentes de variacin del modelo.

Figura 17: Pasos para agregar contrastes ortogonales

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza Variable TCH N 32 R 0.81 R Aj CV 0.71 6.31 F p-valor 8.71 <0.0001 9.55 0.0004 2.67 0.1171 44.73 <0.0001 1.89 0.1832 5.38 0.0305 1.82 0.1921 0.38 0.5423 1.52 0.2311

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM Modelo 7030.28 10 703.03 Bloque 2314.84 3 771.61 Nivel N 215.64 1 215.64 Nivel P 3611.86 1 3611.86 Nivel K 152.99 1 152.99 Nivel N*Nivel P 434.46 1 434.46 Nivel N*Nivel K 146.68 1 146.68 Nivel P*Nivel K 30.99 1 30.99 Nivel N*Nivel P*Nivel K 122.81 1 122.81 Error 1695.89 21 80.76 Total 8726.17 31 Contrastes Nivel N*Nivel P*Nivel K SC Contraste1 215.64 Contraste2 3611.86 Contraste3 152.99 Contraste4 434.46 Contraste5 146.68 Contraste6 30.99 Contraste7 122.81 Total 4715.44
Coeficientes de los contrastes Nivel N*Nivel P*Nivel K Cont.1 50.00:0.00:0.00 -1.00 50.00:0.00:100.00 -1.00 50.00:100.00:0.00 -1.00 50.00:100.00:100.00 -1.00 150.00:0.00:0.00 1.00 150.00:0.00:100.00 1.00 150.00:100.00:0.00 1.00 150.00:100.00:100.00 1.00 Cont.2 -1.00 -1.00 1.00 1.00 -1.00 -1.00 1.00 1.00

27

gl 1 1 1 1 1 1 1 7
Cont.3 -1.00 1.00 -1.00 1.00 -1.00 1.00 -1.00 1.00

CM 215.64 3611.86 152.99 434.46 146.68 30.99 122.81 673.63

F p-valor 2.67 0.1171 44.73 <0.0001 1.89 0.1832 5.38 0.0305 1.82 0.1921 0.38 0.5423 1.52 0.2311 8.34 0.0001

Cont.4 Cont.5 Cont.6 Cont.7 1.00 1.00 1.00 -1.00 1.00 -1.00 -1.00 1.00 -1.00 1.00 -1.00 1.00 -1.00 -1.00 1.00 -1.00 -1.00 -1.00 1.00 1.00 -1.00 1.00 -1.00 -1.00 1.00 -1.00 -1.00 -1.00 1.00 1.00 1.00 1.00

Conclusin: El anlisis indic que el efecto principal de P fue estadsticamente significativo. Con la inclusin de ambos (N y P) se obtuvieron las mximas producciones. No hay diferencia estadstica significativa entre 50 y 0 Kg de N/ha evaluando bajo aplicaciones de P y K. El nivel 150 Kg de N/ha difieren estadsticamente del nivel 0 Kg de N/ha, con aplicaciones iguales de PK.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Parcelas divididas
En este diseo se trabajan con todas las posibles combinaciones de los factores, lo que lo diferencia del anterior es el arreglo, por lo que se puede adecuar de mejor forma a condiciones reales de campo.

28

Figura 16: Arreglo de parcelas divididas en el espacio.

Tomado de Lpez, E. 2008

Siendo: Yijk = Variable de respuesta medida en la ijk - sima unidad experimental = Media general j = Efecto del j - simo bloque i = Efecto del i - simo nivel del factor A. ()ij = Efecto de la interaccin del i-simo nivel del factor A con el j simo bloque, que es utilizado como residuo de parcelas grandes y es representado por error(a) k = Efecto del k - simo nivel del factor B ()ik = Efecto debido a la interaccin del i-simo nivel del factor A con el k simo nivel del factor B. ijk = Error experimental asociado a Yijk , es utilizado como residuo a nivel de parcela pequea, y es definido como: Error(b)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 14: Efecto de dos distintas mezclas de herbicidas, en 13 variedades, evaluando altura .

Bloque

Mezcla de herbicida

Variedad
CP72-2086 CP73-1312 CP88-1165 RB73-2577 SP79-1287 CG98-10

I
16.2 21.8 23.2 17.8 31.6 26.2 15.6 20.4 33.8 23 21.2 23.4 17 24.8 38.8 21.4 17.8 25.8 19.8 21.8 26.4 17.6 36.6 20.6 21.2 20

II
13.8 22 31 17 28.2 30.8 16.4 17.2 30 13.8 29.2 21.6 18.6 22.4 20 40.8 38.6 20 21.8 20.4 24.6 26.4 25.2 20.6 32.4 19.4

III
19 23 29.6 15.6 27 26.6 20 14.8 30 18.2 28 25 18.6 30.6 18.8 31.2 19.2 30.4 26 34 18 21.2 15.4 32.4 36.8 21.2

29

M1

CG96-78 CG98-78 CG99-048 MEX82-114 RB84-5210 RB87-2015 CG96-135 CP72-2086 CP73-1312 CP88-1165 RB73-2577 SP79-1287 CG98-10

M2

CG96-78 CG98-78 CG99-048 MEX82-114 RB84-5210 RB87-2015 CG96-135

Datos tomados de Ing. Gerardo Espinoza, Fisilogo. CENGICAA. Cuadro 15: Forma de crear la base de datos en InfoStat.

Variedad
CP72-2086 CP73-1312 CP88-1165

Mezcla
M1 M1 M1

Bloque
I I I

Altura
16.2 21.8 23.2

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Para este caso es importante el considerar las fuentes de variacin del modelo y el error del efecto A o parcela grande. Para este caso se debe de indicar el error apropiado de dicho efecto (Factor A*Bloque), por medio de el carcter \ (diagonal invertida), para lo cual se utiliza el comando Alt + 93, esto es importante pues en el momento de realizar la comparacin de medias se utiliza el error adecuado. En este caso el factor A o parcela grande es la mezcla de herbicida, y el factor B parcela pequea la variedad.

30

Figura 17: Ingreso del modelo de parcelas divididas a InfoS tat.

Anlisis de la varianza Variable Altura N 78 R 0.49 R Aj CV 0.18 24.51


gl 29 1 2 2 12 12 48 77 CM 53.28 139.20 7.23 5.23 61.49 53.59 34.03 F 1.57 26.63 0.21 0.15 1.81 1.57 p-valor 0.0830 0.0356 0.8094 0.8581 0.0739 0.1314 (Error) (Mezcla*Bloque)

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V. Modelo Mezcla Bloque Mezcla*Bloque Variedad Mezcla*Variedad Error Total SC 1545.05 139.20 14.45 10.45 737.85 643.10 1633.63 3178.68

Test:Tukey Alfa=0.05 DMS=2.23128 Error: 5.2267 gl: 2 Mezcla Medias n M2 25.14 39 A M1 22.47 39

Letras distintas indican diferencias significativas(p<= 0.05)

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Franjas divididas
Cuando las condiciones del campo o la naturaleza de los tratamientos no permiten una completa aleatorizacin de todas las combinaciones de los factores, este diseo es recomendable.

31

Figura 18: Arreglo de un diseo de franjas divididas.

Este es el modelo estadstico- matemtico, propuesto para dos factores y un diseo de bloques completos al azar. Siendo: Yijk = Variable de respuesta medida en la ijk - sima unidad experimental = Media general j = Efecto del j - simo bloque i = Efecto del i - simo nivel del factor A. ()ij = Efecto de la interaccin entre el i-simo nivel del factor A con el j - simo bloque, o sea, es el error experimental asociado al factor A, tal que ()ij ~ N (0, 2 1 ) e independientes, es utilizado como error(a). k = Efecto del k - simo nivel del factor B ()jk = Efecto de la interaccin entre el k-simo nivel del factor A con el j - simo bloque, o sea, es el error experimental asociado al factor B, tal que ()jk ~ N (0, 22 ) e independientes, es utilizado como error(b). ()ik = Efecto debido a la interaccin del i-simo nivel del factor A con el k - simo nivel del factor B. ()ijk = Error experimental asociado a Yijk, tal que ()ijk ~ N (0, 2) e independientes, es utilizado como trmino de error o residuo.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 16: Evaluacin de cuatro tipos de surco y tres densidades de siembra, midiendo % Pol.

Bloque Tipo de surco Densidad de siembra 4 TSH 6 TSH 8 TSH 4 TSH 6 TSH 8 TSH 4 TSH 6 TSH 8 TSH 4 TSH 6 TSH 8 TSH I 17.67 17.31 17.49 17.19 17.21 18.04 17.39 17.39 17.69 17.19 16.78 17.86 II 17.23 17.6 17.3 17.85 17.26 16.38 17.54 17.67 17.02 17.57 17.57 16.85 III 17.43 17.05 17.68 17.44 16.71 17.23 16.61 16.77 17.34 17.72 17.79 18.12 IV 17.61 16.91 18.27 17.56 17.52 17.14 17.51 17.61 18.02 17.73 18.27 17.94

Surco Simple

32

Surco doble

surco base larga surco base corta


Datos tomados de Lpez, E. 2008.

Para este caso se debe de considerar los errores de cada factor e indicarlos, pues es necesario para que al realizar la comparacin de medias se utilice el error adecuado.

Figura 19: Fuentes de variacin para un diseo de franjas divididas.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de la varianza Variable % Pol N 48 R 0.77 R Aj CV 0.39 1.89


F 2.06 1.25 0.36 3.05 0.95 1.66 3.52 p-valor (Error) 0.0563 0.3473 (Tipo de surco*Bloque) 0.7104 (Densidad de siembra*Bloqu.. 0.0554 0.4869 0.1731 0.0175

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM Modelo 6.47 29 0.22 Tipo de surco 0.68 3 0.23 Densidad de siembra 0.28 2 0.14 Bloque 0.99 3 0.33 Tipo de surco*Densidad de .. 0.62 6 0.10 Tipo de surco*Bloque 1.62 9 0.18 Densidad de siembra*Bloque.. 2.29 6 0.38 Error 1.95 18 0.11 Total 8.42 47

33

Test:LSD Fisher Alfa=0.05 DMS=0.48936 Error: 0.1085 gl: 18 Tipo de surco Densidad de siembra surco base corta 8 TSH Surco Simple 8 TSH surco base corta 6 TSH surco base corta 4 TSH surco base larga 8 TSH Surco doble 4 TSH Surco Simple 4 TSH surco base larga 6 TSH surco base larga 4 TSH Surco Simple 6 TSH Surco doble 8 TSH Surco doble 6 TSH

Medias 17.69 17.69 17.60 17.55 17.52 17.51 17.49 17.36 17.26 17.22 17.20 17.18

n 4 4 4 4 4 4 4 4 4 4 4 4 A A A A A A A A A A B B B B B B B B B B

C C C C C C C C C C

Letras distintas indican diferencias significativas(p<= 0.05)

17.89

17.70

AB ABC ABC

% Pol

17.52

ABC

ABC

ABC

ABC 17.33 ABC ABC BC C


Surco doble:6 TSH

Surco Simple:8 TSH

Surco Simple:4 TSH

Surco Simple:6 TSH

Surco doble:4 TSH

surco base larga:8 TSH

surco base larga:6 TSH

surco base corta:8 TSH

surco base corta:6 TSH

surco base corta:4 TSH

Tipo de surco*Densidad de siembra

Figura 20: Grafica resumen de la comparacin de medias.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

surco base larga:4 TSH

Surco doble:8 TSH

17.14

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anlisis de correlacin lineal simple.


En este anlisis se relacionan dos variables aleatorias. Para este ejemplo tomaremos como estadstico de prueba el coeficiente de correlacin de Pearson, y se realizar una prueba de hiptesis para evaluar si el coeficiente de Pearson () es igual a cero, lo que indicara una ausencia de correlacin lineal. Ejemplo: Video.
Cuadro 17: Peso de tallos y rendimiento de caa en Kg.

peso del tallo Kg 1.12 1.21 0.99 1.02 0.93 1.14 0.86 1.03 1.22 1.17

Rendimiento de caa Kg 7.74 8.02 8.16 8.46 6.3 10.01 4.79 7.04 7.62 7.54

34

Se ingresan ambas variables en la casilla de variables a analizar.

Figura 21: Ubicacin de coeficiente de correlacin.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

35
Figura 22: S eleccin del coeficiente de correlacin de Pearson.

Recordemos que se trabajar con el coeficiente de correlacin de Pearson, por lo que se debe de seleccionar cuando InfoStat lo indique.
Coeficientes de correlacin Correlacion de Pearson: coeficientes\probabilidades Rendimiento de caa peso del tallo Kg Rendimiento de caa 1.00 0.62 peso del tallo Kg 0.05 1.00

En la matriz podemos observar en la parte inferior de la diagonal conformada por unos, los coeficientes de correlacin que nos indica el grado de asociacin, donde un nmero negativo indica una asociacin negativa, este valor se encuentra entre -1 y 1 y 0 indica que no existe una correlacin lineal entre variab les. En la parte superior de la diagonal se muestra el valor de la probabilidad (p) de la prueba de hiptesis realizada, al evaluar que el coeficiente de Pearson es igual a cero, se debe de tener en cuenta el valor de significancia con el que se desea trabajar, pues al trabajar con un nivel de significancia del 5%, se acepta la hiptesis alternativa (existe correlacin entre ambas variables) si el valor de p 0.05.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Regresin Lineal
Existen casos cuando se desea conocer la relacin funcional que puede existir entre dos o ms variables cuantitativas, en estos casos la regresin es muy til. Tambin un anlisis de regresin nos puede servir para predecir o describir el comportamiento de una variable respecto al comportamiento de otra, que por su naturaleza es difcil la observacin directa, por lo que con la ayuda de un modelo se puede entender lo anterior relacionando una o ms de una variable.

RL Simple
Cuando se relaciona una variable dependiente o explicada con una variable independiente o explicativa realizamos un anlisis de regresin simple, con la finalidad de generar un modelo que exprese el comportamiento de la variable dependiente respecto a la independiente.

36

Tomado de Lpez, E. 2008.

a) El coeficiente de posicin () o intercepto, indica la posicin en la cual la recta corta el eje Y. Si la recta pasa por el origen, entonces =0. En trminos prcticos, indica el valor que asume la variable Y cuando la variable es X=0. En algunos casos se requiere que la recta corte en el origen, esto siguiendo la lgica de la variable explicada. b) El coeficiente de regresin lineal () o coeficiente angular de la regresin, determina la pendiente de la recta. Este coeficiente indica la variacin en Y causada por la variacin de una unidad en X.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Supuestos del modelo de regresin 1. El trmino de error es una variable aleatoria con media o valor esperado igual a cero, esto es, E(). Esto implica que como y son constantes, E( )= y E()=. 2. La varianza de representada por 2 , es igual para todos los valores de x. Homocedasticidad. Implicacin: la varianza de y es igual a 2 , y es la misma para todos los valores de x. 3. Los valores de son independientes. Implicacin: el valor de para un determinado valor de x no se relaciona con el valor de para cualquier otro valor de x; as, el valor de y para determinado valor de x no se relaciona con el valor de y para cualquier otro valor de x. 4. El trmino de error es una variable aleatoria con distribucin normal. Implicacin: como y es una funcin lineal de , y es tambin una variable aleatoria distribuida normalmente. La siguiente figura ilustra los supuestos del modelo y sus implicaciones:

37

Tomado de Lpez, E. 2008.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Ejemplo: Video.
Cuadro 18: Datos de tres variables de 10 hbridos de caa de azcar.

Hbrido 1 2 3 4 5 6 7 8 9 10

peso del tallo Kg 1.12 1.21 0.99 1.02 0.93 1.14 0.86 1.03 1.22 1.17

Rendimiento de caa Kg 7.74 8.02 8.16 8.46 6.3 10.01 4.79 7.04 7.62 7.54

Brix Kg 0.9 0.87 0.92 0.99 0.58 1.11 0.53 0.73 0.87 0.9

38

Datos tomados del articulo Combining ability and yield component in five parent diallet cross in sugarcane, por el Dr. J. D. M iller.

Se pide que se investigue la relacin Rendimiento de caa en Kg (X) y Brix en Kg (Y). Es importante que tengamos en cuenta que al realizar el anlisis de varianza, evaluamos la hiptesis de que (la pendiente de la recta) es igual a cero, por lo que no existe re lacin entre ambas variables.

Figura 23: Ubicacin de la herramienta regresin lineal.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Es importante que recordemos al momento de indicar las variables a anlisis, que la variable dependiente en este caso es Brix en Kg (Y), y la variable regresora es el rendimiento de caa en Kg (X).

39

Figura 24: Diagnostico de la regresin lineal simple.

En el cuadro de anlisis de regresin lineal, en la pestaa diagnstico debemos de indicar las graficas que deseamos como prueba de los supuestos y si deseamos se debe de indicar que la presencia de las bandas de confianza y prediccin en el grfico del modelo.
Anlisis de regresin lineal Variable Brix Kg N 10 R 0.92 R Aj ECMP 0.91 5.0E-03 AIC -26.30 BIC -25.40

Coeficientes de regresin y estadsticos asociados Coef Est. E.E.


0.10 0.01

LI(95%) LS(95%)
-0.33 0.09 0.13 0.15

p-valor

CpMallows 82.02

const -0.10 Rendimiento 0.12

-1.03 0.3326 9.54 <0.0001

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM F p-valor Modelo 0.26 1 0.26 91.03 <0.0001 Rendimiento de caa 0.26 1 0.26 91.03 <0.0001 Error 0.02 8 2.9E-03 Total 0.29 9 InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

1.33

1.07

Brix Kg

0.82

40

0.56

0.31 4.53

5.96

7.40

8.84

10.27

Rendimiento de caa
En base al anlisis de varianza se acepta la hiptesis alterna, donde se dice que es distinto a 0, y por lo tanto la variable Y est explicada o relacionada con la variable X. Utilizando los coeficientes de los parmetros, se puede generar un modelo que prediga el comportamiento de la variable Brix Kg en funcin de rendimiento de caa en Kg. Y= -0.103 + 0.125X Donde: Y= Kg Brix y X= Kg de caa. Y en base al coeficiente de determinacin ajustado, se puede afirmar en un 91% de certeza que el modelo puede predecir la realidad.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

RL Mltiple
En este caso se relaciona una variable dependiente (Y), con dos o ms variables independientes (X). El modelo que relaciona esta variable dependiente que debe de ser aleatoria y variables independientes que son fijas y predeterminadas, medidas sin error, se llama ecuacin de regresin mltiple.

Este modelo se diferencia de la regresin lineal simple, ya que la adicin de una o ms variables independientes, debe de contribuir significativamente a la prediccin de la variable dependiente (Y), despus de haber tomado en cuenta la contribucin de la variable independiente de la RLS. Tambin es importante tener en cuenta un supuesto que se agrega a los de la RLS, este considera que dos variables independientes no debes de tener correlacin entre ellas, pues al existir esta relacin la variable dependiente es mejor explicada nicamente con una sola variable independiente al presentar un modelo ms simple, a este supuesto se le llama multicolinalidad. Para realizar una RLM en InfoStat, se siguen los mismo s pasos que para realizar una RLS, nicamente se agrega las variables independientes deseadas en la casilla de Regresoras.

41

Ejemplo: Video. Con las variables del ejemplo anterior (RLS), realice un anlisis de regresin lineal mltiple. El primer paso es el realizar una matriz de correlacin, como ya se ha visto en incisos anteriores.
Coeficientes de correlacin Correlacion de Pearson: coeficientes\probabilidades Brix Kg % Brix Rendimiento de caa Brix Kg 1.000 0.595 0.959 % Brix 0.070 1.000 0.344 Rendimiento de caa 1.2E-05 0.331 1.000

Como se puede apreciar en la matriz anterior, se observa que existe correlacin entre las variables Brix Kg y rendimiento de caa y Brix Kg y % Brix mayor a un 10% de significancia, por lo que son tiles en la elaboracin de un modelo de RLM. Tambin se observa que no existe correlacin entre las variables de Rendimiento de caa y % Brix, por
InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

lo que se cumple con el supuesto de multicolinalidad y ambas variables contribuyen a la prediccin de la variable Brix Kg.
Anlisis de regresin lineal Variable Brix Kg N 10 R 1.00 R Aj ECMP 1.00 1.5E-04 AIC -70.02 BIC -68.80

Coeficientes de regresin y estadsticos asociados


Coef const Rendimiento de caa % Brix Est. -0.74 0.11 0.05 E.E. LI(95%) LS(95%) T 0.03 -0.80 -0.68 -27.50 1.5E-03 0.11 0.11 73.50 1.8E-03 0.04 0.05 25.88 p-valor CpMallows <0.0001 <0.0001 4729.69 <0.0001 588.05

42

Cuadro de Anlisis de la Varianza (SC tipo III) F.V. SC gl CM Modelo 0.29 2 0.14 Rendimiento de caa 0.18 1 0.18 % Brix 0.02 1 0.02 Error 2.4E-04 7 3.4E-05 Total 0.29 9

F 4184.19 5402.93 669.63

p-valor <0.0001 <0.0001 <0.0001

El modelo tomando en cuenta los coeficientes anteriores se presentara de la siguiente manera: Y= -074 + 0.11X1 + 0.05X2 Donde: Y= Brix Kg, X1 = Rendimiento de caa y X2 = % Brix.

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Bibliografa
Anderson, E; Black, W; Hair, F; Tatham, R. (1999). Anlisis Multivariado. Madrid. Prentice Hall Iberia. Hines, W; Montgomery, D. (1995). Probabilidades y estadstica para ingenieria y administracin. Mxico. Co mpaa editorial continental, S.A. de C.V. M xico. InfoStat. (2009). In foStat versin 2009. Grupo InfoStat, FCA, Universidad Nacional de Crdova, Argentina. Levin, R. (1981). Estadstica para administradores. Mxico. Prentice Hall. Lpez, E. (2008). Diseo y anlisis de experimentos, fundamentos y aplicaciones en agronoma. Guatemala. USA C. Lpez, E. (2008). Elaboracin de proyectos de investigacin, notas de acompaamiento de curso. Guatemala. USA C. Lpez, E. (2008). Estadstica, con aplicaciones en agronoma y ciencias forestales. Guatemala. USAC. Martnez, A. (1988). Diseos experimentales: mtodos y elementos de teora. Mxico. Trillas. Mendenhall, W; Scheaffer, R; Wackerly, D. (1986). Estadstica matemtica con aplicaciones. Mxico. Iberoamrica. Prez, O. (2002). Diplomado de estadstica: experimentos factoriales. Santa Lucia Cotz. CENGICA A. Quem, J. (2002). Anlisis de regresin. Santa Luca Cotz. CENGICAA. Quem, J. (2002). Introduccin al uso del ayudante de datos MST y MSTAT-C. Santa Luca Cotz. CENGICAA. Quem, J. (2002). Sitematizacin de una prueba de hiptesis, diseos completamente al azar, bloques completos al azar y prueba de medias. Santa Luca Cotz. CENGICAA.

42

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Anexos
Cuadro 19: Resumen. Trminos a considerar en la definicin del modelo, en InfoS tat.

Diseo
Diseo completamente al azar. DCA. (1) Diseo completamente al azar con submuestreo DCAsm. Diseo de bloques completos al azar. DBCA.
(1)

Trminos del modelo.


Tratamiento

Tratamiento Repeticin*Tratamiento>Muestreo Bloque Tratamiento

43

Diseo de bloques completos al azar con submuestreo. DBCAs m.

Bloque Tratamiento Bloque*Tratameinto>Muestreo Localidad\Localidad>Bloque Localidad>Bloque Tratamiento Localidad*Tratamiento Bloque Factor A Factor B Factor A*Factor B Bloque Factor A\Factor A*Bloque Factor A*Bloque Factor B Factor A*Factor B Bloque Factor A\Factor A*Bloque Factor A*Bloque Factor B\Factor B* Bloque Factor B* Bloque Factor A*Factor B

Serie de experimentos con DBCA.

Arreglo co mbinatoria en DBCA. (Factorial)

Parcelas div ididas

Franjas divid idas

(1)

Cuando se definen modelos con submuestro es importante que tengamos en cuenta las distintas decisiones que debemos de tomar en el mo mento de aceptar o rechazar una hiptesis. InfoStat realiza de forma parcial el anlisis de este modelo, por lo que se debe de seguir los siguientes pasos: Prueba de hi ptesis para e valuar la efecti vi dad del muestreo. Ho: 2 e = 0 Ha: 2 e > 0

1.

En este caso si se acepta la Ho, se dice que el muestreo no fue efectivo, en caso contrario, si se rechaza la Ho se dice que el muestreo fue efectivo. Para esto se debe realizar los siguientes clculos:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

Se considerar el cuadrado medio del error experimental (CM ee) y el cuadrado medio del error del muestreo (CM e m). Se debe de encontrar el valor F, para esto se realiza la relacin CM ee/CM em. Para realizar la toma de decisin de rechazar o aceptar la Ho, se puede estimar, en Excel, el valor p (probabilidad), para esto se utiliza la funcin DISTR.F donde se ingresa el grado de libertad del Error experimental (g l 1 ), los grados de libertad del erro r de muestreo (gl2 ) y el valor F (CM ee/CM em), el cual es nombrado en Excel por la letra X. Si el valor p estimado en Excel, es menor al nivel de significancia establecido, se rechaza la Ho, por lo que se dice que el muestreo fue efectivo. 2. Prueba de hi ptesis para evaluar si existe diferencia entre tratameintos, cuando el muestreo es efecti vo

La segunda hiptesis a evaluar, corresponde a la diferencia entre los tratamientos, donde: Ho: = i (todos los tratamientos producen el mis mo efecto) Ha: i para al menos un i; i = 1,2, . . . , t (al menos uno de los tratamientos produce efectos distintos). En este caso, los valores de F y p utilizados en la toma de decisin de aceptar o rechazar la Ho, son los proporcionados por la salida de InfoStat, de igual forma el coeficiente de variacin. 2.1. Prueba de medias, cuando el muestreo es efecti vo. Si el muestreo fue efectivo las prueba de medias se realiza de manera co mn, de igual forma co mo se presenta en la seccin de diseo completamente al azar. 3. Prueba de hi ptesis para evaluar si existe diferencia entre tratamietnos, cuando el muestreo no es efectivo.

44

Al no ser el muestreo efectivo, se debe de unir los errores del error experimental y el error de muestreo de la siguiente forma: CM ep = SCee+ SCe m / glee + gle m Donde: CM ep = Cuadrado med io del error ponderado SCee = Su ma de cuadrados del error experimental SCe m= Su ma de cuadrados del error de muestreo glee= grados de libertad del error experimental glem= grados de libertad del error de muestreo Y el valor F (el valor F del tratameinto), se estima as: F= CM Tratamiento / CM ep Para encontrar el valor p que se utiliza para realizar la to ma de decisin respecto a la segunda hiptesis, relacionada al efecto de los tratamientos, se debe de seguir las instrucciones mencionadas anteriormente en el inciso 1. Y el valor del coeficiente de variacin debe de encontrarse de la siguiente forma:

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.

Mtodos estadsticos utilizados en la industria caera.

CENGICAA

3.1. Prueba de medias, cuando el muestreo no es efecti vo Para esto, se debe de indicar el error y los grados de libertad a utilizar (estimados previamente, de la forma explicada anteriormente en el inciso 3) en la comparacin de medias, donde el error es el valor de CM ep y los grados de libertad la suma de g lee y gle m.

45

Figura 25: Indicacin del error a utilizar en la comparacin de medias

InfoStat. | Centro guatemalteco de investigacin y capacitacin de la caa de azcar.