You are on page 1of 46

i

U N I V E R S I D A D D E C ON C E P C I O N
FACULTAD DE CIENCIAS FORESTALES INGENIERIA FORESTAL

ANALISIS MULTIVARIADO DE FACTORES QUE INCIDEN EN LA PRODUCCION DE CUADRILLAS QUE REALIZAN COSECHA DE Pinus radiata D. Don EN EL SECTOR COSTERO SUR DE LA REGION DEL BIO-BIO, CHILE
Por

MAURICIO ALEJANDRO GARCIA COA

MEMORIA PARA OPTAR AL TITULO DE INGENIERO FORESTAL.

CONCEPCION CHILE 2012

ii

U N I V E R S I D A D D E C ON C E P C I O N
FACULTAD DE CIENCIAS FORESTALES INGENIERIA FORESTAL

ANALISIS MULTIVARIADO DE FACTORES QUE INCIDEN EN LA PRODUCCION DE CUADRILLAS QUE REALIZAN COSECHA DE Pinus radiata D. Don EN EL SECTOR COSTERO SUR DE LA REGION DEL BIO-BIO, CHILE

Por

MAURICIO ALEJANDRO GARCIA COA

MEMORIA PARA OPTAR AL TITULO DE INGENIERO FORESTAL.

CONCEPCION CHILE 2012

iii

ANALISIS MULTIVARIADO DE FACTORES QUE INCIDEN EN LA PRODUCCION DE CUADRILLAS QUE REALIZAN COSECHA DE Pinus radiata D. Don EN EL SECTOR COSTERO SUR DE LA REGION DEL BIO-BIO, CHILE

Profesor Gua

__________________________________ Eduardo Acua Profesor Asistente Ingeniero Forestal; Dr.

Profesor Gua

________________________________ Pedro Real Profesor Asociado Ingeniero Forestal; Dr.

Calificacin de la Memoria de Ttulo:

Eduardo Acua: Pedro Real:

iv

v INDICE DE MATERIAS

CAPITULOS

PAGINA

I INTRODUCCION ..................................................................................................... 1 II METODOLOGIA ..................................................................................................... 5 2.1 CONSIDERACIONES GENERALES ........................................................................................ 5 2.2 PREPARACIN DE DATOS.................................................................................................... 6

2.2.1. Informacin de Produccin. ..................................................................................... 6 2.2.2. Informacin Silvcola. .............................................................................................. 7 2.3 ANLISIS UNIVARIADO. ..................................................................................................... 7 2.3.1. Anlisis exploratorio de datos. ................................................................................. 7 2.4. ANLISIS MULTIVARIADO. ............................................................................................... 8 2.4.1. Anlisis Factorial (AF). ............................................................................................ 8 2.4.2. Anlisis de componentes principales (ACP). ......................................................... 10 2.4.2.1. Componentes principales de la poblacin........................................................... 10 2.4.3. Anlisis Cluster (AC). ......................................................................................... 12 2.4.4. Anlisis de correspondencias simples (ACS). .................................................... 13
III RESULTADO Y DISCUSION ................................................................................... 13 3.1 ANLISIS EXPLORATORIO DE DATOS. ......................................................................... 16 3.2 ANLISIS UNIVARIADO. .............................................................................................. 17

3.2.2. Invierno 2009. ......................................................................................................... 19 3.2.3. Invierno 2010. ......................................................................................................... 20 3.2.4. Verano 2008-2009. ................................................................................................. 22 3.2.5. Verano 2009-2010. ................................................................................................. 23 3.3 REVISIN Y SELECCIN DE VARIABLES. ...................................................................... 25 3.3.1. Asociacin de las variables por temporada. .......................................................... 25 3.4 ANLISIS MULTIVARIADO. ......................................................................................... 26 3.4.1. Anlisis Clster No Jerarquico. ............................................................................. 27 3.4.2. Anlisis Componentes Principales. ........................................................................ 27 3.4.2.1. Anlisis Componentes Principales Temporada de Invierno ............................... 27 3.4.2.2. Anlisis Componentes Principales Temporada de Verano ................................. 30 3.4.3. Anlisis Clster Jerrquico. ................................................................................... 32 3.4.3.1. Anlisis Clster Temporada Invierno. ................................................................ 33 3.4.3.2. Anlisis Clster Temporada Verano. .................................................................. 34 3.4.3. Anlisis de la Varianza. .......................................................................................... 35 3.4.3.1. ANOVA de componentes Temporada Invierno.................................................... 35 3.4.3.2. ANOVA de componentes Temporada Verano. .................................................... 36 3.4.4. Descripcin de los grupos resultantes. .................................................................. 36
IV CONCLUSIONES ................................................................................................. 36 V BIBLIOGRAFIA .................................................................................................... 39

vi INDICE DE TABLAS

TABLA N

PAGINA

En el texto

Tabla 1. Fecha (mes) de inicio y termino de cada temporada de cosecha. ................................. 5 Tabla 2. Nombre y definicin de cada variable de la lnea de produccin a analizar. ............... 6 Tabla 3. Nombre y definicin de cada variable de la EMSEFOR a analizar. ............................ 6 Tabla 4. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2008.......... 15 Tabla 5. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2009.......... 17 Tabla 6. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2010.......... 18 Tabla 7. Estadsticos Descriptivos para la variable Vol HH Temporada Verano 2008-2009. . 20 Tabla 8. Estadsticos Descriptivos para la variable Vol HH Temporada Verano 2009-2010. . 22 Tabla 9. Matriz de correlaciones de las variables en anlisis Temporada de Invierno. ........... 23 Tabla 10. Matriz de correlaciones de las variables en anlisis Temporada de Verano. ........... 23 Tabla 11. Categoras para el Volumen por rbol para temporada de invierno. ........................ 24 Tabla 12. Categoras para el Volumen por rbol para temporada de verano. .......................... 25 Tabla 13. Varianza total explicada de las variables temporada de invierno............................. 25 Tabla 14. Matriz de Componentes rotados para las variables temporada de invierno. ............ 26 Tabla 15. Resumen de variables sintticas para la temporada de Invierno. ............................. 27 Tabla 16. Varianza total explicada de las variables temporada de verano. .............................. 28 Tabla 17. Matriz de Componentes rotados para las variables temporada de verano. ............... 28 Tabla 18. Resumen de variables sintticas para la temporada de verano. ................................ 29 Tabla 19. ANOVA entre grupos para la temporada de invierno. ............................................. 32 Tabla 20. ANOVA entre grupos para la temporada de verano. ............................................... 33

vii INDICE DE FIGURAS

FIGURA N

PAGINA

En el texto

Figura 1. Diagrama de caja Volumen HH por temporada. ....................................................... 14 Figura 2. Histograma de frecuencia Volumen HH temporada Invierno 2008.......................... 16 Figura 3. Histograma de frecuencia Volumen HH temporada Invierno 2009.......................... 17 Figura 4. Histograma de frecuencia Volumen HH temporada Invierno 2010.......................... 19 Figura 5. Histograma de frecuencia Volumen HH temporada Verano 2008-2009. ................. 21 Figura 6. Histograma de frecuencia Volumen HH temporada Verano 2009-2010. ................. 22 Figura 7. Grafico de componentes en espacio rotado temporada invierno. ............................. 27 Figura 8. Grafico de componentes en espacio rotado temporada invierno. ............................. 30 Figura 9. Dendograma de vinculacin media entre grupos temporada invierno. ..................... 31 Figura 10. Dendrograma de vinculacin media entre grupos temporada verano. .................... 32

I INTRODUCCION

La cosecha forestal es el proceso en el cual se talan los rboles adultos mediante la utilizacin de tcnicas establecidas, aplicadas por personal capacitado, con la finalidad de extraer y hacer llegar a destino la madera en las condiciones que la industria establece. De acuerdo al producto final que se desee comercializar, los bosques de pino son cosechados entre los 18 y 20 para la industria de la celulosa; entre los 20 y 25 aos cuando se desea obtener madera aserrable, y entre los 25 y 30 aos para la exportacin de trozos de madera.

Segn las condiciones topogrficas, la labor de cosecha es realizada por los equipos ms apropiados para tales condiciones. Existen los sistemas terrestres a) Sistema de cosecha en pendientes entre 0% y 30%; para pendientes hasta 15%, se utilizan sistemas altamente mecanizados (cortadora-procesadora, skidder grapple o forwarder); y en pendientes entre 15% y 30% principalmente el sistema mecanizado tradicional (skidder winche, motosierras). b) Sistemas de cosecha area, para pendientes entre 30% y 60%, se utilizan torres de madereo. (Carey et al. 2007).

El skidder, emergi a mediados de los aos setenta, como respuesta a la sentida necesidad de la industria forestal de disponer de una maquinaria con altos niveles de productividad, bajo costo por unidad producida y capaz de realizar labores de extraccin en el bosque a mayor velocidad sobre terrenos razonablemente difciles (Abarzua 2000).

De las empresas forestales en Chile, empresas ARAUCO es la ms importante, situndose entre las compaas forestales ms grandes de Amrica Latina y a nivel mundial entre las cuarenta principales. En nuestro pas tiene un patrimonio de un milln de hectreas, distribuidas en sus filiales Forestal CELCO S.A (FCSA) con 520 mil hectreas, que representa un 52% del total, Bosques Arauco S.A. (BASA) con 280 mil hectreas, que representa un 28% del total y Forestal Valdivia (FVSA) con 210 mil hectreas que representa el 21% del total.

2 Anualmente en Chile se cosechan aproximadamente cuarenta millones de metros cbicos de madera, de los cuales cerca del 67% corresponde a la especie pinus radiata (INFOR 2009). Bosque Arauco cosecha anualmente cerca de dos millones ochocientos mil metros cbicos de esta especie, de las cuales el 21% es extrado a travs del mtodo tradicional con Skidder Grapple. (empresas Arauco 2011).

El proceso de cosecha se ha venido desarrollando normalmente por las empresas de servicios Forestales (EMSEFOR), mediante la figura de subcontratistas. Este tipo de empresas han notado un aumento en su cantidad durante los ltimos aos, debido a que las grandes empresas dueas del patrimonio forestal tienden con mayor frecuencia a contratar a terceros las labores en reas silviculturales, medio ambiente, evaluacin de recursos, anlisis, cosecha y transporte. (Rioseco 2003).

En Chile, existen alrededor de 200 EMSEFOR encargadas de la silvicultura y el raleo con una fuerza laboral de aproximadamente 10.300 trabajadores, en el rea de caminos existen unas 120 empresas con unos 2400 trabajadores, cerca de 170 empresas trabajan en cosecha con 8.800 trabajadores y en transporte unas 240 empresas con una fuerza laboral de 5.300 personas. En total existen aproximadamente 930 EMSEFORES con un capital humano directo de alrededor de 32.000 personas a lo largo del pais.

Dado el elevado nivel tecnolgico, las nuevas y diversas formas de acceso a la informacin y una competitividad que va en aumento, ha obligado a las empresas a adoptar mayor y mejor tecnologa y a reacomodar su organizacin, con la finalidad de hacer ms competitivo sus procesos productivos y cumplir con los altos estndares requeridos en temas de seguridad, salud ocupacional, respeto medioambiental y desarrollo social, que son impuestos por las empresas contratantes (Velasquez 2008). Vilaboa (2004) indica que en los ltimos aos, las plantas industriales Chilenas vienen automatizando sus procesos de produccin, lo que se justifica principalmente, en el alza sostenida de los salarios industriales. Sin embargo, tanto o ms importante es la puesta en el mercado de tecnologas de reciente desarrollo y bajo costo.

Dependiendo de la naturaleza del servicio, muchas EMSEFORES no han podido avanzar a la par con los acelerados cambios que ha vivido el sector, haciendo que estas pierdan competitividad frente a aquellas que si han logrado adaptarse. La nica forma en que este tipo de empresas puedan seguir este ritmo es generando cambios decisivos, rediseando sus procesos productivos y configuraciones de forma rpida y radical, para lograr un mejoramiento significativo en su rendimiento (Manganelli et al. 2004).

La cosecha forestal es una de las actividades forestales que presenta mayor variabilidad debido a que est constituido por diversas etapas, entre ellas el volteo, desrame, estrobado, trozado y arrumado de los fustes en cancha o bosque, y cada una de ellas presenta diferentes niveles de mecanizacin, pero por lo general incluyen mquinas que requieren mano de obra intensiva (Apud et al. 1999). En cada una de estas etapas deben interactuar un determinado nmero de personas para el trabajo en equipo, ah cada trabajador es parte de una cadena que se inicia con el volteo del rbol y termina con los trozos transportados a las plantas procesadoras.

La mayora de los problemas por los que se ve mermada la produccin o rendimiento de una organizacin, son multidimensionales, por eso que cualquier actividad empresarial se puede describir de acuerdo a la significancia de diversas variables con las que interacta. Por ello que es necesario estudiar todos los factores que influyen o podran influir, de una manera simultnea (Herrera 2010). Una manera de poder relacionar este conjunto de caractersticas con el rendimiento son los anlisis estadsticos, ms especficamente las denominadas tcnicas multivariantes o multivariables, estas son un conjunto de mtodos estadsticos que permiten el anlisis de forma simultnea de dos o ms variables observadas en una investigacin financiera y comercial (Herrera 2010). Muchas de las empresas forestales demandantes han realizado estudios con el fin de evaluar la excelencia operacional de las EMSEFOR, tanto para medir rendimientos de maquinarias, determinar puntos crticos en los procesos productivos, viabilidad en la aplicacin de nuevas

4 tcnicas y modificacin en la estructura de ciertos procesos. Todo tendiente a generar un criterio lgico de trabajo, de seleccin y redistribucin con el fin de maximizar la produccin.

El objetivo de este estudio fue agrupar aquellas lneas de produccin que contengan caractersticas similares, y determinar que variables discriminan con mayor fuerza el nivel de produccin entre cuadrillas que realicen cosecha forestal de Pino radiata en una determinada temporada, con el fin de abarcar de forma amplia las diferentes tcnicas de anlisis multivariantes disponibles.

II METODOLOGIA 2.1 Consideraciones Generales

Para agrupar las cuadrillas y determinar aquellos factores cualitativos que caracterizan a las lneas de produccin con mayor rendimiento (Volumen M3 HH-1), se sigui los mtodos de anlisis sugeridos por Cabrera et al (2004) que ms se acomodaron a la informacin tabulada por las EMSEFOR para las temporadas de Invierno y Verano. Para determinar la produccin de una cuadrilla se utilizo como variable M 3 HH-1, conformada por el cociente entre el Volumen (M3) notificado diariamente por una lnea de produccin a orilla del camino y la sumatoria de las horas efectivas trabajadas por la cuadrilla en el mismo da de notificacin.

Se utilizaron tres bases de datos, la primera con informacin de cosecha y raleo forestal durante dos aos (tabla 1).

Tabla 1. Fecha (mes) de inicio y termino de cada temporada de cosecha.


Fecha Desde Hasta Periodo

01/08/2008 01/12/2008 04/05/2009 01/12/2009 06/05/2010

29/11/2008 30/04/2009 30/11/2009 26/04/2010 28/07/2010

Invierno 2008 Verano 2008-2009 Invierno 2009 Verano 2009-2010 Invierno 2010

La segunda base de datos posee registros especficos de las maquinarias y sus operarios. La informacin corresponde a los datos del equipo principal de madereo, segn corresponda las variables son las mismas para cada maquinaria asociada a dicho equipo, a esta configuracin se le denominar sigla, este nombre es aplicado por la empresa para identificar a cada lnea de produccin.

6 Tabla 2. Nombre y definicin de cada variable de la sigla a analizar.


Variable Marca Procedencia Motor Ao Hrs Da Edad Operario Escolaridad operario Experiencia Operario Definicin Marca equipo principal Pas de origen equipo principal Marca motor equipo principal Ao adquisicin maquinaria Prom. uso maquinaria al da (hrs) Edad operario equipo p. (aos) Escolaridad operario equipo p. Experiencia oper. equipo p. (aos) Valores 1 (Tigercat), 2 (Caterpillar) 1 (Canad), 2 (U.S.A) 1 (Cummins), 2 (Caterpillar) 1 (2003), 2 (2004), 3 (2005), 4 (2007) 1 (9-10), 2 (7-8) 1 (+50), 2 (40-50), 3 (30-40) 1 (Bsica Incomp.), 2 (Bsica Comp.) 1 (<1), 2 (1-4), 3 (>5)

La tercera base de datos posee informacin sobre las EMSEFOR capital financiero y capital humano. Estos registros nos ayudan a vislumbrar el tamao de la empresa de servicio y el nivel educacional alcanzado las jefaturas de la organizacin.

Tabla 3. Nombre y definicin de cada variable de la EMSEFOR a analizar.


Variable N Trabajadores Profesionales Definicin Cantidad trabajadores EMSEFOR Presencia Profesionales en Jefaturas Valores 1 (<60), 2 (60-120), 3 (>120) 1 (Si), 2 (No)

En general se consolido una base de datos con mil trescientos cincuenta y cinco informes de produccin pertenecientes a las empresas de servicios forestales de la zona costera del sur de la regin del Bio Bio. Esta informacin proviene del Sistema de Informacin Patrimonial (SIP) perteneciente a Bosques Arauco S.A. (BASA).

2.2 Preparacin de datos 2.2.1. Informacin de Produccin. La base de datos de cosecha y raleo contiene dos tipos de informacin. El primero es la produccin diaria de una sigla en un determinado predio, lo cual es lo usual de la base; y el segundo proveniente de ajustes mensuales que corresponden a volmenes cosechados pero no notificados en un determinado mes. Este ltimo tipo de datos es inusual y generalmente

7 corresponde a grandes volmenes extrados sin datos adicionales. Esta informacin provoca gran distorsin, asignando altos rendimientos sin haberse efectuado labores de cosecha.

Cmo fue posible identificar en su gran mayora aquella informacin proveniente de ajustes mensuales, se procedi a eliminarla de la base de datos y el volumen notificado se prorrate por jornada de acuerdo a las horas efectivas trabajadas en el mismo mes. Se determin calcular la mediana del Volumen M3 HH-1 para cada lnea de produccin, en un determinado tipo de bosque a fin de obtener un dato nico de analisis, Alvarado (2010) indica que la mediana es un estadstico ms robusto ante la presencia de valores extremos (outliers) en la media.

2.2.2. Informacin Silvcola. La informacin tabulada esta relacionada con un predio que contiene datos especficos de Volumen por rbol (M3 rbol-1), Densidad de plantacin (rbol hectarea-1) y Volumen por hectrea (M3 hectarea-1).

Esta informacin presenta gran distorsin debido a que una gran parte de dicha informacin del predio corresponde al promedio de los rodales que la componen. En total cerca de un tercio de la informacin silvcola no es coherente entre s.

Se determin calcular un valor nico para cada dato silvcola, es por ello que se calculo la mediana del Volumen por rbol (M3 rbol-1), Densidad de plantacin (rbol hectarea-1) y Volumen por hectrea (M3 hectarea-1).

2.3 Anlisis Univariado. 2.3.1. Anlisis exploratorio de datos. Luego del prorrateo de los volmenes notificadas en los ajustes mensuales (punto 2.2.1), se realizo un anlisis exploratorio de los datos por cada periodo con la finalidad de obtener una visin numrica y grafica de la informacin en su conjunto.

8 Miranda-Salas et al (2003), seala que al analizar una serie de datos, la primera etapa que se debe realizar es visualizar su distribucin y calcular las estadsticas bsicas, adems indica que al analizar modelos de productividad forestal, previo a todos los anlisis que se deseen realizar, se debe verificar los supuestos relacionados con una distribucin normal, y continuar con el clculo de las estadsticas descriptivas como media, mnimo, mximo, varianza, desviacin estndar entre otros datos.

2.4. Anlisis Multivariado. 2.4.1. Anlisis Factorial (AF). En muchos estudios, se tabula y recopila una enorme cantidad de informacin y/o variables para luego del anlisis tratar de explicar un fenmeno o acontecimiento. En algunos de estos casos gran parte del mismo fenmeno es explicado por un nmero reducido de informacin.

El AF permite sintetizar la informacin recogida en un determinado experimento con un nmero reducido de nuevas variables a las que llamaremos factores o componentes. Es decir, es una tcnica estadstica, que intenta explicar un fenmeno o suceso a partir de la informacin almacenada en una matriz de datos con n individuos y K variables a travs de W factores, cumpliendo con W < K.

El AF supone que existe una proporcin de la varianza que es explicada por los factores comunes en una variable, el cual es denominado comunalidad, esta es explicada por factores que son comunes y no observables, y otra parte que es especfica de cada variable que se denomina factor nico. Esta asume que estos ltimos factores son independientes entre s.

El anlisis factorial presenta un modelo matemtico similar al de la regresin mltiple. Es decir cada variable es expresada como una combinacin lineal de factores que no se observa directamente.

Donde:

9 = Puntuacin individuo i en la variable j. = Coeficientes factoriales. = Puntuaciones factoriales. = Factor nico de cada variable.

Asumimos que dichos factores nicos no se encuentran correlacionados entre si ni tampoco con los factores comunes.

En AF se deben cumplir dos condiciones: 1. Parsimonia e 2. Interpretabilidad,

Que indican que por un lado todo fenmeno debera explicarse con un nmero reducido de elementos, Por otro lado dichos elementos deben ser susceptibles de una interpretacin sustantiva. Es decir un buen trabajo factorial dara como resultado elementos sencillos e interpretables.

Como fases del Anlisis Factorial podemos distinguir:

1) La seleccin de las variables explicativas. 2) Estudio y anlisis de la matriz de correlaciones de todas las variables que componen los datos originales. 3) Extraccin de los factores comunes. 4) Rotacin de los factores con el objeto de facilitar su interpretacin (si fuese necesario). 5) Representaciones grficas. 6) Clculo de las puntuaciones factoriales para cada individuo.

10 2.4.2. Anlisis de componentes principales (ACP). La finalidad de los componentes principales es explicar la estructura de varianza-covarianza en un reducido nmero de combinaciones lineales de las variables originales. Entre sus objetivos principales encontramos:

Reduccin de datos Interpretacin de los datos reducidos

Generalmente son necesarios p componentes para explicar la variabilidad del sistema, gran parte de esta variabilidad puede ser explicada con una pequea cantidad, k, de los componentes principales.

Por ello se indica que existe tanta informacin reunida en los k componentes como la existente en las p variables. Entonces los k componentes principales reemplazaran las p variables inciales, y el grupo de variables originales con sus n medidas de las p variables es disminuido a otro grupo que se compone de n medidas de k componentes principales.

Generalmente el ACP muestra relaciones entre las variables que en un principio no se vislumbraban o no eran notorias, y por ello este anlisis permite una nueva interpretacin de la informacin de la que se dispone.

2.4.2.1. Componentes principales de la poblacin. Por un lado en trminos algebraicos los Componentes Principales (CP) son combinaciones lineales de p variables aleatorias X1, X2, Xp. Por otro lado en trminos geomtricos las mismas combinaciones lineales son una representacin de la seleccin de un nuevo sistema de coordenadas que surge de la rotacin del sistema original de los ejes de las coordenadas.

11 Obtenidos estos nuevos ejes, nos ayudan a identificar aquellas direcciones en la que se encuentra la mayor variabilidad y nos entrega informacin simplificada de cmo est estructurada la covarianza.

Los CP dependen de la matriz de covarianza S o de la matriz de correlacin r de X1, X2, Xp. Por un lado este anlisis no requiere que se cumpla con el supuesto de normalidad multivariada de los datos. Por otro lado, los CP que se derivan de las poblaciones normales multivariadas son tiles para interpretar los componentes mustrales. Sea el vector aleatorio XT=(X1, X2,..., Xp) que tiene una matriz de covarianza S con valores propios Se deben considerar las combinaciones lineales.

. . .

Por otro lado sabemos que:

Los CP son las combinaciones lineales correspondiente sean la ms grande posible.

, , ,

que sus varianzas en la ecuacin

Nuestro primer CP es la combinacin lineal con mxima varianza. Es decir, se maximiza Var(Y1) = siendo esta aumentada multiplicando algn por alguna constante.

Para eliminar dicha indeterminacin, es necesario restringir nuestra atencin solo a los coeficientes de los vectores unitarios.

12

Por lo tanto, definimos:

i.

El primer CP igual a la combinacin lineal 1.

que maximiza Var(

sujeto a que

ii.

El segundo CP igual a la combinacin lineal que y la . . . .

que maximiza Var(

sujeto a

n. (

El i-simo componente principal igual a la combinacin lineal ) sujeto a que y la

que maximiza

2.4.3. Anlisis Cluster (AC). Para agrupar aquellas siglas por niveles de produccin se realizo el anlisis Cluster o tambin llamado anlisis de conglomerados. Esta es una tcnica estadstica multivariante cuya objetivo es clasificar, agrupar o conglomerar en nuestro caso los diferentes niveles de produccin con respecto a las horas hombre trabajadas, de este modo cada individuo que integre cada grupo obtenido sean altamente similares entre s (grupos internamente homogeneos) y muy diferentes entre grupos (heterogeneidad entre grupos).

Se calculan las distancias entre las observaciones en una nube con dimensin igual al nmero de variables, donde se procede a unir los puntos ms cercanos en un clster o conglomerado. Luego, se unen otros clster, lo cual da como resultado una jerarqua de conglomerados. Para calcular dichas distancias se utilizo la distancia eucladiana con variables estandarizadas ya que en este caso trabajaremos con valores y no con frecuencias, esta distancia est definida por:

)(

13 Donde:

= Vector asociado a la observacin i, que contiene los n valores de los n componentes principales. = Vector asociado a la observacin j, que contiene los n valores de los n componentes principales. = Varianza asociada al k-esimo componente principal.

Como resultado final se obtiene un dendograma de conglomeracin en el cual se puede identificar los grupos que se originan para cada variable en anlisis, y con ello determinar el nmero de grupos necesarios para el anlisis.

2.4.4. Anlisis de regresin Logistica multinomial (R.L.M). 2.4.4.1.El modelo. La regresin logstica se utiliza para describir la relacin entre una variable categrica denominado de respuesta, en nuestro caso politomica, con un conjunto de variables ya sean categricas y/o cuantitativas. Sea x un vector constituido por p variables independientes, esto es, x=(x1, x2,, xp). en nuestro caso la variable de respuesta es la categora de produccin la cual presenta 3 categoras. Si definimos al tercil mas bajo de produccin como referencia, los logits generalizados van a comparar los otros dos tercios con el de referencia. Asignando Y=0 al primer tercil de produccin, Y=1 segundo tercil de produccin y finalmente Y=2 al tercer tercil de produccin, las dos funciones logit se expresan como sigue:

( ( Donde:

) )

14 es la constante del modelo o termino independiente. p el nmero de covariables. los coeficientes de las covariables. las covariables que forman parte del modelo.

Para valores de las covariables x, la probabilidad condicional de que la variable y tome el valor j (para j=1,2). Para la categora de referencia es Si existen variables independientes discretas con k niveles se debe incluir en el modelo como un conjunto de k-1 variables dummy. El cociente de las probabilidades que corresponden a dos niveles de la variable de respuesta (categora j versus categora de referencia) se denomina odds y se expresa como:

Aplicando logaritmo natural, obtenemos los logits generalizados

2.4.4.2.Estimacin y significacin de los coeficientes del modelo Una muestra con n observaciones independientes de pares (xi, yi) para i=1,2,,n. nuestro objetivo es determinar el vector de parmetros a travs del mtodo de Maxima Verosimilitud.

15 Las ecuaciones a resolver son obtenidas al derivar la funcin de verosimilitud respecto a cada parmetros del modelo e igualando a cero. L as soluciones de estas ecuaciones son los estimadores mximo verosmiles de cada uno de los componentes del vector de parmetros. Asimismo, de acuerdo al mtodo de estimacin por mxima verosimilitud, los estimadores de las variancias y covariancias se obtienen a partir de las derivadas parciales segundas de la funcin de verosimilitud.

Para comprobar la significacin estadstica de cada uno de los coeficientes de regresin en el modelo se puede utilizar, entre otros, el test de Wald y el test de razn de verosimilitudes. 2.4.3. Interpretacin de los coeficientes estimados Los jk estimados representan tasa de cambio de una funcin de la variable dependiente y por unidad de cambio de la variable independiente xk. El coeficiente ik expresa el cambio resultante en la escala de medida de la variable y para un cambio unitario de la variable xk. Por ejemplo, para la variable Xk, j1 = g(xk+1) g(xk) representa el cambio en el logit, correspondiente a la categora Y=j versus la categora de referencia Y=0, frente a un incremento de una unidad en la variable Xk. La interpretacin se hace en trminos de la razn de Odds (OR).
jk j j jk k p p j j jk k jp p

e e e PY PYj PY PYj OR x x x
xxx ... ... ... ( 1) ... k k k k
011 011

(0/x) (/x) ( 0 / x 1) ( / x 1)
C. Beltrn - Aplicacin del anlisis de regresin logstica multinomial en la clasificacin de textos acadmicos: Biometra, Filosofa y Lingstica informtica.

16
60

2.4.4. Seleccin de variables Una cuestin importante en este tipo de anlisis es determinar si todas las variables consideradas en la funcin de discriminante contienen informacin til y si solamente algunas de ellas son suficientes para diferenciar los grupos (en este caso las disciplinas). Dado que las variables utilizadas para explicar la respuesta es probable que estn correlacionadas, es posible tambin que compartan informacin. Por lo tanto, se puede buscar un subgrupo de variables mediante algn criterio de modo tal que las variables excluidas no contengan ninguna informacin adicional. Existen varios algoritmos de seleccin de variables, entre ellos podemos citar: Mtodo forward: comienza por seleccionar la variable ms importante y contina seleccionando las variables ms importantes una por vez, usando un criterio bien definido. Uno de estos criterios involucra el logro de un nivel de significacin deseado pre-establecido. El proceso termina cuando ninguna de las variables restantes encuentra el criterio pre-especificado. Mtodo backward: comienza con el modelo ms grande posible. En cada paso descarta la variable menos importante, una por vez, usando un criterio similar a la seleccin forward. Contina hasta que ninguna de las variables pueda ser descartada. Seleccin paso a paso: combina los dos procedimientos anteriores. En un paso, una variable puede entrar o salir desde la lista de variables importantes, de acuerdo a algn criterio preestablecido. 2.4.5. Bondad de ajuste del modelo: En este trabajo se utiliz como evaluacin del ajuste del modelo la estadstica del cociente o razn de verosimilitud. La ausencia de significacin de la misma indica un buen ajuste del modelo. Otra medida que permite evaluar el modelo cuando es utilizado para clasificar unidades en dos

grupos es la tasa de error estimada por validacin cruzada.


III RESULTADO Y DISCUSION 3.1 Anlisis Exploratorio de Datos.

El diagrama de cajas nos permiti comparar el Volumen HH de las diferentes temporadas a travs de los valores resumen: mediana, primer y tercer cuartil (percentiles 25 y 75), y valores mnimo y mximo. Se encontraron 22 datos atpicos los cuales fueron obviados en el anlisis por escapar de la usualidad de los datos.

17

Figura 1. Diagrama de caja Volumen HH por temporada. 3.2 Anlisis Univariado. Para la temporada de invierno 2008, se obtuvieron 170 casos, el volumen mnimo de cosecha fue 3,7962 m3/HH, mientras que el valor mximo para la misma temporada fue 14,8736 m3/HH. La media fue 8,3729 m3/HH lo que corresponde al promedio de los 170 volmenes cosechados en esta temporada. La mediana fue 7,9704 m3/HH lo cual indica que la mitad de los volmenes cosechados es superior a este valor y la otra mitad es inferior al mismo valor.

El intervalo de confianza para la media el cual con un 95% de confianza indica que el valor de la media, 8,3729 m3/HH, se encuentra entre 7,9942 m3/HH y 8,7517 m3/HH, es decir que con un 95% de confianza se supone que la media o el valor promedio de las calificaciones se encontrara en el rango de [7,9942; 8,7517] m3/HH.

18 La desviacin estndar de la media 2,5016 m3/HH muestra la variabilidad de los datos con respecto a la media, es decir los volmenes de cosecha en el periodo Invierno 2008 varan de su media en un promedio de 2,5016 m3/HH, como se aprecia en la figura xxxx El valor de la varianza es 6,258 m3/HH, esto indica la variedad de los datos la cual tiene un valor considerable debido a la diversidad de los volmenes cosechados.

Tabla 4. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2008.


Temporada Vol_HH inv08 Media Intervalo de confianza para la media al 95% Mediana Varianza Desv. tp. Mnimo Mximo Lmite inferior Lmite superior Estadstico 8,372967160 7,994203146 8,751731174 7,970490000 6,258 2,5016348820 3,7962987 14,8736550 Error tp. ,1918666369

19 Figura 2. Histograma Volumen HH temporada Invierno 2008.

3.2.2. Invierno 2009. Se obtuvieron 600 casos, el volumen mnimo de cosecha fue 2,1659 m3/HH, mientras que el valor mximo para la misma temporada fue 11,6632 m3/HH. La media fue 6,4935 m3/HH lo que corresponde al promedio de los 600 volmenes cosechados en esta temporada. La mediana fue 6,4387 m3/HH lo cual indica que la mitad de los volmenes cosechados es superior a este valor y la otra mitad es inferior al mismo valor.

El intervalo de confianza para la media el cual con un 95% de confianza indica que el valor de la media, 6,4935 m3/HH, se encuentra entre 2,1659 m3/HH y 11,6632 m3/HH, es decir que con un 95% de confianza se supone que la media o el valor promedio de las calificaciones se encontrara en el rango de [2,1659; 11,6632] m3/HH. La desviacin estndar de la media 1,9013 m3/HH muestra la variabilidad de los datos con respecto a la media, es decir los volmenes de cosecha en el periodo Invierno 2009 varan de su media en un promedio de 1,9013 m3/HH, como se aprecia en la figura xxxx El valor de la varianza es 3,615 m3/HH, esto indica la variedad de los datos la cual tiene un valor considerable debido a la diversidad de los volmenes cosechados.

Tabla 5. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2009.


Temporada inv09 Media Intervalo de confianza para la media al 95% Mediana Lmite inferior Lmite superior Estadstico 6,493545624 6,341104255 6,645986993 6,438783300 Error tp. ,0776204827

20

Varianza Desv. tp. Mnimo Mximo

3,615 1,9013057617 2,1659327 11,6632270

Figura 3. Histograma Volumen HH temporada Invierno 2009. 3.2.3. Invierno 2010. Se obtuvieron 25 casos, el volumen mnimo de cosecha fue 3,2435 m3/HH, mientras que el valor mximo para la misma temporada fue 7,7787 m3/HH. La media fue 5,4070 m3/HH lo que corresponde al promedio de los 25 volmenes cosechados en esta temporada. La mediana fue 5,6388 m3/HH lo cual indica que la mitad de los volmenes cosechados es superior a este valor y la otra mitad es inferior al mismo valor.

El intervalo de confianza para la media el cual con un 95% de confianza indica que el valor de la media, 5,4070 m3/HH, se encuentra entre 3,2435 m3/HH y 7,7787 m3/HH, es decir que con

21 un 95% de confianza se supone que la media o el valor promedio de las calificaciones se encontrara en el rango de [3,2435; 7,7787] m3/HH. La desviacin estndar de la media 1,3744 m3/HH muestra la variabilidad de los datos con respecto a la media, es decir los volmenes de cosecha en el periodo Invierno 2010 varan de su media en un promedio de 1,3744 m3/HH, como se aprecia en la figura xxxx El valor de la varianza es 1,889 m3/HH, esto indica la variedad de los datos la cual tiene un valor considerable debido a la diversidad de los volmenes cosechados.

Tabla 6. Estadsticos Descriptivos para la variable Vol HH Temporada Invierno 2010.


Temporada inv10 Media Intervalo de confianza para la media al 95% Mediana Varianza Desv. tp. Mnimo Mximo Lmite inferior Lmite superior Estadstico 5,407045656 4,839707968 5,974383344 5,638889000 1,889 1,3744321028 3,2435327 7,7787304 Error tp. ,2748864206

22 Figura 4. Histograma Volumen HH temporada Invierno 2010.

3.2.4. Verano 2008-2009. Se obtuvieron 463 casos, el volumen mnimo de cosecha fue 2,6069 m3/HH, mientras que el valor mximo para la misma temporada fue 11,3216 m3/HH. La media fue 8,3729 m3/HH lo que corresponde al promedio de los 463 volmenes cosechados en esta temporada. La mediana fue 6,4308 m3/HH lo cual indica que la mitad de los volmenes cosechados es superior a este valor y la otra mitad es inferior al mismo valor.

El intervalo de confianza para la media el cual con un 95% de confianza indica que el valor de la media, 6,4308 m3/HH, se encuentra entre 6,2703 m3/HH y 6,5913 m3/HH, es decir que con un 95% de confianza se supone que la media o el valor promedio de las calificaciones se encontrara en el rango de [6,2703; 6,5913] m3/HH. La desviacin estndar de la media 1,7574 m3/HH muestra la variabilidad de los datos con respecto a la media, es decir los volmenes de cosecha en el periodo Verano 2008-2009 varan de su media en un promedio de 1,7574 m3/HH, como se aprecia en la figura xxxx El valor de la varianza es 3,089 m3/HH, esto indica la variedad de los datos la cual tiene un valor considerable debido a la diversidad de los volmenes cosechados.

Tabla 7. Estadsticos Descriptivos para la variable Vol HH Temporada Verano 2008-2009.


Temporada ver08-09 Media Intervalo de confianza para la media al 95% Lmite inferior Lmite superior Estadstico 6,430817445 6,270316799 6,591318091 Error tp. ,0816750621

23

Mediana Varianza Desv. tp. Mnimo Mximo

6,337959000 3,089 1,7574378223 2,6069570 11,3216670

Figura 5. Histograma Volumen HH temporada Verano 2008-2009.

3.2.5. Verano 2009-2010. Se obtuvieron 75 casos, el volumen mnimo de cosecha fue 1,9607 m3/HH, mientras que el valor mximo para la misma temporada fue 9,9555 m3/HH. La media fue 5,8004 m3/HH lo que corresponde al promedio de los 75 volmenes cosechados en esta temporada. La mediana fue 5,8017 m3/HH lo cual indica que la mitad de los volmenes cosechados es superior a este valor y la otra mitad es inferior al mismo valor.

24 El intervalo de confianza para la media el cual con un 95% de confianza indica que el valor de la media, 5,8004 m3/HH, se encuentra entre 5,3737 m3/HH y 6,2271 m3/HH, es decir que con un 95% de confianza se supone que la media o el valor promedio de las calificaciones se encontrara en el rango de [5,3737; 6,2271] m3/HH. La desviacin estndar de la media 1,8544 m3/HH muestra la variabilidad de los datos con respecto a la media, es decir los volmenes de cosecha en el periodo Verano 2009-2010 varan de su media en un promedio de 1,8544 m3/HH, como se aprecia en la figura xxxx El valor de la varianza es 3,439 m3/HH, esto indica la variedad de los datos la cual tiene un valor considerable debido a la diversidad de los volmenes cosechados.

Tabla 8. Estadsticos Descriptivos para la variable Vol HH Temporada Verano 2009-2010.


Temporada ver09-10 Media Intervalo de confianza para la media al 95% Mediana Varianza Desv. tp. Mnimo Mximo Lmite inferior Lmite superior Estadstico 5,800446121 5,373772440 6,227119803 5,801745400 3,439 1,8544651511 1,9607029 9,9555560 Error tp. ,2141351908

25

Figura 6. Histograma Volumen HH temporada Verano 2009-2010. 3.3 Revisin y Seleccin de variables. 3.3.1. Asociacin de las variables por temporada. Se analizo el grado de asociacin entre cada par de variables, se aplico la matriz de correlacin total para las variable conjuntas de cada temporada en este caso Invierno. Esta matriz establece el grado de asociacin mutua existente entre dos variables. Cuando nos enfrentamos a dos variables con alta correlacin se opta por una de ellas. Como se observa en la tabla xxx la variable: M3arb representa a las variables Mediana Densidad y Mediana M3/ha. Marca representa a las variables Procedencia y Motor. Procedencia representa a la variable Motor Ao representa a las variables Hrs da, Experiencia operador y N Trabajadores. Horas da representa a las variables Experiencia operador y N Trabajadores. Edad Operador representa a la variable Escolaridad operador. Experiencia Operador representa a la variable N Trabajador.

Tabla 9. Matriz de correlaciones de las variables en anlisis Temporada de Invierno.

26

M3arb M3arb Mediana Dens Mediana M3/ha Marca Proced. Motor Ao Hrs dia Edad Oper. Escol. Oper. Experien. Oper N Trabaj. Profes.
1

Mediana Mediana Marca Proced. Motor Dens M3/ha

Ao

Hrs dia

Edad Escol. Exper. N Profes. Oper. Oper. Oper. Trabaj.

-0,540 0,525
0,405 0,405 0,405 -0,135 0,252 0,063 0,165 0,232 0,165
a

1 0,184 -0,207 -0,207 -0,207 -0,195 0,116 -0,010 -0,009 0,112 0,176
a

1 0,279 0,279 0,279 -0,145 0,225 0,060 0,138 0,214 0,171


a

1,000 1,000
0,082 0,261 -0,172 -0,012 0,110 -0,073
a

1,000
0,082 0,261 -0,172 -0,012 0,110 -0,073
a

1 0,082 0,261 -0,172 -0,012 0,110 -0,073


a

-0,904
0,045 -0,148

1 -0,119 0,045 1

0,928
0,349 0,229
a

1 0,414 0,358
a

-0,796 -0,946

0,875 0,896

0,938

Se aplico la matriz de correlacin total para las variables de la temporada verano. Como se observa en la tabla xxx las variables: M3arb representa a las variables Mediana Densidad y Mediana M3/ha. Marca representa a las variables Procedencia y Motor. Procedencia representa a la variable Motor Ao representa a las variables Hrs da, Experiencia operador y N Trabajadores. Horas da representa a las variables Experiencia operador y N Trabajadores. Edad Operador representa a la variable Escolaridad operador. Experiencia Operador representa a la variable N Trabajador.

Tabla 10. Matriz de correlaciones de las variables en anlisis Temporada de Verano.


M3arb M3arb Mediana Dens Mediana M3/ha Marca Proced. Motor Ao Hrs dia Edad Oper. Escol. Oper. Experien. Oper N Trabaj. Profes.
1

Mediana Mediana Marca Dens M3/ha


1 -0,171 -0,126 -0,126 -0,126 -0,203 0,246 -0,005 -0,036 0,183 0,166 -0,209 1 0,175 0,175 0,175 -0,034 0,094 0,234 0,273 0,124 0,059 -0,138 1

Proced. Motor

Ao

Hrs dia

Edad Escol. Exper. N . Profes. Oper. Oper. Oper. Trabaj

-0,700 0,631
0,129 0,129 0,129 0,057 -0,079 0,242 0,269 0,058 0,032 0,135

1,000 1,000
0,154 0,171 0,278 0,452 0,148 -0,086 -0,129

1,000
0,154 0,171 0,278 0,452 0,148 -0,086 -0,129

1 0,154 0,171 0,278 0,452 0,148 -0,086 -0,129 1

-0,867
0,205 -0,024

1 -0,062 0,090 1

0,899
0,361 0,075 -0,179

1 0,376 0,212 -0,123 1

-0,685 -0,912
-0,161

0,831 0,839
-0,093

0,886
0,140

1 0,337 1

3.4 Anlisis Multivariado.

27 3.4.1. Anlisis Clster No Jerarquico. Como se observo en la asociacin de variables para ambas temporadas (Invierno y Verano), la variable M3arb explica a las variables Mediana Densidad y Mediana M3/ha, es por ello que se utilizo como nica variable silvcola dentro del anlisis.

El anlisis clster no Jerrquico con algoritmo de K-medias permiti transformar la variable continua M3arb en una variable categrica con 5 niveles o conglomerados homogneos internamente y lo ms alejado o heterogneo entre grupos, con ello se obtuvo los rangos de clasificacin para los niveles de M3arb en las temporadas de Invierno (tabla xxx) y Verano (tabla xxx).

Tabla 11. Categoras para el Volumen por rbol para temporada de invierno.
Categora 1 2 3 4 5 Rangos de M3arb 0,3400 - 0,6900 1,0200 - 1,3525 1,3800 - 1,6576 1,8241 - 2,0200 2,5894 M3arb Bajo Medio Bajo Medio Medio Alto Alto

Tabla 12. Categoras para el Volumen por rbol para temporada de verano.
Categora 1 2 3 4 5 Rangos de M3arb 0,3400 - 0,5100 0,7115 - 0,7664 0,8900 - 1,2500 1,3000 - 1,6576 1,8241 M3arb Bajo Medio Bajo Medio Medio Alto Alto

3.4.2. Anlisis Componentes Principales. 3.4.2.1. Anlisis Componentes Principales Temporada de Invierno

28 Se defini tres factores que explican el 89,9% de la varianza de las siete variables seleccionadas en un principio (tabla xxx). En la tabla xxx es posible visualizar las cargas factoriales de cada una de las variables sobre los tres factores. En la misma tabla se resaltaron aquellas cargas factoriales cuyo valor absoluto es superior a 0,6.

Tabla 13. Varianza total explicada de las variables temporada de invierno.


Sumas de las saturaciones al Comp Autovalores iniciales % de la Total 1 2 3 4 5 6 7 3,005 2,168 1,123 ,622 ,082 1,175E-16 3,591E-17 varianza 42,928 30,968 16,046 8,880 1,177 1,678E-15 5,131E-16 % acumulado 42,928 73,897 89,943 98,823 100,000 100,000 100,000 Total 3,005 2,168 1,123 cuadrado de la extraccin % de la varianza 42,928 30,968 16,046 % acumulado 42,928 73,897 89,943 Total 2,730 2,375 1,190 Suma de las saturaciones al cuadrado de la rotacin % de la varianza 39,006 33,933 17,003 % acumulado 39,006 72,940 89,943

Mtodo de extraccin: Anlisis de Componentes principales.

Tabla 14. Matriz de Componentes rotados para las variables temporada de invierno.
Componente 1 M3arb_Clas Marca Procedencia Ano Hrs_dia Edad_Op Exp_Oper 0,234 0,004 0,004 2 3 0,228 -0,144 -0,144 0,074 -0,117

0,651 0,964 0,964


0,102 0,238 -0,077 0,139

-0,970 0,961
0,007

0,977
0,351

0,901

29 Se le asigno una interpretacin fsica a los factores extrados con el propsito de caracterizar a las siglas en el contexto de las variables con el valor absoluto ms alto de los coeficientes entregados en la matriz de coeficientes rotados.

Por una parte, el componente 1 tiene una correlacin alta y negativa con la variable Ao (ao adquisicin maquinaria), una correlacin alta y positiva con la variable Hrs Da (promedio de horas que se utiliza la maquinaria al da) y con la variable Experiencia Operador (aos de experiencia del operario de la maquinaria principal). Por lo tanto, el primer factor puede interpretarse como un indicador denominado Configuracin de equipo, entonces se cre una nueva variable bajo este nombre. Por otra parte, el componente 2 tiene una correlacin alta y positiva con la variable M3arb (tipo de bosque intervenido), con la variable Marca (Marca del equipo principal) y con la variable Procedencia (Pas de origen del equipo principal). Este componente puede interpretarse como un indicador de la Configuracin de produccin. Finalmente, el componente 3 tiene una correlacin alta y positiva con la variable Edad Operario (edad del operario del equipo principal). Este componente puede interpretarse como un indicador denominado Gestin de Personal, nombre bajo el cual se designo la ultima variable, como se aprecia en el resumen de la tabla xxx y su representacion en el grafico de componentes rotados (figuraxxx).

Tabla 15. Resumen de variables sintticas para la temporada de Invierno.


Componente Variable (s) Ao Hrs Da Experiencia Operador M3arb Marca Procedencia Edad Operario Carga Factorial 0,970 0,961 0,901 0,651 0,964 0,964 0,977 Proporcin de la Variable explicada Interpretacin (Variable Sinttica)

39,006

Configuracin de equipo

33,933

Configuracin de produccin

17,003

Gestin de Personal

30

Figura 7. Grafico de componentes en espacio rotado temporada invierno.

3.4.2.2. Anlisis Componentes Principales Temporada de Verano

Se defini tres factores que explican el 86,9% de la varianza de las siete variables seleccionadas en un principio (tabla xxx). En la tabla xxx es posible visualizar las cargas factoriales de cada una de las variables sobre los tres factores. En la misma tabla se resaltaron aquellas cargas factoriales cuyo valor absoluto es superior a 0,6.

Tabla 16. Varianza total explicada de las variables temporada de verano.


Sumas de las saturaciones al Autovalores iniciales % de la Comp 1 2 3 4 5 6 Total 2,660 2,334 1,090 ,748 ,122 ,045 varianza 38,003 33,344 15,578 10,690 1,748 ,637 % acumulado 38,003 71,347 86,925 97,615 99,363 100,000 Total 2,660 2,334 1,090 cuadrado de la extraccin % de la varianza 38,003 33,344 15,578 % acumulado 38,003 71,347 86,925 Total 2,591 2,033 1,461 Suma de las saturaciones al cuadrado de la rotacin % de la varianza 37,015 29,039 20,870 % acumulado 37,015 66,055 86,925

31
7 -1,122E-16 -1,603E-15 100,000

Mtodo de extraccin: Anlisis de Componentes principales.

Tabla 17. Matriz de Componentes rotados para las variables temporada de verano.
Componente 1 M3arb_clas Marca Procedencia Ano Hrs_dia Edad_Op Exp_Oper -0,028 0,029 0,029 2 0,161 3

0,693
0,172 0,172 0,186 -0,093

0,984 0,984
0,156 0,166 0,119 0,066

-0,923 0,966
0,019

0,877
0,331

0,896

Se le asigno una interpretacin fsica a los factores extrados con el propsito de caracterizar a las siglas en el contexto de las variables con el valor absoluto ms alto de los coeficientes entregados en la matriz de coeficientes rotados.

Por una parte, el componente 1 tiene una correlacin alta y negativa con la variable Ao (ao adquisicin maquinaria), una correlacin alta y positiva con la variable Hrs Da (promedio de horas que se utiliza la maquinaria al da) y con la variable Experiencia Operador (aos de experiencia del operario de la maquinaria principal). Por lo tanto, el primer factor puede interpretarse como un indicador denominado Configuracin de equipo, entonces se cre una nueva variable bajo ese nombre. Por otra parte, el componente 2 tiene una correlacin alta y positiva con la variable Marca (Marca del equipo principal) y con la variable Procedencia (Pas de origen del equipo principal). Este componente puede interpretarse como un indicador de la Tipo de Maquinaria. Finalmente, el componente 3 tiene una correlacin alta y positiva con la variable M3arb (tipo de bosque intervenido) y con la variable Edad Operario (edad del operario del equipo principal). Este componente puede interpretarse como un indicador denominado Edad Operario y Tipo de Bosque, nombre bajo el cual se denomino la nueva variable, como se aprecia en el resumen de la tabla xxx y su representacin en el grafico de componentes rotados (figuraxxx).

32

Tabla 18. Resumen de variables sintticas para la temporada de verano.


Componente Variable (s) Ao Hrs Da Experiencia Operador Marca Procedencia M3arb Edad Operario Carga Factorial 0,923 0,966 0,896 0,984 0,984 0,693 0,877 Proporcin de la Variable explicada Interpretacin (Variable Sinttica)

37,015

Configuracin de equipo

29,039

Tipo de Maquinaria

20,87

Edad Operario y Tipo de Bosque

Figura 8. Grafico de componentes en espacio rotado temporada invierno. 3.4.3. Anlisis Clster Jerrquico.

El anlisis clster, o de conglomerados, es una tcnica cuya finalidad es agrupar ciertos individuos respecto a una o diversas variables o atributos. Se realizo este anlisis de los valores de los tres componentes generados para cada temporada.

33

Cada componente principal es una variable sinttica que est elaborada a partir de las variables originales; en nuestro caso, cada observacin (volumen notificado por una lnea de produccin) se puede identificar por sus coordenadas con respecto a cada factor generado. Por lo tanto, estos componentes pueden ser utilizados como variables en el anlisis clster. As obtenemos dos ventajas: primero, evitamos la seleccin de criterios de clasificacin entre aquellas variables consideradas de importancia a priori; segundo, la carga de las variables originales en la clasificacin ser aquella que alcancen en la conformacin de dicho componente.

Se utilizo la informacin resultante del anlisis factorial para las variables de cada temporada, con el propsito de formar grupos de siglas a partir de las variables generadas para la temporada de invierno (tabla xxx) y para la temporada de verano (tabla xxx). Es decir se aplico el anlisis de grupo de los factor scores relativos a los factores. De este modo, cada grupo de siglas, formado en funcin de estas variables sintticas en cada temporada, representara y definira una sigla-tipo (sigla modal o representativa).

Desde el punto de vista de la seleccin y anlisis de la gestin y configuracin de las siglas modales de cada uno de los grupos que se conformen, es evidente que el nmero de grupos no debe ser elevado. Es por esta razn se decidi conformar no ms de tres conglomerados por temporada.

3.4.3.1. Anlisis Clster Temporada Invierno. De un global de 46 casos para esta temporada, se definieron 3 grupos: el grupo G1 formado por 29 casos, el grupo G2 formado por 8 casos y el grupo G3 formado por 9 casos (figura xxx)

34

Figura 9. Dendograma de vinculacin media entre grupos temporada invierno.

3.4.3.2. Anlisis Clster Temporada Verano. De un global de 42 casos para esta temporada, se definieron 3 grupos: el grupo G1 formado por 6 casos, el grupo G2 formado por 31 casos y el grupo G3 formado por 5 casos (figura xxx)

35

Figura 10. Dendrograma de vinculacin media entre grupos temporada verano.

3.4.3. Anlisis de la Varianza. 3.4.3.1. ANOVA de componentes Temporada Invierno. El valor de p es menor a 0,05, es decir es un valor que se encuentra por debajo del nivel de significancia del 5%, de tal manera se comprueba que estos tres grupos son distintitos.

El estadstico F cuantifica la importancia de cada factor en la determinacin de los diferentes, para esta temporada el tercer factor tiene un valor de F de 77,78 lo cual indica que gracias e este factor existe una mayor discriminacin entre grupos. Lo contrario sucede con el segundo factor con un valor de 12,3, el cual es muy bajo lo cual indica que este factor juega un rol menos importante en la definicin de los conglomerados

Tabla 19. ANOVA entre grupos para la temporada de invierno.


Suma de cuadrados FACTOR_1 Inter-grupos 28,486 gl 2 Media cuadrtica 14,243 F 37,085 Sig. ,000

36

Intra-grupos FACTOR_2 Inter-grupos Intra-grupos FACTOR_3 Inter-grupos Intra-grupos

16,514 16,403 28,597 35,256 9,744

43 2 43 2 43

,384 8,201 ,665 17,628 ,227 77,788 ,000 12,332 ,000

3.4.3.2. ANOVA de componentes Temporada Verano. El valor de p es menor a 0,05, es decir es un valor que se encuentra por debajo del nivel de significancia del 5%, de tal manera se comprueba que estos tres grupos son distintitos.

El estadstico F cuantifica la importancia de cada factor en la determinacin de los diferentes, para esta temporada el tercer factor tiene un valor de F de 683,35 lo cual indica que gracias e este factor existe una mayor discriminacin entre grupos. Lo contrario sucede con el tercer factor con un valor de 8,9, el cual es muy bajo lo cual indica que este factor juega un rol menos importante en la definicin de los conglomerados.

Tabla 20. ANOVA entre grupos para la temporada de verano.


Suma de cuadrados FACTOR_1 Inter-grupos Intra-grupos FACTOR_2 Inter-grupos Intra-grupos FACTOR_3 Inter-grupos Intra-grupos 39,862 1,138 18,183 22,817 12,921 28,079 gl 2 39 2 39 2 39 Media cuadrtica 19,931 ,029 9,092 ,585 6,460 ,720 8,973 ,001 15,540 ,000 F 683,346 Sig. ,000

3.4.4. Descripcin de los grupos resultantes.

IV CONCLUSIONES

37 Existe diferencia entre el volumen de material leoso encontrado en la cuenca Compuy, puesto que sta duplic lo registrado en Vuelta de Zorra, a pesar que ambos cauces estn sujetos a la misma cobertura vegetal (bosque nativo) y que el nmero de piezas presentes fue menor en el cauce costero valdiviAo. Por otro lado, si es comparada con Pichn, esta diferencia se cuadruplica, ya que responde principalmente a la presencia de especies de rpido crecimiento.

En general, se ha descrito que la variacin del volumen puede explicarse por el manejo actual que presente la cobertura vegetal que sustente a la cuenca, rea de suministro de LW (distancia vegetacin-cauce) y por las diferencias en el rea basal del bosque ribereo. Sin embargo, los resultados obtenidos en el Compuy evidencian que tales diferencias en el volumen de material encontrado en los cauces no siempre est representado por el rea basal del bosque ribereo, ms bien estaran determinados por el estado de desarrollo que presente el bosque (edad, tipo de especie, estado fitosanitario, entre otras), ya que el proceso de aporte del material leoso al cauce es totalmente aleatorio, puesto que individuos longevos o enfermos presentarn mayor probabilidad de cada. Adems, es importante considerar la cantidad de eventos naturales que favorezcan el aporte de material.

Se corrobora lo mencionado por Ulloa (2010), quien describe que la posicin de las piezas en el canal est influenciada por las caractersticas del canal (pendiente y ancho), puesto que a menor pendiente y mayor ancho de cauce lleno existira una mayor concentracin de los elementos dentro del canal, y frente a una mayor pendiente y menor ancho de canal la posicin sera principalmente en los mrgenes.

El ingreso principal de elementos al canal es por cada de rboles de la vegetacin riberea, provocado principalmente por vientos invernales que afectan a la zona.

En base a que la longitud de los elementos es la variable que ms influencia la movilidad de los LW depositados en los cauces, es posible deducir que alrededor del 55% de los registrados en el Compuy presenta una longitud menor al ancho medio de bankfull, que asociado a futuras crecidas provocara el movimiento de alguno de ellos con una alta probabilidad de ocurrencia.

38

Existen diferencias estadsticamente significativas entre la relacin dimensiones de los elementos y caractersticas geomtricas del canal al segregar la muestra obtenida en el estero Compuy. Las diferencias responderan principalmente a un cambio en la estructura del bosque que bordea a ambos cauces. Finalmente, no existen indicios de estudios previos que incorporen este tipo de anlisis, debido a que en todos ellos se realizan comparaciones entre cuencas ubicadas en comunas o provincias diferentes, desconocindose qu pasa dentro de un mismo sistema. Parece obvio encontrar diferencias significativas entre las primeras puesto que existe una variacin de la superficie estudiada, vegetacin existente, condiciones edafoclimticas, entre otras.

V BIBLIOGRAFIA

You might also like