You are on page 1of 15

Técnicas estadísticas multivariadas y sus aplicaciones a indicadores e índices económico financieros de la actividad turística

El análisis económico financiero de las empresas turísticas, muestra cada día mayor relevancia y significación en la literatura nacional e internacional, las técnicas tradicionales son empleadas con más frecuencia y la evaluación de sus resultados permiten tomar las decisiones adecuadas en el momento preciso. El presente artículo expone y sugiere el empleo de herramientas de la estadística multivariada, las que pueden ser utilizadas entre otros, en el sector empresarial y muy en particular en el sector turístico. El trabajo muestra un ejemplo a partir de un Caso de Estudio que intenta estimular su empleo por parte de especialistas e investigadores en el área turística. 2. Comentarios acerca de las Técnicas Multivariadas Las aplicaciones de la estadística multivariada están presentes en distintas áreas o ramas de la ciencias, como por ejemplo en: Investigación de mercados (para identificar características de los individuos con el propósito de determinar qué tipo de personas compran determinado producto); en el sistema de educación de cualquier tipo de especialidad (para conocer los estudiantes que tendrán éxito y concluirán satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de determinado tipo de cosechas a daños por plagas y sequías); en el deporte (para conocer a partir de medidas antropométricas las posibilidades de obtener buenos resultados en un deporte específico); en la psicología (al estudiar la relación entre el comportamiento de adolescentes y actitudes de los padres); en la economía (para conocer el nivel de desarrollo de un territorio en relación con otros y realizar inferencias a partir de variables económicas fundamentales, entre otros). Los datos multivariados surgen cuando a un mismo individuo se le mide más de una característica de interés. Un individuo puede ser un objeto o concepto que se puede medir. Más generalmente, los individuos son llamados unidades experimentales. Ejemplos de objetos: personas, animales, terrenos, compañías, países, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es

Ejemplo: Suponga que se realizan exámenes de español. 2. seleccionados en las entidades turísticas del país. 2) Relación: Encontrar relaciones entre variables. para el ingreso en la carrera de licenciatura en turismo.una característica o atributo que se le mide a un individuo. Si cada uno de los estudiantes obtiene calificaciones altas. entonces los exámenes estarían relacionados entre sí. 2. regulares o bajas en los tres exámenes. En este caso. la característica común que estos exámenes pueden estar midiendo podría ser la "inteligencia general" que les permita comenzar esa carrera universitaria. matemática e historia a estudiantes de nivel 12. . o que los tipos de cervezas sean totalmente diferentes. Ejemplo: Suponga que se evalúan diferentes tipos de cervezas respecto a su nivel de aceptación y se miden.1) Relación entre variables: Existe relación entre variables cuando las mismas miden características comunes. se podría esperar que las cervezas claras y oscuras tengan algún tipo de relación. Objetivos de las técnicas multivariadas: 1) Simplificación: Los métodos multivariados son un conjunto de técnicas que permiten al investigador interpretar y visualizar conjuntos grandes de datos (tanto en individuos como en variables). por ejemplo. a partir de su simplificación o reducción. los consumos de las mismas para diferentes grupos de edades. entre individuos y entre ambos.2) Relación entre individuos: Existe relación entre individuos si alguno de ellos son semejantes entre sí.

Clasificación de los métodos multivariados: 1) Dirigidas o motivadas por las variables: se enfocan en las relaciones entre variables. Estimación Puntual: El problema de estimación puntual consiste en proporcionar un valor puntual que aproxime al parámetro de interés. entre ellas las más importantes son: · Media Muestral · Varianza Muestral · Correlación Muestral · Diagrama de Dispersión · Componentes Principales Inferencia estadística El problema de inferencia estadística consiste en aproximar el valor de ciertas características poblacionales (llamadas parámetros) por medio de resúmenes (llamados estadísticas) generados a partir de la información contenida en una muestra obtenida de la población. Ejemplos: análisis discriminante.En los métodos multivariados. Ejemplos: matrices de correlación. Esta suposición permite que el análisis multivariado se desarrolle paralelamente al correspondiente análisis univariado basado en una distribución normal. sirven para describir el comportamiento de un conjunto de datos. análisis de conglomerados y análisis multivariado de varianza. análisis de factores y análisis de regresión. pero las observaciones sobre los individuos son independientes. análisis de componentes principales. Análisis exploratorio multivariado Las estadísticas descriptivas (multivariadas). Los métodos clásicos de . 2) Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre individuos. Generalmente se supone también que el conjunto de variables que intervienen en el análisis poseen una distribución normal multivariada. como su nombre lo indica. se supone que las variables están correlacionadas.

la regresión es un proceso que tiene como finalidad ajustar un modelo a un conjunto de datos u observaciones. el intervalo de confianza de mayor interés es el de la correlación entre dos variables. Técnicas Seleccionadas del Análisis Multivariado Análisis de Regresión Múltiple La regresión es una técnica utilizada para la investigación y modelación de las relaciones existentes entre variables que inciden en un determinado fenómeno de la realidad. Al igual que en el caso de pruebas de hipótesis. Pruebas de Hipótesis: El problema de contraste de hipótesis en estadística consiste en decidir cuál de dos hipótesis es correcta. la ecuación de regresión es sólo una aproximación de la relación existente entre las variables. Intervalos de Confianza: El calcular un intervalo de confianza es un problema de estimación por intervalo. La prueba de hipótesis de mayor importancia en datos multivariados es probar si la correlación entre dos variables es significativamente distinta de cero. El coeficiente de correlación entre parejas de variables permite agrupar variables de tal manera que variables en el mismo grupo tengan correlaciones altas y variables en grupos diferentes tengan correlaciones bajas. En realidad. La decisión se toma de acuerdo con la información de la muestra. Es posible que cuando se tiene un conjunto grande de variables. pudiera estar interesado en establecer la relación que existe entre la situación que presentan los índices financieros de una empresa y un probable escenario de desequilibrio o no. por ejemplo.estimación puntual de parámetros son: método de momentos y método de máxima verosimilitud. Un analista económico. exista cierta relación entre algunas de las variables. en donde lo que se proporciona es un conjunto de valores altamente posibles como aproximaciones al parámetro. Uso de correlaciones para agrupar variables. En un sentido amplio. La regresión puede ser utilizada como herramienta descriptiva o como herramienta .

transformando el conjunto de p variables originales en otro conjunto de q variables incorrelacionadas. También puede controlar un conjunto de factores presentes en el fenómeno para evaluar. inferencial. la matriz de covarianzas. llamadas componentes principales. Las p variables son medidas sobre cada uno de los n individuos. La segunda opción se puede utilizar cuando todas las variables tengan las mismas unidades de medida y además. En el primer caso. el investigador puede estar interesado en encontrar la mejor ecuación lineal de predicción. el investigador está interesado en realizar estimaciones de los parámetros poblacionales a través del examen de una muestra de observaciones y verificar algunas pruebas de hipótesis tales como si existe realmente una relación lineal entre las variables independientes. Sin embargo la complejidad de los cálculos retrasó su desarrollo hasta la aparición de los computadores y su utilización en la segunda mitad del siglo XX. es una técnica estadística que fue propuesta a principios del siglo XIX por Karl Pearson como parte del análisis de factores. . o sea. En el ACP existe la opción de usar la matriz de correlaciones o bien. En el segundo caso.inferencial. En la primera opción se le está dando la misma importancia a todas y a cada una de las variables. o sea. si una variable independiente específica no tiene efecto lineal sobre la dependiente. Análisis de Componentes Principales El análisis de componentes principales (ACP). Dicha representación debe ser tal que al desechar dimensiones superiores (generalmente de la tercera o cuarta en adelante) la pérdida de inormación sea mínima. esto puede ser conveniente cuando el investigador considera que todas las variables son igualmente relevantes. Lo anterior. cuando el investigador juzga conveniente destacar cada una de las variables en función de su grado de variabilidad. no niega la posibilidad de que también pueda ser utilizado con fines de inferencia. El ACP permite reducir la dimensionalidad de los datos. obteniéndose una matriz de datos de orden np (p < n). aunque sugiere que el ACP es una técnica descriptiva. El objetivo principal que persigue el ACP es la representación de las medidas numéricas de varias variables en un espacio de pocas dimensiones donde nuestros sentidos puedan percibir relaciones que de otra manera permanecerían ocultas en dimensiones superiores.

esto sugiere que expresan la mismas características pero de diferente forma y que sólo hay un pequeño número de rasgos no directamente medibles. 3) Construir variables no observables (componentes) a partir de variables observables. como datos de entrada para otros análisis. tomando sólo los primeros componentes. En este sentido. en el caso de la regresión múltiple cuando las variables independientes presentan alta colinealidad es preferible hacer la regresión sobre los componentes principales en lugar de usar las variables originales. es de gran utilidad usar estos componentes incorrelacionados. 2) Reducir la dimensionalidad de la matriz de datos con el fin de evitar redundancias y destacar relaciones. Por ejemplo. en cambio. Queda a criterio del investigador decidir cuántos componentes se elegirán en el estudio.Las q nuevas variables (componentes principales) son obtenidas como combinaciones lineales de las variables originales. proponer los análisis estadísticos más apropiados. Por ejemplo. la inteligencia de una persona no es observable directamente. se puede explicar la mayor parte de la variación total contenida en los datos originales. que se denominan Indicadores sintéticos y que vienen estimados por los componentes. Los componentes se ordenan en función del porcentaje de varianza explicada. El ACP tiene la ventaja de no exigir supuestos tales como la normalidad. 4) Bajo ciertas circunstancias. se puede medir distintos aspectos de ésta mediante pruebas psicométricas. En la mayoría de los casos. Las variables que miden los distintos aspectos de la inteligencia tienden a covariar. Aplicaciones Entre los usos más frecuentes del ACP están: 1) Como técnica de análisis exploratorio que permite descubrir interrelaciones entre los datos y de acuerdo con los resultados. el primer componente será el más importante por ser el que explica mayor porcentaje de la varianza de los datos. Análisis Discriminantes .

Otros ejemplos de aplicación es en instituciones financieras. donde definidas cuentas "problemáticas" o "serias". razones de deuda a capital.. Utilizada en investigaciones de mercado... para predecir si las ventas potenciales en un territorio dado de mercado serán "buenas" o "malas" . que hagan que los puntajes promedios de las categorías de las variables dependientes en ésta combinación lineal se diferencien en forma máxima..-determinar cuales son las variables predictoras con mayor poder discriminante para clasificar a las unidades de análisis para que tengan uno o el otro atributo de la variable dependiente. números de veces en mora.-predecir la categoría de una unidad de análisis u objeto o individuo. betas discriminantes o pesos discriminantes.. Dos son los objetivos centrales del análisis discriminante: 1. objetos o en éste caso una cuenta pueda convertirse en "seria " o "problemática". con base en ciertas evaluaciones sobre el ingreso personal disponible por territorio..... las variables predictivas. individuos. características o parámetros. Cada beta discriminante calculado tiene un monto o coeficiente determinado y su correspondiente signo positivo o negativo. a cada una de ellas se les describe parámetros como tasas de crédito... BMD-07M o el statgrafics determinan los valores para cada variable independiente de los ß que reciben el nombre de coeficientes discriminantes.+ ßm Xm donde xm es la m-ésima variable independiente.Técnica y herramienta estadística que permite predecir el comportamiento nominal de una variable dependiente a través de una combinación lineal de las variables independientes. posteriormente se obtienen aquellas variables predictivas que mejor puedan discriminar en que una determinada unidad de análisis... 2. existencia de demandas. La forma de conseguir los objetivos es vía la obtención de una función discriminante: FD = ß1 X1 + ß2 X2 + . también llamadas variables predictivas. La función discriminante obtenida por programas computacionales como el systat.las variables dependientes.. por ejemplo. densidad de población y número de ventas al detalle. El coeficiente de los betas determina el peso de cada una de las variables independientes en la .

la que puede ser calculada por componentes principales o dadas. dedicada a temas económicos y de auditoria. La consultora decide que para lograr el objetivo propuesto debían apelar a las técnicas multivariadas.A. de uso muy extendido. una clasificación de los mismos.. conocida para hallar diferencias entre las varianzas. Para realizar este trabajo.discriminación y el signo. objeto o individuo de la población objetivo con sus variables independientes. de carácter nominal. Un Caso de Estudio. ha consolidado su posición en la zona del Caribe. Por lo tanto.sea máxima Variabilidad intra Grupos El punto de partida de cualquier análisis discriminante es la determinación de la matriz de datos de variables dependientes. 3. y le solicita que se examinen en cada uno de los 30 hoteles que posee la Cadena las variables siguientes: Crecimiento de las Ventas. de la Rentabilidad Económica y el Costo por Peso. de acuerdo a los resultados de su actividad económica con el propósito de tomar decisiones en aquellos que han quedado rezagados en sus metas. específicamente al análisis de componentes principales y el análisis discriminante. En el procesamiento de la información se empleó el Sistema Statgraphics. la Junta de Dirección contrata a una consultora. con 10 años de operación. positivo o negativo. los coeficientes discriminantes se derivan de tal forma que: Variabilidad entre Grupos F = --------------------------------. La Junta de Accionista ha solicitado a la Junta de Dirección de sus hoteles. Los resultados que se brindan a continuación . La finalidad es remplazar una unidad de análisis. parámetros o característica en la función obtenida y calcular a priori su categoría. representa su asignación en uno u otro de los subgrupos definidos por las variables dependientes. Hoteles Miramar La Cadena de Hoteles Miramar S. El criterio que se utiliza para decidir cuando son diferentes al máximo la variabilidad de grupos es la prueba análisis de varianza F o también denominada F de Snedecor. con instalaciones en casi todos los países del área. Algebráicamnte la función discriminante representa una combinatoria lineal de los datos originales que maximizan la razón de variabilidad entre grupos (por una parte la cuentas problemáticas y por otra las seria) a variabilidad intra grupos.

provienen de los resultados que brinda ese Sistema. que explique la mayor parte de la variabilidad de los datos.433 92.433 2 0.7729800 92. en este caso.1507870 5.026 97. la .0762356 2.000 ---------------------------------------------------------------------------Comentario --------------El propósito ha sido obtener una combinación lineal de las 3 variables estudiadas.541 100.459 3 0. ANALISIS DE COMPONENTES PRINCIPALES RESUMEN Variables Analizadas: Crecimiento de las Ventas Rentabilidad Económica Costo por peso Número de casos: 30 Estandarización: si Número de componentes extraídas: 1 Análisis de Componentes Principales ----------------------------------------------------------------------------Por ciento Componente de Varianza Por ciento Número Valor Propio Explicada Acumulado 1 2.

es decir.570088*Costo por peso Donde a los valores de las variables en la ecuación han sido estandarizados.584118*Crecimiento de las Ventas + 0. se les ha sustraído sus valores medios y divididos por la desviación estándar.577760 .433% de la variabilidad de los datos originales.57776*Rentabilidad Económica + 0. Table of Component Weights Componente 1 -----------Crecimiento de las Ventas Costo por peso Comentario El cuadro anterior muestra los coeficientes de las variables de la primera componente principal.primera componente explica el 92.570088 0. cuya ecuación viene dada por: 0. ANALISIS DISCRIMINANTE Resumen Variable de Clasificación: Col_7 0.584118 Rentabilidad Económica 0.

00 Functions Derived 1 0. Unos 30 casos fueron empleados para obtener un modelo discriminante en dos grupos.Variables Independientes: Crecimiento de las Ventas Rentabilidad Económica Costo por peso Número de casos: 30 Número de Grupos: 2 Función Porcentaje Correlación Canónica Discriminante Valor Propio Relativo 1 3.6633 Comentario Este procedimiento está diseñado para obtener un conjunto de funciones discriminantes que puedan ayudar a predecir la variable dependiente basado en los valores cuantitativos de las variables independientes. Tres variables predictivas fueron introducidas. La primera función discriminante es estadísticamente significativa a un nivel de significación del 95%.87097 ----------------------------------------------------------------------------- Wilks Chi-Square DF P-Value Lambda 3 0. .0000 ----------------------------------------------------------------------------0.241411 37.14232 100.

736324 Crecimiento de las Ventas 0.196148*Costo por peso A partir de las magnitudes relativas de los coeficientes de la ecuación anterior.5891 0. Tabla de Clasificación Tamaño Grupos Grupos del Grupo 1 2 --------------------------------------------------------------1 15 15 0 (100.0454077 0.1371040 0.736324*Rentabilidad Económica + 0.171982 Costo por peso 0. se puede determinar como la variable dependiente puede emplearse para discriminar entre grupos.196148 ----------------------------------------------------------------------Coeficientes no Estandarizados ------------------------------------Rentabilidad Económica Crecimiento de las Ventas Costo por peso Constante Comentario --------------El cuadro anterior muestra los coeficientes de la función usada para discriminar entre los diferentes niveles de la variable dependiente. La primera función discriminante estandarizada es: 0.171982*Crecimiento de las Ventas + 0. De particular interés son los coeficientes estandarizados.Función Discriminante para la variable Dependiente Coeficientes Estandarizados --------------------------------Rentabilidad Económica 0.0%) -25.0%) 2 15 0 15 (0.0629418 .

093 103.26241 10.37296 3.38 115.28191 -523.71377 4.0%) (100.47386 2.06632*Costo por peso -0.0%) ---------------------------------------------------------------Por ciento de clasificación correcta: 100.4767 Costo por peso DEVIACIÓN ESTANDAR Rentabilidad Económica 4.3667 107.227 106.29737 6.893 99.268809 9.45449 99.23 --------------------------------------------------------------------------------------------15 2 TOTAL 15 30 -------------------------------------------------------------------------------------------- Esta función es utilizada como predictora de la variable dependiente para las .0.06632 9.29896*Crecimiento de las Ventas + 9.94533 6.303 Crecimiento de las Ventas 94.29896 2.306 .0% Resumen de las Estadísticas del Grupo -------------------------------------------------------------------------------------------Variable Dependiente 1 CANTIDAD MEDIAS Rentabilidad Económica 97.(0.738405*Rentabilidad Económica + 2.738405 -0.4986 Crecimiento de las Ventas 4.306 -610.6485 Costo por peso 2.06 104.951 Crecimiento de las Ventas 2.98163 --------------------------------------------------------------------------------------------Coeficientes de la Función de Clasificación para la variable dependiente -----------------------------------------------------------------------------1 2 Rentabilidad Económica Costo por peso Constante Resultado -523.

¨ Estadística Multivariada ¨ENDES.721541 0.8426 14. Sintache Vega. Gladys. Estadísticas Matriz de Covarianzas Rentabilidad Económica Crecimiento Ventas Rentabilidad Económica Crecimiento de las Ventas 28. Este estudio deberá debe realizarse tanto en período de baja como alta turística.672066 Costo por peso 1. le sigue a continuación la rentabilidad de las ventas y finalmente el costo por peso.71152 Matriz de Correlación Rentabilidad Económica Crecimiento Ventas Rentabilidad Económica 1.36831 7.6768 Costo por peso 14. Vivian.36831 14. Se aconseja efectuar una revisión rigurosa de la situación que presentan aquellos Hoteles que no logran estar en el grupo de resultados satisfactorios. El indicador crecimiento de las ventas tiene el peso fundamental en el resultado de las operaciones de los Hoteles.0 0. 4.559758 0. Liliam.93248 9. La entidad consultora resume los resultados obtenidos de la forma siguiente: La mitad de los hoteles de la Cadena Miramar presentan problemas en sus operaciones.559758 .3452 7. Stgo de Cuba. Cuba.6768 9.0 0.0 Crecimiento de las Ventas Costo por peso Comentario Este cuadro muestra las correlaciones estimadas entre las variables independientes dentro de cada Grupo. Bibliografía · Linares Fintes.721541 0. Acosta Ramírez. 0.93248 Costo por peso 9. 1986.672066 1. La metodología empleada y las ecuaciones encontradas permiten discriminar si un Hotel se encuentra o no con problemas en sus operaciones.nuevas observaciones.

emagister.es//Análisis Multivariado. ¨ Salud Financiera de una Empresa.· htpp://www.es//Análisis Discriminante.es. 2005 · htpp://www. ¨ Componentes Principales con Statgraphics ¨.google.google.com//Comunidad_Emagister_quiebra_2001 · htpp://www. Modelo Altman para Mercados Emergentes ¨.google. ¨ Análisis Discriminante ¨. 2005 · htpp://www.google.es//Análisis de Componentes Principales. 2006 · htpp://www.//Análisis Discriminante. 2006 . ¨ Análisis Multivariado¨.

.

8907 . 02.42.

.

/*2.*  955.42:3/.8907*6:0-7.

.

 440 08.

.

5.8   955.43$9.97.5.08.08 4254303908 !73.5.3E88/04254303908!73.

.

 440 08.

.

7.3E88:9./4   955.7../4 3E88:9..

.

 440 08 .

.

/4820703908   955.3.07. 25708.:/3.07.3E888.7.723.35. 4/0492.390 $../0:3.

.

 440 08.

.

3E888.390 3E888.390     .723.723.