Professional Documents
Culture Documents
TEMA 06 - Análisis Multivariado y Exploratorio Con Ms Excel
TEMA 06 - Análisis Multivariado y Exploratorio Con Ms Excel
1. COVARIANZA ................................................................................................................................. 3
2. COEFICIENTE DE CORRELACIÓN ..................................................................................................... 5
3. HERRAMIENTA DE ANÁLISIS ESTADÍSTICO MULTIVARIADO ........................................................... 7
4. GRÁFICOS ESTADÍSTICOS ............................................................................................................. 13
4.1 HISTOGRAMA ................................................................................................................................ 13
4.2 DISPERSIÓN .................................................................................................................................. 19
4.3 OJIVA .......................................................................................................................................... 21
5. REGRESIÓN LINEAL ...................................................................................................................... 23
6. BIBLIOGRAFÍA .............................................................................................................................. 30
1
Tema 06
Microsoft Excel tiene funciones estadísticas muy útiles que permiten realizar análisis
estadísticos, los cual ayudarán a establecer relaciones entre los múltiples conjuntos de datos.
Asimismo, el trabajo en el análisis estadístico se hace muy efectivo, por ello que Ms. Excel a
través de las técnicas de gráficos de histogramas, dispersión, ojiva y regresión lineal pueden dar
resultados muy favorables para múltiples propósitos del análisis estadístico en forma rápida y
sencilla.
El participante podrá aplicar funciones y herramientas de datos que permitan realizar análisis
estadístico, gráficos estadísticos y regresión lineal:
CAPACIDAD
Automatiza la información en Ms Excel, gestiona y analiza datos con IBM SPSS.
TEMÁTICA
1. Covarianza
2. Coeficiente de correlación
4. Gráficos estadísticos
5. Regresión lineal
2
1. COVARIANZA
En Excel la covarianza es una medida de dispersión, nos muestra promedio de los productos de
las desviaciones para cada pareja de puntos de datos en dos conjuntos de datos. También
podemos decir que es un valor que indica el grado de variación conjunta de dos variables
aleatorias respecto a sus medias.
COVARIANZA.M
Devuelve la covarianza de la muestra, o promedio de los productos de las desviaciones para cada
pareja de puntos de datos en dos conjuntos de datos.
Sintaxis
COVARIANZA.M(matriz1;matriz2)
Donde:
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
COVARIANZA.P
Sintaxis
COVARIANCE.P(matriz1;matriz2)
Donde:
3
Observaciones
Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Ejercicio:
Desarrollo:
4
Solución:
1. Selecciona la celda (F2), luego insertar la función (COVARIANZA.M) o escribir
directamente como en este caso =COVARIANZA.M(C2:C32;B2:B32)
2. Selecciona la celda (F11), luego insertar la función (COVARIANCE.P) o escribir
directamente como en este caso =COVARIANCE.P(C2:C32;B2:B32)
3. Se muestran los resultados.
Cuando la covarianza es >0, estamos ante un caso de Covarianza positiva, lo que significa
que las dos variables están relacionadas, todos van hacia un mismo punto, a mayor
altura mayor es el peso.
2. COEFICIENTE DE CORRELACIÓN
Devuelve el coeficiente de correlación entre dos rangos de celdas definidos por los argumentos
matriz1 y matriz2. Use el coeficiente de correlación para determinar la relación entre dos
5
propiedades. Por ejemplo, para examinar la relación entre la temperatura promedio de una
localidad y el uso de aire acondicionado.
Sintaxis
COEF.DE.CORREL(matriz1;matriz2)
Donde
Observaciones
Ejercicio:
Desarrollo:
6
Solución:
1. Selecciona la celda (F2), luego insertar la función (COEF.DE.CORREL) o escribir
directamente como en este caso =COEF.DE.CORREL(B2:B32;C2:C32)
2. Se muestran los resultados.
Microsoft Excel, nos proporciona una herramienta de análisis estadístico a través del
complemento llamado Herramienta para análisis la cual proporciona herramientas de análisis
de datos el cual permite calcular la covarianza y el coeficiente de correlación, etc. de una manera
7
rápida y guiada. Para usar las herramientas de análisis de datos, primero se tiene que habilitar,
para lo cual seguimos los siguientes pasos:
3. Ahora se visualiza en la ficha Datos, en el grupo Análisis, está como Análisis de datos.
8
COVARIANZA
Ejercicio 1:
El Centro nutricional Trilce, desea determinar la covarianza de la variable talla y peso de un total
de 31 pacientes mujeres entre las edades de 25 y 39 años, según se muestra en la imagen:
Desarrollo:
9
3. En la ventana Covarianza, ingresar los siguientes datos:
Rango de entrada: ($B$1:$C$32) corresponde a los datos de la variable altura y
peso.
Agrupado por: Seleccionar por columnas (las variables altura y peso se
encuentran en columnas).
Rótulos en la primera fila: Marcar porque corresponde a los textos con los
nombres de las variables Altura y Peso.
Opciones de salida: clic en Rango de salida y seleccionar la celda F2.
Finalmente, clic en Aceptar.
10
Se observa que la Covarianza de las dos variables es: 47.85, lo que significa que hay una
alta correlación entre las dos variables.
COEFICIENTE DE CORRELACIÓN
Ejercicio 1:
Desarrollo:
Solución:
1. Hacer clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.
11
2. En la ventana de Análisis de datos, seleccionar Coeficiente de correlación, clic en
Aceptar.
12
Se observa que el coeficiente de correlación de las dos variables es: 0.99827492, lo que
significa que hay una correlación alta entre las dos variables.
4. GRÁFICOS ESTADÍSTICOS
Los gráficos en Excel son una buena opción para representar información estadística, que mejora
la comprensión de los datos de información. Los gráficos son una excelente herramienta para
resumir la información e identificar fácilmente cualquier tendencia en los datos que ayudan a
que la audiencia visualice los resultados de una forma más efectiva.
4.1 Histograma
¿Qué es un Histograma? Un histograma es un tipo de gráfico que cuenta con amplias
aplicaciones en la estadística. Los histogramas permiten una interpretación visual de datos
numéricos al indicar el número de puntos de datos que permanecen dentro del rango de
valores, denominado una clase o compartimento. La frecuencia de datos que cae en cada
clase es representada mediante el uso de una barra.
Ejercicio 1:
La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades de
los pacientes atendidos en el área de emergencia, en temporada de invierno, la muestra
poblacional fue de 120 encuestados. Se solicita representar la información mediante un
gráfico de histograma de frecuencias teniendo en cuenta la siguiente tabla. Según se
muestra en la imagen:
Desarrollo:
13
Solución:
1. Hacemos un clic en una celda vacía, luego vamos a la ficha Insertar, luego clic en
gráfico de columna agrupada, se muestra un gráfico vacío.
14
Nombre de la serie: Histograma de frecuencias.
Valores de la serie: =Histograma!$N$3:$N$8 (frecuencia absoluta simple)
Clic en Aceptar.
6. Ahora en la ventana Rótulos del eje, se selecciona el grupo de las Xi (las marcas de
clase) luego clic en Aceptar.
15
8. En esta ventana vemos que el gráfico necesita una apariencia más segura y para ello
haciendo clic derecho en una de las columnas, nos muestra una ventana contextual
y haremos clic en Dar formato a serie de datos.
16
Con el mismo caso del ejercicio 1, pero ahora para utilizar la herramienta de análisis
de datos:
La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades
de los pacientes atendidos en el área de emergencia, en temporada de invierno, la
muestra poblacional fue de 120 encuestados. Se solicita representar la información
mediante un gráfico de histograma de frecuencias teniendo en cuenta la siguiente
tabla. Según se muestra en la imagen:
Desarrollo:
17
1. Clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.
18
4.2 Dispersión
Los gráficos de dispersión también son conocidos como gráficos XY y su función principal
es la de mostrar la relación que existe entre los valores numéricos de diferentes series de
datos sobre los ejes de coordenadas XY.
Ejercicio:
El gerente de cadena de Pizzería Trilce, solicita crear un gráfico de dispersión para saber si
existe relación entre la población estudiantil y las ventas trimestrales, los lugares donde
sus establecimientos han tenido más éxito están cercanos a establecimientos de
educación superior, las ventas trimestrales (representadas por Y) y población estudiantil
(representada por X), según se muestra en la imagen:
19
Desarrollo:
Se solicita crear un gráfico de dispersión para saber si existe relación entre población
estudiantil y ventas trimestrales.
Solución:
1. Seleccione las celdas C1:D11 (información de Población estudiantil y Ventas
trimestrales).
20
4. Se muestra el grafico Dispersión.
Se visualiza en el grafico que existe una relación entre las variables, a mayor
población estudiantil mayor serán las ventas trimestrales.
4.3 Ojiva
Los gráficos de ojiva se usan para mostrar frecuencias acumulativas. Una línea conecta los
puntos superiores de cada elemento para mostrar el flujo de la información. Aunque los
gráficos de ojiva pueden hacerse a mano, a menudo ahorra tiempo y esfuerzo ingresar los
valores en una base de datos. Selecciona el área de datos ingresados y usa un ayudante
de gráficos para construir tu ojiva.
21
Ejercicio:
La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades de
los pacientes atendidos en el área de emergencia, en temporada de invierno, la muestra
poblacional fue de 120 encuestados. Se solicita representar la información mediante un
gráfico de ojiva teniendo en cuenta la siguiente tabla. Según se muestra en la imagen:
Desarrollo:
Solución:
1. Seleccione las celdas K2:K8; presionar la tecla Ctrl y seleccionar ahora M2:M8.
2. Seleccionar ficha Insertar, en el grupo Gráficos, hacer clic en botón insertar gráfico
de líneas o áreas.
22
4. Se muestra como resultado el gráfico de Ojiva.
5. REGRESIÓN LINEAL
Los gráficos pueden ayudar a validar los supuestos de normalidad, linealidad e igualdad de las
varianzas. También son útiles para detectar valores atípicos, observaciones poco usuales y casos
de influencia. Tras guardarlos como nuevas variables, dispondrá en el Editor de datos de los
valores pronosticados, los residuos y otra información de diagnóstico, con los cuales podrá crear
gráficos respecto a las variables independientes.
23
En Excel puedes realizar un gráfico de regresión lineal, mostrando su ecuación siempre y cuando
se contemple la tendencia y proyección en la tabla de datos.
Ejercicio:
El gerente de cadena de Pizzería Trilce, solicita realizar un análisis de regresión lineal mediante
un gráfico de dispersión para saber si existe relación entre la población estudiantil y las ventas
trimestrales, los lugares donde sus establecimientos han tenido más éxito están cercanos a
establecimientos de educación superior, las ventas trimestrales (representadas por Y) y
población estudiantil (representada por X), según se muestra en la imagen:
Desarrollo:
Se solicita crear un gráfico de dispersión para saber si existe relación entre población
estudiantil y ventas trimestrales.
Solución:
24
2. Seleccionar ficha Insertar, en el grupo Gráficos, hacer clic en botón gráfico de dispersión.
25
5. Clic en cualquier punto del gráfico, luego clic derecho y seleccionar Agregar línea de
tendencia.
26
ANÁLISIS DE REGRESIÓN LINEAL UTILIZANDO ANÁLISIS DE DATOS
Ejercicio:
El gerente de cadena de Pizzería Trilce, solicita realizar un análisis de regresión lineal mediante
un gráfico de dispersión para saber si existe relación entre la población estudiantil y las ventas
trimestrales, los lugares donde sus establecimientos han tenido más éxito están cercanos a
establecimientos de educación superior, las ventas trimestrales (representadas por Y) y
población estudiantil (representada por X), según se muestra en la imagen:
Desarrollo:
27
Solución:
28
4. En la siguiente ventana se muestran los resultados de la Regresión, con los coeficientes de
intercepción 60 y población estudiantil 5, estos valores se representan en la línea recta
(Y=5x+60) y se visualiza idéntica al gráfico.
Grafico
29
6. BIBLIOGRAFÍA
SITIOS WEB
https://dtutivenc20162017.wordpress.com/292-2/
https://exceltotal.com/graficos-de-dispersion/
https://pildorasdeexcel.wordpress.com/2017/01/20/calculando-covarianzas-con-excel/
https://help.xlstat.com/s/article/regresion-lineal-multiple-tutorial-en-excel?language=es
30