You are on page 1of 31

Tabla de Contenidos

1. COVARIANZA ................................................................................................................................. 3
2. COEFICIENTE DE CORRELACIÓN ..................................................................................................... 5
3. HERRAMIENTA DE ANÁLISIS ESTADÍSTICO MULTIVARIADO ........................................................... 7
4. GRÁFICOS ESTADÍSTICOS ............................................................................................................. 13
4.1 HISTOGRAMA ................................................................................................................................ 13
4.2 DISPERSIÓN .................................................................................................................................. 19
4.3 OJIVA .......................................................................................................................................... 21
5. REGRESIÓN LINEAL ...................................................................................................................... 23
6. BIBLIOGRAFÍA .............................................................................................................................. 30

1
Tema 06

ANÁLISIS MULTIVARIADOS Y EXPLORATORIOS CON MS EXCEL

Microsoft Excel tiene funciones estadísticas muy útiles que permiten realizar análisis
estadísticos, los cual ayudarán a establecer relaciones entre los múltiples conjuntos de datos.

Asimismo, el trabajo en el análisis estadístico se hace muy efectivo, por ello que Ms. Excel a
través de las técnicas de gráficos de histogramas, dispersión, ojiva y regresión lineal pueden dar
resultados muy favorables para múltiples propósitos del análisis estadístico en forma rápida y
sencilla.

Este tema proporciona al participante los conocimientos en cuanto al análisis estadístico,


gráficos estadísticos y regresión línea que permitan ver la relación que existen entre variables
de un conjunto de información.

El participante podrá aplicar funciones y herramientas de datos que permitan realizar análisis
estadístico, gráficos estadísticos y regresión lineal:

Utilizar información en Excel para aplicar funciones estadísticas.


Utilizar información en Excel para aplicar gráficos estadísticos.
Utilizar información en Excel para aplicar análisis de datos.

CAPACIDAD
Automatiza la información en Ms Excel, gestiona y analiza datos con IBM SPSS.

TEMÁTICA
1. Covarianza

2. Coeficiente de correlación

3. Herramientas de análisis estadístico multivariado

4. Gráficos estadísticos

5. Regresión lineal

2
1. COVARIANZA

En Excel la covarianza es una medida de dispersión, nos muestra promedio de los productos de
las desviaciones para cada pareja de puntos de datos en dos conjuntos de datos. También
podemos decir que es un valor que indica el grado de variación conjunta de dos variables
aleatorias respecto a sus medias.

COVARIANZA.M

Devuelve la covarianza de la muestra, o promedio de los productos de las desviaciones para cada
pareja de puntos de datos en dos conjuntos de datos.

Sintaxis

COVARIANZA.M(matriz1;matriz2)

Donde:

Matriz1 Obligatorio: El primer rango de celdas de números enteros.


Matriz2 Obligatorio: El segundo rango de celdas de números enteros.

Observaciones

Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.

COVARIANZA.P

Devuelve la covarianza de la población, el promedio de los productos de las desviaciones para


cada pareja de puntos de datos en dos conjuntos de datos. Use la covarianza para determinar
las relaciones entre dos conjuntos de datos. Por ejemplo, puede investigar si unos ingresos más
elevados corresponden con niveles de estudios más altos.

Sintaxis

COVARIANCE.P(matriz1;matriz2)

Donde:

Matriz1 Obligatorio: El primer rango de celdas de números enteros.


Matriz2 Obligatorio: El segundo rango de celdas de números enteros.

3
Observaciones

Los argumentos deben ser números o nombres, matrices o referencias que contengan
números.
Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,
estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.

Ejercicio:

El Centro nutricional Trilce, desea determinar la covarianza de la muestra y la covarianza de la


población de los productos de las desviaciones para cada pareja de puntos de datos de un total
de 31 pacientes mujeres entre las edades de 25 y 39 años, teniendo en cuenta la talla y peso,
según se muestra en la imagen:

Desarrollo:

Se desea determinar la covarianza de la muestra y la covarianza de la población de los


productos de las desviaciones para cada pareja de puntos de datos de un total de 31
pacientes mujeres entre las edades de 25 y 39 años, teniendo en cuenta la talla y peso.

4
Solución:
1. Selecciona la celda (F2), luego insertar la función (COVARIANZA.M) o escribir
directamente como en este caso =COVARIANZA.M(C2:C32;B2:B32)
2. Selecciona la celda (F11), luego insertar la función (COVARIANCE.P) o escribir
directamente como en este caso =COVARIANCE.P(C2:C32;B2:B32)
3. Se muestran los resultados.

Cuando la covarianza es >0, estamos ante un caso de Covarianza positiva, lo que significa
que las dos variables están relacionadas, todos van hacia un mismo punto, a mayor
altura mayor es el peso.

2. COEFICIENTE DE CORRELACIÓN

Devuelve el coeficiente de correlación entre dos rangos de celdas definidos por los argumentos
matriz1 y matriz2. Use el coeficiente de correlación para determinar la relación entre dos

5
propiedades. Por ejemplo, para examinar la relación entre la temperatura promedio de una
localidad y el uso de aire acondicionado.

Sintaxis

COEF.DE.CORREL(matriz1;matriz2)

Donde

Matriz1 Obligatorio: Un rango de celdas de valores.


Matriz2 Obligatorio: Un segundo rango de celdas de valores.

Observaciones

Si el argumento matricial o de referencia contiene texto, valores lógicos o celdas vacías,


estos valores se pasan por alto; sin embargo, se incluirán las celdas con el valor cero.
Si los argumentos matriz1 y matriz2 tienen un número diferente de puntos de datos,
COEF.DE.CORREL devuelve el valor de error #N/A.
Si el argumento matriz1 o matriz2 está vacío, o si la desviación estándar o sus valores
son cero, COEF.DE.CORREL devuelve el valor de error #¡DIV/0!.

Ejercicio:

El Centro nutricional Trilce, desea determinar el coeficiente de correlación de la variable Altura


y Peso, de un total de 31 pacientes mujeres entre las edades de 25 y 39 años, según se muestra
en la imagen:

Desarrollo:

Se desea determinar el coeficiente de correlación de la variable Altura y Peso, de un total de


31 pacientes mujeres entre las edades de 25 y 39 años.

6
Solución:
1. Selecciona la celda (F2), luego insertar la función (COEF.DE.CORREL) o escribir
directamente como en este caso =COEF.DE.CORREL(B2:B32;C2:C32)
2. Se muestran los resultados.

Cuando la Correlación es >0, estamos ante un caso de Correlación positiva, lo que


significa que las dos variables están relacionadas, todos van hacia un mismo punto,
tienden a subir, a mayor altura mayor es el peso.

3. HERRAMIENTA DE ANÁLISIS ESTADÍSTICO MULTIVARIADO

Microsoft Excel, nos proporciona una herramienta de análisis estadístico a través del
complemento llamado Herramienta para análisis la cual proporciona herramientas de análisis
de datos el cual permite calcular la covarianza y el coeficiente de correlación, etc. de una manera

7
rápida y guiada. Para usar las herramientas de análisis de datos, primero se tiene que habilitar,
para lo cual seguimos los siguientes pasos:

1. Hacer clic en el botón Archivo y elija Opciones, Complementos, y en Administrar seleccionar


Complementos de Excel y clic en Ir.

2. En la ventana Complementos: Activar Herramientas para análisis y clic en Aceptar.

3. Ahora se visualiza en la ficha Datos, en el grupo Análisis, está como Análisis de datos.

8
COVARIANZA

Ejercicio 1:

El Centro nutricional Trilce, desea determinar la covarianza de la variable talla y peso de un total
de 31 pacientes mujeres entre las edades de 25 y 39 años, según se muestra en la imagen:

Desarrollo:

Se desea determinar la covarianza de la variable talla y peso de un total de 31 pacientes


mujeres entre las edades de 25 y 39 años.
Solución:
1. Hacer clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.

2. En la ventana de Análisis de datos, seleccionar Covarianza, clic en Aceptar

9
3. En la ventana Covarianza, ingresar los siguientes datos:
Rango de entrada: ($B$1:$C$32) corresponde a los datos de la variable altura y
peso.
Agrupado por: Seleccionar por columnas (las variables altura y peso se
encuentran en columnas).
Rótulos en la primera fila: Marcar porque corresponde a los textos con los
nombres de las variables Altura y Peso.
Opciones de salida: clic en Rango de salida y seleccionar la celda F2.
Finalmente, clic en Aceptar.

4. Se muestran los resultados.

10
Se observa que la Covarianza de las dos variables es: 47.85, lo que significa que hay una
alta correlación entre las dos variables.

COEFICIENTE DE CORRELACIÓN

Ejercicio 1:

El Centro nutricional Trilce, desea determinar el coeficiente de correlación de la variable Altura


y Peso, de un total de 31 pacientes mujeres entre las edades de 25 y 39 años, según se muestra
en la imagen:

Desarrollo:

Se desea determinar el coeficiente de correlación de la variable Altura y Peso, de un total de


31 pacientes mujeres entre las edades de 25 y 39 años.

Solución:
1. Hacer clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.

11
2. En la ventana de Análisis de datos, seleccionar Coeficiente de correlación, clic en
Aceptar.

3. En la ventana Coeficiente de correlación:


Rango de entrada: ($B$1:$C$32) corresponde a los datos de la variable altura y
peso.
Agrupado por: Seleccionar por columnas (las variables altura y peso se
encuentran en columnas)
Rótulos en la primera fila: Marcar porque corresponde a los textos con los
nombres de las variables Altura y Peso.
Opciones de salida: clic en Rango de salida y seleccionar la celda F2.
Finalmente, clic en Aceptar.

4. Se muestran los resultados.

12
Se observa que el coeficiente de correlación de las dos variables es: 0.99827492, lo que
significa que hay una correlación alta entre las dos variables.

4. GRÁFICOS ESTADÍSTICOS

Los gráficos en Excel son una buena opción para representar información estadística, que mejora
la comprensión de los datos de información. Los gráficos son una excelente herramienta para
resumir la información e identificar fácilmente cualquier tendencia en los datos que ayudan a
que la audiencia visualice los resultados de una forma más efectiva.

4.1 Histograma
¿Qué es un Histograma? Un histograma es un tipo de gráfico que cuenta con amplias
aplicaciones en la estadística. Los histogramas permiten una interpretación visual de datos
numéricos al indicar el número de puntos de datos que permanecen dentro del rango de
valores, denominado una clase o compartimento. La frecuencia de datos que cae en cada
clase es representada mediante el uso de una barra.

Ejercicio 1:

La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades de
los pacientes atendidos en el área de emergencia, en temporada de invierno, la muestra
poblacional fue de 120 encuestados. Se solicita representar la información mediante un
gráfico de histograma de frecuencias teniendo en cuenta la siguiente tabla. Según se
muestra en la imagen:

Desarrollo:

Se solicita representar la información mediante un gráfico de histograma de


frecuencias.

13
Solución:
1. Hacemos un clic en una celda vacía, luego vamos a la ficha Insertar, luego clic en
gráfico de columna agrupada, se muestra un gráfico vacío.

2. Luego en la ficha Diseño, en grupo Datos, Clic en Seleccionar datos.

3. En la ventana Seleccionar origen de datos, clic en Agregar:

4. En la ventana Modificar serie, ingresar los siguientes datos:

14
Nombre de la serie: Histograma de frecuencias.
Valores de la serie: =Histograma!$N$3:$N$8 (frecuencia absoluta simple)
Clic en Aceptar.

5. Ahora en la ventana Seleccionar origen de datos, hacer clic en Editar.

6. Ahora en la ventana Rótulos del eje, se selecciona el grupo de las Xi (las marcas de
clase) luego clic en Aceptar.

7. Luego en la ventana Seleccionar origen de datos, clic en Aceptar.

15
8. En esta ventana vemos que el gráfico necesita una apariencia más segura y para ello
haciendo clic derecho en una de las columnas, nos muestra una ventana contextual
y haremos clic en Dar formato a serie de datos.

9. En la ventana de Formato de serie de datos cambiar el Ancho de rango: 5% al ancho


del intervalo.

16
Con el mismo caso del ejercicio 1, pero ahora para utilizar la herramienta de análisis
de datos:

La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades
de los pacientes atendidos en el área de emergencia, en temporada de invierno, la
muestra poblacional fue de 120 encuestados. Se solicita representar la información
mediante un gráfico de histograma de frecuencias teniendo en cuenta la siguiente
tabla. Según se muestra en la imagen:

Desarrollo:

Se solicita representar la información mediante un gráfico de histograma de frecuencias


utilizando herramienta de análisis de datos (Histograma).
Solución:

17
1. Clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.

2. En la ventana de Análisis de datos, seleccionar Histograma y Aceptar.

3. Luego en ventana Histograma ingresar los siguientes datos.


Rango de entrada: Seleccionar $B$3:$I$17 (información de los encuestados)
Rango de clases: $M$3:$M$8: (los grupos)
Rango salida: $M$12, donde se mostrará el gráfico
Crear gráfico: activar la casilla Crear gráfico y clic en Aceptar

4. En la siguiente ventana se muestran los resultados.

18
4.2 Dispersión
Los gráficos de dispersión también son conocidos como gráficos XY y su función principal
es la de mostrar la relación que existe entre los valores numéricos de diferentes series de
datos sobre los ejes de coordenadas XY.

Ejercicio:

El gerente de cadena de Pizzería Trilce, solicita crear un gráfico de dispersión para saber si
existe relación entre la población estudiantil y las ventas trimestrales, los lugares donde
sus establecimientos han tenido más éxito están cercanos a establecimientos de
educación superior, las ventas trimestrales (representadas por Y) y población estudiantil
(representada por X), según se muestra en la imagen:

19
Desarrollo:

Se solicita crear un gráfico de dispersión para saber si existe relación entre población
estudiantil y ventas trimestrales.

Solución:
1. Seleccione las celdas C1:D11 (información de Población estudiantil y Ventas
trimestrales).

2. Seleccionar ficha Insertar, en el grupo Gráficos, hacer clic en botón gráfico de


dispersión.

3. Seleccionar el grafico de Dispersión.

20
4. Se muestra el grafico Dispersión.

Se visualiza en el grafico que existe una relación entre las variables, a mayor
población estudiantil mayor serán las ventas trimestrales.

4.3 Ojiva
Los gráficos de ojiva se usan para mostrar frecuencias acumulativas. Una línea conecta los
puntos superiores de cada elemento para mostrar el flujo de la información. Aunque los
gráficos de ojiva pueden hacerse a mano, a menudo ahorra tiempo y esfuerzo ingresar los
valores en una base de datos. Selecciona el área de datos ingresados y usa un ayudante
de gráficos para construir tu ojiva.

21
Ejercicio:

La Clínica “Trilce” hizo una encuesta en un día determinado, para conocer las edades de
los pacientes atendidos en el área de emergencia, en temporada de invierno, la muestra
poblacional fue de 120 encuestados. Se solicita representar la información mediante un
gráfico de ojiva teniendo en cuenta la siguiente tabla. Según se muestra en la imagen:

Desarrollo:

Se solicita representar la información mediante un gráfico de ojiva teniendo en


cuenta los intervalos y la frecuencia acumulada de las edades de los pacientes.

Solución:
1. Seleccione las celdas K2:K8; presionar la tecla Ctrl y seleccionar ahora M2:M8.

2. Seleccionar ficha Insertar, en el grupo Gráficos, hacer clic en botón insertar gráfico
de líneas o áreas.

3. Seleccionar el grafico de Líneas con marcadores.

22
4. Se muestra como resultado el gráfico de Ojiva.

5. REGRESIÓN LINEAL

Los gráficos pueden ayudar a validar los supuestos de normalidad, linealidad e igualdad de las
varianzas. También son útiles para detectar valores atípicos, observaciones poco usuales y casos
de influencia. Tras guardarlos como nuevas variables, dispondrá en el Editor de datos de los
valores pronosticados, los residuos y otra información de diagnóstico, con los cuales podrá crear
gráficos respecto a las variables independientes.

23
En Excel puedes realizar un gráfico de regresión lineal, mostrando su ecuación siempre y cuando
se contemple la tendencia y proyección en la tabla de datos.

Ejercicio:

El gerente de cadena de Pizzería Trilce, solicita realizar un análisis de regresión lineal mediante
un gráfico de dispersión para saber si existe relación entre la población estudiantil y las ventas
trimestrales, los lugares donde sus establecimientos han tenido más éxito están cercanos a
establecimientos de educación superior, las ventas trimestrales (representadas por Y) y
población estudiantil (representada por X), según se muestra en la imagen:

Desarrollo:

Se solicita crear un gráfico de dispersión para saber si existe relación entre población
estudiantil y ventas trimestrales.

Solución:

1. Seleccione las celdas C1:D11 (información de Población estudiantil y Ventas trimestrales).

24
2. Seleccionar ficha Insertar, en el grupo Gráficos, hacer clic en botón gráfico de dispersión.

3. Seleccionar el grafico de Dispersión.

4. Se muestra el grafico Dispersión.

25
5. Clic en cualquier punto del gráfico, luego clic derecho y seleccionar Agregar línea de
tendencia.

6. En la ventana de Formato de línea de tendencia, activar Presentar ecuación en el gráfico.

7. Se muestra el grafico con la ecuación de la regresión lineal.

26
ANÁLISIS DE REGRESIÓN LINEAL UTILIZANDO ANÁLISIS DE DATOS

Vamos a tomar el mismo ejercicio para este caso.

Ejercicio:

El gerente de cadena de Pizzería Trilce, solicita realizar un análisis de regresión lineal mediante
un gráfico de dispersión para saber si existe relación entre la población estudiantil y las ventas
trimestrales, los lugares donde sus establecimientos han tenido más éxito están cercanos a
establecimientos de educación superior, las ventas trimestrales (representadas por Y) y
población estudiantil (representada por X), según se muestra en la imagen:

Desarrollo:

Se solicita realizar el análisis de regresión lineal utilizando la herramienta de análisis de


datos.

27
Solución:

1. Clic en la ficha Datos, en el grupo Análisis, clic en Análisis de datos.

2. En la ventana Análisis de datos, seleccionar Regresión y clic en Aceptar.

3. En la ventana de Regresión ingresar los siguientes valores


Rango Y de entrada: $D$1:$D$11 (Ventas trimestrales)
Rango X de entrada: $C$1:$C$11(Población estudiantil)
Activar: Rótulos, Nivel de confianza (95%)
Rango de salida: $B$15 (lugar donde se mostrarán los resultados).

28
4. En la siguiente ventana se muestran los resultados de la Regresión, con los coeficientes de
intercepción 60 y población estudiantil 5, estos valores se representan en la línea recta
(Y=5x+60) y se visualiza idéntica al gráfico.

Grafico

29
6. BIBLIOGRAFÍA

• Microsoft Excel 2019 Paso a Paso, Hanz Valentin, ValentinBook Publishing.


• Curso avanzado de Excel paso a paso, wordexperto Pepe Martínez.

SITIOS WEB

https://dtutivenc20162017.wordpress.com/292-2/

https://exceltotal.com/graficos-de-dispersion/

https://pildorasdeexcel.wordpress.com/2017/01/20/calculando-covarianzas-con-excel/

https://help.xlstat.com/s/article/regresion-lineal-multiple-tutorial-en-excel?language=es

30

You might also like