You are on page 1of 9

UNIVERSIDAD TÉCNICA DE COTOPAXI

EXTENSION LA MANA

FACULTAD DE CIENCIAS ADMINISTRATIVAS LICENCIATURA EN


ADMINISTRACION DE EMPRESAS

TEMA:

Resumen Distribuciones de probabilidad.

INTEGRANTES:

Edgar Alexis Vega Pastuña

Evelyn Paulina Pilatasig Ayala

Marlene Yajaira Pastuña Tipan

Jose Armando Cedeño Vivas

DOCENTE:

Ing. MSc. Martínez Fabian Xavier

ASIGNATURA

Estadística para la Investigación

CICLO:

Sexto

PERIODO ACADEMICO:

ABRIL 2023 - AGOSTO 2023


RESUMEN
Desviación estándar

La desviación estándar se define como la raíz cuadrada positiva de la varianza.


Continuando con la notación adoptada para la varianza muestral y para la varianza
poblacional, se emplea para denotar la desviación estándar muestral y σ para denotar la
desviación estándar poblacional. La desviación estándar se obtiene de la varianza como
sigue.

Desviación estándar poblacional _ σ _ _σ2


Desviación estándar muestral _ s _ _s2

Ejemplo
El gerente de una empresa de alimentos desea saber que tanto varían los pesos de los
empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco
unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510,
515 y 520) gramos respectivamente.
Por lo que su media es:
Coeficiente de variación

En algunas ocasiones se requiere un estadístico descriptivo que indique cuán grande


es la desviación estándar en relación con la media. Esta medida es el coeficiente de variación
y se representa como porcentaje.

Su utilidad estriba en que nos permite comparar la dispersión o variabilidad de dos o


más grupos. Así, por ejemplo, si tenemos el peso de 5 pacientes (70;60; 56; 83 y 79 kg) cuya
media es de 69,6kg. y su desviación típica (s)=10,44 y la TAS de los mismos (150 ; 170; 135;
180 y 195 mm Hg) cuya media es de 166 mm Hg y su desviación típica de 21,3. La pregunta
sería: ¿qué distribución es más dispersa, el peso o la tensión arterial? Si comparamos las
desviaciones típicas observamos que la desviación típica de la tensión arterial es mucho
mayor; sin embargo, no podemos comparar dos variables que tienen escalas de medidas
diferentes, por lo que calculamos los coeficientes de variación:

A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.

Fórmula para calcular el sesgo de datos muestral:


Puntos z

Además de las medidas de localización, variabilidad y forma, interesa conocer


también la ubicación relativa de los valores de un conjunto de datos. Las medidas de
localización relativa ayudan a determinar qué tan lejos de la media se encuentra un
determinado valor.

Al punto z también se le suele llamar valor estandarizado. El punto zi puede ser


interpretado como el número de desviaciones estándar a las que xi se encuentra de la media

El punto z de cualquier observación se interpreta como una medida relativa de la


localización de la observación en el conjunto de datos. Por tanto, observaciones de dos
conjuntos de datos distintos que tengan el mismo punto z tienen la misma localización
relativa; es decir, se encuentran al mismo número de desviaciones estándar de la media.

Teorema de Chebyshev

El teorema de Chebyshev permite decir qué proporción de los valores que se tienen
en los datos debe estar dentro de un determinado número de desviaciones estándar de la
media.
Ejemplo

Una muestra de tamaño n=50 tiene media x¯=28 y desviación estándar s=3. Sin
saber nada más sobre la muestra, ¿qué se puede decir del número de observaciones que se
encuentran en el intervalo (22,34)? ¿Qué se puede decir del número de observaciones que se
encuentran fuera de ese intervalo?

Solución:

El intervalo (22,34) es el que se forma sumando y restando dos desviaciones estándar


de la media. Por el Teorema de Chebyshev, al menos 3/4 de los datos están dentro de este
intervalo. Dado que ¾ de 50 es 37.5, esto significa que al menos 37.5 las observaciones
están en el intervalo. Pero no se puede tomar una observación fraccionaria, por lo que
concluimos que al menos 38 las observaciones deben estar dentro del intervalo (22,34). Si al
menos 3/4 de las observaciones están en el intervalo, entonces en la mayoría 1/4 de ellas
están fuera de él. Dado que 1/4 de 50 es 12.5, a lo sumo 12.5 las observaciones están fuera
del intervalo. Ya que de nuevo una fracción de una observación es imposible, x (22,34).

Regla empírica
Una de las ventajas del teorema de Chebyshev es que se aplica a cualquier conjunto
de datos, sin importar la forma de la distribución de los datos. En efecto se usa para cualquiera
de las distribuciones. Sin embargo, en muchas aplicaciones prácticas los datos muestran una
distribución simétrica con forma de montaña o de campana. Cuando se cree que los datos
tienen aproximadamente esta distribución, se puede emplear la regla empírica para
determinar el porcentaje de los valores de los datos que deben encontrarse dentro de un
determinado número de desviaciones estándar de la media.

Diagrama de caja

Un diagrama de caja es un resumen gráfico de los datos con base en el resumen de


cinco números. La clave para la elaboración de un diagrama de caja es el cálculo de la
mediana y de los cuartiles Q1 y Q3 También se necesita el rango intercuartílico, RIC _ Q3 _
Q1.

Ejemplo

Cuarenta estudiantes tomaron el examen de admisión de álgebra universitaria y los


resultados del mismo se resumen en el diagrama de caja y bigotes de abajo. Cuántos
estudiantes serán admitidos para inscribirse en dicha clase si la marca de aprobación se ubicó
en:
(i) 65%

(ii) 60%

Del diagrama, podemos visualizar la siguiente información.

Puntaje m\'{a}s bajo = 52%


Primer cuartilPuntaje = 60%
Puntaje de la Mediana = 65%
Tercer cuartil = 77%
Puntaje m\'{a}s alto = 97%

Dado que las marcas de aprobación corresponden a los puntajes de la mediana y del
primer cuartil, realmente se nos está preguntando ¿Cuántos estudianes hay en: (i) la mitad
superior de los datos y (ii) los 3 cuartos superiores de la población?

Solución

(i) Si la marca de aprobación fue del 65%, entonces 20 estudiantes pasaron.


(ii) Si la marca de aprobación fue del 60%, entonces 30 estudiantes pasaron.

Observa de nuevo a la información que obtenemos de un diagrama de caja y bigotes.


Un diagrama de caja y bigotes siempre representará cinco cantidades en el resumen de cinco
números: el valor más pequeño, el primer cuartil, la mediana, el tercer cuartil y el valor más
grande.
Medidas de la asociación entre dos variables

Hasta ahora se han examinado métodos numéricos que resumen datos en una sola
variable. Con frecuencia los administradores o quienes toman decisiones necesitan conocer
la relación entre dos variables. En esta sección se presentan la covarianza y la correlación
como medidas descriptivas de la relación entre dos variables.

Covarianza

En una muestra de tamaño n con observaciones (x1, y1), (x2, y2), etc., la covarianza
muestral se define como sigue:

Esta fórmula aparea cada xi con una yi. Después se suman los productos obtenidos al
multiplicar la desviación de cada xi de su media muestral por la desviación de la yi
correspondiente de su media muestral y¯; esta suma se divide entre n _ 1 entre x y y.

Ejemplo

Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respectivamente, 14, 20,32, 42 y 44


kilos.Hallar la covarianza.
➢ X= 25/5=5
➢ Y=152/5=30.4
➢ Qx2=151/5-52
➢ Qy2=5320/2-30.42=139.84
➢ Qxy=894/6-5*30*4=26.8

You might also like