You are on page 1of 49

Probabilidad y Estadstica

M.I. Elia Ins Luna Ceballos


eli_luna33@hotmail.com
Objetivo
El alumno aplicar los conceptos y la metodologa bsica
de la teora de la probabilidad para analizar algunos
fenmenos aleatorios que ocurren en la naturaleza y la
sociedad.
Temario
1. Anlisis estadstico de datos muestrales
2. Fundamentos de la teora de la probabilidad
3. Variables aleatorias
4. Modelos probabilsticos comunes
5. Variables aleatorias conjuntas
6. Distribuciones muestrales
7. Manejo de datos bivariados
Reglas
Prohibido fumar
Prohibido comer en el saln de clases
Celular en modo silencioso

* Entregar tareas en papel de reso


Evaluacin
Tareas y ejercicios de clase 25%
Series 15%
Evaluaciones 60%
Evaluacin 1 20%
Evaluacin 2 20%
Evaluacin 3 20%

Para tener derecho a final es obligatoria la entrega mnima


del 50% de las tareas y ejercicios de clase.
Bibliografa Recomendada
DEVORE, Jay L. Probabilidad y estadstica para ingeniera y
ciencias, 9a edicin, Mxico Cengage Learning, 2016
WACKERLY, Dennis, MENDENHALL, William, SCHEAFFER,
Richard Estadstica matemtica con aplicaciones, 7a edicin,
Mxico, Cengage Learning Editores, 2010
Notas de Leonardo Bauelos Saucedo y Nayelli Manzanarez
Gmez http://www.dcb.unam.mx/users/angellbs/

Murray R. Spiegel , Probabilidad y Estadstica, Serie de


Comprendios Schaum, McGraw-Hill

freelibros.org
TEMA I
Anlisis estadstico de datos muestrales

Objetivo: El alumno podr describir los datos de una


muestra y obtener las medidas descriptivas ms
significativas.

1 La poblacin y la muestra. Relacin entre la probabilidad y


la estadstica. Clasificaciones de la estadstica.
2 Estadstica descriptiva: Anlisis de datos univariados. Tabla
de distribucin de frecuencias. Histogramas y polgonos de
frecuencias. Medidas de tendencia central, dispersin y
asimetra.
3 Uso de equipo de cmputo.
TEMA I
Anlisis estadstico de datos muestrales
. S

Poblacin: conjunto de todos los


posibles resultados de un experimento

Muestra: subconjunto de la poblacin


que contiene los resultados observados
de un experimento.
TEMA I
Anlisis estadstico de datos muestrales
Univariable
Segn el
nmero de
variables
Multivariable

Tablas de
frecuencia

Estadstica Descriptiva Grficas


Segn su
aplicacin
Medidas
Inferencial
Numricas

Paramtrica
Segn la
informacin que
se posee
No.Paramtrica
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 0
El nmero de alumnos reprobados por grupo de la materia
PyE durante cierto semestre fue el siguiente:

15 1 8 29 8
15 26 14 5 24
10 11 22 5 29
3 14 23 10 3
20 9 14 5 8
26 5 1 10 2
TEMA I
Anlisis estadstico de datos muestrales
Elementos de una tabla terica completa
Lmite Fronteras Marca Frecuencia Frecuencia Frecuencia Frecuencia
de de clase de acumulada relativa acumulada
clase clase relativa

1-3 0.5-3.5 2 6 6 0.6 0.6
4-6 3.5-6.5 5 4 10 0.4 1
TEMA I
Anlisis estadstico de datos muestrales
Recomendaciones para elaborar una tabla:
1. El nmero de clases est entre 5 y 20 inclusive
2. La primer aproximacin del nmero de clases se
obtiene con:
3. Todas las clases deben ser de la misma longitud
4. La longitud de la clase se aproxima mediante:

.
5. Deber evitarse que haya intervalos vacos.
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 1
Dada la tabla de datos, hacer una tabla de distribucin de
frecuencias terica completa.

10.5 8.3 8.8 7.5 10.5


11.7 7.2 7.6 11.6 7
9.3 7.8 8.8 6.1 6.6
8.7 9.4 5.8 7.8 5.2
9.4 6.4 8.2 9 8.6
6.6 9.8 9 7 12.4
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 2
Dada la tabla de datos, hacer una tabla de distribucin de
frecuencias terica completa.

280 310 710 530 340 350


410 130 610 470 950 100
900 490 970 900 760 130
690 590 380 300 440 790
550 890 160 460 580 600
370 770 400 650 760 330
TEMA I
Anlisis estadstico de datos muestrales
Histograma: Grfica de barras rectangulares cuyas bases
estn centradas en las marcas de clase del intervalo y sus
reas son proporcionales a la frecuencia del intervalo.
TEMA I
Anlisis estadstico de datos muestrales
Polgono de Frecuencias: es una grfica de lneas rectas (o
poligonal) que indica para cada marca de clase la
frecuencia.
TEMA I
Anlisis estadstico de datos muestrales
Ojiva: Grfica poligonal que se dibuja utilizando las
fronteras contra las frecuencias acumuladas.
TEMA I
Anlisis estadstico de datos muestrales
TAREA 3
Elaborar tabla de distribucin de frecuencias terica
completa para los siguientes datos.
Histograma
9

6
Frecuencia

0
0.4 1.3 2.2 3.1 4 4.9
Clase
TEMA I
Anlisis estadstico de datos muestrales
EJERCICIO DE CLASE 1
Completar la tabla terica completa y dibujar histograma,
polgono de frecuencia y Ojiva.

Frecuencia
Lmite inf de Lmite sup de Frontera Frontera Marca de Frecuencia Frecuencia
Frecuencia acumulada
clase clase inferior Superior clase acumulada relativa
relativa

3 7
0.125 0.271
0.208
0.625
0.104
0.875
100 86.5 100.5 48 0.125 1.000
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS NUMRICAS

Medidas de tendencia central


Son valores representativos de un conjunto de datos, que
se sitan en la parte central de los mismos. Las medidas de
tendencia central ms conocidas son la media, la mediana y
la moda.
TEMA I
Anlisis estadstico de datos muestrales

MEDIA
TEMA I
Anlisis estadstico de datos muestrales
Mediana: es el valor que divide al conjunto en dos
conjuntos de igual tamao, o bien, es el promedio de los
dos valores centrales. Se denota por

Cuando los datos no estn agrupados, se deben ordenar en


forma ascendente o descendente y seleccionar el valor
central.
Cuando los datos estn agrupados, entonces se realiza una
interpolacin lineal utilizando las fronteras y la frecuencia
acumulada (los datos de la ojiva), para encontrar el valor de

en el cual la frecuencia acumulada es de .
2
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 3

Obtener la media, mediana y moda de los siguientes datos


no agrupados:
5 7 8 2 5 7 8 2
6 7 9 3 7 9 4 5
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 4
Obtener la media, mediana y moda de los siguientes datos
agrupados:
Fronteras
de clase
28.5 - 36.5 32.5 4 4
36.5 - 44.5 40.5 5 9
44.5 - 52.5 48.5 9 18
52.5 - 60.5 56.5 8 26
60.5 - 68.5 64.5 8 34
68.5 - 76.5 72.5 10 44
76.5 - 84.5 80.5 6 50
TEMA I
Anlisis estadstico de datos muestrales
Moda. La moda de un conjunto de datos es el valor que
se repite con mayor frecuencia. Se denota por , o en
ocasiones .
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 5
Obtener la moda de los siguientes datos agrupados:
Frontera
s de clase
28.5 - 36.5 32.5 4 4
36.5 - 44.5 40.5 5 9
44.5 - 52.5 48.5 9 18
52.5 - 60.5 56.5 8 26
60.5 - 68.5 64.5 8 34
68.5 - 76.5 72.5 10 44
76.5 - 84.5 80.5 6 50
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 6
Obtener las medidas de tendencia central de los siguientes
datos agrupados:
Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
TAREA 4
Elaborar una tabla terica de frecuencias para los siguientes
datos con 5 clases y una longitud de clase de 166.
Calcular las medidas de tendencia central para datos no
agrupados y para datos agrupados.

111 107 412 260 259


254 341 573 845 460
883 262 252 905 702
675 561 703 271 890
933 142 228 606 845
120 340 224 754 597
TEMA I
Anlisis estadstico de datos muestrales
Simetra
Para un conjunto de datos con distribucin de frecuencia
unimodal y poca simetra se tiene la siguiente relacin
emprica:
= 3

Si la distribucin es simtrica y unimodal, entonces se tiene


la siguiente relacin:
= =
TEMA I
Anlisis estadstico de datos muestrales
Cuartiles (Q), Deciles (D) y percentiles (P)

Los datos pueden dividirse en cuatro conjuntos de igual


tamao (cuartiles), en 10 conjuntos de igual tamao
(deciles) y en 100 conjuntos de igual tamao (percentiles).
Los cuartiles se denotan generalmente por 1 , 2 3 , y
el segundo cuartil coincide con la mediana.
Los deciles se denotan 1 , 2 , 3 , , 9 , y el quinto decil
coincide con la mediana y con el segundo cuartil.
Los percentiles se denotan 1 , 2 , 3 , 99 el percentil 50
coincide con la mediana, con el segundo cuartil y con el
quinto decil.
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 7

Obtener los cuartiles para datos no agrupados de los


siguientes datos:
280 530 490 760
410 470 590 440
900 900 890 580
690 300 770 760
550 460 710 350
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 8
Obtener los cuartiles para datos agrupados de los
siguientes datos:
Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
TAREA 5
Ojiva de frecuencia acumulada relativa
1 1
0.9 0.966666667
0.8
0.716666667
0.6

0.4
0.45

0.2
0.133333333
0 0
8050 8350 8650 8950 9250 9550 9850

a) Determinar si la distribucin emprica es o no simtrica.


b) Calcular los deciles
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS DE DISPERSIN

Rango
Desviacin media
Variancia
Desviacin estndar,
Rango semi-intercuartil
Coeficiente de variacin
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 8

Obtener el rango de los siguientes datos agrupados.


Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS DE DISPERSIN: DESVIACIN MEDIA
Es el promedio de las distancias de cada valor con respecto
a la media.
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 8
Obtener la desviacin media de los siguientes datos
agrupados.
Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS DE DISPERSIN:VARIANCIA
Es el promedio de las distancias cuadradas de cada valor
con respecto a su media.
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 8
Obtener la variancia y desviacin estndar de los siguientes
datos agrupados.
Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS DE DISPERSIN: COEFICIENTE DE
VARIACIN
Es una medida de la dispersin en relacin con la media de
los datos


=

TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 8
Obtener el coeficiente de variacin de los siguientes datos.

Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 9
La siguiente distribucin representan los montos por
concepto de carga, adeudados a una compaa americana de
35 facturas.

Calcular el coeficiente de variacin.


TEMA I
Anlisis estadstico de datos muestrales
TAREA 6
Un hospital elabor el siguiente histograma de frecuencias
tomando como base una muestra aleatoria de los pesos (en
kg.) de los bebs recin nacidos en ese hospital.
Con base en la informacin proporcionada en la grfica
a) Obtenga el peso promedio de la muestra.
b) La moda de la muestra.
c) La desviacin media de la muestra.
d) La varianza de la muestra.
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 10

Considere el caso de dos alumnos que obtuvieron las


siguientes calificaciones durante el semestre pasado:

a) Obtenga el valor de la media, mediana y moda de las


calificaciones obtenidas por cada alumno.
b) Obtenga el valor de la varianza de las calificaciones de
cada alumno e indique cul de los dos conjuntos de
datos tiene mayor variabilidad?
TEMA I
Anlisis estadstico de datos muestrales
MEDIDAS DE FORMA (de Fisher)
Mide la
simetra
Sesgo
3
3 = 3

Medidas de
forma
Mide el
aplanamiento
Curtosis
4
4 = 4

TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 11
De la siguiente tabla, calcular el sesgo y la curtosis.

Front front
Li Lsup inf sup x_i fi Fi f*i F*i
40 190 35 195 115 6 6 0.1667 0.1667
200 350 195 355 275 5 11 0.139 0.306
360 510 355 515 435 8 19 0.222 0.528
520 670 515 675 595 6 25 0.1667 0.694
680 830 675 835 755 6 31 0.1667 0.861
840 990 835 995 915 5 36 0.1389 1
TEMA I
Anlisis estadstico de datos muestrales
EJEMPLO 12
La siguiente distribucin representan los montos por concepto
de carga, adeudados a una compaa americana de 35 facturas.

a) Determinar si la distribucin es o no simtrica.


b) Clasificar la distribucin por su grado de aplanamiento.
TEMA I
Anlisis estadstico de datos muestrales
EJERCICIO DE CLASE 2
Los datos que se muestran en la siguiente tabla de
frecuencias, fueron obtenidos por la observacin de una
cmara oculta, corresponden a las velocidades, para una
muestra aleatoria de 37 coches que recorren el circuito
interior en CU.
TEMA I
Anlisis estadstico de datos muestrales
EJERCICIO DE CLASE 2
a) Completar la tabla de frecuencias con los datos faltantes.
b) Calcular la media, moda y mediana.
c) Determinar la varianza, la desviacin estndar y el coeficiente de variacin.
d) Obtener el sesgo e interpretarlo.
e) Calcular el coeficiente de curtosis e interpretarlo.