You are on page 1of 131

Manual de Estadstica

EST-103

Maria Teresa Villalobos

Estudios Generales Letras


Marzo 2016

Presentacin
La presente gua resume la teora necesaria para llevar el curso Estadstica
de Estudios Generales Letras de la Pontificia Universidad Catlica del Per. Se ha
realizado con la finalidad de brindar a los alumnos una ayuda en su proceso educativo y una herramienta que colabore en el dictado de las clases.
Es muy importante resaltar que este material no sustituye la clase del profesor y ni tampoco equivale a un libro de texto.
Esta gua est basada en el trabajo de los profesores: Ana Valdivia, Sergio
Pavletich y Walter Luna.
Se agradece que los usuarios de esta gua hagan llegar sus crticas y comentarios a esta publicacin.
Maria Teresa Villalobos.
Pando, marzo del 2016

Contenido
Captulo 1. Nociones de Estadstica Descriptiva ................................................................. 3
1.1. Conceptos bsicos .............................................................................................................. 3
1.2. Organizacin y tratamiento de datos ................................................................................ 12
1.3. Grficos y tablas estadsticas ............................................................................................ 14
1.4. Tablas de contingencia ..................................................................................................... 24
1.5. Grficos a partir de tablas de contingencia ........................................................................ 25
1.6. Estadsticos de posicin .................................................................................................... 29
1.7. Medidas de tendencia central .......................................................................................... 34
1.8. Medidas de dispersin ..................................................................................................... 42
1.9. Indicadores de asimetra .................................................................................................. 50
1.10. Estadstica descriptiva bidimensional: Regresin lineal simple ......................................... 59

Captulo 2. Nociones de probabilidad .............................................................................. 67


2.1. Conceptos bsicos ............................................................................................................ 67
2.2. Definicin clsica de probabilidad..................................................................................... 74
2.3. Definicin axiomtica de probabilidad .............................................................................. 77
2.4. Probabilidad condicional .................................................................................................. 80
2.5. Eventos independientes ................................................................................................... 85

Captulo 3. Variables aleatorias y modelos o distribuciones de probabilidad .................... 91


3.1. Variable aleatoria............................................................................................................. 91
3.2. Variable aleatoria discreta................................................................................................ 92
3.3. Algunos modelos discretos importantes ........................................................................... 96
3.4. Algunos modelos continuos importantes .........................................................................105
3.5. Teorema central del lmite ..............................................................................................113

Captulo 4. Introduccin a la Estadstica Inferencial ........................................................119


4.1. Muestra aleatoria ...........................................................................................................119
4.2. Estimacin de parmetros ...............................................................................................119
Tablas estadsticas .................................................................................................................128

Estadstica EEGGLL

Captulo 1. Nociones de Estadstica Descriptiva


1.1. Conceptos bsicos
Definicin de Estadstica
La Estadstica se ocupa de la recoleccin, organizacin, presentacin y anlisis de datos que corresponden a fenmenos o situaciones en donde est presente la variabilidad.

Recoleccin

Organizacin

Presentacin

Objetivos y
Necesidades
de
informacin

Anlisis

Subdivisin de la Estadstica
Estadstica
Descriptiva

Son mtodos y tcnicas de recoleccin, caracterizacin y presentacin que


permiten describir, apropiadamente, las caractersticas de un conjunto de
datos. Comprende el uso de grficos, tablas y medidas resumen adems
de otras tcnicas.

Estadstica
Inferencial

Son mtodos y tcnicas que hacen posible estudiar una o ms


caractersticas de una poblacin o tomar decisiones sobre la poblacin
basados en el resultado de muestras. La generalizacin de los resultados
muestrales a toda la poblacin cae en el dominio de la Estadstica
Inferencial; en dicha generalizacin juega un papel muy importante la
teora de la Probabilidad.

Ejercicio 1
Indique si las siguientes afirmaciones son de tipo descriptiva o inferencial.
Afirmacin
El 32% de los encuestados cuenta con servicio de Internet en casa.
El 46% de todos los alumnos de EEGGLL son hombres.
La edad media de los estudiantes seleccionados es 19 aos.
El 47% de las personas encuestadas es de sexo femenino.
El 23% de los peruanos ha visitado Machu Picchu por lo menos una vez.

Notas

Tipo de afirmacin

Captulo 1. Nociones de Estadstica Descriptiva

Poblacin
Es el conjunto de todos los elementos de inters en determinado estudio.
Los elementos que forman la poblacin pueden ser personas, cosas, animales, instituciones, etc.
A cada elemento de la poblacin se le llama unidad estadstica.

Muestra
Es un subconjunto de elementos de la poblacin.

Poblacin

Conjunto de todos
los elementos de
inters en
determinado
estudio.

Muestra
Un subconjunto de
elementos de la
poblacin.

Cuando el objetivo es hacer inferencia estadstica es necesario que la muestra sea seleccionada de
acuerdo a un diseo aleatorio, es decir, que sus elementos sean escogidos al azar.
Ejemplo 1
Cada ao, el Departamento de Salud y Servicios Humanos de Estados Unidos examina a miles de
estadounidenses. Mdicos, dentistas, nutricionistas y tcnicos de salud realizan la Encuesta Nacional
de Examen de Salud y Nutricin (NHANES). Cada participante representa unos 50.000 personas.
1.
2.
3.
4.
5.
6.

NHANES divide los Estados Unidos en comunidades.


Las comunidades son divididas en vecindades.
Las vecindades son seleccionadas al azar.
De cada vecindad, las unidades de vivienda son seleccionadas al azar.
Las viviendas seleccionadas son visitadas por los entrevistadores que hacen unas preguntas cortas
a los a residentes para determinar si su familia es elegible para el estudio.
Las personas son seleccionadas en base a su edad, gnero, y origen racial/tnico.

Ejercicio 2
En el Per, se desea determinar el porcentaje de mujeres en edad frtil que usa algn mtodo anticonceptivo. Defina la poblacin.

Notas

Estadstica EEGGLL

Ejercicio 3
En el Per se desea determinar la media de las edades de las mujeres en edad frtil que usan algn
mtodo anticonceptivo. Defina la poblacin.

Ejercicio 4
Se desea determinar el porcentaje de agencias del Banco de Crdito con menos de 25 trabajadores.
Defina la poblacin.

Ejercicio 5

Tomado del folleto Lo que debes saber de Pisa 2015 Ministerio de Educacin.

Defina la poblacin del estudio para el caso peruano.


Resultados del estudio PISA 2013 por pases
Puesto
1
2
3
4

Pas
Shanghai-China
Singapur
Hong Kong-China
Taipei

65
66

Indonesia
Per

Fuente: OECD PISA 2013 database

Notas

Comprensin lectora

Matemtica

Ciencias

613

570

580

573

542

551

561

545

555

560

523

523

375

396

382

368

384

373

Captulo 1. Nociones de Estadstica Descriptiva

Variable estadstica
Una variable es una caracterstica que interesa observar o medir en las unidades estadsticas y que
puede asumir al menos dos valores diferentes.
Una variable estadstica es una funcin que a cada elemento de la poblacin le asigna un nmero.
Los nmeros se asignan de acuerdo con una escala y representan la medicin de una determinada
caracterstica en cada unidad estadstica.
En una poblacin se pueden definir muchas variables estadsticas.

Rango de la variable estadstica


Es el conjunto formado por todos los valores que puede asumir la variable estadstica.

Dato
Es el valor de la medicin de una variable, realizada en una unidad estadstica.

Variable

Rango
Caracterstica a
medir

Conjunto de
todos los valores
que puede
asumir

Dato
Valor de la
medicin

Ejercicio 6
Indique la poblacin, variables a medir y rangos y un posible dato de las siguientes investigaciones:
Se quiere estimar el porcentaje de personas, por sexo y por grupos de edades, que votaran por cierto candidato a la presidencia del Per.
Poblacin: ..
Variable

Rango

Un dato posible

Se quiere estimar el gasto promedio semanal en fotocopias de un alumno de EEGGLL.


Poblacin: ..
Variable

Rango

Un dato posible

Ejercicio 7
En una investigacin, se quiere estimar el ingreso promedio semanal de la fotocopiadora que est en
EEGGLL
Poblacin: ..
Variable

Notas

Rango

Un dato posible

Estadstica EEGGLL

Parmetro
Es un valor que describe una caracterstica de la poblacin. Para calcular un parmetro se requiere
medir la caracterstica de inters en todos los elementos que conforman la poblacin.

Estadstico
Es un valor que describe una caracterstica de la muestra. Para calcular el estadstico se usan las mediciones de la caracterstica de inters en los elementos que conforman la muestra de estudio.
Poblacin

Parmetro

Muestra

Estadstico

Ejercicio 8
Poblacin: Alumnos regulares
matriculados en la Facultad de
Ciencias e Ingeniera en el semestre
2016 01.

Parmetro: Edad media (en aos), calculada con todas las


edades de los alumnos que conforman la poblacin.

Muestra: Un conjunto de 100


alumnos regulares matriculados en
la Facultad de Ciencias e Ingeniera
en el semestre 2016 01,
seleccionados al azar.

Estadstico: Edad media (en aos), calculada con las edades


de los alumnos que conforman la muestra.

Ejercicio 9
El 13 de marzo del 2016, la empresa Ipsos, para el diario El Comercio, present los resultados de una
encuesta sobre intencin de voto. Indique si estos valores son parmetros o estadsticos.

(Fuente: El Comercio)

Notas

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicio 10
Poblacin: Vacas en la regin
Cajamarca.

Parmetro:
..................................................................................................
..................................................................................................

Muestra:
..........................................................
..........................................................
..........................................................

Estadstico:
.................................................................................................
.................................................................................................

Ejercicio 11
Poblacin: Das de los meses
enero, febrero y marzo de 2016.

Parmetro:
..................................................................................................
..................................................................................................

Muestra:
..........................................................
..........................................................
..........................................................

Estadstico:
.................................................................................................
.................................................................................................

Ejercicio 12
Segn los Censos Nacionales X de Poblacin y V de Vivienda 2007 ejecutados por el INEI, el 50,06%
de los peruanos es mujer. Indique si este valor es un parmetro o un estadstico.

Ejercicio 13
En octubre del 2011, Ipsos Apoyo present los resultados de una encuesta sobre sexualidad, reproduccin y desigualdades de gnero, en la cual se indica que el 55% de los entrevistados afirma que la
violencia fsica es el principal problema de la mujer peruana. Indique si este valor es un parmetro o
un estadstico.

Ejercicio 14
En una muestra de viviendas del rea urbana de Ica se observ que en el 35% de los casos, el material predominante de las paredes era adobe. Indique si este valor es un parmetro o un estadstico.

Notas

Estadstica EEGGLL

Tipos de variables
Las variables se pueden clasificar en cualitativas o cuantitativas.

Variables
cualitativas

Variables
cuantitativas

Son las variables que


miden una cualidad.
Son de carcter no
numrico y por lo
general clasifican a las
unidades estadsticas
en categoras.
Son variables que
miden una cantidad.
Son de carcter
numrico. A su vez, las
variables cuantitativas
se pueden clasificar en
discretas y continuas.

Variable cuantitativa
discreta

Es una variable cuyo rango


es un conjunto finito o
infinito numerable, es
decir, que en un intervalo
determinado, solo puede
tomar ciertos valores.

Variable cuantitativa
continua

Es una variable cuyo rango


es un conjunto continuo y
puede asumir un nmero
infinito no numerable de
valores diferentes; es
decir, que en un intervalo
determinado, pueden
tomar cualquier valor.

Son ejemplos de variables cualitativas las siguientes:


- Sector industrial al que pertenece una empresa,
- Tipo de material de construccin de una vivienda.
Son ejemplos de variables discretas las siguientes:
- Nmero de llamadas que ingresan a una central telefnica por minuto,
- Nmero de trabajadores de una agencia de bancos en una empresa.
Son ejemplos de variables continuas las siguientes:
- Tiempo, en minutos, que demora un estudiante en resolver un examen
- rea de terreno construida de una vivienda en Lima, en m2.
Ejercicio 15
Indique el tipo de las siguientes variables.
Variable
Nivel socioeconmico de una persona (bajo, medio, alto)
Cantidad de dinero gastado en una semana, en nuevos soles
Estatura, en centmetros, de una persona
Nmero de DNI
Escala de pagos de un alumno de la PUCP
Tipo de empresa (privada, pblica, otro)
Notas

Tipo de variable

Captulo 1. Nociones de Estadstica Descriptiva

10

Escalas de medicin de las variables


Medicin
Es el proceso de observacin de una caracterstica de inters (variable), sobre una unidad estadstica.

Escala de medicin
Asigna nmeros a las mediciones realizadas en las unidades estadsticas. Los nmeros asignados por
las escalas deben informar lo ms precisamente posible acerca de las caractersticas de cada unidad
observada.

Tipos de escalas de medicin


Stanley Smith Stevens (1906 1973) profesor de la Universidad de Harvard, en la revista
Science de junio de 1946, present su artculo Sobre la Teora de las Escalas de Medicin. La clasificacin de Stevens considera cuatro tipos de escala: nominal, ordinal, de
intervalo y de razn.
Tomado de http://www.nasonline.org/publications/biographical-memoirs/memoir-pdfs/Stevens_Stanley.pdf

Las variables de tipo cualitativo se miden en escalas nominal u ordinal; las variables de tipo cuantitativo se miden en escalas de intervalo y de razn.

Nominal
Una variable est medida en escala nominal cuando los valores de la variable clasifican a las unidades
estadsticas en iguales o diferentes.
Por ejemplo:
- Sexo:
1 = femenino; 2 = masculino
- Estado civil:
1 = casado; 2 = soltero; 3 = viudo; 4 = otro
- Especialidad de un alumno de Psicologa: social = 1; educacional = 2; clnica = 3

Ordinal
Una escala ordinal es una escala nominal cuyos valores reflejan el orden existente entre los valores
de la variable, segn el mayor o menor grado en el que se encuentre presente la caracterstica.
Por ejemplo:
- Escala de pagos de un alumno de la PUCP: 1, 2, 3, 4, 5
- Grado de instruccin: 1 = primaria completa; 2 = secundaria completa; 3 = superior completa
- Grado de satisfaccin de un cliente: 1 = muy insatisfecho; 2 = insatisfecho; 3 = satisfecho; 4 = muy
satisfecho.
- La consultora Mercer elabora este ranking cada ao. Justifica
que es importante disponer de una anlisis actualizado de la
calidad de vida en las ciudades, sobre todo para poder fijar
sueldos o condiciones para la plantilla y los ejecutivos. Se elabora a partir del anlisis 10 variables entre ellas el entorno
social, poltico, econmico y cultural, as como los servicios sanitarios y educativos, la disponibilidad de bienes de consumo y
el entorno natural para definir cules son los mejores lugares para vivir.
Notas

11

Estadstica EEGGLL

Intervalo
Una escala de intervalo es una escala ordinal en la que, adems, las diferencias entre los valores
asignados proporcionan informacin acerca de la diferencia en el grado en que se presenta la caracterstica observada.
Esta escala no tiene un cero real sino un cero relativo, definido arbitrariamente y que no indica ausencia de la caracterstica medida.
Por ejemplo:
- Temperatura, en grados centgrados.

- Altura de una ciudad, en metros sobre el nivel del mar.

Razn
Es una escala de intervalos en la que adems los nmeros asignados representan las cantidades de la
caracterstica que se mide.
La proporcin entre dos nmeros corresponde a la misma proporcin entre las cantidades de la caracterstica medida.
El cero es real e indica ausencia total de la caracterstica que mide la variable.
Por ejemplo:
- Sueldo bruto mensual, en nuevos soles, de los empleados de una empresa.
- Tiempo, en minutos, que tarda un alumno en terminar una prueba de agilidad mental.
- Peso, en kilogramos, de una persona.
- Velocidad, en metros por segundo.
- Velocidad, en Km por hora.
- Productividad del mes, en piezas producidas en un mes.
Ejercicio 16
Indique el tipo y la escala de medicin adecuada para las siguientes variables.
Variable
Cdigo de una alumna o alumno de la PUCP
Costo de una licencia del software SPSS
Nmero de aplicaciones en un celular
Material de una tubera (cobre, pvc, etc.)
Ao de nacimiento de una persona
Facultad (Letras y CCHH; Ciencias Sociales, Derecho,
Gestin y Alta Direccin, otras)
Nota en la primera prctica de Estadstica
Nmero de telfono
Acceso a Internet en casa (s, no)

Notas

Tipo de variable

Escala de medicin

12

Captulo 1. Nociones de Estadstica Descriptiva

1.2. Organizacin y tratamiento de datos


Distribucin de frecuencias
Es la representacin estructurada, en forma de tabla, de los datos que se han recolectado sobre una
variable en estudio.
Es til para resumir grandes volmenes de datos.
Permite que quienes toman decisiones puedan extraer directamente la informacin relevante.

Frecuencias simples
La frecuencia absoluta ni de una clase es la cantidad de datos que pertenecen a esa clase.
La frecuencia relativa fi de una clase es la proporcin de datos que pertenecen a esa clase.
frecuencia relativa fi

frecuencia absolutade la clasei


n
i
nmero totalde datos
n

La frecuencia porcentual pi de una clase es el porcentaje de datos que pertenecen a esa clase.
Ejercicio 17
Distribucin de visitantes extranjeros al Per, segn zona geogrfica, 2012
Zona geogrfica

Nmero de visitantes extranjeros

Sudamrica

Porcentaje

2 590 766

74,29%

Norteamrica

459 413

13,17%

Europa

294 440

8,44%

Centroamrica

138 654

3,98%

797

0,023%

79

0,002%

184

0,005%

3 013

0,086%

Asia
frica
Oceana
Otros
Total

3 487 346

Fuente: Ministerio del Interior - Direccin General de Migraciones y Naturalizacin


Elaboracin: Instituto Nacional de Estadstica e Informtica

Interprete los valores n1, f2 y p3

Notas

13

Estadstica EEGGLL

Ejercicio 18
La empresa IGK tom una muestra de personas y les pregunt por su bebida gaseosa preferida. Los
resultados se muestran a continuacin. Construya la distribucin de frecuencias de la variable en
estudio.
Inca Kola
Kola Real
Kola Real
Inca Kola
Inca Kola

Otras
Kola Real
Kola Real
Coca Cola
Coca Cola

Coca Cola
Inca Kola
Sprite
Otras
Inca Kola

Coca Cola
Inca Kola
Inca Kola
Kola Real
Inca Kola

Inca Kola
Sprite
Inca Kola
Coca Cola
Coca Cola

Kola Real
Inca Kola
Inca Kola
Coca Cola
Inca Kola

Sprite
Inca Kola
Otras
Coca Cola
Inca Kola

Coca Cola
Otras
Kola Real
Inca Kola
Sprite

Kola Real
Coca Cola
Coca Cola
Kola Real
Coca Cola

Distribucin de .
Marca de gaseosa

ni : Nmero de personas

fi: Proporcin de personas

pi: Porcentaje de personas

Total
Fuente: .....

Frecuencias acumuladas
Dado un conjunto de n datos cuantitativos, organizados en k clases, se define:
- La frecuencia acumulada absoluta Ni de una clase es la cantidad de datos que pertenecen hasta
esa clase.
Se tiene que:

Ni

n ,
j

i 1, 2,..., k

j 1

Luego,

N1 n1

Ni Ni 1 ni , i 2, 3,...,k

- La frecuencia acumulada relativa Fi de una clase es la proporcin de datos que pertenecen hasta
esa clase.
frecuencia relativa acumuladaFi

frecuencia absolutaacumuladai Ni

nmero total de datos


n

- La frecuencia acumulada porcentual Pi de una clase es el porcentaje de datos que pertenecen


hasta esa clase.

Notas

14

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicio 19
Los siguientes datos muestran el nmero de veces que fueron al cine el ltimo mes un grupo de
alumnos de Estudios Generales Letras.
2
1

3
0

4
0

0
2

0
1

8
1

1
2

0
0

5
4

3
3

2
5

1
3

2
5

2
1

3
4

2
1

1
4

2
0

1
2

4
1

3
5

4
1

0
2

1
2

0
0

0
0

2
0

2
2

3 4
2 0

Construya la tabla de distribucin de frecuencias de la variable en estudio.


Nmero de veces
que fue al cine el
ltimo mes

ni: Nmero de
alumnos

pi: Porcentaje de
alumnos

Total

1.3. Grficos y tablas estadsticas


Todo grfico debe tener, por lo menos, lo siguiente:
- un ttulo que lo describa lo mejor posible
- unidades y rtulos en todosos ejes
- fuente de los datos.

Notas

Ni: Nmero acumulado de alumnos

Pi: Porcentaje
acumulado de
alumnos

15

Estadstica EEGGLL

Grficos para datos de variables cualitativas


Grfico de barras
Se usa para representar grficamente la distribucin de un conjunto de datos cualitativos.
En uno de los ejes, se representan las categoras o clases de la variable; para el otro eje, se puede
usar una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada
indicador de clase de una altura proporcional a la frecuencia correspondiente.
Las barras deben ser del mismo ancho y deben estar separadas para enfatizar el hecho de que cada
clase es diferente de otra.
Por ejemplo, investigadores analizaron 28 tipos de cncer en 188 pases entre 1990 y 2013 a partir de
registros de cncer, informes de autopsias y otras fuentes sobre las causas de muerte, obteniendo
este grfico de barras para el nmero de casos de cncer diagnosticados en el mundo.

Grfico circular o de pastel


Cuando se utiliza el grfico circular, cada sector circular representa la frecuencia observada de una
clase o categora.
El sector circular que representa a una determinada clase o categora de la variable tiene un ngulo
en el centro proporcional a la frecuencia relativa de dicha clase. El ngulo que le corresponde a cada
clase se obtiene multiplicando 360 por la respectiva frecuencia relativa.
Distribucin porcentual de nuevos casos de cncer segn continente.

Fuente: Globocan

Notas

16

Captulo 1. Nociones de Estadstica Descriptiva

Grficos para datos de variables cuantitativas discretas


Grfico de bastn
Es un grfico que muestra la frecuencia de ocurrencia de cada valor observado de la variable discreta
mediante un segmento (bastn) cuya altura es proporcional a la frecuencia correspondiente.

Ejercicio 20
Los siguientes datos muestran el nmero de veces que fueron al cine el ltimo mes un grupo de
alumnos de Estudios Generales Letras.
2
1

3
0

4
0

0
2

0
1

8
1

1
2

0
0

5
4

3
3

2
5

1
3

2
5

2
1

3
4

Construya el grfico de bastones correspondiente.

Notas

2
1

1
4

2
0

1
2

4
1

3
5

4
1

0
2

1
2

0
0

0
0

2
0

2
2

3 4
2 0

Estadstica EEGGLL

17

Distribucin de frecuencias por intervalos para variables cuantitativas continuas


Cuando se realiza mediciones de una variable continua, por lo general, los datos observados tienen
muchos valores diferentes, por ello, para presentarlos en una tabla de forma tal que se facilite su
anlisis, estos datos deben agruparse primero en clases o intervalos.
Tres pasos previos para la construccin de una distribucin de frecuencias por intervalos son los siguientes:
Determinar la cantidad de intervalos o clases.
Determinar el ancho o amplitud de cada intervalo o clase.
Determinar los lmites de cada intervalo o clase.

Cantidad de clases: k
Se recomienda usar entre 5 y 20 intervalos o clases.
La idea es emplear suficientes clases para mostrar la variacin de los datos, pero no tantas que varias
contendran muy pocos o ningn elemento.
Hay algunas reglas que sugieren el nmero de clases o intervalos que se deben usar que dependen
del nmero de datos disponibles, sin embargo en la prctica la decisin generalmente se toma atendiendo a una necesidad especfica o por experiencia.

Amplitud de cada clase: A


Por lo general, se usa la misma amplitud o ancho para todas las clases.
Se calcula de la siguiente manera:

dato mximo dato mnimo x mx x mn Rango

k
k
k
La amplitud se aproxima por exceso de acuerdo con la cantidad de decimales que tienen los datos o
segn la precisin con que se desea trabajar.
Se usa la aproximacin por exceso para asegurar que el mayor de los datos pertenezca a alguna de
las clases.
Amplitud

Lmites de cada clase o intervalo


Los intervalos deben ser disjuntos y deben cubrir todo el rango de variacin de los datos.
Los lmites de cada clase se escogen de tal manera que cada dato pertenezca a una clase y slo a una.
Por lo general, el lmite inferior de la primera clase es el mnimo valor observado.

Marca de clase
La marca de clase es el punto medio de cada intervalo. Se obtiene calculando la semisuma de los
lmites de cada intervalo o clase.
La marca de clase se considera un valor que representa a cada uno de los datos que pertenecen al
intervalo o clase correspondiente. Por eso es importante que los intervalos no sean demasiado grandes porque la marca de clase no sera un buen representante, ni demasiado pequeos como para
complicar la construccin de la tabla o para que hayan varias clases sin datos.
La marca de clase de la clase i se denota mi.
Notas

18

Captulo 1. Nociones de Estadstica Descriptiva

Ejemplo 2
Construya una distribucin de frecuencias de siete intervalos o clases para los siguientes datos que
representan los tiempos (en minutos), que demoraron 48 alumnos en resolver una prueba.
8,8
8,9
12,7

8,7
12,4
8,4

10,2
9,6
10,5

10,3
10,1
10,9

8,2
9,6
11,9

11,7
9,7
9,9

7,8
9,6
9,5

9,8
11,3
10,7

11,1
10,9
12,6

8,9
9,8
10,8

9,3
9,5
8,6

8,3
12,0
9,2

8,2
10,9
8,5

9,0
12,4
9,6

9,2
9,3
10,0

8,5
9,4
9,8

Solucin
El rango R se calcula con:
R = dato mximo dato mnimo = xmax xmin = 12,7 - 7,8 = 4,9
De acuerdo a lo indicado, el nmero de clases o intervalos a usar es k = 7.
La amplitud de cada intervalo es:

R 4,9

0,7
k
7
En el curso usaremos intervalos abiertos a la izquierda, pero tambin puede usarse intervalos abiertos a la derecha. Los intervalos o clases para los datos de este ejemplo son:
I1: [xmin
; xmin + A] = [7,8 ; 7,8 + 0,7] = [7,8 ; 8,5]
I2: ]xmin +A ; xmin + 2A] = ]8,5 ; 9,2]
...
I7: ]xmin + 6A ; xmin + 7A] = ]12,0 ; 12,7]
A

Ttulo: _____________________________________________________________________________
Tiempo (min.)

Marca de clase
(mi)

ni: Nmero de
alumnos

fi: Proporcin
de alumnos

Ni: Nmero
acumulado de
alumnos

Fi: Proporcin
acumulada de
alumnos

[7,8

8,5]

8,15

0,1458

0,1458

]8,5

9,2]

8,85

0,1667

15

0,3125

]9,2

9,9]

9,55

14

0,2917

29

0,6042

]9,9

10,6]

10,25

0,1042

34

0,7083

]10,6

11,3]

10,95

0,1458

41

0,8542

]11,3

12,0]

11,65

0,0625

44

0,9167

]12,0

12,7]

12,35

0,0833

48

1,0000

Distribucin de frecuencias por intervalos para datos de una variable cuantitativa discretas
Si los datos que se quiere organizar en una distribucin de frecuencias corresponden a mediciones de
una variable discreta pero se han observado muchos valores diferentes, entonces tambin podemos
utilizar una distribucin de frecuencias por intervalos para facilitar el anlisis de estos datos.

Notas

19

Estadstica EEGGLL

Ejercicio 21
En una central telefnica se tienen 45 puestos de atendimiento (PA). Durante una semana, cada PA
recibi la cantidad de llamadas conforme la tabla abajo.
130

158

163

166

168

170

171

174

178

180

183

185

186

187

189

190

190

192

192

193

193

193

193

194

195

196

198

198

199

203

205

211

214

215

217

218

222

224

226

227

233

235

238

239

305

Construya una distribucin de frecuencias usando seis intervalos para las llamadas a los PAs de la
central telefnica estudio.

Ttulo: _____________________________________________________________________________
mi
[

]
Total

Interprete el valor de n4

Interprete el valor de p2

Interprete el valor de P3

Interprete el valor de m3

Notas

ni

pi

Ni

Pi

20

Captulo 1. Nociones de Estadstica Descriptiva

Grficos de variables cuantitativas continuas


Para presentar estos grficos usaremos los datos correspondientes a la experiencia laboral de los
obreros de una fbrica que han sido organizado previamente en la siguiente distribucin de frecuencias por intervalos.
Ttulo:
Experiencia
laboral
(en aos)

mi: marca
de clase

ni: nmero de
obreros

fi: proporcin de
obreros

Ni: Nmero acumulado de obreros

Fi: proporcin
acumulada de
obreros

[0;4]

57

0,2780

57

0,2780

]4;8]

78

0,3805

135

0,6585

] 8 ; 12 ]

10

43

0,2098

178

0,8683

] 12 ; 16 ]

14

25

0,1220

203

0,9903

]16 ; 20 ]

18

0,0098

205

Total

205

Histograma
Este grfico se construye a partir de una distribucin de frecuencias por intervalos.
Cada frecuencia de clase se representa trazando un rectngulo, cuya base es el intervalo de clase
sobre el eje horizontal y cuya altura es proporcional a la frecuencia correspondiente (absoluta, relativa o porcentual).
Los rectngulos adyacentes se tocan entre s.

Notas

21

Estadstica EEGGLL

Polgono de frecuencias
Es la representacin por medio de una figura poligonal cerrada de una distribucin de frecuencias
absolutas, relativas o porcentuales.
Se obtiene uniendo con segmentos de recta los puntos con la marca de clase como abscisa y la correspondiente frecuencia absoluta o relativa como ordenada.
Los polgonos de frecuencias se cierran en los puntos del eje horizontal correspondientes al lmite
inferior del primer intervalo y al lmite superior del ltimo intervalo.

Ojiva
Es la grfica de una distribucin de frecuencias acumuladas (absolutas, relativas o porcentuales).
La ojiva parte del punto que tiene al lmite inferior del primer intervalo como abscisa y a cero como
ordenada.
Se obtiene uniendo con segmentos de recta los puntos con el lmite superior de cada intervalo como
abscisa y la frecuencia acumulada respectiva como ordenada.
Con la ojiva se puede estimar el nmero o porcentaje aproximado de observaciones que corresponden a un intervalo determinado.

Porcentaje acumulado

Experiencia laboral de los obreros de la


empresa A
100.00%
100%
99.02%

80%

86.63%

60%

65.85%
27.80%

40%
20%
0%
0

12

16

Experiencia laboral (en aos)


Fuente: Empresa A. Encuesta RRHH 2013

Notas

20

22

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicio 22
La anchoveta es el pez ms importante del ecosistema de la Corriente de Humboldt. Su abundancia
ha permitido el desarrollo y sustento de muchas otras especies de peces, aves, mamferos e invertebrados que hoy en da habitan en nuestro mar. Una muestra de 250 anchovetas de un ao de edad
ha dado una longitud mnima de 6 cm. Los datos se muestran organizados en la tabla siguiente.
Complete la distribucin de frecuencias por intervalos de las longitudes de las anchovetas.
Ttulo: _______________________________________________________________________
Tamao
(centmetros)

mi:
Marca de clase

ni:

fi:

Ni:

Fi:

0,10
65
180
30
0,96
17

0,04

Total

Grafique el histograma, polgono de frecuencias y la ojiva de frecuencias relativas.

Notas

Estadstica EEGGLL

23

Calcule el porcentaje aproximado de anchovetas de la muestra que midieron 13 centmetros o menos.

Calcule el porcentaje aproximado de anchovetas de la muestra que entre 12 y 15,5 centmetros.

Determine, aproximadamente, la longitud mnima que debera tener una de estas anchovetas para
estar considerada dentro de las 10% ms grandes.

Notas

Captulo 1. Nociones de Estadstica Descriptiva

24

1.4. Tablas de contingencia


Tambin llamadas tablas cruzadas o tablas de doble entrada.
Se usan para resumir de manera simultnea los datos para dos variables.
Ejercicio 23
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se
pregunt a las peruanas de 12 a ms aos por la cantidad de hijos que han tenido vivos, obtenindose los siguientes resultados.
Tabla 1. Per. Edad de la madre y nmero de hijos nacidos vivos
Edad de la madre
12 aos
13 aos
14 aos
15 aos
16 aos
17 aos
18 aos
19 aos
Total

Cero hijos
298,985
284,650
285,732
283,045
247,888
231,839
216,999
193,952
2,043,090

Nmero total de hijos/a que ha tenido nacidos vivos


Un hijo
Dos hijos
Tres hijos
Cuatro hijos
1,028
1,162
1,638
734
4,909
994
12,358
922
576
24,243
2,280
636
38,938
5,089
586
481
52,797
9,273
1,118
496
137,073
19,292
2,916
977

Total
300,013
285,812
288,104
288,948
261,744
258,998
262,093
257,636
2,203,348

Fuente: INEI - Censos Nacionales 2007: XI de Poblacin y VI de Vivienda

Identifique las variables usadas en la realizacin de esta tabla de doble entrada.

Rellene los espacios en blanco de acuerdo a la informacin contenida en la tabla.

El nmero de peruanas menores de 15 aos de la muestra, que han tenido hijos es

En la muestra, el nmero de peruanas de 18 aos que han tenido dos o ms hijos es

En la muestra, el nmero de menores de edad que han tenido hijos es

En la muestra, el ..% de las menores de edad ha tenido hijos.

El ..% de mujeres de 17 aos, en la muestra, ha tenido hijos.

El .% de .

Notas

Estadstica EEGGLL

25

1.5. Grficos a partir de tablas de contingencia


Son realizados a partir de tablas de contingencia.
Por ejemplo, segn una encuesta realizada por la agencia Euromonitor, los brasileos pueden llegar a
ducharse hasta doce veces en media a la semana. A la cola de este sondeo se encuentran los chinos,
quienes al parecer solo se duchan una vez cada dos das.

Tomado de http://elpais.com/elpais/2015/06/28/actualidad/1435483359_779060.html

Grfico de barras apiladas


Un grfico de barras apiladas muestra todas las series apiladas en una sola barra para cada categora.
El alto de cada barra es proporcional a la frecuencia de cada categora.

Notas

Captulo 1. Nociones de Estadstica Descriptiva

26

Grfico de barras apiladas al 100%


Un grfico de barras apiladas al 100% muestra todas las series apiladas en una sola barra para cada
categora. El alto de cada barra es el mismo para cada categora.

Notas

27

Estadstica EEGGLL

Ejercicio 24
En el II Censo Nacional Universitario del ao 2010 realizado por el INEI se pregunt a los alumnos de
pregrado de todo el Per por su tipo de universidad y su gnero. Los datos se muestran en el siguiente cuadro.
Per. Distribucin de alumnos censados en pregrado por gnero y tipo de universidad. 2010
Gnero

Pblica

Privada

Total

Femenino

135 082

247 743

382 825

Masculino

174 093

226 052

400 145

309 175

473 795

782 970

Total

Fuente: INEI. Censo Universitario. 2010

a) Interprete el valor 135 082 de la tabla.

b) Elabore un grfico que permita ver la composicin porcentual por gnero y tipo de universidad.
Ttulo ....
Gnero

Pblica

Privada

Total

Femenino
Masculino
Total

100%

Fuente:
Ttulo ....

Interprete el valor .. de la tabla.

Notas

28

Captulo 1. Nociones de Estadstica Descriptiva

c) Elabore un grfico que permita ver la composicin porcentual segn tipo de universidad por gnero.
Ttulo ....
Gnero

Pblica

Privada

Total

Femenino

100%

Masculino

100%

Fuente: INEI. Censo Universitario. 2010

Ttulo ....

d) Elabore un grfico apilado al 100% que permita ver la composicin porcentual segn gnero por
tipo de universidad.
Ttulo ....
Gnero

Pblica

Privada

100%

100%

Femenino
Masculino
Total

Fuente: INEI. Censo Universitario. 2010

Ttulo ....

Parece haber relacin entre el gnero del estudiante y el tipo de universidad en que estudia?

Notas

Estadstica EEGGLL

29

1.6. Estadsticos de posicin


Percentil
El k-simo percentil, denotado Pk, es el menor de los datos tal que por lo menos el k% de los datos
son menores o iguales que este valor.

Cuartil
Se denomina as a cada uno de los tres percentiles: P25, P50, P75 y se les denota como Q1, Q2 y Q3 respectivamente.

Quintil
Se denomina as a cada uno de los cuatro percentiles: P20, P40, P60, P80 y se les denota como Q1, Q2, Q3,
Q4 respectivamente.

Decil
Se denomina as a cada uno de los diez percentiles: P10, P20, y P90 y se les denota como D1, D2 , ,
D10 respectivamente.
Ejemplo 3
La Encuesta de Caracterizacin Socioeconmica Nacional, Casen, en Chile, es realizada con el objetivo
de disponer de informacin que permita conocer peridicamente la situacin de los hogares.
Por ejemplo: una familia compuesta por cinco personas (padre, madre y tres hijos), si el padre tiene
ingresos de $400.000 mensuales y la madre de $350.000, el clculo sera as: ($400.000+$350.000)/5
= $150.000, la familia estara en el decil 5.

Ejercicio 25
En los ltimos 150 aos, los holandeses han pasado a ser los habitantes ms altos del mundo, y segn los expertos siguen creciendo. El estudio de la altura de los holandeses a lo largo de los siglos
ofrece un panorama sobre la salud y riqueza de la nacin. No siempre fue as, en 1848, uno de cada
cuatro varones era rechazado del servicio militar porque no alcanzaba la estatura de 1,57 metro.
Actualmente, el percentil 1 de la estatura de los varones holandeses es 1,57 metro y el percentil 70
es 1,88 metro. Indique el significado de estos percentiles. Fuente http://www.ap.org/ Associated Press.

Notas

30

Captulo 1. Nociones de Estadstica Descriptiva

Percentil k para un conjunto de n datos


Si el valor calculado de i es
un entero, el percentil ksimo Pk es el dato xi que
tiene la posicin igual a i.

Ordene los n datos de


manera ascendente:

Calcule la posicin i del


percentil k-simo, Pk.

x1 x2 x3 xn

Si el valor calculado de i no
es entero, el percentil ksimo Pk es el dato xi+1 que
tiene la posicin inmediata
superior a i.

Ejercicio 26
Dadas las siguientes edades de una muestra de personas asistentes al Tnel de la Ciencia, calcule e
interprete el percentil 30 y el percentil 50.
10

12

15

14

25

19

10

14

12

18

13

11

15

13

15

16

14

13

Ejercicio 27
En la tabla siguiente se muestra la distribucin de los trabajadores de una empresa segn el nmero de
tardanzas en el mes pasado. Calcule e interprete el percentil 30 y el percentil 75.
xi : Nmero de
tardanzas

ni: Nmero de trabajadores

48

80

57

15

Total

Notas

fi: Proporcin de
trabajadores

Ni :

Fi :

15

31

Estadstica EEGGLL

Percentil de datos organizados en una distribucin de frecuencia por intervalos


Cuando no conocemos los valores exactos de cada uno de los datos y slo los tenemos organizados
en una distribucin de frecuencias por intervalos, no es posible calcular el valor exacto del percentil
k-simo, Pk, en ese caso, hallaremos un valor aproximado de este percentil usando la informacin
contenida en la tabla.
- Primero, identificamos el intervalo Ii = ]Li ; Ui] en el que se encuentra el percentil Pk mirando en la
columna de frecuencias relativas acumuladas. Se debe cumplir que:
k
Fi 1
Fi .
100
- El valor del percentil Pk se determina por la siguiente expresin:
Pk Li

A k
A nk

Fi 1 Li
Ni 1

fi 100
ni 100

donde:
Li = lmite inferior del intervalo que contiene al percentil k
fi = frecuencia relativa del intervalo que contiene al percentil k
Fi-1 =Frecuencia relativa acumulada del intervalo anterior al que contiene al percentil k
A = Amplitud del intervalo.
Para deducir la frmula para percentiles de datos agrupados en intervalos, podemos establecer una
semejanza de tringulos usando la ojiva de frecuencias relativas acumuladas.

Ui Li
F F
i i 1
k
Pk Li
Fi 1
100

De donde se tiene que:


fi
A

k
Pk Li
Fi 1
100
Despejando se obtiene la frmula del percentil k.

Pk Li

Cuartiles
Primer cuartil:
Segundo cuartil:
Tercer cuartil:
Notas

Q1 = P25
Q2 = P50
Q3 = P75

A k

Fi 1

fi 100

32

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicio 28
Segn la definicin oficial de la Organizacin Meteorolgica Mundial, la lluvia es la precipitacin de
agua en forma de gotas, cuando stas alcanzan un dimetro superior a los 0,5 mm. La cantidad de
lluvia que cae en un lugar se mide con pluvimetros. La intensidad de la precipitacin es medida en
milmetros por hora (mm/h), es decir, la altura medida en milmetros, del agua cada en una hora en
una superficie plana de 1 m2.
Las lluvias se categorizan en:

dbiles: cuando su intensidad es menor o igual a 2 mm/h,

moderadas: intensidad mayor a 2 mm/h y menor o igual a 15 mm/h,

fuertes: intensidad mayor a 15 mm/h y menor o igual a 30 mm/h,

muy fuertes: intensidad mayor a 30 mm/h y menor o igual a 60 mm/h

torrenciales: intensidad mayor a 60 mm/h

En la ciudad A se realizaron 120 mediciones de una hora de la cantidad de lluvia, en una muestra de
120 das del ao pasado, obtenindose los siguientes resultados.
Ciudad A: Distribucin de precipitaciones segn su intensidad (en mm/h)
Intensidad (mm/h)

mi: marca de
clase

ni: Nmero de fi:


precipitaciones

Ni:

Fi:

[0

16]

30

0,2500

30

0,2500

]16

32]

24

55

0,4583

85

0,7083

]32

48]

40

21

0,1750

106

0,8833

]48

64]

56

0,0750

115

0,9583

]64

80]

72

0,0417

120

1,0000

Fuente: Direccin de Saneamiento Ambiental. Ciudad A.

a. Calcule e interprete el P80 de las mediciones.

b. Calcule la cantidad de precipitacin mxima para estar en el 15% de las precipitaciones ms bajas
de las 120 medidas.

Notas

Estadstica EEGGLL

33

c. Calcule la cantidad de precipitacin mnima para estar en el 15% de las precipitaciones ms altas
de las 120 medidas.

d. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia dbil o moderada.

e. Calcule el porcentaje de mediciones que fueron clasificadas como lluvia fuerte o muy fuerte.

Notas

34

Captulo 1. Nociones de Estadstica Descriptiva

1.7. Medidas de tendencia central


Las medidas de tendencia central son medidas resumen que se usan como valores que representan
al conjunto de datos de una variable.
Existen varias medidas de tendencia central, como por ejemplo:

Moda

Mediana

Media

Media
ponderada

Media
gemetrica

Media
armnica

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con mayor
frecuencia.

Caractersticas de la moda
- La moda se puede calcular para datos medidos en cualquier escala de medicin.
- El valor de la moda no se ve afectado por valores extremos.
- La moda no siempre es un valor nico. Una serie de datos puede tener dos modas (bimodal) o
ms modas (multimodal).

Moda de un conjunto de n datos


Agrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.
Ejercicio 29
La moda de nombre en el Per es Esto significa que

Notas

35

Estadstica EEGGLL

Ejercicio 30
Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos comprados por 14 clientes de cierto supermercado.
2

Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos comprados por 14 clientes de cierto supermercado.
2

80

80

Ejercicio 31
En la empresa A, se midi el nmero de errores por da que cometieron 158 obreros al ensamblar un
determinado producto. Calcule e interprete la moda del nmero de errores por obrero.
Empresa A. Distribucin de obreros por el nmero de errores al ensamblar el producto
xi : Nmero de errores

ni : Nmero de obreros

25

45

60

28

Fuente: Gerencia de Produccin. Empresa A

Notas

36

Captulo 1. Nociones de Estadstica Descriptiva

Mediana
Es el percentil 50, tambin llamado segundo cuartil.

Caractersticas de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.
La mediana es un estadstico que no se ve afectado por valores extremos. Por eso se le utiliza cuando
hay datos inusuales o el polgono de frecuencias no es muy simtrico.

Ejercicio 32
El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar una
tarea se muestra en la siguiente tabla.
Capacitados

4,5

4,3

2,7

8,2

8,3

6,4

5,4

No capacitados

8,3

7,4

8,5

8,5

9,0

8,4

18

3,4

2,7

5,6

Calcule e interprete la mediana del tiempo para cada grupo. Compare los valores hallados y comente.

Notas

37

Estadstica EEGGLL

Ejercicio 33
En la empresa A se tom una muestra aleatoria de 560 trabajadores y se les pregunt por su ingreso
mensual, en dlares, obtenindose los siguientes resultados.
Distribucin de trabajadores por sus ingresos mensuales (en dlares)
mi: Marca de
clase

Ingresos (en dlares)

275

275

275

325

325

325

ni

fi

Ni

Fi

30
77170000

0,1339
190
130

22500

25

Fuente: Gerencia de Recursos Humanos. Empresa A

Complete la tabla de distribucin de frecuencias y calcule aproximadamente la mediana de los ingresos de los trabajadores de la muestra. Interprete.

Notas

Captulo 1. Nociones de Estadstica Descriptiva

38

Media aritmtica
La media aritmtica es el valor que se obtiene al dividir la suma total de los datos entre el nmero de
datos.

Caractersticas de la media
- Se puede calcular para datos medidos en escala de intervalo o razn.
- El clculo de la media es sencillo y es la medida de tendencia central ms conocida.
- El valor de la media depende de todos los datos, por lo que la presencia de valores muy grandes o
muy pequeos con respecto a los dems pueden cambiar drsticamente su valor.

nx

i 1
n

x x 0
i

i 1

- Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces,


la media de los n valores yi es:
y ax b
Ejercicio 34
Un comerciante ha comprado 30 computadores y ha pagado un precio medio de 450 dlares por
cada computadora. El comerciante planea revender estas computadoras para obtener ganancias.
Si decide fijar el precio de venta de tal manera que gane 80 dlares sobre el costo de cada computadora, cul sera el precio medio de venta de las computadoras?

Si decide fijar el precio de venta aumentando un 10% sobre el costo de cada computadora ms un
monto fijo de 50 dlares, cul sera el precio medio de venta de las computadoras?

Notas

39

Estadstica EEGGLL

Media aritmtica para un conjunto de n datos no agrupados


Sean x1, x2, , xn un conjunto de n datos de una variable cuantitativa X. La media aritmtica de estos
n datos es:
n

i 1

Ejercicio 35
Calcule la media de los siguientes datos que representan el nmero de papeletas pendientes de pago
de cada uno de 11 choferes de vehculos de transporte pblico seleccionados al azar.
12

13

25

20

17

19

15

14

28

Media aritmtica para datos en una distribucin de frecuencias para variable discreta
Sean x1, x2,, xk los valores observados de una variable discreta X con frecuencias absolutas respectivas n1, n2,, nk. La media aritmtica de estos datos es:
k

x n

i i

i 1

x f

i i

i 1

Ejercicio 36
En la empresa A, se midi el nmero de errores que cometieron 158 obreros al ensamblar un determinado producto. Calcule la media del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar un producto
xi: Nmero de errores ni: Nmero de obreros
0

25

45

60

28

Fuente: Gerencia de Recursos Humanos. Empresa A

Notas

fi: Proporcin de obreros

40

Captulo 1. Nociones de Estadstica Descriptiva

Media aritmtica para datos en una distribucin de frecuencias por intervalos


Cuando solamente se cuenta con los datos organizados en una distribucin de frecuencias por intervalos no es posible calcular la media aritmtica usando la definicin porque no se conoce el valor
exacto de cada dato. En ese caso, se obtiene un valor aproximado de la media aritmtica de los datos
usando las marcas de clase de los intervalos.
El valor aproximado de la media aritmtica para n datos organizados en una distribucin de frecuencias con k intervalos o clases, con marcas de clase m1, m2,, mk y frecuencias absolutas n1, n2, , nk
respectivamente es:
k

m n

i i

i 1

m f

i i

i 1

Ejercicio 37
En el distrito A se tom una muestra aleatoria de jvenes y se les pregunt por su estatura, en centmetros, obtenindose los siguientes resultados.
Distrito A. Distribucin de una muestra de 800 jvenes segn estatura

150

ni:

mi:

Estatura (en centmetros)

fi:

Ni:

Fi:

166

0,48

0,32
0,95
800

Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribucin de frecuencias y calcule la estatura media para la muestra de jvenes.

Ejercicio 38
En los reportes estadsticos de una empresa, correspondientes al perodo de los ltimos 100 das, se
lee la siguiente informacin sobre el nmero de facturas diarias emitidas por la empresa en dicho
perodo.

Notas

Nmero de facturas

Proporcin de das

[30 ; 60]

0,25

]60 ; 90]

0,40

]90 ; 120]

0,20

]120 ; 150]

0,10

]150 ; 180]

0,05

41

Estadstica EEGGLL

Calcule el valor aproximado de la media y la mediana del nmero de facturas diarias emitidas por la
empresa en dicho perodo, compare los valores y comente cul le parece ms adecuado para representar este conjunto de datos.

Calcule aproximadamente el porcentaje de das en los que fueron emitidas ms facturas que la media.

Media aritmtica ponderada


Dados n datos x1, x2,, xn con pesos w1, w2,, wn la media aritmtica ponderada de los datos es:
n

w x
i

xp

i i
n

i 1

Si todos los pesos son iguales, entonces x p x


Ejercicio 39
Calcule la nota final de un alumno del curso de Estadstica de Estudios Generales Letras que tiene las
siguientes notas: prctica calificada 1 = 18, prctica calificada 2 = 10, prctica calificada 3 = 12, prctica calificada 4 = 15, examen parcial = 14 y examen final = 9. Los pesos del promedio de prcticas,
examen parcial y examen final son 3, 3 y 4, respectivamente. La prctica con menor nota se anula.

Notas

42

Captulo 1. Nociones de Estadstica Descriptiva

1.8. Medidas de dispersin


Con las medidas de tendencia central es posible determinar el valor que representa a los datos de un
conjunto, pero no indica qu tan cercanos o lejanos estn los datos de dicho valor central.
Las medidas de variabilidad indican cun alejados estn los datos del valor que los representa.

Tomado de http://gastronomiaycia.republica.com/2010/08/06/manzanas-tamano-xl/

Ejercicio 40
Calcule la media, mediana y moda de los siguientes grupos de datos:
Grupo 1
1

-20

30

Grupo 2

Grupo 3

Qu conclusin deduce de los clculos?

Varianza (s2)
Dados n datos cuantitativos x1, x2,, xn la varianza de los datos se define como la media de las distancias al cuadrado de cada dato a la media aritmtica.
n

s2

x i x 2
i 1

x
i 1

2
i

x2

Desviacin estndar (s)


Dados n datos cuantitativos x1, x2,, xn la desviacin estndar de los datos se define como la raz cuadrada de la varianza.

Notas

43

Estadstica EEGGLL

Ejemplo 5
Las notas de cuatro alumnos son x1 = 6, x2 = 11, x3 = 15, x4 = 16.
6 11 15 16
Luego la media aritmtica de las notas es x
12 puntos
4
Las diferencias o desvos de cada dato con respecto a la media son d1 = 6 12 = -6, d2 = 11 - 12 = -1,
d3 = 15 - 12 = 3, d4 = 16 - 12 = 4.

(6)2 (1)2 32 4 2
3,937 puntos.
4

Luego, la desviacin estndar de las notas es: s

Ejercicio 41
Calcule e interprete la media y la desviacin estndar de los siguientes datos que representan el nmero de personas atendidas por da en la caseta de informacin de un proyecto inmobiliario, en una
muestra de 15 das.
18

10

11

Desviacin estndar de datos agrupados. Variable cuantitativa discreta


k

n x
i

x 2

i 1

f x
i

x 2

i 1

Ejercicio 42
Calcule la desviacin estndar de los siguientes datos que representan el nmero artculos defectuosos encontrados en cada uno de 122 lotes recibidos la semana pasada. Cada lote tiene 1000 artculos.

Notas

xi: nmero de defectuosos

ni: nmero de lotes

58

26

10

30

44

Captulo 1. Nociones de Estadstica Descriptiva

Desviacin estndar de datos organizados en una distribucin por intervalos


k

n m
i

i 1

x 2

f m
i

x 2

i 1

Ejercicio 43
Calcule la media y la desviacin estndar de los siguientes datos que corresponden a los pesos de los
equipajes de los pasajeros de un vuelo Lima - Arequipa
Peso (kg.)
[10,0

Marca de clase
]

ni: nmero de pasajeros


9

17,5

75

56

10

Propiedades de la varianza y la desviacin estndar


-

La varianza y la desviacin estndar son nmeros no negativos.


Se calculan para datos medidos en escala de intervalo o de razn.
Son sensibles a la existencia de valores atpicos.
La varianza se expresa en las unidades de los datos elevadas al cuadrado. La desviacin estndar
en las mismas unidades que los datos. Por ejemplo, si los datos estn expresado en kilos, la varianza estar expresada en kilos2 y la desviacin estndar en kilos.
- Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces,
la varianza de los n valores yi es
sy2 a 2 s 2x , de donde sy a s x

Ejercicio 44
En una muestra de ferreteras se ha registrado el precio de las varillas de acero de 12 mm, encontrndose un precio medio de 19,80 nuevos soles y una desviacin estndar de 0,85 nuevos soles.
Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la nueva
desviacin estndar de los precios.

Notas

45

Estadstica EEGGLL

Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica qu proporcin de la media es la desviacin estndar.
El coeficiente de variacin se determina calculando el cociente de la desviacin estndar de los datos
entre la media de los datos

sx
x
Es til al comparar la variabilidad de dos o ms series de datos que se miden en distintas o iguales
unidades, pero difieren a tal punto que una comparacin directa de las respectivas desviaciones estndar no es muy til, por ejemplo, cuando las medias estn muy distantes.
Un valor mayor del coeficiente de variacin indica mayor dispersin del conjunto de datos.
CV

Ejercicio 45
En una tienda, el precio medio y la desviacin estndar del precio de los jeans es de 74 y 15,4 nuevos
soles, respectivamente. Si se rebaja 10 nuevos soles a todos los precios, calcule e interprete el nuevo
coeficiente de variacin de los precios. Despus del descuento, los precios de los jeans son ms
homogneos que antes?

Ejercicio 46
El coeficiente de variacin de los salarios un grupo de trabajadores es 0,12. Si se aprueba un aumento del 20% ms una bonificacin especial de S/.115, el nuevo coeficiente de variacin ser igual a
0,06. Determine el valor de la media y la varianza de los salarios de los obreros, antes y despus del
aumento.

Notas

Captulo 1. Nociones de Estadstica Descriptiva

46

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:
R = dato mximo dato mnimo

Caractersticas del rango


- Se puede calcular en variables medidas en escala de intervalo y de razn.
- Solo depende del valor mximo y mnimo de los datos e ignora cmo estn distribuidos los dems.
- Se ve afectado por valores extremos.
- El rango es la longitud del intervalo de variacin de los datos.

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango intercuartil = RIC = Q3 Q1= P75 P25

Caractersticas del rango intercuartil


Se puede calcular en variables medidas en escala de intervalo y de razn.
No se ve afectado por valores extremos.

Notas

Estadstica EEGGLL

47

Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como referencia los
valores de los cuartiles como medidas de posicin, la mediana como medida de tendencia central y el
valor del rango intercuartil como medida de dispersin. Adems, permite apreciar la forma de la
distribucin de los datos (simtrica o asimtrica).

Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera un dato
atpico a cualquier dato que est:
- a ms de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
- a ms de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil.

Pasos para trazar un diagrama de cajas


- Determinar los cuartiles Q1, Q2, y Q3
- Calcular el rango intercuartil RIC = Q3 - Q1
- Calcular los lmites mximo y mnimo para la longitud de los bigotes:
o Lmite inferior = Linf = Q1 1,5RIC
o Lmite inferior = Lsup = Q3 + 1,5RIC
- Detectar los datos atpicos que son aquellos que no pertenecen al intervalo [Linf ; Lsup]. A los datos
que s pertenecen al intervalo anterior se les llama datos tpicos.
- Sobre un eje horizontal, se traza un rectngulo con los extremos en el primer cuartil (Q1) y tercer
cuartil (Q3).
- En la caja rectangular se traza un segmento vertical en el lugar de la mediana.
- Se traza el bigote izquierdo desde el primer cuartil hasta el mnimo de los datos tpicos y el bigote
derecho desde el tercer cuartil hasta el mximo de los datos tpicos.
- Se marcan con un asterisco (*) las localizaciones de los datos atpicos.

Diagramas de caja comparativos


Una ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite la fcil
comparacin visual de las caractersticas de varios conjuntos de datos.
Los diagramas de caja permiten comparar las distribuciones de los valores de una variable cuantitativa en los diferentes niveles de otra variable cualitativa.

Notas

Captulo 1. Nociones de Estadstica Descriptiva

48

Ejercicio 47
Se desea comparar los resultados de la primera prctica en tres horarios de Estadstica de EEGGLL,
para lo cual se ha registrado las notas de una muestra de alumnos de cada horario.
H1 0 2 3 11 11 11 12 12 12 12 12 12 12 13 13 13 14 14 15 15 15 15 15 15 15 20
H2 11 11 11 12 12 12 13 14 14 14 14 14 15 15 16 16 16 16 16 17 17 18 18 18 18
H3 0 1 8 8 8 9 10 10 11 11 12 12 13 13 13 14 15 15 16 16 16 17 17 17

Construya un diagrama de cajas que permita comparar las distribuciones de notas en los tres horarios.

Ttulo: .

El horario que tiene la mayor mediana de notas es ..


El horario con mayor rango intercuartil es
Existen valores atpicos en

Notas

49

Estadstica EEGGLL

Puntuacin estandarizada Z
Si los datos son x1 x2, . , xn entonces los datos estandarizados son:
zi

xi x
sx

i = 1, 2,, n

Se cumple que z 0 y que s z 1


EL valor estandarizado del dato xi indica a cuntas desviaciones estndar, por arriba o por debajo de
la media, se encuentra este dato.
Ejemplo 6

Tomado de Encuesta Nacional de Salud y Nutricin 2012 Mxico

Ejercicio 48
Un conjunto de alumnos rindi dos exmenes. En el primer examen, la nota media fue 13,4 y la desviacin estndar de 2,3, mientras que en el segundo examen la nota media fue 15,4 y la desviacin
estndar 4,3. Una persona obtuvo 14 en el primer examen y 16 en el segundo examen. En trminos
relativos a los resultados de los exmenes, en cul de ellos la nota fue mejor?

Notas

50

Captulo 1. Nociones de Estadstica Descriptiva

1.9. Indicadores de asimetra


Mide si los datos estn ubicados simtricamente o no respecto a una medida de tendencia central.

Distribucin de frecuencias simtrica


Una distribucin de frecuencias de k clases es simtrica, si se cumple que
f2 fk 1 , f3 fk 2 , ...

f1 f k ,

Coeficiente de asimetra de Pearson para datos agrupados o no agrupados


El coeficiente de asimetra para datos simples o agrupados se calcula con la siguiente frmula:
x Q2

As 3
sx

Si el coeficiente de asimetra (As) es


- igual a cero, la distribucin es simtrica alrededor de la media.
- positivo, indica sesgo a la derecha (cola derecha).
- negativo, indica sesgo a la izquierda (cola izquierda).

Ejercicio 49
El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuacin:
25

14

19

14

15

16

15

15

18

15

Calcule e interprete el coeficiente de asimetra de Pearson.

Notas

52

24

36

15

15

23

24

51

Estadstica EEGGLL

Ejercicio 50
El siguiente cuadro muestra la distribucin del sueldo mensual de los empleados de dos empresas A y
B en julio del 2015.
Empresas A y B. Sueldos mensuales en julio del 2015
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1 500 2 500]

]2 500 3 500]

40

]3 500 4 500]

12

25

]4 500 5 500]

]5 500 6 500]

Fuente: Gerencias de Recursos Humanos Empresa A y B.

a) En un solo grfico muestre los dos polgonos de frecuencias para los sueldos de los trabajadores
de las empresas A y B. Comente comparativamente las distribuciones de los sueldos mensuales.
b) Calcule la media, desviacin estndar y coeficiente de variacin de los sueldos para los trabajadores de las empresas A y B. En cul de las dos empresas los sueldos son ms homogneos?
c) Compare la simetra de las distribuciones de los sueldos en las empresa A y B grficamente (use el
grfico de la parte a) y usando el coeficiente de asimetra de Pearson. Comente.

Notas

52

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicios
1.

Un auditor, luego de revisar las declaraciones juradas de impuesto a la renta de 50 personas


naturales, hace un informe de los montos omitidos. El informe lo presenta con una distribucin
de frecuencias de 6 intervalos de la misma longitud. Los montos omitidos varan de 0 soles a
3000 soles, y las frecuencias acumuladas del primero al sexto intervalo son respectivamente: 5,
15, 35, 43, 48, 50.
a. Encuentre e interprete la mediana y el coeficiente de variacin.
b. Halle el porcentaje de declaraciones en las que el monto omitido supera la media.

2.

Hay 10 personas en un ascensor, 4 mujeres y 6 hombres. El peso medio de las mujeres es de 60


kilos con una desviacin estndar de 8 kilos y el peso medio de los hombres es de 80 kilos con
una varianza de 25 kilos2.
a. Cul es el peso medio de las 10 personas en el ascensor?
b. Si el peso de cada una de las mujeres aumentara al doble cules seran el nuevo peso medio y la nueva varianza de los pesos de las mujeres?
c. Suponga que cada uno de los hombres se pesa en una balanza que no est bien calibrada y
que aumenta 2,5 kilos en cada medicin. Cul sera el coeficiente de variacin que se obtendra con esas mediciones de los pesos de los hombres?

3.

A continuacin, se presenta la distribucin de los tiempos totales, en minutos, que diferentes


estaciones de radio dedicaron a los avisos comerciales entre las 8:00 a. m. y las 12:00 m. de un
da de la semana pasada.

Tiempo (minutos) [0 - 6] ]6 - 12] ]12 - 18] ]18 - 24] ]24 - 30] ]30 - 36] ]36 - 42] ]42 - 48] ]48 - 54] ]54 - 60]
Nmero de radios

17

10

14

a. Calcule e interprete el coeficiente de variacin del tiempo dedicado a los avisos comerciales.
b. Halle e interprete los cuartiles de la distribucin.
c. Grafique el histograma, el polgono de frecuencias y la ojiva de la distribucin. Comente la
simetra de la distribucin de tiempos.
4.

Los salarios que ofrece una empresa a los practicantes varan entre $180 y $300. Si los salarios
se agrupan en cuatro intervalos de clase de longitudes iguales de manera que el 40% de los
practicantes tienen salarios menores o iguales que $225, el 80% tienen salarios menores o iguales que $255 y el 15% tiene salarios mayores que $262,50.
a. Hallar el porcentaje de practicantes en cada intervalo.
b. Si el ingreso mnimo se fija en $265 y la empresa aumenta una misma cantidad a todos los
practicantes de modo que el 25% supere el ingreso mnimo, cunto sera el aumento?

5.

El porcentaje de grasa corporal es el mtodo ms fiable para establecer el peso ideal de una
persona pero es el ms difcil y complicado de medir. En un grupo de hombres adultos se midi
el porcentaje de grasa corporal obteniendo la tabla siguiente.
Porcentaje de grasa [ 3 , 7 ] ]7 , 11] ]11,15] ]15,19] ]19,23] ]23,27]
Frecuencia absoluta

16

66

44

60

10

a. Grafique el polgono de frecuencias y la ojiva de la distribucin.


b. Calcule e interprete el coeficiente de variacin.
Notas

53

Estadstica EEGGLL

c. Halle e interprete los cuartiles de la distribucin.


d. Se considera que un hombre tiene sobrepeso si tiene un porcentaje de grasa corporal mayor a 18%. Qu porcentaje de entrevistados tuvo sobrepeso?
6.

La anchoveta es el pez ms importante del ecosistema de la Corriente de Humboldt. Su abundancia ha permitido el desarrollo y sustento de muchas otras especies de peces, aves, mamferos e invertebrados que hoy en da habitan en nuestro mar. Una muestra de 250 anchovetas de
un ao de edad ha dado una longitud media de 11,24 cm. Los datos se muestran en la tabla.

Tamao (centmetros)

Marca de
clase

Frecuencia
absoluta

Frecuencia
relativa

Frecuencia absoluta
acumulada

Frecuencia relativa
acumulada

0,10
65
180
30
0,96
17

0,04

a. Determine de manera aproximada el porcentaje de anchovetas que miden entre 11 y 13


centmetros.
b. Calcule e interprete la mediana y el rango intercuartil de los tamaos de las anchovetas.
c. Realice el diagrama de cajas del tamao de las anchovetas.
7.

El porcentaje de germinacin es uno de los principales factores para decidir la calidad de las
semillas. Un fabricante afirma que el porcentaje de germinacin de sus semillas de maz es del
85%. Para verificar tal afirmacin, una cooperativa de agricultores seleccion 120 muestras de
100 semillas cada una y anot el porcentaje de germinacin en cada muestra. Los valores observados se organizaron en la siguiente tabla.

Germinacin
(%)

Frecuencia absoluta

Frecuencia relativa

[ 70 ; ]

Frecuencia absoluta
acumulada

Frecuencia relativa
acumulada

10
0,20
0,70
22

] ; 95 ]
2

a. Complete la tabla y construya el histograma, el polgono y la ojiva correspondiente.


b. Calcule la media, la mediana, y el coeficiente de variacin de los porcentajes observados.
c. Comente la afirmacin del fabricante.

Notas

54

Captulo 1. Nociones de Estadstica Descriptiva

8.

En dos ros de determinada regin se han soltado cras de truchas marcadas y se han recogido
muestras de las mismas despus de cierto periodo de tiempo. Se ha medido el peso (en gramos)
de esos ejemplares resultando la tabla siguiente:
Peso (en gramos)

Nmero de peces del ro 1

Nmero de peces del ro 2

[0 , 50]

14

11

]50 , 100]

31

23

]100, 150]

25

29

]150, 200]

18

22

]200, 250]

12

15

a. En qu ro la distribucin del peso resulta ms homognea?


b. Calcule la mediana de los pesos de las truchas del ro 1. Interprete el resultado.
c. Grafique el polgono de frecuencias relativas de los pesos de las truchas del ro 2.
9.

En los reportes estadsticos de una empresa, correspondientes al perodo de los ltimos 100
das, se lee la siguiente informacin sobre el nmero de facturas diarias emitidas por la empresa
en dicho perodo.
Nmero de facturas

Frecuencia relativa

[30 ; 60]

0,25

]60 ; 90]

0,40

]90 ; 120]

0,20

]120 ; 150]

0,10

]150 ; 180]

0,05

a. Graficar el polgono y la ojiva de la distribucin. Adems, calcule la media y la desviacin


estndar del nmero de facturas diarias emitidas por la empresa en dicho perodo.
b. Calcule aproximadamente el porcentaje de das en los que fueron emitidas ms facturas
que la media.
10. Se realiz una prueba de destreza manual entre los obreros de una fbrica. Se midi el nmero
de errores cometidos en la prueba, obtenindose los siguientes resultados:
Nmero de errores

Nmero de obreros

16

24

12

20

a. Calcule el rango intercuartil y el coeficiente de variacin del nmero de errores en la prueba.


b. Grafique el diagrama de cajas correspondiente.
11. En agosto del 2005, la empresa LibroOnLine dict un curso sobre redes en computadoras mediante dos sistemas: presencial y a distancia. Con el objetivo de comparar las notas promedio, la
variabilidad de los valores centrales y el rango de las notas, se tom un examen final y se registr los resultados en la siguiente distribucin de frecuencias.
Notas

55

Estadstica EEGGLL
3,5

9,5

Frecuencia relativa (Sistema presencial)

0,14

0,10

0,12

0,23

0,27

Frecuencia relativa (Sistema a distancia)

0,19

0,26

0,24

0,15

0,13

Notas del examen final

a. Realizar un grfico que permita llegar al objetivo deseado y realizar dos conclusiones sobre
el grfico.
b. Encontrar, en cada uno de los dos sistemas, el porcentaje de notas que son mayores que su
respectiva media.
12. Los pesos de una muestra de estudiantes se organizan en una distribucin de frecuencias simtrica:
Intervalos

Frecuencias absolutas Frecuencias relativas acumuladas

0,96

]60 ; 70]
n = 50

a. Graficar el histograma y el polgono de frecuencias.


b. Calcular la media, la mediana, la moda y la desviacin estndar.
13. Se aplic un cuestionario a 16 trabajadores de una gran empresa y se obtuvieron los datos presentados en la siguiente tabla:
Cdigo del
trabajador

Gnero

Ao de nacimiento

Nivel educativo
(aos)

Categora
laboral

Salario anual
actual en S/.

Salario anual
inicial en S/.

9534

1966

10

Empleado

27,900

12,750

2041

1960

12

Empleado

26,250

11,550

1187

1952

16

Ejecutivo

41,500

18,750

1842

1980

12

Empleado

24,000

12,750

1813

1960

12

Empleado

27,450

10,200

2519

1979

12

Empleado

23,100

11,250

3338

1985

16

Ejecutivo

37,050

18,000

3012

1973

12

Empleado

24,450

12,450

1056

1980

Empleado

28,350

12,000

2087

1960

19

Directivo

95,000

56,980

1004

1967

12

Empleado

30,900

15,000

6589

1975

12

Empleado

26,700

14,500

1723

1962

20

Directivo

69,250

42,800

2013

1968

16

Directivo

48,200

21,000

1096

1981

12

Empleado

27,900

16,500

2873

1979

16

Ejecutivo

40,350

19,500

(Gnero: F = Femenino, M = Masculino)

Notas

56

Captulo 1. Nociones de Estadstica Descriptiva

a. Clasifique cada una de las variables e indique la escala de medicin adecuada para cada caso.
b. Calcule la moda, la media y la mediana de la variable nivel educativo y comente su simetra.
c. Haga un grfico que permita comparar el rango y los cuartiles de los salarios iniciales de los
hombres y mujeres. Comente el grfico.
14. Se ha encuestado a un grupo de alumnos de una facultad de ingeniera sobre la cantidad de
minutos que usan al da la Internet obtenindose los siguientes resultados.
i

Intervalo

fi

[0 ; 18]

0,0548

0,1905

0,2500

0,2857

0,1071

0,0762

0,0357

a. Calcule el tiempo mnimo para estar en el quinto superior de los que usan la Internet.
b. Calcule el porcentaje de alumnos que usan una hora o menos la Internet.
c. Encuentre la media y la varianza del nmero de minutos diarios que usan la Internet.
15. En la siguiente tabla se muestra la distribucin de frecuencias del nmero de hojas impresas por
un grupo de impresoras durante un da:
Intervalo

Marca de clase

[20 ; ]

Frecuencia relativa

Frecuencia relativa acumulada

0,20
0,45
0,60
125
0,10

a. Complete la tabla de distribucin de frecuencias y presente grficamente la distribucin de


frecuencia relativa y de frecuencia relativa acumulada.
b. Encontrar la media, mediana, la moda y la desviacin estndar de la distribucin.
c. Hallar el porcentaje de impresoras que imprimen entre 70 y 115 hojas.
16. Los siguientes datos representan la cantidad de bebida gaseosa en una muestra de 25 botellas
de dos litros.
1,928
1,928
1,938
1,941
1,941

Notas

1,946
1,957
1,969
1,971
1,973

1,984
1,996
1,997
1,999
2,003

2,013
2,014
2,014
2,015
2,034

2,045
2,066
2,075
2,086
2,088

57

Estadstica EEGGLL

a. Las especificaciones del proceso de llenado de las botellas establecen que el contenido
medio debe estar entre 1,950 y 2,050 litros y que la desviacin estndar del contenido debe ser menor a 0,050 litros. A partir de los datos de la muestra, dira usted que el proceso
cumple las especificaciones?
b. Determine e interprete el rango y los cuartiles para la muestra de contenidos de gaseosa.
c. Construya un diagrama de cajas y comente la simetra de la distribucin de los contenidos
de gaseosa observados.
17. En un estudio sobre consumo de petrleo en una gran ciudad se eligi dos grifos y se tom una
muestra de 100 camiones en cada uno de ellos y se observ el nmero de galones que consuman en un da, obtenindose la siguiente distribucin de frecuencias.
Grifo A

Grifo B

Nmero de galones

Nmero de camiones

Nmero de galones

Nmero de camiones

1 ; 5

10

20

5 ; 9

15

37

9 ; 13

35

20

25

13 ; 17

30

25

10

17 ; 21

20

30

21 ; 25

a. En cul de los dos grifos el consumo de petrleo presenta mayor variabilidad?


b. Realice un diagrama de cajas que permita comparar el consumo de petrleo de los dos grifos.
18. Se tom una muestra aleatoria de 80 viajes de la empresa de transporte interprovincial A y una
muestra aleatoria de 20 viajes de la empresa B. Las tablas siguientes muestran los datos del
nmero de pasajeros por viaje de esas muestras.
Nmero de pasajeros por viaje

Empresa A

[10 ; 14]

20

]14 ; 18]

30

]18 ; 22]

15

]22 ; 26]

10

]26 ; 30]

Nmero de pasajeros por viaje en la empresa B


12

13

14

17

17

18

19

23

23

25

26

26

27

27

30

31

32

32

34

34

a. Grafique el polgono y la ojiva de las frecuencias relativas de la distribucin del nmero de


pasajeros por viaje de la empresa A.
b. Cul empresa presenta mayor variabilidad en el nmero de pasajeros por viaje?

Notas

58

Captulo 1. Nociones de Estadstica Descriptiva

19. La ojiva de los ingresos mensuales, en miles de nuevos soles, de una empresa se muestran en el
siguiente grfico.
Ojiva de ingresos mensuales
1
0.9
0.8
0.7

Fi

0.6
0.5
0.4
0.3
0.2
0.1
0
0

1000

2000

3000

4000

5000

6000

7000

8000

Ingresos

a. Grafique el polgono de frecuencias relativas de los ingresos mensuales.


b. Hallar la mediana y coeficiente de variacin de los ingresos mensuales.
c. Calcule e interprete el tercer cuartil de los ingresos mensuales.
20. Se muestra la distribucin de los asistentes a una charla informativa sobre un nuevo programa
de especializacin ofrecido por cierta escuela de posgrado, segn su profesin.
Profesin

Nmero de asistentes

Ingeniera

24

Administracin

Contabilidad

10

Economa

15

Derecho

3
Total

60

a. Construya un grfico que permita observar la composicin porcentual de los asistentes, segn sus profesiones, a la charla informativa. El grfico debe tener un ttulo adecuado.
b. Calcule una medida de tendencia central para la variable cualitativa.
21. Una compaa requiere los servicios de un tcnico especializado. De los expedientes presentados, se han seleccionado 2 candidatos: A y B, los cuales renen los requisitos mnimos requeridos. Para decidir cul de los 2 se va a contratar, los miembros del jurado deciden tomarles 7
pruebas. Todas las pruebas se calificaron utilizando una escala de 0 a 80, donde 80 es el mximo
puntaje posible. Los resultados se dan a continuacin:
Prueba

Puntaje obtenido por A

57

55

54

52

62

55

59

Puntaje obtenido por B

80

40

62

72

46

80

40

a. Calcule e interprete la media y mediana de los puntajes de los dos candidatos.


b. Calcule e interprete las desviaciones estndar y los coeficientes de variacin.
c. Si usted fuese el gerente de Recursos Humanos, a cul de los candidatos contratara?

Notas

Estadstica EEGGLL

59

1.10. Estadstica descriptiva bidimensional: Regresin lineal simple


Correlacin
La correlacin entre las variables X e Y mide el grado en el que estas dos variables tienden a variar de
manera conjunta, se usa para medir el grado de asociacin lineal entre las variables.

Regresin
La regresin encuentra una relacin funcional entre las variables cuantitativas X e Y.

Diagrama de dispersin
Dado un conjunto de n observaciones de las variables cuantitativas X e Y: (x1, y1), (x2, y2),, (xn, yn), el
primer paso para evaluar la posible asociacin entre estas variables es construir una grfica de los
datos en un plano bidimensional. Esta grfica se denomina diagrama de dispersin o scatter plot.

Fuente: Notas de clase de EST103 del profesor Arturo Caldern

Notas

60

Captulo 1. Nociones de Estadstica Descriptiva

Covarianza
Dada una muestra de n pares de observaciones de las variables cuantitativas X e Y, (x1 , y1), (x2 ,
y2),, (xn , yn), la covarianza muestral se define como:
n

cov( X , Y ) s xy

x
i 1

n
x y i y xi y i
i 1
n
n

xy

Coeficiente de correlacin lineal de Pearson


Dados n pares de datos (x1 , y1), (x2 , y2),, (xn , yn), el coeficiente de correlacin lineal de Pearson se
determina dividiendo la covarianza entre X e Y entre el producto de las desviaciones estndar de X e
Y
Correlacin ( X ,Y ) r

sxy
sx sy

Este coeficiente de correlacin mide el grado de asociacin lineal que existe entre las variables X e Y.
- El coeficiente de correlacin r es mayor o igual a -1 y menor o igual a 1.
- Si r = 0 entonces indica que no existe una asociacin lineal entre las variables (pero puede existir
otro tipo de asociacin entre ellas).
- Si r se acerca a 1 o a -1 indica que existe una asociacin lineal fuerte entre las variables, directa si r
= 1 e inversa si r = -1.
- |r| = 1 solamente cuando todos los datos observados pertenecen a una recta, es decir, cuando la
asociacin lineal es perfecta.

Observaciones
- Una correlacin alta no indica que una variable dependa de la otra o que sea causa de las variaciones en la otra. La asociacin entre ellas no necesariamente es causal.
- Una correlacin alta indica que el modelo lineal podra ser adecuado para hacer predicciones en
el intervalo de variacin de los datos; fuera de l, el tipo de relacin entre las variables puede
cambiar o no existir.
- Podemos obtener valores de correlacin muy altos si usamos una muestra de dos o tres pares de
datos pero en ese caso es claro que la conclusin acerca de la asociacin entre las variables puede
no ser vlida.
- Diversos grupos de datos pueden tener el mismo coeficiente de correlacin (como se observa en
el grfico siguiente); sin embargo, el tipo de relacin entre las variables es distinta, lo que muestra
la importancia de realizar el diagrama de dispersin. El coeficiente de correlacin slo se debera
calcular interpretar para nubes de puntos de tipo franja, ya sea creciente o decreciente.

Notas

61

Estadstica EEGGLL

Regresin lineal simple


El anlisis de regresin lineal simple estudia la relacin lineal entre dos variables numricas y da como resultado una ecuacin matemtica y a bx que describe dicha relacin.
La regresin lineal simple encuentra una recta L: y = a + bx que modela los datos y que permite estimar un valor de la variable Y dado un valor de la variable X.

Mtodo de mnimos cuadrados


Dados n datos (x1 , y1), (x2 , y2),, (xn , yn), donde: xi (i = 1, 2,, n) son los valores observados de la
variable independiente X e yi (i = 1, 2,, n) son los valores observados de la variable dependiente Y.
Si la recta L: y = a + bx es la recta de regresin, entonces, denotamos yi a bx i (i = 1, 2,, n) al
valor estimado de Y cuando X = xi.
En general, el valor observado yi es diferente al valor estimado con la recta de regresin, es decir, se
comete un error de estimacin. El i-simo error de estimacin es: ei yi yi (i = 1, 2,, n).
La suma de los cuadrados de los errores (SCE) es:
SCE

ei 2

i 1

i 1

i 1

2
yi yi yi a bxi 2

La recta de regresin de mnimos cuadrados de Y sobre X, es L: y = a + bx; sus coeficientes son los
valores a y b que minimizan la suma de los cuadrados de los errores.
Los valores de b y a que minimizan SCE son:
sy

br

a y bx

sx

sxy
sx 2

Interpretacin de los coeficientes de regresin


- a es igual al valor estimado de la variable dependiente Y cuando la variable independiente X es
igual a cero.
- b es la variacin estimada del valor de la variable dependiente Y cuando la variable independiente
X se incrementa en una unidad.

Propiedad de la recta de regresin


Si la recta L: y = a + bx es la recta de regresin de mnimos cuadrados de Y sobre X.
- El punto x, y pertenece a la recta de regresin.

- La media de los errores es igual a cero, es decir, e 0


-

y y , la media de los valores estimados con la recta es igual a la media de los valores observados.

Prediccin
Para predecir el valor de la variable dependiente para un valor dado de la variable independiente,
basta con reemplazar el valor dado en la frmula de la recta de mnimos cuadrados.

Notas

62

Captulo 1. Nociones de Estadstica Descriptiva

Coeficiente de determinacin
Se puede demostrar que:

Var(Y ) Var(Y) Var(e)


Donde:
Var(Y) es la varianza de los valores observados de la variable dependiente:
n

sy 2

(y

y )2

i 1

n 1

Var( Y ) es la varianza de los valores estimados con la recta de regresin:


n

(y y )

sy 2

i 1

n 1

Va (e) es la varianza de los errores de estimacin:


n

(e e ) (y
2

se 2

i 1

n 1

yi )2

i 1

n 1

El coeficiente de determinacin es:

Var (Y )
Var (Y )

- R mide qu proporcin de la varianza de los valores observados de Y representa la varianza de los


valores estimados por la recta de regresin. Es decir, la proporcin de la varianza total, Var(Y),
que es explicada por la recta de regresin de mnimos cuadrados.
- Se cumple que R r 2 , es decir, el coeficiente de determinacin es el cuadrado del coeficiente de
correlacin lineal de Pearson.
- Se cumple que 0 R 1 .
- Mientras ms prximo a 1 sea el coeficiente de determinacin, mejor ser el ajuste de los datos al
modelo lineal.
Ejemplo 8
Durante ocho semanas se observ la relacin, entre el nmero de comerciales contratados y el valor
de las ventas (en miles de soles) de un artculo.
X: Comerciales

58

51

85

35

62

70

98

104

Y: Ventas

208

171

253

126

206

220

275

281

a.
b.
c.
d.
e.

Grafique el diagrama de dispersin, evale si las variables en estudio parecen estar asociadas.
Calcule e interprete el coeficiente de correlacin lineal de Pearson.
Determine la ecuacin de la recta de regresin de las ventas sobre el nmero de comerciales.
Si en una semana se contratan 75 comerciales, estimar las ventas en esa semana.
Calcule e interprete el coeficiente de determinacin.

Notas

63

Estadstica EEGGLL

Solucin
a. El diagrama de dispersin muestra un comportamiento de franja creciente, esto nos sugiere asociacin lineal directa entre las variables.

Ventas semanales
(miles de nuevos soles)

Diagrama de dispersin
300
250
200
150
100
50
0
0

20

40

60

80

100

120

Nmero de comerciales

b. El coeficiente de correlacin es r 0,981 , este valor indica una asociacin lineal fuerte y directa
entre el nmero de comerciales contratados por semana y el valor de las ventas semanales.
c. Calculemos los coeficientes de la recta de regresin.
x 70,375 y 217,5 sx 22,242 sy 49,196 sxy 1074,187

De donde b 2,1712, a 64,699


Por lo tanto, la recta de regresin es L : y 64,699 2,171x

Ventas semanales
(en miles de nuevos soles)

Diagrama de dispersin con recta de regresin


350

y = 2.1712x + 64.699
R = 0.9637

300
250
200
150
100
50
0
0

20

40

60

80

100

120

Nmero de comerciales

d. Si x es igual a 75, entonces, y a b (75) 227,5 ; entonces, en una semana en que se contratan
75 comerciales se estima que el valor de las ventas sera 227 500 soles.
e. El coeficiente de determinacin es R r 2 0,96 96% . La varianza explicada por la recta de
regresin es el 96% de la varianza de la variable valor de las ventas semanales. El ajuste de los
datos al modelo lineal es muy bueno.

Notas

64

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicio 51
Las notas siguientes corresponden a la primera prctica de un horario de un curso de Estadstica y la
cantidad de horas dedicadas a estudiar para dicha prctica.
Horas

5,0

6,0

12,0

10,0

8,0

8,5

4,5

5,0

2,0

2,5

4,0

5,0

6,0

3,0

4,0

6,0

12,5

Notas

15

12

17

14

15

15

13

13

10

10

10

14

12

12

13

11

17

a. Grafique el diagrama de dispersin y evale si parece existir relacin lineal entre el tiempo de
estudio y la nota obtenida en el examen de Estadstica.

b. Calcule e interprete el coeficiente de correlacin.

c. Determine la ecuacin de la recta de regresin de mnimos cuadrados e interprete sus coeficientes.

Notas

Estadstica EEGGLL

d. Estime la nota de un alumno que estudi nueve horas.

e. Calcule e interprete el coeficiente de determinacin.

Notas

65

66

Captulo 1. Nociones de Estadstica Descriptiva

Ejercicios
22. En un estudio para determinar la relacin entre la edad y la presin sangunea en mujeres se
tom una muestra aleatoria de 9 mujeres dando los siguientes resultados:
Edad (aos)

56

41

70

37

63

46

57

50

39

Presin sangunea (mm Hg)

146

125

153

117

151

124

151

142

118

a. Grafique el diagrama de dispersin y evale la posible asociacin entre las variables edad y
presin sangunea.
b. Calcule e interprete el coeficiente de correlacin lineal.
c. Determine la ecuacin de la recta de regresin lineal y estime la presin sangunea de una
mujer de 65 aos.
23. Se lleva a cabo un estudio, por medio de detectores radioactivos, de la capacidad corporal para
absorber hierro y plomo. A cada participante del estudio se le da una dosis oral idntica de hierro y plomo. Despus de 12 das se mide la cantidad de cada componente retenida en el sistema
corporal y, a partir de sta, se determina el porcentaje absorbido por el cuerpo. Se obtienen los
siguientes resultados:
Sujeto

a.
b.

c.

Notas

10

Porcentaje de hierro

17

22

35

43

80

85

91

92

96

99

Porcentaje de plomo

17

18

25

58

59

62

65

70

72

Grafique el diagrama de dispersin. Parece haber asociacin entre las variables estudiadas?
Prediga el porcentaje de hierro absorbido por un individuo cuyo sistema corporal absorbe
el 20% del plomo ingerido. Le parece adecuado un modelo de regresin lineal para hacer esta prediccin?
Calcule e interprete el coeficiente de determinacin. Considerado el valor calculado, evale nuevamente su respuesta a la pregunta de la parte b.

67

Estadstica EEGGLL

Captulo 2. Nociones de probabilidad


La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.
La probabilidad es el lenguaje para describir y tratar la incertidumbre.
Ejercicio 52
Asigne un valor numrico entre 0 y 1 a las siguientes frases de acuerdo a la posibilidad de ocurrencia
del evento al que hacen referencia:
Posibilidad de ocurrencia del evento
Es muy probable que ocurra
.
Es posible que ocurra
.
Es poco probable que ocurra
.
Es casi imposible que ocurra
.

2.1. Conceptos bsicos


Experimento aleatorio
Es todo proceso que genera dos o ms resultados bien definidos sin que se pueda predecir con certeza cul de ellos ser observado u ocurrir en cada realizacin del proceso.

Espacio muestral
Es el conjunto de todos los posibles resultados de un experimento aleatorio. Se le suele simbolizar
como .
Ejercicio 53
Indique, para los siguientes experimentos aleatorios, los respectivos espacios muestrales.
Experimento aleatorio
Lanzar una moneda y anotar lo obtenido en
la cara superior
Registrar el resultado de una partida de
ajedrez
Lanzar un dado y anotar el nmero de puntos de la cara superior
Lanzar dos dados y anotar el nmero de
puntos de cada cara superior
Lanzar un dado y anotar lo obtenido hasta
que salga seis

Notas

Espacios muestrales

68

Captulo 2. Nociones de Probabilidad

Evento
Es cualquier subconjunto del espacio muestral.
Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido es un elemento del evento A.
Ejercicio 54
Indique, para cada uno de los siguientes experimentos aleatorios, uno o ms eventos que pertenezcan a sus respectivos espacios muestrales.
Experimentos aleatorios

Eventos

Lanzar una moneda y anotar lo obtenido en


la cara superior
Registrar el resultado de una partida de
ajedrez
Lanzar un dado y anotar el nmero de puntos de la cara superior
Lanzar dos dados y anotar el nmero de
puntos de cada cara superior

Tipos de eventos
Evento elemental o simple:

Se llama as a cada uno de los elementos del espacio muestral

Evento conjunto:

Formado por dos o ms eventos simples

Evento contrario o complemen- Formado por todos los elementos del espacio muestral que
to del evento A (Ac):
no pertenecen a A
Evento imposible:

Evento seguro o siempre cierto:

2.2. Probabilidad
Mide la posibilidad de que un evento ocurra cuando se realiza un experimento.
Ejemplo 9
El Aedes aegypti, mosquito que trasmite el zika, de desarrolla
en cualquier recipiente que acumula agua dentro de las casas y
en patios, jardines, balcones y terrazas. Y no as, en charcos,
zanjas, lagos, lagunas o ros.
La Organizacin Mundial de la Salud seala que el virus del zika
podra dispersarse por todo el continente americano. El mosquito Aedes vive en gran parte del planeta, especialmente en
los pases cercanos a la lnea del ecuador.
Aqu un grfico sobre la probabilidad de aparicin en las diversas zonas del mundo.

Notas

69

Estadstica EEGGLL

Operaciones con eventos


Unin de eventos
Es el conjunto de los resultados que estn en uno o en ambos eventos. Se denota por (A B).
A B {w / w A w B}
A B se expresa como: Al menos uno de los eventos A o B ocurre.

Interseccin de eventos
Es el conjunto de los resultados que estn en ambos eventos. Se denota por (A B).

A B {w / w A w B}
A B se expresa como: Ambos eventos, A y B ocurren a la vez.

Complemento de un evento
AC {w / w A }
AC se expresa como: El evento A no ocurre.

Notas

Captulo 2. Nociones de Probabilidad

Diferencia de eventos
A B A BC {w / w A w B}
A B se expresa como: Ocurre el evento A pero no el evento B.

Diferencia simtrica de eventos


A B A BC AC B {w / w A w B}
A B se expresa como: Ocurre solamente uno de los eventos A o B.

Eventos disjuntos (mutuamente excluyentes)


Dos eventos A y B son disjuntos, si A B , es decir, si no tienen elementos comunes.

Notas

70

71

Estadstica EEGGLL

Ejercicio 55
Una empresaria comprar un hotel y un restaurante. Se definen los eventos:
A:= la empresaria tenga xito en la inversin del hotel
B:= la empresaria tenga xito en la inversin del restaurante
Escriba los siguientes eventos en funcin de los eventos A y B. Adems, grafique dicho evento en un
diagrama de Venn.
Evento

Notacin

La empresaria tenga xito en las dos inversiones

A ... B

Diagrama de Venn

La empresaria no tenga xito en el restaurante

La empresaria tenga xito en, al menos una, de


sus inversiones
La empresaria tenga xito solamente en una de
sus inversiones
La empresaria tenga xito en el restaurante pero
no en el hotel
Ejercicio 56
Un inspector revisa un proceso de produccin de tres etapas. Cada una de las etapas puede o no
haber sido concluida satisfactoriamente. Definamos los eventos Ai:= la etapa i del proceso concluy
satisfactoriamente, i = 1, 2, 3. Escriba los siguientes eventos en funcin de los eventos A1, A2 y A3.
Adems, grafique dicho evento en un diagrama de Venn.
Evento

Las tres etapas concluyeron satisfactoriamente.

Por lo menos una de las etapas del proceso concluy satisfactoriamente.

Solo dos de las etapas concluyeron satisfactoriamente.

Notas

Notacin

A1 A2 A3

Diagrama de Venn

72

Captulo 2. Nociones de Probabilidad

Principios de conteo, combinaciones, variaciones y permutaciones


Principio de la adicin
Si A y B son eventos finitos y A B , entonces nA B nA nB
Ejercicio 57
Una persona solo puede viajar de una ciudad a otra por carretera de cuatro formas o por avin de
dos formas. De cuntas formas diferentes puede viajar la persona de una ciudad a la otra?

Principio de la multiplicacin
Si A y B son eventos finitos, entonces nA B nA nB
Ejercicio 58
Una joven tiene 34 polos, 16 pantalones y 15 pares de zapatos de cuntas maneras diferentes puede elegir un polo, un pantaln y un par de zapatos para vestirse?

Permutaciones
La cantidad de formas en que se puede ordenar n objetos distinguibles es:
Pn n!

Ejemplo 10
Encontrar de cuntas maneras se puede ordenar en una fila a cuatro alumnos.

Solucin
La cantidad de maneras es P4 4! 24.

Notas

73

Estadstica EEGGLL

Ejercicio 59
Un grupo de doce personas hace cola en un cine para comprar una entrada.
De cuntas maneras diferentes pueden formar la cola las doce personas?

De cuntas maneras diferentes pueden formar la cola, si el ms grande y el ms bajo no tienen que
estar juntos?

Regla de conteo para variaciones


La cantidad de formas en que se puede ordenar r objetos seleccionados de un total de n objetos distinguibles es:

Vrn

n!
n r !

Si n = r, entonces Vnn Pn .
Ejemplo 11
Encontrar de cuntas maneras se pueden ordenar dos de cinco alumnos.

Solucin
La cantidad de maneras es V25

5!
20
5 2!

Ejercicio 60
De un grupo de 12 vecinos de un edificio, se desea escoger a tres personas al azar para que ocupen
los puestos de presidente, tesorero y vocal de la junta de administracin del edificio, respectivamente. De cuntas maneras diferentes se puede hacer dicha eleccin?

Notas

74

Captulo 2. Nociones de Probabilidad

Regla de conteo para combinaciones


La cantidad de formas de seleccionar r objetos de un total de n objetos distinguibles sin tomar en
cuenta el orden es:
n!
C rn
r! n r !
Ejemplo 12
Encontrar de cuntas maneras se pueden escoger dos de cinco alumnos.

Solucin
La cantidad de maneras es C25

5!
10
2!5 2!

Ejercicio 61
Un grupo de 25 amigos quiere elegir, al azar, a cuatro de ellos para organizar una fiesta. De cuntas
maneras diferentes se puede elegir a dichas personas?

2.3. Definicin clsica de probabilidad


Si el espacio muestral tiene un nmero finito de elementos equiprobables, la probabilidad de la
ocurrencia del evento A.

P(A)

Es decir, P(A)

nA
n

nmero de elementos del evento A


nmero de elementos del espacio muestral

Ejemplo 13
Se lanza un dado, calcular la probabilidad de que salga:
a. un as.
b. un nmero par.
c. un nmero menor que 5.
d. un nmero par y menor que 5.
e. un nmero par o menor que 5.

Notas

75

Estadstica EEGGLL

Solucin
El espacio muestral al lanzar un dado es {1, 2, 3, 4, 5, 6} . La cantidad de elementos del espacio
muestral es n() 6

A {1} ,

n(A) 1

entonces, P(A)

nA 1

n 6

b. B {2,4,6} ,

n(B) 3

entonces, P(B)

nB 3

n 6

C {1,2,3,4} ,

n(C) 4

entonces, P(C )

nC 4

n 6

d. D B C {2,4} ,

n(D) 2

entonces, P(D)

nD 2

n 6

n(E) 5

entonces, P(E )

nE 5

n 6

a.

c.

e.

E B C {1,2,3,4,6} ,

Ejercicio 62
Una persona realiza una jugada de la Tinka, que es un juego de lotera que consiste en elegir seis
nmeros de 45 nmeros posibles. Encontrar la probabilidad de que con un boleto de seis nmeros se
acierte con todos los nmeros seleccionados.

Solucin
Sea el evento A := Ganar la Tinka.
P A

nA

Ejercicio 63
De un mazo de 52 cartas se saca una carta al azar, calcule la probabilidad de que sea 6.

Ejercicio 64
Se lanzan dos dados, calcule la probabilidad de que la suma sea mayor a 6.

Notas

76

Captulo 2. Nociones de Probabilidad

Ejercicio 65
Se entrevist a 3500 clientes de una empresa de telefona celular que adquirieron un paquete promocional que permita llamar ilimitadamente a otros dos celulares de la misma empresa durante tres
meses. La siguiente tabla muestra la distribucin de los clientes entrevistados por sexo y por su intencin de renovar el paquete promocional.
Sexo

S renueva

No renueva

Masculino

1 000

900

Femenino

1 200

400

Si se selecciona al azar uno de los clientes entrevistados, calcule la probabilidad de que el cliente
seleccionado:
A = Sea mujer

B = Tenga intencin de renovar el paquete promocional

C = Sea hombre y no tenga intencin de renovar el paquete promocional

D = Sea mujer o no tenga intencin de renovar el paquete promocional

Notas

77

Estadstica EEGGLL

Definicin frecuencial de probabilidad


La probabilidad de ocurrencia de un evento se determina por la observacin de la proporcin de
veces que eventos similares ocurrieron en el pasado (frecuencia relativa). Si un experimento se realiza n veces y si en nA de ellas ocurre el evento A, la probabilidad de A es:

nA
n n

P(A) lim

Probabilidad subjetiva
Es la valoracin que hace un individuo de las posibilidades de obtener un resultado, basado en su
experiencia, opinin personal y anlisis que l hace de la situacin particular que se evala (estado
de informacin de la persona).
Ejercicio 66
La probabilidad de que el rendimiento de una cierta accin en la Bolsa de Valores de Lima sea mayor
al 10% es
La probabilidad de que Per clasifique para la Copa Mundial del de Ftbol 2018 es .
La probabilidad de que apruebe el curso de Estadstica es .

2.4. Definicin axiomtica de probabilidad


La probabilidad es una funcin P que a cada evento A del espacio muestral le hace corresponder el
nmero P(A) que satisface los siguientes axiomas:
Axioma 1. A : P(A) 0
Axioma 2. P() 1
Axioma 3. Sean A1 y A2 eventos de , si A1 A2 , entonces P(A1 A2 ) P(A1 ) P(A2 )

Propiedades
Sean A y B dos eventos cualesquiera de , se cumple que:
-

P(A) P(AC ) 1
PA B PA PB PA B

A B P(A) P(B)

P A 1

P A B P A P A B

P A P A B P A B C

Ejemplo 14
La probabilidad de que una computadora de un cierto instituto de computacin tenga instalado el
programa A es 0,6 y de que tenga el programa B es 0,5. Si la probabilidad de que tenga instalados los
dos programas es 0,2, calcule la probabilidad de que:
a. tenga alguno de los dos programas.
b. tenga el programa A pero no el B.
c. tenga el programa B pero no el A.
d. tenga slo uno de los dos programas.
e. no tenga ninguno de los dos programas.
Notas

Captulo 2. Nociones de Probabilidad

78

Solucin
Sean los eventos A = {Tenga el programa A} y B = {Tenga el programa B}
a. P(A B) P(A) P(B) P(A B) 0,6 0,5 0,2 0,9
b. P(A B) P(A) P(A B) 0,6 0,2 0,4
c.

P(B A) P(B) P(B A) 0,5 0,2 0,3

d. P(AB) P(A B) P(B A) 0,4 0,3 0,7


e.

P(A C B C ) P A BC 1 P(A B) 1 (0,9) 0,1

Ejercicio 67
El anlisis costo-beneficio de la compra de cierta fbrica determin que solo la ocurrencia de alguno
de los eventos A o B ocasionara una inversin desfavorable. Se estima que la probabilidad de que
ocurra el evento A es 10%; la probabilidad de que el evento B ocurra es 5% y la probabilidad de que
ocurran ambos eventos es 2%.
Cul es la probabilidad de que la inversin resulte desfavorable debido nicamente a la ocurrencia
del evento A?

Cul es la probabilidad de que la inversin resulte desfavorable debido nicamente a la ocurrencia


del evento B?

Cuantifique el riesgo que se corre en esta inversin, es decir, la probabilidad de que la compra ocasione una inversin desfavorable.

Notas

Estadstica EEGGLL

79

Ejercicio 68
La probabilidad que se fracase en el negocio A es de 1/3, que se tenga xito en al menos uno de los
negocios es 5/6 y que se fracase en el negocio B es 1/2. Determine la probabilidad de que solamente
se tenga xito en uno de los negocios.

Ejercicio 69
Una persona escoge seis manzanas al azar de 25 posibles. Si de las 25 manzanas solo hay ocho que
estn jugosas, calcule la probabilidad de que al menos una de las manzanas escogidas por la persona
estn jugosas.

Ejemplo 15
En un estrado se sientan al azar las personas: I , J, K, L y M. Encontrar la probabilidad de que J y K no
se sienten juntos.

Solucin
El evento pedido es A = {J y K no se sienten juntos}.
Luego AC = {J y K se sienten juntos}.
P P
4 ! 2! 3
La probabilidad pedida es P(A) 1 P(A C ) 1 4 2 1

P5
5!
5
Notas

80

Captulo 2. Nociones de Probabilidad

Ejemplo 16
En un lote de conservas de atn 12 son de marca nacional y ocho son de marca extranjera. Se escogen al azar y sin reposicin seis conservas, encontrar la probabilidad de que entre las conservas elegidas:
a. cuatro sean de marca nacional
b. todas sean de marca nacional
c. ninguna sea de marca nacional
d. alguna sea de marca nacional
e. por lo menos cuatro sean de marca nacional
f. a lo ms una sea de marca nacional

Solucin
P A

C412 C28
0,3576
C620

b. P B

C612 C 08
0,0238
C620

P C

C 012 C68
0,0007
C620

a.

c.

d. PD 1

C012 C68
0,9993
C620

e.

P E

C412 C28 C512 C18 C612 C08


0,5449
C620

f.

P F

C012 C68 C112 C58


0,0181
C620

2.5. Probabilidad condicional


La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta informacin (condicin).

P(A B)

P(A B)
P(B)

PB / PB

Ejercicio 70
En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se
pregunt a todos los peruanos por los servicios de comunicacin con los que contaba su hogar y su
rea de residencia, obtenindose los siguientes resultados:

Notas

Estadstica EEGGLL

81

Servicios con que los cuenta el hogar


Urbano
Rural
Total
Hogares sin ningn tipo de servicio
1 682 454 1 468 889 3 151 343
Solo tienen telfono fijo
480 831
6 170 487 001
Solo tienen telfono celular
1 299 037 138 721 1 437 758
Solo tienen Internet
3 336
275
3 611
Solo tienen TV por cable
56 343
2 688
59 031
Tienen telfono fijo y telfono celular
506 759
2 912 509 671
Tienen telfono fijo e Internet
15 684
31
15 715
Tienen telfono fijo y TV por cable
117 733
186 117 919
Tienen telfono celular e Internet
9 970
84
10 054
Tienen telfono celular y TV por cable
204 563
1 981 206 544
Tienen Internet y TV por cable
1 288
19
1 307
Tienen telfono fijo, telfono celular e Internet
93 103
110
93 213
Tienen telfono fijo, telfono celular y TV por cable 326 181
468 326 649
Tienen telfono fijo, Internet y TV por cable
19 732
9
19 741
Tienen telfono celular, Internet y TV por cable
15 424
49
15 473
Los cuatro servicios
298 911
133 299 044
Total 5 131 349 1 622 725 6 754 074

a. Si se selecciona a un hogar de zona rural, cul es la probabilidad de que tenga algn servicio?

b. Si se selecciona a un hogar de zona urbana, cul es la probabilidad de que cuente con tres servicios por lo menos?

c. Si se selecciona a un hogar que no cuenta con ningn servicio, cul es la probabilidad de que sea
de zona rural?

Notas

82

Captulo 2. Nociones de Probabilidad

Ejemplo 17
De las 100 computadoras de una empresa, 60 tienen instalado el programa A y 50 tienen instalado el
programa B. Si 20 tienen instalados los dos programas, encontrar la probabilidad de que una computadora de la empresa tenga instalado el programa B si tiene instalado el programa A.

Solucin
Sean los eventos A y B, definidos como: A:={La computadora tenga instalado el programa A}
B:={La computadora tenga instalado el programa B}
60
50
20
Se tiene que P(A)
, P(B)
, P(A B)
100
100
100
20
P(A B) 100 20
La probabilidad pedida es P(B / A)

60 60
P(A)
100

Regla del producto


La regla del producto se usa para calcular la probabilidad de una interseccin de eventos
P(A B) PAP(B / A) PBP(A / B)

Ejercicio 71
De los adultos de 25 o ms aos empleados en cierto pas, el 90,3% complet la enseanza media y
de ellos, el 30,8% complet la universidad. Calcular la probabilidad de que un adulto empleado de
ese pas, seleccionado al azar, haya completado la enseanza media y tambin la universidad.

Ejemplo 18
En un lote de 50 computadoras hay 20 que son HP. Si se escoge al azar y una por una dos computadoras del lote, encontrar la probabilidad de que la primera sea HP y la segunda no lo sea.

Solucin
Sean los eventos A y B, definidos como: A:={La primera computadora escogida sea HP}
B:={La segunda computadora escogida no sea HP}
Por dato del problema, afirmamos que PA

20
30
, PB / A
50
49

Por la regla del producto tenemos que P(A B) P(A)P(B / A)

Notas

20 30

50 49

83

Estadstica EEGGLL

Particin del espacio


Los eventos A1, A2,, Ak son una particin del espacio muestral , si:
-

P(Ai ) 0 , (i 1, 2,...,k)

Ai Aj , (i j)
k

i 1

Teorema de la probabilidad total


Sean los k eventos A1, A2, A3,..., Ak que constituyen una particin del espacio muestral , entonces
para cualquier evento B de se cumple lo siguiente:
PB PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

Teorema de Bayes
Sean los k eventos A1, A2, A3,..., Ak que constituyen una particin del espacio muestral , entonces
para cualquier evento B de se cumple lo siguiente, si P(B) > 0:
P Ai B

PAi B
PAi PB / Ai

PB
PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

El teorema de Bayes establece una relacin muy importante en la teora de probabilidades y es la


base para la revisin de la asignacin de probabilidades a la luz de informacin adicional.
Probabilidades a
priori

Informacin
nueva

Teorema de
Bayes

Posibilidades a
posteriori

Ejemplo 19
En una fbrica los discos bluray son producidos por una de tres mquinas: M1, M2, M3. La produccin
diaria de cada mquina es de: 500, 300 y 200 discos, respectivamente. El porcentaje de discos defectuosos producidos por cada mquina es de: 1%, 1,5% y 0,5% respectivamente.
a. Si se escogi un disco producido en la fbrica, calcule la probabilidad de que sea defectuoso.
b. Si el disco escogido es defectuoso, calcule la probabilidad que haya sido producido por M1.

Solucin
Sean los eventos Ei:={El disco es producido por Mi}, (i = 1, 2, 3); D:={El disco es defectuoso}
500
300
200
PE1
0,5 , PE2
0,3 , PE 3
0,2
1 000
1 000
1 000
Adems, se sabe que: PD / E1 0,01, PD / E2 0,015, PD / E3 0,005
a.

PD

PE PD / E 0,5 0,01 0,3 0,015 0,2 0,005 0,0105


i

i 1

b. PE1 / D

Notas

PE1 PD / E1 0,5 0,01

0,4761
PD
0,0105

Captulo 2. Nociones de Probabilidad

84

Ejercicio 72
En una zona de la ciudad, durante las noches de los fines de semana, la polica sabe por experiencia
que el 20% de los conductores ha consumido alcohol, por lo que realiza operativos para detectar a
los conductores que han consumido alcohol. Para realizar las pruebas usan unos dispositivos que
detectan al consumidor de alcohol en el 95% de los casos y que se equivocan al indicar que una persona ha consumido, cuando en realidad no lo ha hecho en el 3% de los casos.
Estime el porcentaje de conductores para los que el dispositivo da positivo al consumo de alcohol.

Si la persona ha dado positivo para consumo de alcohol, calcule la probabilidad de que en realidad no
haya consumido alcohol.

Ejercicio 73
Un administrador est interesado en determinar si cierta impureza est presente en un producto.
Por estudio de los datos histricos, el administrador estima que la impureza est presente en 20% de
estos productos. Con un experimento de laboratorio se puede evaluar si la impureza est o no presente en el producto; este experimento tiene una probabilidad de 86% de detectar la impureza
cuando esta est presente y una probabilidad de 8% de indicar que la impureza est presente cuando
en realidad no lo est.
Si acaba de realizarse el experimento y el resultado indica que la impureza est presente en el producto evaluado, determine la probabilidad de que la impureza est realmente presente en este producto.

Notas

85

Estadstica EEGGLL

2.6. Eventos independientes


Si PA 0 , los eventos A y B son independientes si y solo si:
PB A PB

- Dos eventos A y B son independientes si se cumple que PA B PAPB


- Tres eventos A, B y C son independientes si se cumple que:
PA B PAPB
PB C PBPC

PA C PAPC

P(A B C) P(A)P(B)P(C)

Sean dos eventos A y B de tales que P(A) 0 y P(B) 0, entonces:


- Si los eventos A y B son independientes, entonces A y B no son disjuntos
- Si los eventos A y B son disjuntos, entonces A y B no son independientes
Ejercicio 74
En una empresa, los obreros A y B realizan trabajos riesgosos. En cierta tarea, la probabilidad de que
el obrero A tenga un accidente laboral es del 10%, mientras que para el obrero B es del 25%. Si al
realizar dicha tarea, la ocurrencia de los accidentes se puede considerar independiente.
Evento
Cul es la probabilidad de que al menos uno de
los obreros tenga un accidente laboral?.

Notacin
P(A ... B)=

Diagrama de Venn

Cul es la probabilidad de que ninguno de los


obreros tenga un accidente laboral?
Cul es la probabilidad de que solo uno de los
obreros tenga un accidente laboral?
Ejercicio 75
En la fabricacin de un producto se presenta tres tipos de defectos A, B y C, cada uno con probabilidad del 0,02; 0,05 y 0,03, respectivamente. Los defectos ocurren de manera independiente.
Evento
Si se elige al azar un producto,
calcule la probabilidad de que
se presente un solo defecto.
Si se elige al azar un producto,
calcule la probabilidad de que
se presente al menos dos defectos.
Ejemplo 20
Notas

Notacin
P(A1 A2 A3)=

Diagrama de Venn

86

Captulo 2. Nociones de Probabilidad

Se lanza un dado n veces, encontrar la probabilidad de que el as aparezca por lo menos una vez.

Solucin
Definamos el evento A = {El as aparece por lo menos una vez}
Definamos los eventos Ai = {El as aparece en el lanzamiento i}, se tiene que P Ai

1
6

Luego, podemos afirmar que Ai, i = 1, 2,, n son eventos independientes.

Tambin, afirmamos que AiC , i = 1, 2,, n son eventos independientes y que P AiC
n

5
6

Adems, A Ai por lo que AC AiC . Luego, tenemos que


i 1

i 1

5 5
5
5
PA 1 P AC 1 P AiC 1 P A1C P A2C ...P AnC 1 ... 1
6 6
6
6
i 1

Ejemplo 21
Un televidente ve de manera independiente los programas A y B. La probabilidad de que vea el programa A es 0,2 y de que vea el programa B es 0,3, calcule la probabilidad de que:
a. vea los dos programas.
b. no vea ninguno de los dos programas.
c. vea alguno de los dos programas.
d. vea slo el programa A.
e. vea slo el programa B.
f. vea slo uno de los dos programas.

Solucin
Sean los eventos:
A:= {El televidente vea el programa A}
B:= {El televidente vea el programa B}
a.

P(A B) P(A)P(B) 0,2 0,3 0,06

b. P AC BC P AC P BC 0,8 0,7 0,56


c.

PA B 1 P(( A B)C ) 1 P(AC BC ) 1 0,56 0,44

d. PA B P(A B C ) P(A) P(B C ) 0,2 0,7 0,14


e.

PB A P(B A C ) P(B) P(A C ) 0,3 0,8 0,24

f.

PAB P(A B) P(B A) 0,14 0,24 0,38

Notas

Estadstica EEGGLL

87

Ejercicios
24. Tres mquinas producen cierto artculo en cantidades muy grandes, de tal manera que cualquiera de estos artculos resulta defectuoso independientemente de la mquina que lo haya
producido. La primera mquina produce 2,5% de artculos defectuosos, la segunda 3,1% y la
tercera 1,8%. Se seleccionan al azar tres de estos artculos, el primero producido en la mquina
1, el segundo en la mquina 2 y el tercero en la mquina 3.
a. Cul es la probabilidad de que al menos uno de los artculos seleccionados de las dos primeras mquinas sea defectuoso?
b. Cul es la probabilidad de que el artculo seleccionado de la tercera mquina sea el segundo defectuoso?
c. Cul es la probabilidad de que solo uno de los artculos seleccionados sea defectuoso?
25. La probabilidad de que un evento ocurra es p. Si el experimento aleatorio se repite tres veces de
manera independiente, calcule el valor de p que hace mxima la probabilidad de que ocurra el
evento como mximo una vez.
26. Una fbrica de bujas para motores produce un 88% de buenas y un 12% de defectuosas. Antes
de enviarlas a los almacenes para su venta, se someten a un control en la que se admiten como
buenas las que los son con una probabilidad de 0,91 y las que no los son con una probabilidad
de 0,04.
a. Calcule la probabilidad de que una buja sea considerada como buena en un control.
b. Si una buja fue considerada como buena en un control, cul es la probabilidad de que sea
realmente buena?
27. Tres tiradores tiran al blanco simultneamente y de manera independiente. Sus probabilidades
de acertar son 50%; 25% y 75% respectivamente. Calcule la probabilidad de que consigan:
a. al menos un acierto.
b. exactamente un acierto.
c. exactamente dos aciertos.
28. En una ciudad el 55% de los habitantes consume pan integral, el 30% consume pan blanco y el
20% consume ambos. Si se selecciona un habitante al azar:
a. Cul es la probabilidad de que solamente coma pan blanco?
b. Cul es la probabilidad de que una persona de esa ciudad no consuma ninguno de los dos
tipos de pan?
c. Sabiendo que el habitante seleccionado consume pan blanco, cul es la probabilidad de
que no consuma pan integral?
29. Si un vehculo se pasa la luz roja en un cruce que se equip con una cmara de vigilancia, hay un
95% de probabilidad de que reciba una multa de trnsito. Si durante las ltimas tres horas cinco
vehculos se han pasado la luz roja en el referido cruce, cul es la probabilidad de que al menos
uno de ellos reciba una multa?
30. Tres personas lanzan un dado cada una. Calcule la probabilidad de que las tres saquen el mismo
nmero.
Notas

Captulo 2. Nociones de Probabilidad

88

31. Se estima que slo un 25% de las personas que compran acciones en la Bolsa de Valores tiene
conocimientos burstiles. De los que compran acciones sin conocimientos burstiles, slo un
10% obtienen beneficios. El 5% de los que compran acciones tiene conocimientos burstiles pero no obtiene beneficios. Si se elige al azar una persona que ha comprado acciones en la Bolsa
de Valores y resulta que ha obtenido beneficios, cul es la probabilidad de que tenga conocimientos burstiles?
32. El gerente de proyectos de la empresa LUCET est determinando si deba presentar una oferta
para hacerse cargo de la iluminacin de un nuevo centro comercial. En el pasado, el principal
competidor de LUCET, la empresa ILUMIN, ha propuesto ofertas en el 78% de los nuevos proyectos. Si ILUMIN no presenta ofertas para un trabajo, la probabilidad de que LUCET obtenga el
trabajo es de 0,62. Si ILUMIN propone una oferta para el trabajo, la probabilidad de que LUCET
obtenga el trabajo es de 0,25.
a. Cul es la probabilidad de que LUCET obtenga el trabajo? Con base en este resultado, recomendara usted que la empresa presente una oferta? Por qu?
b. Si la empresa LUCET obtiene el trabajo, cul es la probabilidad de que la empresa ILUMIN
haya propuesto una oferta?
33. Un inversionista que tiene acciones en tres compaas: A, B y C, estima que las probabilidades
de tener utilidades son 0,3; 0,6 y 0,4 respectivamente.
a. Si la probabilidad de que tenga utilidades en A y B es 0,12, cul es la probabilidad de que
no tenga utilidades en B dado que s las tuvo en A?
b. El tener utilidades en A es independiente de no tener utilidades en B?
c. Si hay independencia entre tener utilidades en las compaas, calcular la probabilidad de
que el inversionista tenga utilidades en ms de una de ellas.
34. Segn datos del informe Perfil Sociodemogrfico del Per, publicado por el INEI en:
http://www.inei.gob.pe/Anexos/libro.pdf, el 78,78% de la poblacin censada de 18 o ms aos
vive en rea urbana y el resto en rea rural. En rea urbana, el 97,59% de las personas censadas
de 18 o ms aos cuenta con Documento Nacional de Identidad (DNI), y este porcentaje es del
93,65% en rea rural.
a. Con base en los datos anteriores, calcule el porcentaje de la poblacin censada, de 18 o
ms aos, que no cuenta con DNI.
b. Si se selecciona una persona censada de 18 o ms aos y tiene DNI, cul es la probabilidad
que viva en rea urbana?
35. Los registros de los delitos en una ciudad muestran que 20% de ellos son violentos y 80% son no
violentos. Se seala tambin que son denunciados el 90% de los delitos violentos y solo el 70%
de los delitos no violentos
a. Cul es la proporcin global de delitos que se denuncian en la ciudad?
b. Si no se denuncia un delito ante la polica, cul es la probabilidad de que el delito sea violento?
36. El nico aeropuerto de cierta ciudad cuenta con tres terminales. El terminal A controla el 50%
del trnsito areo, el terminal B controla el 35% y el terminal C el 15%. La probabilidad de de
detectar a un pasajero portando armas de fuego en los terminales A, B y C se estiman en 96%;
95% y 90%, respectivamente.
Notas

Estadstica EEGGLL

89

a. Cul es la probabilidad de que un pasajero que porte arma de fuego sea detectado en este
aeropuerto?
b. Si un pasajero que portaba un arma de fuego fue detectado, cul es la probabilidad de que
haya sido detectado en el terminal B?
37. De la poblacin de trabajadores de cierta empresa, el 30% han participado en el curso de capacitacin sobre Control Estadstico de Procesos y el 15% han participado en el curso de capacitacin en Seis Sigma. Se sabe tambin que el 37% de los trabajadores han participado en al menos
uno de los dos cursos.
a. Qu porcentaje de los trabajadores participaron en los dos cursos?
b. Si se selecciona uno de estos trabajadores al azar, cul es la probabilidad de que haya participado slo en uno de los cursos?
38. Se entrevist a 120 personas que visitaron B&B, una nueva tienda por departamentos, durante
el fin de semana pasado. Se sabe que fueron entrevistadas 84 mujeres y que 30 de las personas
entrevistadas tenan la tarjeta de crdito de la tienda; tambin se sabe que un tercio de los
hombres tenan la tarjeta de crdito de la tienda.
a. Calcule la probabilidad de que una de las personas entrevistadas, elegida al azar, sea mujer
o tenga tarjeta de crdito de la tienda.
b. Se selecciona uno de los entrevistados al azar y se verifica que tiene la tarjeta de crdito de
la tienda, cul es la probabilidad de que el cliente entrevistado sea hombre?
c. Sean los eventos H = el cliente seleccionado es hombre y T = el cliente seleccionado tiene
tarjeta de crdito de la tienda. Son H y T eventos independientes?

Notas

91

Estadstica EEGGLL

Captulo 3. Variables aleatorias y modelos o distribuciones de probabilidad


3.1. Variable aleatoria
Es una funcin del espacio muestral en los nmeros reales, es decir, X : IR
La variable aleatoria atribuye a cada elemento del espacio muestral un nmero que no es aleatorio
o imprevisible, sino fijo y predeterminado. Lo que es aleatorio es el experimento sobre cuyo espacio
muestral se define la variable aleatoria.

Rango de la variable aleatoria


Es el conjunto de los valores posibles de la variable aleatoria, es decir, RX { X (w) / w }

Tipos de variable aleatoria


Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores
diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.
Ejercicio 76
Indique el tipo de la variable aleatoria y su rango.
Variable aleatoria

Tipo

W = nmero de libros defectuosos en un


lote de 100 unidades
X = nmero de veces que debe picarme
mosquitos hasta contraer el dengue
Y = tiempo que puede pasar un humano
debajo del agua sin respirar (en minutos)
Z = dinero gastado en almorzar por un
alumno el presente da, en nuevos soles

Evento (X = a)
El evento (X a) se define como (X a) { w / X(w) a }

Notas

Rango

Captulo 3. Variables aleatorias y distribuciones de probabilidad

92

3.2. Variable aleatoria discreta


Una variable aleatoria es discreta si el conjunto de valores que puede tomar es finito o infinito numerable. Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad que se
denota P(X = x).
Por ejemplo, son las variables aleatorias discretas las siguientes:
Nmero de barcos que llegan a un puerto diariamente.
Cantidad de preguntas correctamente contestadas en una prueba de evaluacin.
Cantidad de guacamayos que viven en la reserva nacional Pacaya y Samiria.
Ejemplo 22
Sea el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o sello (s) cada
vez. = {(c,c), (c,s), (s,c), (s,s)}.
Sea X el nmero de caras obtenidas.
El rango de RX = {0, 1, 2}. X es una variable aleatoria discreta.
El evento (X = 0) = {(s,s)}
El evento (X = 1) = {(c,s), (s,c)}
El evento (X = 2) = {(c,c)}

Ejemplo 23
Sea el espacio obtenido al lanzar un dado hasta que salga el as. Sea X el nmero de lanzamientos.
RX = {1, 2, 3,} = Z+. X es una variable aleatoria discreta.

Distribucin de probabilidad de una variable aleatoria discreta


La distribucin de probabilidad de una variable aleatoria discreta X se describe como una funcin de
probabilidad representada por f(x) que asigna a cada valor de la variable aleatoria, la probabilidad de
que X asuma ese valor, esto es f(x) = P(X = x).
Toda funcin de probabilidad cumple lo siguiente:
0 f(x) 1

f x 1

xR X

Si A RX , entonces PA

f x
xA

El dominio de la funcin f(x) se puede extender a todos los nmeros reales, si se define f(x) = 0 para
todo x IR- RX.
Notas

93

Estadstica EEGGLL

Ejemplo 24
Sea X el nmero de caras obtenidas al lanzar una moneda dos veces. Determine la funcin de probabilidad de la variable X y calcule P(X 1)

Solucin
Sea la variable aleatoria X := nmero de caras obtenidas al lanzar una moneda dos veces.
RX = {0, 1, 2}
Luego, la funcin de probabilidad de la variable X es:

f 0 P X 0

1
,
4

f 1 P X 1
1

2
,
4

La probabilidad pedida es P( X 1) f (x) f (0) f (1)


x 0

f 2 P X 2

1
4

1 2
0,75
4 4

Ejemplo 25
Sea X el nmero de lanzamientos de un dado hasta que salga el primer seis. Determine la funcin de
probabilidad de la variable X y calcule P(X 3)

Solucin
Sea la variable aleatoria X := nmero de lanzamientos de un dado hasta que salga el primer seis.
RX = {1, 2, 3,} = Z+.
f 1 P X 1

1
6

5 1
f 2 P X 2
6 6

5 1
f 3 P X 3
6 6

5
Luego, la funcin de probabilidad de la variable X es f x P X x
6

x 1

1
; x 1, 2, 3,....
6

25
1 5
La probabilidad pedida es P( X 3) 1 P( X 3) 1 f (1) f (2) f (3) 1

0,5787
6 36 216
Ejercicio 77
Se lanza un dado una vez, sea la variable aleatoria X igual al nmero de la cara superior. Determine y
grafique la funcin de probabilidad de la variable X.

Notas

94

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Ejercicio 78
Se lanza dos dados a la vez, sea la variable aleatoria X igual a la suma de los nmeros de las caras
superiores. Determine y grafique la funcin de probabilidad de la variable X.

Solucin
Primero definamos la variable X: =
El rango de la variable es RX =
La funcin de probabilidad f(x) ser:

Valor esperado de una variable aleatoria discreta


El valor esperado E(X) de una variable aleatoria discreta X con distribucin de probabilidad f(x) se
define por:

E X

xf x

xR X

El valor esperado E(X), tambin, se le conoce como media de la variable X, denotada por X.
Ejercicio 79
El nmero de trabajadores que faltan por da por razones de salud en una empresa se modela con
una variable aleatoria X con funcin de distribucin.
x

f(x)

0,08

0,12

0,40

0,25

Determine k.

Calcule e interprete el valor esperado de X.

Notas

95

Estadstica EEGGLL

Valor esperado de una funcin de variable aleatoria discreta


Sea G(X) una funcin de la variable aleatoria discreta X. El valor esperado de G(X) es:

E G X

Gx f x

xR X

Ejercicio 80
Un jugador lanza un dado, si sale un nmero de puntos mayor a cuatro gana 10 nuevos soles y si no,
pierde cinco nuevos soles. Calcule e interprete el valor esperado de la ganancia.

Varianza de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con funcin de probabilidad f(x) se define por:

Se cumple V X E X 2 X2

V X E X X 2

f x X2

xR X

La varianza de la variable aleatoria X, V(X), tambin se denota por X2 .

Desviacin estndar de una variable aleatoria discreta


X X2
Ejercicio 81
La demanda diaria de un producto perecible puede modelarse por una variable aleatoria discreta X
cuya distribucin de probabilidad est dada por la tabla que sigue:
x

12

24

36

48

60

f(x)

0,15

0,25

0,30

0,20

0,10

Se obtiene por cada unidad demandada de producto 20 nuevos soles de utilidad. Si la cantidad demandada en un da es mayor a 36 unidades, se obtiene una utilidad adicional de dos nuevos soles por
unidad demandada de producto. Se tiene siempre ms de 60 productos en su almacn al inicio del
da. Calcule la desviacin estndar de la utilidad por la demanda diaria de productos.

Notas

Captulo 3. Variables aleatorias y distribuciones de probabilidad

96

3.3. Algunos modelos discretos importantes


Experimento de Bernoulli
Un experimento de Bernoulli es un experimento aleatorio con dos nicos resultados posibles denominados xito (E) y fracaso (F).
La probabilidad de xito se denota P(E) = p y la de fracaso P(F) = 1- p = q.
Los siguientes son ejemplos de experimentos Bernoulli:
Lanzar un dado y observar si sale seis
o E:= Sale 6.
Luego, P(E) = 1/6
Revisar un artculo y verificar si es defectuoso en una lnea de produccin que produce el 0,1% de
artculos defectuosos.
o E:= El artculo es defectuoso.
Luego, P(E) = 0,001
Ofrecer una pliza de seguros a un cliente y anotar si la compra. Por experiencia se sabe que el 5% de
los clientes compra la pliza.
o E:= El cliente compra la pliza.
Luego, P(E) = 0,05

Distribucin binomial
Un experimento binomial consiste en una serie de n repeticiones de un experimento Bernoulli, donde n se fija antes de realizar el experimento.
Las pruebas son independientes entre s por lo que el resultado de un intento en particular no
influye en el resultado de cualquier otro.
La probabilidad de xito es constante de una prueba a otra y la denotamos como p.
Se define la variable aleatoria binomial X como el nmero de xitos observados en un experimento
binomial, es decir:
X := Nmero de xitos obtenidos en n repeticiones independientes de un experimento de Bernoulli
con probabilidad de xito p.
La funcin de probabilidad de la variable aleatoria binomial X es:

f x PX x C xn p x 1 pnx ; x 0, 1, 2,, n

Se denota X ~ B (n, p) y se lee X sigue una distribucin binomial con parmetros n y p.


Media

E X np

Varianza

2 V X np1 p

Notas

97

Estadstica EEGGLL

Ejemplo 26
Los siguientes son ejemplos de variables binomiales:
X1 = Nmero de artculos defectuosos en un lote de 500
o n = 500
E:= artculo defectuoso
P(E) = 0,001
X1 ~ B(n = 500, p = 0,001)
X2 = Nmero de clientes que compran una pliza de seguro de vida de los 20 visitados
o n = 20
E:= cliente compra la pliza
P(E) = 0,08
X2 ~ B(n = 20, p = 0,08)
X3 = Nmero de solicitudes de crdito hipotecario aprobadas de 15 evaluadas
o n = 15
E:= crdito aprobado
P(E) = 0,68
X3 ~ B(n = 15, p = 0,68)

Ejemplo 27
En un proceso de fabricacin artesanal de papel reciclado se estima, por experiencia anterior, que el
3% de las hojas de papel producidas presentan defectos en el teido. Las hojas de papel se empacan
en cajas de 50 unidades. Si usted ha comprado una de estas cajas, calcule la probabilidad de que:
a. ninguna de las hojas presente defectos en el teido
b. la caja contenga exactamente tres hojas con defectos en el teido
c. la caja contenga a lo ms dos hojas con defectos en el teido
d. la caja contenga al menos una hoja con defectos en el teido
e. Cuntas hojas con defectos en el teido esperara encontrar en su caja?

Solucin
Definimos la variable aleatoria X: = nmero de hojas con defectos en el teido en la caja de 50 hojas
de papel reciclado
Notemos que X ~ B (n = 50, p = 0,03)
a. La probabilidad de que ninguna de las hojas de la caja presente defectos en el teido es
PX 0 C 050 0,030 0,9750 0,218
b.

La probabilidad de que en la caja haya exactamente tres hojas que presenten defectos en el
teido es PX 3 C350 0,0330,9747 0,126

c. La probabilidad de que en la caja haya a lo ms dos hojas con defectos en el teido es


P X 2

50
x
50 x
x 0,03 0,97

0,811

x 0

d. La probabilidad de que en la caja haya ms de una hoja con defectos en el teido es


P X 1 1 P X 1 1

50
x
50 x
x 0,03 0,97

1 0,555 0,445

x 0

e. En una caja de 50 hojas recicladas se esperara encontrar E(X) = np = 50(0,03) = 1,5 hojas que
presenten defectos en el teido.

Notas

Captulo 3. Variables aleatorias y distribuciones de probabilidad

98

Ejercicio 82
Una encuestadora va a entrevistar 30 personas seleccionadas al azar de un rea rural. Si la probabilidad de que una persona cualquiera de esta zona est indocumentada es de 0,25.
Determine la distribucin de probabilidades del nmero de encuestados indocumentados de los 30
seleccionados.

Calcule la probabilidad de que la encuestadora entreviste cinco o seis personas indocumentadas.

Cuntos indocumentados se espera encontrar en el grupo de 30 seleccionados?

Ejercicio 83
Un mdico estima que el 42% de los pacientes que atiende diariamente requiere algn examen de
laboratorio.
Si en un da en particular el mdico debe atender 18 pacientes, estime la probabilidad de que menos
de siete de ellos requieran algn examen de laboratorio.

Notas

99

Estadstica EEGGLL

Distribucin hipergeomtrica
El experimento hipergeomtrico consiste en extraer al azar y sin sustitucin n elementos de un conjunto de N elementos, r de los cuales son xitos y N - r son fracasos.
Se define la variable aleatoria hipergeomtrica como X nmero de xitos observados en la muestra
de tamao n.
La funcin de probabilidad de la variable X es:
f ( x) P X x

C xr C nNxr
C nN

x max{0, n (N r )},..., min{n, r }

Se denota X ~ H (N, r, n) y se lee que la variable aleatoria X sigue una distribucin hipergeomtrica
con parmetros N, r y n.
r
Media
E X n
N
Varianza

r
r N n
2 V X n 1

N N 1

Ejercicio 84
En un equipo de ftbol hay 18 jugadores de los cuales cuatro consumen sustancias prohibidas. Calcule la probabilidad de detectar a por lo menos uno de los jugadores que usan sustancias prohibidas, si
la directiva del club ha realizado una prueba antidoping a dos jugadores.

Notas

Captulo 3. Variables aleatorias y distribuciones de probabilidad

100

Ejercicios
39. En un taller hay tres tipos de mquinas: A, B y C. De las 20 del tipo A, 4 estn malogradas; de las
15 del tipo B, 2 estn malogradas; y de las 10 del tipo C, 3 estn malogradas. Se escoge al azar y
de manera independiente una mquina de cada tipo. Si la variable X es igual al nmero de mquinas malogradas escogidas, encontrar la media y la desviacin estndar de la variable X.
40. La demanda diaria de cierto artculo es una variable aleatoria cuyos valores son 10, 20 o 30 con
probabilidades de 0,2; 0,5 y 0,3 respectivamente. El costo de cada artculo es 1,80 soles y el precio de venta es dos soles. Los artculos son perecederos de tal manera que si un artculo no se
vende en el da la prdida es total. Hallar el nmero de artculos que se deben ordenar para la
venta de tal manera que la ganancia esperada sea mxima.
41. Air Amrica tiene la poltica de registrar a 24 personas para viajar en un avin que cuenta con
20 asientos para pasajeros. Estudios anteriores revelaron que solo el 80% de los pasajeros que
se registran en un determinado vuelo, se presentan al aeropuerto para viajar en ese vuelo. Calcular la probabilidad de que no haya suficientes asientos disponibles para los pasajeros, en un
vuelo en el que se registraron 24 personas.
42. Con fines de auditora sobre 18 empresas que comercializan gas domstico que funcionan en
nuestro medio (entre las cuales tenemos a las compaas A, B y C) se tomar una muestra aleatoria de 6 de ellas. Determine la probabilidad de los siguientes eventos:
a. Que la muestra solo tenga una de las tres empresas antes citadas.
b. La muestra incluya a las tres empresas mencionadas.
c. Que la muestra incluya al menos una de las tres empresas antes citadas.
43. Una empresa de seguros considera que slo alrededor de 5 % de los asegurados atendidos tiene
una determinada enfermedad.
a. Halle la probabilidad de atender ms de dos casos hasta que se reporte el primer asegurado que sufre de esta enfermedad.
b. Si fueron seleccionados aleatoriamente 100 de los asegurados atendidos, cul sera la
probabilidad de que no ms de 3 de ellos tengan la enfermedad?
44. A un estudiante que tiene de manera independiente una probabilidad p de aprobar cada examen del curso de Fsica 1, se le ofrecen dos alternativas:
I) Dar un nico examen.
II) Dar tres exmenes con la condicin de aprobar por lo menos dos.
Cul es la alternativa ms favorable para el alumno?
45. En un lote de 50 computadoras 12 son defectuosas. Si se eligen al azar y de una sola vez 20 de
ellas, calcule la probabilidad de que de las computadoras elegidas por lo menos dos sean defectuosas.

Notas

101

Estadstica EEGGLL

Variable aleatoria continua


Es una variable cuyo rango es un conjunto infinito no numerable de valores. Por ejemplo: peso, en
kilos, de una persona, tiempo en resolver la primera pregunta del examen parcial de un curso o volumen, en decibeles, en una discoteca a una hora determinada.

Funcin de densidad de una variable aleatoria continua


Se denomina funcin de densidad de probabilidad f(x) de una variable aleatoria continua X a la funcin que satisface lo siguiente:
f x 0 x R X

f x dx 1

RX

El dominio de la funcin f(x) se puede extender a todos los nmeros reales, si se define f(x) = 0 para
todo x IR- RX
Se cumple que:
b

P a X b f x dx

P( X a) f (x) dx 0
a

P(a X b) P(a X b) P(a X b) P(a X b)

Ejercicio 85
Una variable aleatoria continua tiene la siguiente funcin de densidad de probabilidad:
ax
f ( x)
0

Determine el valor de a.

Notas

0 x5
en otro caso

102

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Calcule la probabilidad de P(X < 3)

Calcule la probabilidad de P(1,5< X < 3,5)

Ejemplo 29
Si las ventas diarias (en miles de nuevos soles) en una tienda se modelan con una variable continua X
con funcin de densidad de probabilidad
f (x) c x ; 0 x 10
a. Calcular el valor de c
b. Calcule e interprete P(X 5)
c. Calcule e interprete P(X 8)

Solucin
10

x2
a. Como f(x) es una funcin de densidad cx dx 1 , luego c
2
0

50c 1 c 0,02

10

1 , de donde,
0

b. P( X 5) f (x) dx 0,25 . La probabilidad de que las ventas en un da cualquiera sean menores


0

a 5 000 nuevos soles es de 0,25.


10

c.

P( X 8) f (x) dx 0,36 . La probabilidad de que las ventas en un da cualquiera sean de al me8

nos 8 000 nuevos soles es de 0,36.

Distribucin de probabilidad
La distribucin de probabilidad f(x) de una variable aleatoria X, es la funcin de probabilidad de X, si X
es discreta y la funcin de densidad de probabilidad de X, si X es continua.

Notas

103

Estadstica EEGGLL

Funcin de distribucin acumulada


La funcin de distribucin acumulada de la variable aleatoria X, es una funcin F : RX IR , tal que
F (x) P(X x)
Si X es una variable discreta con funcin de probabilidad f(x)
F (a) P( X a)

f x
x a

Si X es una variable continua con funcin de densidad de probabilidad f(x)

F (a) P( X a)

f x dx

x a

Se cumple que:
P(a < X b) = F(b) F(a)

Valor esperado de una variable aleatoria continua


El valor esperado E(X) de una variable aleatoria continua X con distribucin de probabilidad f(x) se
define por:

E X xf x dx

RX

El valor esperado E(X), tambin, se le conoce como media de la variable X, denotada por X.

Valor esperado de una funcin de variable aleatoria continua


Sea G(X) una funcin de la variable aleatoria X. El valor esperado de G(X) es:

E G X Gx f x dx

RX

Notas

104

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Varianza de una variable aleatoria continua


La varianza V(X) de una variable aleatoria continua X con distribucin de probabilidad f(x) se define
por:

V X E X 2

f x dx

RX

Se cumple V X E X 2 X2 x 2 f x X2

RX

La varianza de la variable aleatoria X, V(X), tambin se denota por X2 .

Desviacin estndar de una variable aleatoria continua


X X2

Propiedades del valor esperado en variables aleatorias


E(b) = b
Si X e Y son variables aleatorias,
a y b son constantes, entonces:
E(aX + bY) = a E(X) + b E(Y)
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y
a1, a2, a3, . . ., an son n constantes, entonces:

E a1 X1 a2 X 2 ... an X n a1E X1 a2E X 2 ... an E X n

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes,
entonces Y2 a2 X2
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y
a1, a2, a3, . . ., an son n constantes, entonces:

V a1 X 1 a2 X 2 ... an X n a12V X 1 a22V X 2 ... an2V X n

Variable estandarizada
La variable Z

Notas

X x

, tiene esperado igual a 0 y varianza igual a 1.

105

Estadstica EEGGLL

3.4. Algunos modelos continuos importantes


Distribucin de probabilidad uniforme
La variable aleatoria X tiene una distribucin uniforme en el intervalo [a, b], si su funcin de densidad
de probabilidad es:
1
f x
; axb
ba

Se denota X ~ U (a, b) y se lee que la variable aleatoria X sigue una distribucin uniforme con parmetros a, b.
La funcin de distribucin acumulada es:
;
xa
0
x a
F ( x)
; axb
b a
;
xb
1

Media E X
Varianza

Notas

ab
2

2 V X

b a2
12

Captulo 3. Variables aleatorias y distribuciones de probabilidad

106

Ejercicio 86
El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede modelarse
por una variable aleatoria uniforme con parmetros 10 y 38. Si la pizza se tarda ms de 30 minutos
en ser entregada, el cliente no la pagar.
Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.

Si la familia pide una pizza diaria durante diez das seguidos, calcule la probabilidad de que por lo
menos una de ellas le salga gratis.

Una familia pidi una pizza hace 25 minutos y an no ha llegado, cul es la probabilidad de que le
salga gratis?

Notas

107

Estadstica EEGGLL

Distribucin normal
La variable aleatoria X tiene una distribucin normal con parmetros y 2 (2 > 0) si su funcin de
densidad de probabilidad es:
2

f x

1 x

x IR

Se denota X ~ N (, 2) y se lee que la variable aleatoria X sigue una distribucin normal con parmetros y 2.
Media

E X

Varianza

2 V X 2

La funcin de densidad de una variable normal tiene forma de campana y es simtrica, por lo que las
medidas de tendencia central coinciden.
El rango de la variable aleatoria normal es el conjunto de los nmeros reales.

Estandarizacin de una variable normal


Sea X ~ N(,2), si Z

entonces la variable aleatoria Z tiene distribucin normal y se cumple Z

= 0 y Z2 = 1. Se dice que la variable Z ~ N(0,1) tiene distribucin normal estndar.


1

La funcin de densidad de Z es

La funcin de distribucin acumulada de Z es

1 2 z2
(z)
e
2

(z)

1 2 z2
e
dz
2

Clculo de probabilidades para una variable normal


Sea X ~ N(, 2), entonces:

b
a X b a
P a X b P

Z
P




b
a



Notas

108

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Ejercicio 87
Si Z ~ N 0, 2 1 , calcular
P(Z < 1,12) =

P(Z > 0,75) =

P(0,04 < Z < 1,27) =

P(Z < -4) =

Tabla de la distribucin normal estndar


rea bajo la curva normal: PZ z
Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891

1,0
1,1
1,2

0,84134
0,86433
0,88493

0,84375
0,86650
0,88686

0,84614
0,86864
0,88877

0,84849
0,87076
0,89065

0,85083
0,87286
0,89251

0,85314
0,87493
0,89435

0,85543
0,87698
0,89617

0,85769
0,87900
0,89796

0,85993
0,88100
0,89973

0,86214
0,88298
0,90147

Notas

Estadstica EEGGLL

109

Hallar c para que P(Z < c) = 0,9750

Hallar c para que P(-c < Z < c) = 0,90

Ejercicio 88
Una compaa ha comprado una prueba para seleccionar personal. Los que han diseado la prueba
saben que las notas siguen una distribucin normal con una media de 75 puntos y una desviacin
estndar de diez puntos. Calcule la probabilidad de que una persona que rinda esta prueba obtenga
una nota superior a 90 puntos.

Ejercicio 89
En una ciudad se estima que la temperatura mxima en un da del mes de enero puede modelarse
con una variable normal con media 30C y desviacin estndar 2C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima
sea menor a 31C.

Notas

110

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima
est entre 28,5 y 32C.

Calcule el nmero esperado de das en el mes de enero en que la temperatura mxima es mayor a
33C. Asuma independencia entre las temperaturas de un da y otro.

Ejemplo 30
Si los puntajes de los postulantes en un examen de ingreso se distribuyen como una variable aleatoria normal con una media de 1 200 y una desviacin estndar de 300 puntos.
a. Encontrar la probabilidad de que el puntaje de un postulante sea de por lo menos 1 300.
b. Si ingresa el 12,3 % de los postulantes con puntajes ms altos, hallar el puntaje mnimo para ingresar.

Solucin
Definamos la variable aleatoria X := puntaje de un postulante.
= 1 200, = 300, 2 = 3002 X ~ N(1 200, 3002)
a. La probabilidad pedida es
X 1 300
PX 1 300 1 PX 1 300 1 P

X 1 200 1 300 1 200


= 1 P

1 PZ 0,33 1 0,33 0,3707


300
300

b. Sea k el puntaje mnimo para ingresar. Se tiene P(X k) 0,123, luego P(X k) 0,877 . Estandak 1 200
X 1 200 k 1 200

rizando tendremos que P


P Z
0,877
300
300
300
k 1 200
De lo cual, se tiene que
0,877
300

En la tabla N(0, 1) observamos que (1,16) 0,8770, luego

Notas

k 1 200
1,16 , de donde k = 1 548.
300

111

Estadstica EEGGLL

Propiedad reproductiva de la normal

Sean X e Y dos variables aleatorias normales e independientes, tales que X ~ N X , X2

Y ~ N Y , Y2 , c1 y c2 constantes reales, entonces se cumple que:

S c1 X c2Y ~ N c1 X c2 Y , c12 X2 c22 Y2

Esta propiedad se puede generalizar para la suma de ms variables normales independientes.

La suma
de una
variable
aleatoria
normal

con otra
variable
aleatoria
normal

es una
variable
aleatoria
normal

- Si Xi ~ N(, 2) (i = 1, 2,, n) son variables aleatorias independientes, entonces la variable


S

X ~ Nn , n
n

i 1

Ejercicio 90
Sean X ~ N(5, 6) e Y ~ N(8, 10) variables aleatorias independientes, calcular la distribucin de las siguientes variables:
S=X+Y

S=XY

S = 4X - 5Y

Notas

Captulo 3. Variables aleatorias y distribuciones de probabilidad

112

Ejercicio 91
El peso de un adulto peruano puede modelarse con una variable aleatoria normal. El peso medio
para los varones es de 72 kilos y de 64 kilos para las mujeres, mientras que sus desviaciones estndar
fueron de 8 kilos y 4 kilos respectivamente.
Si se elige, al azar, a un hombre y una mujer, calcular la probabilidad de que la mujer pese ms que el
hombre.

Si se elige a dos hombres y a dos mujeres, calcular la probabilidad de que la suma total de pesos supere los 260 kilos.

Notas

Estadstica EEGGLL

113

3.5. Teorema central del lmite


Si n variables aleatorias independientes X1, X2, X3,...Xn tienen la misma distribucin de probabilidad
con media y varianza 2, entonces para la variable aleatoria S = X1 + X2 + X3 +...+ Xn se tiene que S
tiende a seguir una distribucin normal a medida que n crece.
Se considera que S sigue aproximadamente una distribucin normal si n 30.
Se tiene que:
Media

E S n

Varianza

V S n 2

Ejercicio 92
La cantidad de mango que exporta una empresa mensualmente es una variable con una media de 25
toneladas y una desviacin estndar de cuatro toneladas. Encontrar la probabilidad de que la cantidad exportada en tres aos sea menor a 920 toneladas. Asuma independencia entre las cantidades
mensuales exportadas.

Ejercicio 93
Los ingresos por factura en un restaurante pueden modelarse con una variable aleatoria de media 84
soles y desviacin estndar 12 soles. Cul es la probabilidad de que los ingresos totales por 100 facturas elegidas al azar sean de ms de 8650 soles?

Notas

114

Captulo 3. Variables aleatorias y distribuciones de probabilidad

Aplicaciones del Teorema Central del Lmite


- Sea X1, X2,, Xn una muestra aleatoria de tamao n de la variable aleatoria X tal que E(Xi) = , V(Xi)
n

= (i = 1, 2,, n). Se define la variable aleatoria media muestral como X


2

X
i 1

; entonces se

2
siempre y cuando n 30.
puede afirmar X N ,
n

- La distribucin de una variable aleatoria X ~ B(n, p) se puede aproximar por una distribucin N(np,
npq) siempre y cuando n 30. La aproximacin es buena si, adems, se verifica que np es mayor a
5 y nq = n(1-p) es mayor a 5.
X
- Sea X ~ B(n, p), Se define la variable aleatoria proporcin muestral como P ; entonces se
n
p1 p
puede afirmar P N p ,
siempre y cuando n 30.
n

Ejercicio 94
El peso de los pasajeros que abordan un mnibus de transporte interprovincial tiene una media de
60 kilogramos y una desviacin estndar de 19 kilogramos. Si se sabe que los 72 asientos de pasajeros estn ocupados, cul es la probabilidad de que el peso medio de los pasajeros supere los 65
kilogramos?

Notas

Estadstica EEGGLL

115

Ejercicio 95
Por un estudio previo se estima que la probabilidad de que un elector vote por la eleccin del candidato oficialista es del 25%. Si 1000 electores son entrevistados uno por uno de manera independiente, encontrar la probabilidad de que por lo menos 275 de ellos voten por el candidato oficialista.

Ejercicio 96
El porcentaje de los clientes de una tienda por departamentos que paga con la tarjeta de crdito de
la tienda es 72%. Si se toma una muestra aleatoria de 250 clientes, calcule la probabilidad de que
menos de 75% de los clientes de la muestra paguen con tarjeta de crdito.

Notas

Captulo 3. Variables aleatorias y distribuciones de probabilidad

116

Ejercicios
46. El peso de los jabones fabricados por una empresa es una variable aleatoria uniforme con media
120 gramos y varianza 12 gramos2. Un jabn se considera defectuoso si su peso es menor a 115
gramos o mayor de 124 gramos. En el control de calidad, los jabones se pesan uno por uno. Calcular la probabilidad de que se necesite pesar ms de 10 jabones hasta encontrar el primer jabn defectuoso.
47. En un supermercado, la demanda diaria, en kilos, de mariscos se distribuye segn el modelo
uniforme en el intervalo [70, 170]. Por cada kilo de mariscos que se vende se gana 8 soles, pero
por cada kilo que no se vende en el da se pierde 5 soles. El supermercado compra los mariscos
todos los das, muy temprano en la maana. Calcular la cantidad de kilos que el supermercado
debe comprar diariamente para maximizar su utilidad esperada.
48. Si una mquina de una imprenta se malogra, sta puede destinarse a uno de dos talleres A o B
para su reparacin. El tiempo de reparacin en el taller A es una variable normal con una media
de 5 horas y una desviacin estndar de 3 horas. El tiempo de reparacin en el taller B es una
variable aleatoria normal con una media de 7 horas y una desviacin estndar de 2 horas.
a) En qu taller es ms probable que la mquina se repare en menos de 8 horas?
b) Calcule la probabilidad de que la reparacin demore ms en el taller B que en el taller A.
49. Una compaa ha comprado una prueba para seleccionar personal. Los que han diseado la
prueba saben que, para cierta poblacin, las notas siguen una distribucin normal con una media de 75 puntos y una desviacin estndar de 10 puntos. Si se va a escoger al primer postulante
que supere los 90 puntos. Calcular el nmero esperado de entrevistas que debe hacer la compaa para escoger un postulante.
50. Los sueldos mensuales, en miles de dlares, de los directivos de una multinacional se modelan
con una distribucin N(10, 1) mientras que los del resto de personal se modelan con una N(4, 2).
Si se extrae una muestra aleatoria de 10 directivos y de 20 empleados no directivos, cul es la
probabilidad de que el sueldo medio mensual de los directivos de la muestra supere al correspondiente de la muestra de empleados no directivos en ms de 5 000 dlares?
51. El porcentaje de determinado compuesto, contenido en un galn de cierto lquido industrial, se
modela con una distribucin normal con una media de 15% y una desviacin estndar de 3%. El
fabricante del lquido obtiene una utilidad neta por galn de $0,15 si el porcentaje del compuesto est entre 9% y 21%, mientras que la utilidad es de $0,10 si el porcentaje vara entre 21% y
27%. Cuando el porcentaje est entre 3% y 9%, el fabricante sufre una prdida de $0,05. Calcular la utilidad esperada por galn.
52. En un estudio de evaluacin de la atencin de un servicio de cafeteras se encontr que los
tiempos, en minutos, que tardan en atender a un cliente las cafeteras A y B se pueden modelar
con las variables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente. Si en cada cafetera son atendidas 20 personas, halle la probabilidad de que el tiempo total
de atencin en la cafetera B sea mayor que el de la cafetera A.
53. En una fbrica, el 25% de los corchos para las botellas de vino se producen en una mquina y la
distribucin de los dimetros de estos corchos se modela normal con una media de 3 cm y una
desviacin estndar de 0,1 cm. El resto de la produccin de corchos para botellas de vino se reaNotas

Estadstica EEGGLL

117

liza en otra mquina y en este caso la distribucin de los dimetros de los corchos se modela
normal con media 3,04 cm y varianza 0,0004 cm 2. Los corchos son considerados aceptables si
sus dimetros estn entre 2,9 y 3,1 cm. Cul es la probabilidad de que un corcho producido en
esta fbrica sea considerado aceptable?
54. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo puede modelarse como una variable normal. Al menor se le da en promedio 20 nuevos soles con una desviacin estndar de 3 nuevos soles, al del medio se le da el doble que al menor y al mayor se le
da el triple que al menor. Calcular la probabilidad de que en cuatro semanas la suma total recibida en propinas por los tres sume ms de 500 nuevos soles.
55. La estatura de las personas de un pas se puede modelar por una variable normal con una media
de 1,68 metros y una desviacin estndar de 8 centmetros. Si se eligen al azar personas para
medir su estatura, calcule el valor esperado y desviacin estndar del nmero de personas elegidas hasta encontrar a las primeros doce personas que midan ms de 1,80.
56. Cuando el cemento y el agua entran en contacto, se inicia una reaccin qumica exotrmica que
determina el endurecimiento de la mezcla. Dentro del proceso de endurecimiento se presenta
un estado en que la mezcla pierde su plasticidad y se vuelve difcil de manejar; tal estado corresponde al fraguado inicial de la mezcla. El tiempo de fraguado inicial de un tipo de cemento
puede modelarse por una variable aleatoria normal con una media de 50 minutos y una desviacin estndar de 10 minutos.
a. Calcule la probabilidad de que el cemento tenga un tiempo de fragua inicial menor a 40
minutos.
b. Calcule el tiempo mximo para estar en el 25% de las mezclas con menor tiempo de fraguado inicial.
c. Si un obrero prepara dos mezclas independientes, calcule la probabilidad de que la diferencia entre los tiempos de fraguado inicial de estas mezclas sea menor a 5 minutos.
57. Los pesos de los posibles usuarios de un ascensor constituyen una poblacin cuya distribucin
es normal con media 70 kg y una desviacin estndar de 10 kg.
a. Qu peso mximo debera poder soportar el ascensor de modo que slo el 1% de las ocasiones el peso de cuatro personas supere ese peso mximo?
b. Si el ascensor admite como peso mximo 585 kg, cuntas personas a la vez pueden entrar
al ascensor de manera que sea 0,0668 la probabilidad de que el peso no supere el mximo
permitido?
58. El ingreso mensual de las socias de una cooperativa se modela por una variable aleatoria con
media de 2800 nuevos soles y desviacin estndar de 500 nuevos soles. Si 80 de las socias han
decidido que destinarn el 3% de sus ingresos para constituir un fondo comn que sirva para
posibles emergencias, calcule la probabilidad de que en un ao el fondo tenga ms de 81 mil
nuevos soles.

Notas

119

Estadstica EEGGLL

Captulo 4. Introduccin a la Estadstica Inferencial


4.1. Muestra aleatoria
Una muestra aleatoria de tamao n de la variable aleatoria X, es un conjunto de n variables aleatorias
X1, X2,, Xn independientes y con la misma distribucin que la variable aleatoria X.
As, dada una variable aleatoria X con E(X) = y V(X) = 2; si X1, X2,, Xn es una muestra aleatoria de
X, entonces E(Xi) = , V(Xi) = 2 (i = 1, 2,, n)

Estadstico
Un estadstico es cualquier funcin de las variables de una muestra aleatoria.
Un estadstico es una variable aleatoria.

Distribucin muestral
Es la distribucin de probabilidades de un estadstico.

4.2. Estimacin de parmetros


Estimador puntual
Un estimador puntual es un estadstico para estimar un parmetro.
Los siguientes son ejemplos de estimadores puntuales.
- La media muestral X es un estimador puntual de la media poblacional .
- La proporcin muestral P es un estimador puntual de la proporcin poblacional p.
n

x x

- La varianza muestral S 2

i 1

es un estimador puntual de la varianza poblacional 2.


n 1
Un estimador puntual de un parmetro es una variable aleatoria y la estimacin puntual es un nmero real.

Ejemplos de estimaciones puntuales


- La velocidad media de viaje en Lima se estima en 16,8 km/h
- Se estima que el 67,1% de los pasajeros de buses opinan que la tarifa es justa
- La desviacin estndar estimada de la antigedad de los mnibus de transporte pblico es de 8,2
aos

Notas

Captulo 4. Introduccin a la Estadstica Inferencial

120

Estimacin de parmetros por intervalo de confianza


Sean x1, x2,, xn los valores experimentales de una muestra aleatoria X1, X2,, Xn de la variable aleatoria X cuya funcin de distribucin depende del parmetro .
Un intervalo de confianza proporciona informacin acerca de qu tan cerca se encuentra la estimacin puntual, calculada con los datos de la muestra, del verdadero valor del parmetro de inters.
El intervalo [A, B] se denomina intervalo de confianza al nivel (1-) para estimar el parmetro ,
Un intervalo de confianza al nivel (1-) x 100% para el parmetro , es un intervalo que con probabilidad (1-) contiene al parmetro.
La forma general de una estimacin por intervalo es:
I(parmetro) = Estimacin puntual del parmetro margen de error
El margen de error determina qu tan precisa es la estimacin realizada, y este valor depende de los
siguientes factores: tamao de la muestra n, nivel de confianza (1-) y variabilidad de la poblacin .

Interpretacin del nivel de confianza


Por ejemplo, para un intervalo de confianza para la media a un nivel de confianza del 95%
- Si se seleccionan repetidamente 1000 muestras de tamao n, y calculamos la media de cada una
de ellas, podremos realizar 1000 estimaciones por intervalo de confianza para la media poblacional .
- Se espera o confa que aproximadamente 950 de los intervalos de confianza hallados contengan
el parmetro y los restantes no lo contengan.
Ejemplo 31
Intervalos a 95% de confianza para generados con once muestras de tamao n.

Fuente: http://www.fisicanet.com.ar/matematica/estadisticas/ap08_inferencia_estadistica.php

Notas

121

Estadstica EEGGLL

Intervalo de confianza para la media poblacional


Sean x1, x2,, xn los valores experimentales de una muestra aleatoria X1, X2,, Xn de la variable aleatoria X, con E(Xi) = , V(Xi) = 2.
Se requiere estimar la media usando esta muestra y con un nivel de confianza de (1-) x 100%
Si la poblacin es normal o el tamao de muestra n es mayor o igual a 30, entonces el intervalo de
confianza para , a un nivel de confianza de (1-) x 100%, es


I ( ) x z
; xz

1
1
n
n

2
2
donde x es la media calculada con los datos de la muestra de tamao n.
Si la poblacin es normal o el tamao de muestra n es mayor o igual a 30, entonces el intervalo de
confianza para , a un nivel de confianza de (1-) x 100%, es

s
s
I ( ) x z
; xz

1
1
n
n

2
2
n

x x

donde x es la media calculada con los datos de la muestra de tamao n y S

i 1

n 1

Ejemplo 32
Para estimar el precio medio de las guas tursticas para visitar el Cusco se elige una muestra aleatoria formada por 34 guas y se determina que la media muestral es de S/.34,90. Por estudios realizados anteriormente se sabe que la desviacin estndar de los precios de estas guas es de S/.4,50.
Construya un intervalo de confianza para el precio medio de las guas tursticas para visitar el Cusco,
al nivel del 95%. Interprete.

Solucin
El intervalo de confianza al 95% est dado por

x z 0 ,975

x z 0 ,975

Reemplazando los datos tenemos:

34,9 1,96

4,5
4,5
34,9 1,96
34
34

33,39 36,41

El precio medio de las guas de turismo para visitar el Cusco, se estima entre S/.33,39 y S/.36,41, con
una confianza del 95%.

Notas

122

Captulo 4. Introduccin a la Estadstica Inferencial

Ejercicio 97
Para estimar el puntaje medio en una prueba de pensamiento crtico se aplica la prueba a una muestra aleatoria de 100 estudiantes de EEGGLL. El manual de instrucciones de la prueba reporta que la
desviacin estndar de los puntajes es 8 puntos. El puntaje medio de los estudiantes evaluados es 68
puntos (sobre un mximo de 80 puntos). Con esta informacin se estima que el puntaje medio en la
prueba de pensamiento crtico para la poblacin de estudiantes de EEGGLL est entre 66,53 y 69,47
con una confianza del 90%.

Tamao de muestra para estimar la media poblacional


La forma general de una estimacin por intervalo es:
I() = Estimacin puntual de la media margen de error
El margen de error determina qu tan precisa es la estimacin realizada, y este valor depende de los
siguientes factores: tamao de la muestra n, nivel de confianza (1-) x 100% y variabilidad de la poblacin .
Para tener una confianza de (1-) x 100% de que el margen de error o error de estimacin, al estimar
la media poblacional con la media muestral, sea de a lo ms e unidades:
P| X | e 1 e z

__
X

De la expresin anterior, se deduce que:


- Si la poblacin es infinita o el muestreo es con reposicin

z
1
n 2
e

- El tamao de muestra n debe ser un nmero entero. Si es necesario el valor obtenido en las expresiones anteriores se aproxima al siguiente entero.
- Si es desconocida, para encontrar el tamao de muestra, se estima por sx.
2

Notas

123

Estadstica EEGGLL

Ejemplo 35
El peso de cierto tipo de motores se modela con una variable con desviacin estndar de 7,04 kilos.
Calcular el tamao de muestra para que con una confianza del 99% el error de estimacin, al estimar
la media poblacional por la media muestral, sea de a lo ms dos kilos.

Solucin
Sea X = peso del motor, en kilos, la desviacin estndar = 7,04 kilos y error mximo e = 2 kilos.

El nivel de confianza 1- es 0,99, luego 1 0,995 z 0 ,995 2,575


2
Luego, el tamao de muestra ser
2

2,575 7,04
n
82,15
2

El tamao de muestra n se aproxima al entero siguiente, luego n = 83.


Basta tomar una muestra de 83 motores para que la estimacin del peso medio, al 99% de confianza,
tenga un error mximo de dos kilos.
Ejercicio 98
Se pide al administrador de un supermercado que estime el tiempo medio que invierte una cajera en
atender a un cliente. Le piden que las estimaciones tengan un nivel de una confianza del 90% y un
margen de error de 15 segundos. Si se sabe que la desviacin estndar poblacional es de 0,5 minutos, cul debe ser el tamao de muestra?

Notas

124

Captulo 4. Introduccin a la Estadstica Inferencial

Intervalos de confianza para la proporcin poblacional


Sean x1, x2,, xn los valores experimentales de una muestra aleatoria X1, X2,, Xn de una poblacin
Bernoulli(p), tales que con E(Xi) = p, V(Xi) = p(1-p) i = 1,..,n..
El intervalo de confianza para la proporcin poblacional p con un nivel de confianza de (1-) x 100%
es

p 1 p
p 1 p
I(p) p z
; pz

1
1
n
n

2
2
donde p es la proporcin muestral de xitos observada en la muestra de tamao n.
Ejemplo 36
En una muestra aleatoria de 100 clientes de una empresa de telefona celular, se encontr que 28 de
ellos presentaron quejas por fallas en el servicio durante el mes de abril. Calcule e interprete un intervalo con una confianza del 90%, para la proporcin de clientes de esta empresa que presentaron
quejas por fallas en el servicio, durante el mes de abril.

Solucin
El nivel de confianza (1- ) es 0,90, luego 1

n 100 ; p

28
0,28 ;
100

0,95 z0 ,95 1,645


p 1 p
(0,28)(1 0,28)

0,045
n
100

Luego, el intervalo de confianza pedido es

I(p) [0,28 1,645 0,045] 0,28 0,074

La proporcin de clientes que presentaron quejas por fallas en el servicio, durante el mes de abril, se
estima entre 0,206 y 0,354, con una confianza del 90%.
Ejercicio 99
A una muestra aleatoria de 650 personas mayores de 18 aos de una ciudad determinada se les pregunt si estaban a favor de un incremento del 4% en el impuesto al precio de la gasolina para obtener fondos necesarios que se destinaran a un programa de asistencia social. Si en la muestra elegida
se encontr que 312 estn a favor del impuesto adicional, calcule e interprete un intervalo de confianza del 90% para la verdadera proporcin de personas a favor del nuevo impuesto.

Notas

125

Estadstica EEGGLL

Ejercicio 100
Se quiere estimar la aprobacin del presidente de la repblica para lo cual se realiz una encuesta
nacional, en la cual se entrevist a 1116 personas, encontrndose que 854 de ellas no estaban de
acuerdo con la gestin presidencial. Calcule un intervalo de confianza al 96% para proporcin poblacional de las personas que estn de acuerdo con la gestin presidencial. Adems, determine el margen de error. Interprete.

Tamao de muestra para estimar una proporcin poblacional


Para tener un nivel de confianza de (1- ) x 100% de que el error de estimacin al estimar la proporcin poblacional por la proporcin muestral, sea de a lo ms e:

P P p e 1 e z

__
P

Si la poblacin es infinita o el muestreo es con reposicin, entonces:


z2
n

p1 p

e2
Como p es desconocida (p es el parmetro que se desea estimar), para encontrar el tamao de muestra, el valor p se reemplaza por una estimacin previa disponible o por 0,5.
El tamao de muestra n debe ser un nmero entero. Si es necesario el valor obtenido en las expresiones anteriores se aproxima al siguiente entero.

Ejercicio 101
Una empresa encuestadora quiere realizar una investigacin sobre intencin de voto a favor de cierto candidato en la segunda vuelta electoral de las prximas elecciones presidenciales. Desea que los
resultados tengan un nivel de confianza del 95% y un margen de error del 3%. Calcule el tamao de
muestra necesario para dicha encuesta.

Notas

Captulo 4. Introduccin a la Estadstica Inferencial

126

Ejercicio 102
Una compaa de investigacin de mercado desea estimar el porcentaje de hogares que tienen Internet en casa, cuntos hogares debe encuestarse si desea tener un nivel de confianza del 99% y un
margen de error del 2%? En una investigacin del ao pasado se determin que el porcentaje de
hogares con Internet era del 24%.

Notas

Estadstica EEGGLL

127

Ejercicios
59. El gerente financiero de una cadena de tiendas desea estimar la proporcin de clientes que
utilizan tarjetas de crdito, qu tamao de muestra es necesario si el intervalo de confianza del
95% para la proporcin debe tener una longitud de a lo sumo 0,10?
60. Un intervalo de confianza para el porcentaje de taxis informales en Lima es [69,6; 80,4]. Si este
intervalo se obtuvo a partir de una muestra de 200 taxis, cul es su nivel de confianza?
61. Una empresa constructora desea estimar, con un nivel de confianza del 95% y un error mximo
de estimacin de 0,025 la proporcin de personas de una determinada ciudad que compraran
una vivienda de dimensiones comprendidas entre 180 y 200 m2. Para ello pretende tomar una
muestra aleatoria entre los potenciales compradores de vivienda, disponiendo para realizar el
muestreo de 10 000 dlares.
a. Si cada elemento muestreado supone un costo de 10 dlares, es suficiente el presupuesto
disponible?
b. Qu nivel de confianza se puede alcanzar con 10 000 dlares de presupuesto, si se pretende mantener el error mximo de estimacin en 0,025?
62. En un restaurante universitario, el peso de la racin de arroz que se pone en un plato del men
se puede modelar como una variable aleatoria normal. Si se pesan las raciones de arroz de 116
mens escogidos al azar y se encuentra una media muestral de 220 gramos y una desviacin estndar muestral de 25 gramos. Estime la media poblacional del peso de la racin de arroz en cada plato con un nivel de confianza del 95%.
63. En la ficha tcnica de la encuesta realizada por Ipsos Apoyo Opinin y Mercado S.A. y publicada
el da 22 de julio de 2007 en el diario El Comercio se afirma que el margen de error fue de 4,4%
con un nivel de confianza del 95%. Qu tamao mnimo de muestra se debe usar para cumplir
con dichas especificaciones?
64. En una investigacin realizada en el Valle de los ros Apurmac y Ene (VRAE) se tom una muestra aleatoria de 350 viviendas y se estim en 80% 4,8% el porcentaje de viviendas que no tienen agua potable. Encontrar el nivel de confianza de la estimacin.
65. Para estimar el porcentaje de colegos rurales que tienen por lo menos una computadora, una
universidad realiz una encuesta en 200 colegios rurales. Si en el informe de esta encuesta se
indic que el porcentaje de colegios rurales con por lo menos una computadora se estima entre
33,2% y 46,8%, determine con qu nivel de confianza se realiz la estimacin.

Notas

128

Tablas Estadsticas

Tablas estadsticas
Tabla de la distribucin normal estndar rea bajo la curva PZ z
Z
-3,9
-3,8
-3,7
-3,6
-3,5
-3,4
-3,3
-3,2
-3,1
-3,0

-0,09
0,000033
0,000050
0,000075
0,000112
0,000165
0,000242
0,000349
0,000501
0,000711
0,001001

-0,08
0,000034
0,000052
0,000078
0,000117
0,000172
0,000251
0,000362
0,000519
0,000736
0,001035

-0,07
0,000036
0,000054
0,000082
0,000121
0,000178
0,000260
0,000376
0,000538
0,000762
0,001070

-0,06
0,000037
0,000057
0,000085
0,000126
0,000185
0,000270
0,000390
0,000557
0,000789
0,001107

-0,05
0,000039
0,000059
0,000088
0,000131
0,000193
0,000280
0,000404
0,000577
0,000816
0,001144

-0,04
0,000041
0,000062
0,000092
0,000136
0,000200
0,000291
0,000419
0,000598
0,000845
0,001183

-0,03
0,000042
0,000064
0,000096
0,000142
0,000208
0,000302
0,000434
0,000619
0,000874
0,001223

-0,02
0,000044
0,000067
0,000100
0,000147
0,000216
0,000313
0,000450
0,000641
0,000904
0,001264

-0,01
0,000046
0,000069
0,000104
0,000153
0,000224
0,000325
0,000466
0,000664
0,000935
0,001306

-0,00
0,000048
0,000072
0,000108
0,000159
0,000233
0,000337
0,000483
0,000687
0,000968
0,001350

-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0

0,00139
0,00193
0,00264
0,00357
0,00480
0,00639
0,00842
0,01101
0,01426
0,01831

0,00144
0,00199
0,00272
0,00368
0,00494
0,00657
0,00866
0,01130
0,01463
0,01876

0,00149
0,00205
0,00280
0,00379
0,00508
0,00676
0,00889
0,01160
0,01500
0,01923

0,00154
0,00212
0,00289
0,00391
0,00523
0,00695
0,00914
0,01191
0,01539
0,01970

0,00159
0,00219
0,00298
0,00402
0,00539
0,00714
0,00939
0,01222
0,01578
0,02018

0,00164
0,00226
0,00307
0,00415
0,00554
0,00734
0,00964
0,01255
0,01618
0,02068

0,00169
0,00233
0,00317
0,00427
0,00570
0,00755
0,00990
0,01287
0,01659
0,02118

0,00175
0,00240
0,00326
0,00440
0,00587
0,00776
0,01017
0,01321
0,01700
0,02169

0,00181
0,00248
0,00336
0,00453
0,00604
0,00798
0,01044
0,01355
0,01743
0,02222

0,00187
0,00256
0,00347
0,00466
0,00621
0,00820
0,01072
0,01390
0,01786
0,02275

-1,9
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0

0,02330
0,02938
0,03673
0,04551
0,05592
0,06811
0,08226
0,09853
0,11702
0,13786

0,02385
0,03005
0,03754
0,04648
0,05705
0,06944
0,08379
0,10027
0,11900
0,14007

0,02442
0,03074
0,03836
0,04746
0,05821
0,07078
0,08534
0,10204
0,12100
0,14231

0,02500
0,03144
0,03920
0,04846
0,05938
0,07215
0,08691
0,10383
0,12302
0,14457

0,02559
0,03216
0,04006
0,04947
0,06057
0,07353
0,08851
0,10565
0,12507
0,14686

0,02619
0,03288
0,04093
0,05050
0,06178
0,07493
0,09012
0,10749
0,12714
0,14917

0,02680
0,03362
0,04182
0,05155
0,06301
0,07636
0,09176
0,10935
0,12924
0,15151

0,02743
0,03438
0,04272
0,05262
0,06426
0,07780
0,09342
0,11123
0,13136
0,15386

0,02807
0,03515
0,04363
0,05370
0,06552
0,07927
0,09510
0,11314
0,13350
0,15625

0,02872
0,03593
0,04457
0,05480
0,06681
0,08076
0,09680
0,11507
0,13567
0,15866

-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
-0,0

0,16109
0,18673
0,21476
0,24510
0,27760
0,31207
0,34827
0,38591
0,42465
0,46414

0,16354
0,18943
0,21770
0,24825
0,28096
0,31561
0,35197
0,38974
0,42858
0,46812

0,16602
0,19215
0,22065
0,25143
0,28434
0,31918
0,35569
0,39358
0,43251
0,47210

0,16853
0,19489
0,22363
0,25463
0,28774
0,32276
0,35942
0,39743
0,43644
0,47608

0,17106
0,19766
0,22663
0,25785
0,29116
0,32636
0,36317
0,40129
0,44038
0,48006

0,17361
0,20045
0,22965
0,26109
0,29460
0,32997
0,36693
0,40517
0,44433
0,48405

0,17619
0,20327
0,23270
0,26435
0,29806
0,33360
0,37070
0,40905
0,44828
0,48803

0,17879
0,20611
0,23576
0,26763
0,30153
0,33724
0,37448
0,41294
0,45224
0,49202

0,18141
0,20897
0,23885
0,27093
0,30503
0,34090
0,37828
0,41683
0,45620
0,49601

0,18406
0,21186
0,24196
0,27425
0,30854
0,34458
0,38209
0,42074
0,46017
0,50000

129

Estadstica EEGGLL

Tabla de la distribucin normal estndar


rea bajo la curva: PZ z

Z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891

1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9

0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128

0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193

0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257

0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320

0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381

0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441

0,85543
0,87698
0,89617
0,91309
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500

0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558

0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615

0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670

2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9

0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813

0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819

0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825

0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831

0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836

0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841

0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846

0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851

0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856

0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861

3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952

0,998694
0,999065
0,999336
0,999534
0,999675
0,999776
0,999847
0,999896
0,999931
0,999954

0,998736
0,999096
0,999359
0,999550
0,999687
0,999784
0,999853
0,999900
0,999933
0,999956

0,998777
0,999126
0,999381
0,999566
0,999698
0,999792
0,999858
0,999904
0,999936
0,999958

0,998817
0,999155
0,999402
0,999581
0,999709
0,999800
0,999864
0,999908
0,999938
0,999959

0,998856
0,999184
0,999423
0,999596
0,999720
0,999807
0,999869
0,999912
0,999941
0,999961

0,998893
0,999211
0,999443
0,999610
0,999730
0,999815
0,999874
0,999915
0,999943
0,999963

0,998930
0,999238
0,999462
0,999624
0,999740
0,999822
0,999879
0,999918
0,999946
0,999964

0,998965
0,999264
0,999481
0,999638
0,999749
0,999828
0,999883
0,999922
0,999948
0,999966

0,998999
0,999289
0,999499
0,999651
0,999758
0,999835
0,999888
0,999925
0,999950
0,999967

Tablas Estadsticas

130

ndice alfabtico
Coeficiente de correlacin, 60
Coeficiente de variacin, 45
Cuartil, 29
Desviacin estndar, 42
Distribucin
binomial, 97
de frecuencias, 12, 16, 17
de probabilidad, 92
hipergeomtrica, 100
normal, 108
uniforme continua, 106
Escalas de medicin
intervalo, 11
nominal, 10
ordinal, 10
razn, 11
Espacio muestral, 67
Estadstica
Definicin, 3
Estadstico, 7, 119
Evento, 68
Eventos
independientes, 85
Experimento aleatorio, 67
Experimento de Bernoulli, 97
Funcin
de densidad, 102
Grfico
de barras, 15

de barras apiladas, 25
de barras apiladas al 100%, 26
Diagrama de cajas, 47
Histograma, 20
Ojiva, 21
Polgono de frecuencias, 21
Intervalo de confianza
media poblacional, 121
proporcin poblacional, 124
Media, 38
Mediana, 36
Moda, 34
Muestra, 4
Parmetro, 7
Percentiles, 29
Poblacin, 4
Propiedad reproductiva de la normal, 112
Puntuacin estandarizada Z, 49
Rango, 46
Rango intercuartil, 46
Teorema
de Bayes, 83
Valor esperado
de una funcin de una variable aleatoria, 95, 104
Variable, 9
aleatoria continua, 102
aleatoria discreta, 92
Varianza, 42
de una variable aleatoria, 95, 105

You might also like