You are on page 1of 160

MANUAL DE

ESTADSTICA GENERAL

Jorge Crdova Egocheaga

Manual de
Estadstica General
Jorge Crdova Egocheaga
1ra Edicin: Marzo del 2003

SOBRE EL AUTOR
Estudios Doctorales en Ciencias Administrativas (UNFV), Matre
en Administration des Affaires (MBA-UQAM, Canad), Magster
en Administracin (ESAN), Magster Scientiae (MSc) en
Economa (UNA), Especialista en Formulacin y Evaluacin de
Proyectos de Inversin (UNMSM), Profesor de Estadstica en la
Maestra en Administracin de la Universidad de San Martn de
Porres, Docente de Estadstica y de Informtica Aplicada en el
rea de Salud en la Escuela Universitaria de Post Grado de la
Universidad Nacional Federico Villarreal, Profesor Principal y Jefe
de la Divisin de Evaluacin y Estadsticas de la Escuela de
Sanidad Naval de la Marina de Guerra del Per, Profesor de
Estadstica y Mtodos Cuantitativos para los Negocios en el MBA
de la Universidad San Ignacio de Loyola, Consultor y Expositor
Independiente. Director Ejecutivo del Centro de Capacitacin y
Asesora de Negocios, CECAN.

Los derechos intelectuales de esta obra son de propiedad exclusiva de


Jorge Crdova Egocheaga.
Toda reproduccin total o parcial del contenido de esta obra requerir la
autorizacin del propietario de los derechos intelectuales.

CAPTULO

INTRODUCCIN
El pensamiento estadstico algn da ser tan necesario para la
ciudadana como la capacidad de leer y escribir...
H.G.Wells hace mas de 100 aos

OBJETIVOS
Al finalizar el Captulo 1, el participante ser capaz de:
1.
2.
3.
4.
5.
6.
7.
8.

Comprender los reas de aplicacin de la


Estadstica dentro de las Gestin de la Salud.
Comprender el pensamiento estadstico
Identificar las etapas de la investigacin cientfica
Definir las etapas del trabajo estadstico.
Identificar los diversos tipos de datos.
Diferenciar poblacin y muestra.
Distinguir parmetro y estimador.
Diferenciar estadstica descriptiva y estadstica
inferencial.

Manual de Estadstica General

1.1 SITUACIONES
ESTADSTICA

EN

LAS

QUE

SE

UTILIZA

LA

Ejemplos
Varias veces durante el da una enfermera toma la
temperatura a los pacientes en el Servicio de Emergencia de
un Centro Hospitalario local.
Un investigador mdico examina los efectos de un agente
cancergeno en las ratas. Tres semanas despus de
inyectado el agente en una rata, el investigador realiza una
intervencin quirrgica para extraer y pesar los tumores.
El Director de un Hospital registra el tiempo de recuperacin
por tratamiento.
El Director de un Hospital cuenta el nmero de camas a fin
de medir la tasa de ocupabilidad.
Un investigador mdico est interesado en conocer la
relacin entre el sexo y el riesgo de infarto.
El Jefe de Almacn de una Clnica revisa unos cuantos
frascos del lote de vacunas que acaba de llegar, y verifica su
fecha de expiracin.
El mdico responsable del Laboratorio Clnico del Hospital,
extrae una muestra de sangre a fin de determinar el nivel de
colesterol del paciente.
1.2 EL PENSAMIENTO ESTADSTICO
El profesional de la gestin de la salud debe de preocuparse
permanentemente en registrar informacin sobre las
caractersticas que le permitan conocer los factores que
inciden en la variabilidad del servicio y as estar en
condiciones de implementar acciones dirigidas a mejorar la
calidad del servicio que ofrece.
Debe medir

Las quejas en el Servicio de Emergencia,


Las devoluciones por da en una farmacia,

Jorge Crdova Egocheaga

Las demoras en la atencin en una clnica o


Las placas radiolgicas reprocesadas en un
hospital, y compararlos con los indicadores de gestin o
estndares internacionales, y as determinar la calidad
del servicio.

La implementacin del pensamiento estadstico tiene tres


fases:
Identificar los factores de variabilidad.
Conocer (o medir) la variabilidad.
Manejar (o controlar) la variabilidad

1.3 LA INVESTIGACIN CIENTFICA


1.3.1 Qu es la investigacin cientfica?
Es la bsqueda sistematizada y objetiva de nuevos
conocimientos. Investigar es un proceso de buscar,
indagar o pesquisar.
El mtodo cientfico, comprende la realizar a
investigacin en forma sistematizada y objetiva,
organizada y coherente.
1.3.2 Etapas de la investigacin cientfica
A. Planificacin:
Elaboracin del proyecto. Abarca
una descripcin detallada y fundamentada de cada
una de las actividades a desarrollarse en la
investigacin.
B. Ejecucin: Es la etapa en la cual se lleva a cabo al
investigacin. Recoleccin de datos, anlisis e
interpretacin.

Manual de Estadstica General

C. Informe: Escrito donde se presentan los hallazgos


encontrados.
1.4 ESTRUCTURA DE UN PROYECTO DE INVESTIGACIN
1.4.1 Definicin del problema
A. Ttulo
B. Antecedentes: Se refiere al nivel actual de
conocimientos. La investigacin que se planea
realizar debe contribuir a elevar el conocimiento que
la humanidad tenga de este tema. Si no se conocen
los antecedentes, es probable que repita una
investigacin
anterior.
Existen
antecedentes
tericos (marco terico) y antecedentes empricos
(resultados).
C. Objetivos: Enunciado de los logros alcanzables y
evaluables en el estudio.
a. Cmo voy a identificar las variables?
b. Cmo voy a medir esas variables?
c. Qu tcnica estadstica se utilizar?
D. Hiptesis: Enunciado de la relacin de la relacin
entre 2 o ms variables.
Recomendacin: al escribir el ttulo, el problema,
objetivos y las hiptesis, se debe referir a lo mismo.
1.4.2 Tipo de estudio
Casos y controles

Jorge Crdova Egocheaga

1.4.3 Definicin del alcance del estudio


Qu mbito abarca el estudio?. Definir el alcance
fsico, temporal, social, etc.
1.4.4 Diseo estadstico de la muestra
A) Tamao de la muestra
B) Procedimiento de seleccin
1.4.5 Definicin de variables y escalas de medicin
Depende de los objetivos y las hiptesis
1.4.6 Recoleccin de datos
Fuentes primarias y secundarias. Disear cuestionario
y fichas de observacin.
1.4.7 Procesamiento de la informacin
Definir con anticipacin los anlisis estadsticos que se
van a realizar y entre que variables: regresin,
hiptesis, entre otros.
1.4.8 Recursos y presupuesto de investigacin
Qu recursos personales y de materiales se requieren.
Cuales son los costos para llevar a cabo la
investigacin. Cmo se desembolsar (mes a mes)
estos gastos. Cmo se financiar.
1.4.9 Cronograma
Con ayuda de un Diagrama Gantt o un PERT, para
visualizar las diferentes etapas.
1.4.10 Referencias bibliogrficas
7

Manual de Estadstica General

1.5 PARTES DE UN INFORME FINAL DE INVESTIGACIN


1.5.1 Introduccin: Ttulo, antecedentes, objetivos,
hiptesis
1.5.2 Materiales y mtodos
1.5.3 Resultados analticos: fundamentar diferencias
evidenciadas
1.5.4 Discusin de resultados
1.5.5 Conclusiones: en relacin con los objetivos de la
investigacin.
1.6 QU ES ESTADSTICA?
Es una ciencia que comprende diversas tcnicas para :
RECOLECTAR

ORGANIZAR

ANALIZAR

INTERPRETAR

DATOS
8

Jorge Crdova Egocheaga

Cundo se RECOLECTAN datos ?


Cuando se registran caractersticas (medicin, observacin,
conteo).
Cundo se ANALIZAN datos ?
Cuando se ordenan para una mejor comprensin y facilitar
sus anlisis. (tablas, grficos y figuras)
Por ejemplo
Tabla de Distribucin
Edad

N Pacientes

30 - 34
35 - 39
40 - 44
45 - 49

6
12
8
2

Diagrama Circular

12
10
8
6

Diagrama de
Barras

4
2
0
30-34

35-39

40-44

45-49

Manual de Estadstica General

Cundo se analizan datos?


Cuando se calculan promedios, medidas de variabilidad y
medidas de la forma de la distribucin.Cuando se establecen
relaciones entre ellas (regresin y correlacin).
Cundo se INTERPRETAN datos ?
Cuando se le otorga un sentido prctico a los resultados
obtenidos en el anlisis.
1.7 QU SON DATOS?
Son los registros de una caracterstica.
Ejemplo

Unidad de
medida
aos
27
Edad del paciente
Kg.
3,750
Peso del recin nacido
das
5
Tiempo permanencia
C
37,5
Temperatura corporal
--Enfermera
Profesin

Caractersticas

Datos

Si un DATO es til para tomar decisiones se convierte en


INFORMACIN.
Los datos ayudan a los responsables de tomar decisiones a
hacer suposiciones coherentes acerca de las CAUSAS y, por
tanto, de los EFECTOS probables de ciertas caractersticas
en situaciones dadas.
Por qu necesitamos recolectar datos?
Proporcionan la evidencia imprescindible en un estudio de
investigacin.

10

Jorge Crdova Egocheaga

Permiten medir el desempeo en el proceso de produccin


de un bien o servicio.
Ayudan a la formulacin de cursos alternativos de accin en
un proceso de toma de decisiones.
Satisfacen nuestra curiosidad innata.
1.8 QU TIPOS DE DATOS EXISTEN?
Constante
Si el registro de la caracterstica toma un slo valor en todas
las unidades elementales. Son muchos datos, pero iguales.
Ejemplo:

Sexo de las pacientes en el Servicio de Ginecologa


Especialidad de los integrantes del Colegio Mdico del
Per

Las constantes no son inters en Estadstica, puesto que ella


se ocupa del estudio de la variabilidad de los datos.
Variable
Si el registro de la caracterstica toma diversos valores en las
unidades elementales.
Ejemplo:
Edad, sexo y peso de los pacientes de una Clnica
Una misma caracterstica puede generar constantes
variables, depende del marco muestral.
Los datos variables pueden ser :

11

Manual de Estadstica General

1.

Cualitativos : Registro de un atributo. Provienen de una


observacin. Las operaciones posibles son el clculo de
la tasa porcentual y de proporciones.
Pueden ser
categoras.

dicotmicas

(slo

pueden

tener

Ejemplo :Estado de salud: sano o enfermo. Sexo de


pacientes : masculino y femenino

80% son varones (tasa porcentual).


8 de cada 10 pacientes son varones (proporcin)

O politmicas (si tienen ms de 2 categoras)


Ejemplo : Estado civil del paciente: soltero, casado,
viudo, divorciado.
2.

Cuantitativos : Registro de una caracterstica a travs de


un conteo o una medicin. Las operaciones posibles son
los promedios y las medidas de dispersin, entre otras.
Las variables cuantitativas pueden ser continuas o
discretas.

DISCRETA o DISCONTINUA: Cuando la variable slo


puede tomar determinados valores dentro de una escala
de valores. Proviene de un conteo.
Ejemplo: Nmero de consultas en un da.
Nmero de hijos

CONTINUA : Cuando la variable puede tomar cualquier


valor, dentro de una escala de valores. Provienen de
una medicin.
Ejemplo: Tiempo de duracin de una consulta.
Peso de la gestante

12

Jorge Crdova Egocheaga

DATOS

CONSTANTES

VARIABLES

CUALITATIVAS

CUANTITATIVAS

DISCRETAS

CONTINUAS

1.9 QU SE PUEDE HACER CON LOS DATOS?


Identificar caractersticas de inters
para la gestin.

Organizarlos en tablas, grficos y figuras


Calcular promedios (media, mediana,
moda y percentiles) .
Calcular su dispersin (varianza,
desviacin estndar ) y forma de la curva.

Recoleccin de
datos

Determinar una ecuacin que represente


la relacin entre ellos (regresin)
Determinar el grado de asociacin entre
ellos (correlacin).

Utilizar datos para


mejorar la calidad

Analizarlos dentro de un horizonte


temporal (series cronolgicas)

13

Manual de Estadstica General

1.10 POBLACIN Y MUESTRA


Marco Poblacional
Conjunto de todas las unidades elementales (personas,
procesos o cosas) al que se circunscribe el estudio
estadstico.
Ejemplos :

Los mdicos cirujanos del mundo.


Los trabajadores asegurados en una EPS
El proceso de triaje en los Centros de Salud del Estado.
Las historias clnicas de un hospital.

MARCO POBLACIONAL(1200 pacientes de un hospital)


Poblacin Estadstica
Registro de una caracterstica EN TODOS los elementos del
marco poblacional.
Tiene tantos datos como elementos tenga el marco
poblacional.
Habrn tantas poblaciones como caractersticas se deseen
registrar en un determinado marco poblacional.

14

Jorge Crdova Egocheaga

MARCO POBLACIONAL
(1200 pacientes de un hospital)

Caractersticas
de inters
Edad

Poblacin

Registro
de la
caracteP1
rstica (1200 datos)

Peso

Temperatura
corporal

Estado
Civil

Poblacin

Poblacin

P2

P3

(1200 datos)

...

Pn

Marco Muestral
Subconjunto del marco poblacional.
Comprende los elementos o estratos del marco poblacional
(es representativo).
En contraste con el marco poblacional es ms conveniente
porque se obtienen los datos en menor tiempo y reduciendo
los costos.
Ejemplo :
75 pacientes de un hospital.

15

Manual de Estadstica General

Marco Poblacional

Marco Muestral

Tcnicas
de muestreo

(75 pacientes de un hospital)

(1200 pacientes de un hospital)


Caracterstica
Edad

Peso

Registro
de la POBLACIN
caracterstica.
P1

Temp. Corpor.

Estado civil

POBLACIN

P2

POBLACIN

P3

POBLACIN

...

Pn

Muestra
Registro de una caracterstica en todos los elementos del
marco muestral.
Tiene tantos datos como elementos el marco muestral.
Habrn tantas muestras como caractersticas se deseen
registrar en un marco muestral.
Las muestras no extraen de la poblacin, sino del marco
muestral

16

Jorge Crdova Egocheaga

MARCO POBLACIONAL
(1200 pacientes de un hospital)

MARCO MUESTRAL

Tcnicas
de muestreo

(75 pacientes de un hospital)

Caracterstica
Edad

Peso

Estado
civil

Temp.
corporal

Edad

Peso

MUESTRA

MUESTRA

m1

m2

Estado
civil

MUESTRA

m3

MUESTRA

mn

75 datos

Registro
de la POBLACIN
caracterstica.

POBLACIN

P1

P2

POBLACIN

P3

POBLACIN

...

Pn

1.11 PARMETRO Y ESTIMADOR


Valor representativo de una poblacin. Se simboliza por
letras griegas. Slo hay un parmetro en cada poblacin.
: Media poblacional (mu)

V arianza poblacional (sigma cuadrado)

: Desviacin estndar poblacional (sigma)


: Proporcin poblacional (pi)
: Coeficiente de correlacin poblacional (rho)

Estimador
Valor representativo de una muestra. Se llama tambin
estadgrafo o estadstico. Se simboliza por letras latinas.
Existen tantos estimadores como muestras se extraigan de
una poblacin.

17

Manual de Estadstica General

Media muestral.

Varianza muestra.

s
p

Desviacin estndar muestral.

Coeficiente de correlacin muestral

Proporcin muestral

n1

n2

POBLACIN

x1
x2

n3

x3

.
.

.
.

nm

xm

PARMETRO
DIFERENTES MUESTRAS GENERAN DIFERENTES
VALORES DEL ESTIMADOR

1.12 ESTADSTICA DESCRIPTIVA E INFERENCIAL


Estadstica Descriptiva
Tcnicas que permiten describir un conjunto de datos. El
anlisis se limita a esos datos (sean muestrales o
poblacionales). Tiene como objetivo presentar los datos
obtenidos en forma resumida, clara y comprensible.

18

Jorge Crdova Egocheaga

Estadstica Inferencial
Tcnicas que permiten estimar un parmetro a partir de
datos muestrales.

POBLACIN

Muestra

Estimador

Parmetro
Estadstica
Descriptiva
d
as
nic
c

POBLACIN

Parmetro

: -

MUESTRA

ue
eM

Estimador :

o
stre

Estadstica
Inferencial

= Error de muestreo

Ejemplos sobre muestra y estimador


Suponga que estamos interesados en conocer la duracin
de la evaluacin en el Servicio de Psiquiatra de las Clnicas
de Lima.
El INPE esta interesado en la relacin existente entre la
criminalidad y los hogares destruidos. Un psiclogo mide la
caracterstica en de 50 procesados.
Supngase que el equipo de investigacin, desea determinar
la proporcin de fumadores en la ciudad de Lima para

19

Manual de Estadstica General

determinar los factores de riesgo e incidencia de cncer


pulmonar.
1.13 EJERCICIO APLICATIVO
El Director de Personal de la Clnica Santa Luca desea
estimar la tardanza mensual promedio del personal que
labora en esta clnica. Con este fin elige al azar la Tarjeta de
Control de Asistencia del ltimo mes de 10 trabajadores. En
uno de las tarjetas seleccionadas se registr 140 minutos de
tardanza.
En esta situacin, identifique:
La caracterstica

: Tiempo de tardanza mensual

La unidad elemental : Un trabajador de la clnica

(o unidad de anlisis)

El marco poblacional: Todo el personal que labora en


esa clnica
La poblacin
: Registro de tiempo de tardanza
mensual de todo el personal que
labora en esta clnica
El marco muestral

: Diez trabajadores

La muestra

: Registro del tiempo de tardanza


de cada uno de los trabajadores
seleccionado

Tipo de dato

: Variable cuantitativa continua

Un dato registrado

: 140

La unidad de medida: minutos

20

El estimador

: El tiempo medio de tardanza de


los 10 trabajadores x

El parmetro

: El tiempo medio de tardanza de todos


los trabajadores de la clnica ()

Jorge Crdova Egocheaga

Ejercicio 1
El Director de un Hospital sabe que en lo que va del ao, fueron
dados de alta 1000 pacientes hospitaliza-dos y desea conocer el
tiempo medio de permanencia en el hospital. Para ello selecciona
al azar la historia clnica de 100 pacientes. Una de las historias
permiti conocer que cierto paciente haba permanecido 6 das
hospitalizado. En esta situacin identifique los siguientes
trminos (no se pide la definicin):
Caracterstica. Unidad elemental. Marco poblacional Poblacin.
Marco muestral. Tipo de muestreo. Un dato. Unidad de medida.
Un estimador. Un parmetro

21

Manual de Estadstica General

22

CAPTULO

2
1

RECOLECCIN
DE DATOS
Los datos no se recopilan como
un fin en s mismos, sino como
un medio para describir los hechos
que estn tras los datos

OBJETIVOS
1.
2.
3.
4.
5.
6.

Recopilar datos.
Identificar la escala adecuada para cada
caracterstica a recopilar.
Redondear datos cuantitativos.
Diferenciar mtodos y tcnicas de recoleccin de
datos.
Elaborar una encuesta
Elaborar una hojas de registro.

Manual de Estadstica General

2.1 CMO SE RECOPILAN DATOS?


Las buenas decisiones se basan en un adecuado registro
de datos, para lo cual se debe:
A.

ESTABLECER OBJETIVOS CLAROS


En control de la calidad, los objetivos son:
Control del proceso de produccin
Anlisis de lo que no se ajusta a las normas o
estndares.
Inspeccin o auditoria.
Permite determinar qu tipo de datos se requiere.

B. DETERMINAR EL TIPO DE DATO


Datos para el control: se toman peridicamente para
conocer la variacin diaria dentro de un proceso; es
decir, para verificar su estado de control (estabilidad).
Ejemplo: Nmero de pacientes diarios en consultorios
externos por especialidad.
Datos para el anlisis: se registran para conocer
situacin actual de nuestro proceso.

la

Ejemplo: la tasa de prescripciones que no estn


disponibles en la farmacia del hospital.
Dato para la inspeccin: se recopilan al recibir o
entregar un material. Son datos que sirven para verificar
si el producto cumple con las especificaciones.
Ejemplo: fecha de expiracin de un lote
medicamentos, antes de su ingreso a almacn.

24

de

Jorge Crdova Egocheaga

C.

CONSIDERAR
REGISTROS

LA

CONFIABILIDAD

DE

LOS

Tener en cuenta la adecuada calibracin de los


instrumentos de medicin y la variabilidad en
inspecciones visuales.
D.

SELECCIONAR
FORMAS
RECOLECTAR DATOS.

APROPIADAS

DE

I.

Se debe registrar adecuadamente el origen de


datos (el da, la hora, quines fueron los
responsables, qu lote se uso, entre otros).

II.

Los datos deben registrarse de manera que facilite


su utilizacin (hojas de registro).

2.2 ESCALAS DE MEDICIN


ESCALA NOMINAL:
Los valores son nominativos, sirven para designar. Slo se
puede realizar un conteo (frecuencias). No es factible las
operaciones aritmticas. Se analizan a travs de la
comparacin: igualdad y no igualdad ( = y ).
Ejemplo
Sexo del paciente
Grupo sanguneo
Servicio mdico

1: Masculino 2: Femenino
A B AB
O
1: Emergencia
2: Ginecologa
3: Traumatologa 4: Pediatra

ESCALA ORDINAL:
Los valores representan un orden. No son cuantitativos, slo
simbolizan una posicin. Se analizan a travs de la
desigualdad :mayor que o menor que (> y <).
25

Manual de Estadstica General

Ejemplo:
Calificacin
Lugar (orden)
Dolor

:
:
:

A,B,C,D
A>B
1 , 2 , 3
1 > 2
leve, moderado, intenso

ESCALA DE INTERVALOS:
Se utilizan nmeros cardinales. El cero es relativo o
diferencial, es decir no indica ausencia de la propiedad. Se
pueden realizar operaciones aritmticas.(+ y -). Es una
escala creada por el hombre.
Ejemplo:
Hora
Temperatura ambiental
El ao en que vivimos

00:00
0 C
2003

ESCALA DE RAZN:
Se utilizan nmeros cardinales. Tienen unidad de medida
(cms, pulgadas). El cero es absoluto, indica ausencia de la
propiedad. Se pueden realizar operaciones aritmticas
(+,-,x ,),
Ejemplo:
Pacientes no atendidos hoy
:
N de hijos en edad de vacunacin :
Procesos deficientes
:

0
0
0

2.3 REDONDEO DE DATOS


Durante el anlisis, muchas veces se divide un nmero por
otro obtenindose en algunas ocasiones, un nmero infinito
de decimales.

26

Jorge Crdova Egocheaga

Con el objeto de hacer ms operativo el manejo de estos


datos se redondean. Para cortar o redondear, se siguen las
siguientes reglas.
1ra REGLA:
Para la respuesta final, debemos redondear hasta dos
lugares ms de lo que haba en los datos originales. No se
debe redondear en los pasos intermedios.
Ejemplo :

datos originales : enteros


resultado final : 2 decimales.

2 REGLA:
Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra
que sigue es menor a 5, el nmero no vara.
Ejemplo: Redondeo a 2 decimales
6,176 .
6,18
4,123 .
4,12
3 REGLA:
Si la cifra que sigue es 5 y el nmero
anterior es par no
se modifica. Pero si el nmero es impar, aumenta 1.
Ejemplo: Redondeo a 2 decimales
6,545 .
6,54
1,975 .
1,98

27

Manual de Estadstica General

2.4 FUENTES DE DATOS


A) FUENTES SECUNDARIAS
Datos recolectados anteriormente para alcanzar otros
objetivos. Constituye la primera fuente que se debe
analizar. La tcnica ms utilizada son las fichas.
Ejemplo:
Datos publicados (en papel o en forma electrnica) en
revistas especializadas, tesis, censos y en las hojas de
registro anteriores.
La calidad de los datos debe ser comprobada:
De donde provienen los datos?
La fuente es imparcial?
Los datos comprueban o contradicen otras evidencias
que se disponen?
Hace falta una evidencia cuya ausencia conduzca a
otra conclusin?
Cuantas observaciones se tienen?
La conclusin que obtengo es lgica?
Los principales organismos
publicaciones son:
1.
2.
3.
4.

que

disponen

de

Instituto Nacional de Estadstica e Informtica (INEI)


Organizacin Mundial del Trabajo (OIT)
Organizacin Mundial de la Salud (OMS)
Organizacin Panamericana de la Salud (OPS)

B) FUENTES PRIMARIAS
1.
2.
28

Constituyen datos recolectados para el trabajo. Son


datos que no existan antes.
Se registran bajo dos mtodos: directo e indirecto

Jorge Crdova Egocheaga

2.5 MTODOS Y TCNICAS DE RECOLECCIN DE DATOS


A) MTODOS DIRECTOS
El responsable registra personalmente los valores de la
caracterstica.
Ejemplo: registro del tiempo que demora un mdico
durante una consulta.
Comprende 2 tcnicas.
(a) La observacin
1.
2.

Se registra el dato bajo condiciones normales


Cuando se mide el desempeo, la persona
observada no debe saber que es sujeta de
observacin
Se utiliza una hoja de registro.

Ejemplo
La observacin del desempeo de una enfermera
durante sus labores en el Servicio de Emergencia.
(b) La experimentacin
Se registra un dato bajo condiciones provocadas
simulando el proceso lo ms real posible.
Ejemplo:
Un mercado prueba para introducir un tipo jabn de
antisptico con fragancia .
B) MTODOS INDIRECTOS
1
2.

Se registra la caracterstica a travs de preguntas


No se realiza medicin

29

Manual de Estadstica General

Ejemplo:
Se pregunta a un paciente el tiempo que esper antes
que sea atendido en el consultorio externo.
Comprende 2 tcnicas: la encuesta y la entrevista.
(a) La encuesta
1.
2.

Cuestionario de preguntas abiertas o cerradas


Al disearla se debe:

Elegir lo temas generales de la encuesta

Decidir forma de aplicarlo: correo, telfono


o personal

Plantear preguntas

Realizar una prueba piloto y hacer


revisiones finales

Ejemplo:
Encuesta para conocer el grado de satisfaccin de
los asegurados a una clnica.
(b) La entrevista
1. Permite recolectar datos o partir de un dialogo
2. Puede se estructurada o no estructurada
Ejemplo:
Entrevista al Director de una Clnica sobre la
aplicacin de norma de calidad.
METODOS Y TCNICAS DE RECOLECCION DE DATOS
FUENTE
METODOS
SECUNDARIA
PRIMARIA

30

TECNICAS

FICHAS
DIRECTO
OBSERVACION
EXPERIMENTACION
INDIRECTO
ENCUESTA
ENTREVISTA

Jorge Crdova Egocheaga

Cmo seleccionar la fuente, el mtodo y la tcnica?


No toda la informacin requerida ser recopilada de una sola
fuente, ni usando un mismo mtodo y tcnica. Casi siempre
es una combinacin de ellos, para lo cual hay que:
Definir caractersticas que interesan registrar.
Identificar la fuente de informacin apropiada
caracterstica.

para

cada

Seleccionar la tcnica ms conveniente.


En un estudio de investigacin de mercados para paales
desechables, interesa conocer ciertas caractersticas,
CARACTERISTICA
Tasa de natalidad
Nivel socio-econmico de la familia
Textura del producto

FUENTE
Secundaria
Primaria
Primaria

TECNICA
Fichas
Encuesta
Entrevista

2.6 EL CUESTIONARIO
Consiste en un conjunto de preguntas diseadas de acuerdo
a la necesidad de informacin.
Junto con las hojas de registro, es la tcnica ms comn
para la recopilacin de datos de fuentes primarias.
Recomendaciones para su elaboracin
Las preguntas deben ser coherentes con el objetivo de la
investigacin. No hay preguntas de carcter general.
La extensin (nmero de preguntas) depende de la
necesidad de informacin a recolectar por esta tcnica.

31

Manual de Estadstica General

El lenguaje utilizado en la redaccin de preguntas debe ser


entendible por los encuestados. Es diferente al lenguaje a
usarse en el informe final
Debe evitarse la ambigedad.
Ejemplo: En un estudio para determinar el grado de
asociacin entre la incidencia a cncer pulmonar y el hbito
a fumar, se hizo la siguiente pregunta:
Fuma usted?

Si 1

No 2

No formular preguntas dirigidas. Evitar adjetivos, ya que


predisponen a una respuesta.
Ejemplo: Cree Ud. que el precio del medicamento es alto?
Si 1 No 2
Preguntas cerradas y abiertas

Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificacin y operatividad de los datos.
Ejemplo :
Posee Ud. un seguro mdico?
Si 1
No 2

Preguntas abiertas
Los encuestados tienen libertad para emitir su opinin.
Se utilizan cuando no se tiene precisin sobre las
posibles respuestas.
Dificulta la recoleccin de datos (incomoda al
encuestado).
Dificulta la interpretacin de datos.

32

Jorge Crdova Egocheaga

Ejemplo:
Qu opinin tiene sobre la poltica de salud del
actual Gobierno ?
2.7 LA ELABORACIN DE DATOS: EL CONTROL DE
CALIDAD
Una vez que se han recolectado los datos referidos a las
diferentes variables necesarias para la investigacin, se
debe proceder a revisarla y presentarla de manera que
facilite su anlisis. A este proceso se denomina elaboracin
de datos.
Las etapas que abarca son: edicin, tabulacin
codificacin.
A)

La edicin: Se revisan los formularios (cuestionario y


fichas de observacin) para verificar si todas las
preguntas han sido respondidas en todos los ellos. Se
debe verificar incongruencias en de las respuestas.
a)

Reencuestar: Si no se respondieron todas las


preguntas y es posible identificar al encuestado (por
ejemplo, se tiene su direccin), se podra regresar y
formular aquellas preguntas que se obviaron.

b)

Anular la pregunta: Si una pregunta es dejada de


contestar
en
muchos
cuestionarios,
sera
recomendable anular esa pregunta y buscar la
forma de conseguir el dato por otra fuente.
Probablemente, la pregunta fue mal formulada.

c)

Anular el formulario: Si una encuesta o la ficha de


observacin tiene demasiadas preguntas en blanco,
se anular todo el cuestionario. Es posible que no
se contara con la colaboracin apropiada del
encuestado o tal vez no se aplic correctamente.

33

Manual de Estadstica General

B.

La tabulacin: Consiste en etiquetar o titular con pocas


palabras, las respuestas a preguntas abiertas. Para
homogenizar el criterio, es recomendable que una
persona se encargue de este proceso. Si fueran muchos
formularios y varias preguntas abiertas, podran ser
varias personas que tabulen, pero necesariamente solo
una persona por pregunta.

C. La codificacin: Consiste en colocar un cdigo a las


respuestas, a fin de poder construir una base de datos.
2.8 LAS HOJAS DE REGISTRO (O CHECK LIST)
Son formatos preimpresos que facilitan el registro y la
organizacin de cualquier tipo de datos. Puede ser:
Para registro: Se anota sistemticamente la informacin.
Ejemplo: Tarjeta de Registro de Asistencia del personal que
labora en una Clnica
Para verificacin: Se anota informacin en determinado
tiempo, que debe cotejarse con la realidad.
Ejemplo: Registro de las recetas no atendidas por semana.
EJEMPLO 1:
Hoja
de
registro
proceso de produccin

para

la

distribucin

La medida optima es 8.300


Se acepta una variabilidad mxima 0,008
Se registra cada uno de los 55 productos
elaborados
un da, colocando una x en la casilla correspondiente.
Se construye simultneamente el histograma.

del

en

Caso: Hoja de registro para ver la distribucin en un proceso


de produccin.
34

Jorge Crdova Egocheaga

EJEMPLO 2:
Hoja de registro de tems defectuosos
Permiten identificar el tipo de defecto ms frecuente.
Un producto puede presentar ms de un defecto.
Es necesario tipificar con antelacin los defectos posibles.
Caso: Hoja de registro de inspeccin final de cierto producto
plstico moldeado.

35

Manual de Estadstica General

EJEMPLO 3
Hoja de registro de las causas del defecto
Permite una estratificacin adicional con el fin de encontrar
las causas de los defectos.
Caso: Hoja de registros de ocurrencias de los defectos en
ciertos accesorios utilizados en la elaboracin de prtesis
dental, asignables a maquinaria, trabajadores, da y tipo de
defecto.

36

Jorge Crdova Egocheaga

37

Manual de Estadstica General

38

CAPTULO

ORGANIZACIN
TABULAR DE
DATOS

OBJETIVOS
Al finalizar el Captulo 3, el participante ser capaz de:
1.
2.
3.
4.

Organizar datos a travs de una clasificacin ordenada


de datos.
Organizar datos a travs de un diagrama tallo-hojas.
Elaborar una tabla de distribucin de frecuencias para
datos univariados
Elaborar una tabla de distribucin de frecuencias para
datos bivariados.

Manual de Estadstica General

3.1 LA IMPORTANCIA DE LA ORGANIZACIN DE LOS


DATOS
Los datos deben organizarse, para entender mejor su
naturaleza fundamentalmente utilizando dos mtodos : el
mtodo tabular y el mtodo grfico.
Si los datos no estn organizados son de poca utilidad en
una investigacin o para una toma de decisiones.
Ejemplo
Los niveles altos de colesterol en suero, han sido por mucho
tiempo asociados con el incremento del riesgo de
enfermedades cardiovasculares. Se han efectuado
numerosos estudios en un esfuerzo por lograr una mayor
comprensin de la naturaleza de esta asociacin. Se
muestra a continuacin las concentraciones de colesterol en
suero que fueron recolectadas a una poblacin de 480
individuos aparentemente sanos. A qu conclusin llega?

40

Jorge Crdova Egocheaga


231

199

236

259

183

269

191

260

197

159

227

245

214

275

186

234

262

230

212

163

220

202

221

223

243

203

180

292

198

201

174

223

186

200

192

236

186

188

234

230

170

304

197

216

214

189

138

269

197

222

202

213

163

241

218

242

197

248

228

154

218

243

192

191

243

230

248

231

262

177

207

276

230

238

189

212

200

179

249

225

223

289

280

235

220

194

205

206

194

232

222

209

209

248

194

192

200

261

238

233

222

223

267

263

159

243

230

193

195

259

186

229

184

215

254

233

229

263

163

212

271

216

230

252

218

265

218

155

222

173

228

214

266

172

203

262

213

249

244

177

242

180

241

261

221

222

189

204

229

212

192

257

248

243

190

166

216

197

250

224

257

220

255

241

245

212

225

201

209

155

249

253

265

225

192

212

212

174

184

227

216

250

248

187

222

195

247

161

188

229

194

209

250

180

228

196

254

208

265

234

219

203

230

232

212

236

191

161

258

252

169

249

231

170

233

161

189

191

209

229

246

274

215

215

206

218

234

248

222

175

202

154

249

189

171

263

238

177

261

265

224

249

252

220

199

239

221

221

221

232

218

239

205

196

211

221

276

251

189

286

258

227

236

167

184

245

243

218

173

220

231

196

196

200

221

217

270

261

248

254

232

231

219

225

265

222

226

208

219

189

226

292

192

172

186

264

211

240

237

156

228

241

171

223

185

199

188

263

208

199

259

272

202

214

201

231

210

223

210

209

239

203

212

295

202

195

218

218

253

239

272

216

221

208

225

175

239

191

214

215

227

221

208

224

208

181

187

179

234

262

216

221

152

180

193

244

184

183

226

266

242

220

266

269

223

198

204

179

209

215

222

196

228

195

160

261

177

232

224

203

265

238

247

225

169

172

187

199

245

183

171

246

187

222

278

212

250

174

220

188

223

241

200

193

226

243

206

142

277

244

210

258

207

267

254

136

231

253

229

240

204

187

202

209

238

240

190

253

203

271

281

226

244

182

146

251

277

184

240

239

185

201

259

234

174

226

246

222

205

211

216

230

220

201

231

183

214

219

206

276

215

195

209

258

287

182

176

275

204

183

212

237

249

142

256

258

213

208

202

244

Al observar a un conjunto de datos, deseamos identificar a


las principales propiedades que definen a este conjunto.
Lamentablemente, no se puede obtener alguna conclusin
vlida. Los datos tal como se presentan no nos permiten
afirmar algo sobre ellos.
Para lograr identificar las principales medidas y propiedades
de este conjunto de datos, tenemos que organizar
previamente al conjunto de datos.
3.2 ELEMENTOS DE LA ORGANIZACIN TABULAR
Consiste en una presentacin resumida de la informacin
usando tablas o cuadros
Ejemplo: Supongamos que en una entrevista a pacientes del
lo que se busca evaluar son 2 aspectos:

41

Manual de Estadstica General

- La opinin sobre la calidad de atencin


- Nivel de instruccin de la paciente
Como son dos variables categricas, la presentacin de los
datos podra realizarse en una tabla cruzada:

NIVEL

OPININ

EDUCATIVO Favorable Desfavorable

TOTAL

Analfabeta

10

Primaria

15

20

Secundaria

23

30

Superior

12

15

TOTAL

58

17

75

3.2.1 Ventajas
Se pueden apreciar propiedades de los datos.
Permite establecer asociaciones entre variables
Se ahorra espacio en un informe escrito.
3.2.2 Elementos:
A. El Ttulo: enunciado breve e informativo acerca del
contenido del cuadro. Un buen ttulo debe
responder a las siguientes interrogantes:
1. Qu contiene la tabla?
Ej.: La opinin de 75 pacientes sobre calidad
de atencin.
2. Cmo estamos presentando el contenido?
Ej.: Por nivel educativo de las pacientes

42

Jorge Crdova Egocheaga

3. De dnde se obtuvieron los datos?


Ej.: Del servicio de Ginecologa del Hospital
Santa Rosa. Lima.
4. Cundo se obtuvo la informacin?
Ej.: (fecha de la recoleccin de los datos)
Un buen ttulo podra ser:
Opinin de 75 pacientes por nivel educativo sobre la
calidad de atencin en el Servicio de Ginecologa
del HOSPITAL SANTA ROSA. Lima, enero del
2003.
B. La Matriz: Est constituido por el primer rengln y la
primera columna, en donde se describen los
nombres de las categoras (en datos categricos) o
los intervalos de clases (en datos cuantitativos), tan
conciso como sea posible.

Ejemplo
NIVEL DE
INSTRUCCIN

OPININ
Favorable

TOTAL

Desfavorable

Analfabeta

Para datos
categricos

Primaria
Secundaria
Superior
TOTAL

EDAD

N de pacientes

Tasa porcentual :%

(en aos)

(fi)

(hi)

39 - 46
47 - 54
55 - 62
63 - 70
71 - 78
Total

C. El cuerpo: Est conformado por espacios y


constituyen intersecciones de filas y columnas, que
a veces se denominan celdas, y donde se anotan

43

Manual de Estadstica General

las frecuencias absolutas y relativas obtenidas en la


tabulacin, incluyendo totales y subtotales.
Por ejemplo
OPININ

NIVEL
EDUCATIVO

TOTAL

Favorable

Desfavorable

Analfabeta

10

Primaria

15

20

Secundaria

23

30

Superior

12

15

TOTAL

58

17

75

D. Notas aclaratorias: Estn constituidas por toda


aquella informacin adicional que es necesaria para
describir e interpretar adecuadamente el contenido
de la tabla o cuadro. Es muy importante cuando se
trata de datos proveniente de fuente secundaria. Es
un aspecto tico precisar de donde provienen los
datos, a la vez que nos liberamos de la
responsabilidad de responder por su calidad. Se
escribe con letra ms pequea.

44

Jorge Crdova Egocheaga

Tabla 1: Opinin de 75 pacientes por nivel educativo sobre la


calidad de atencin en el Servicio de Ginecologa del
HOSPITAL SANTA ROSA. Lima, enero del 2003.

OPININ

NIVEL

EDUCATIVO Favorable Desfavorable


Analfabeta
8
2

TOTAL
10

Primaria

15

20

Secundaria

23

30

Superior

12

15

TOTAL

58

17

75

Fuente: Hospital San Rosa. Direccin de Procesos. Enero 2003.

La presentacin tabular de datos pueden realizarse bajo tres


formas, desde la ms elemental se tiene:
- Clasificacin ordenada de datos.
- Diagrama de tallos y hojas
- Tablas de distribucin de frecuencias.
3.2 CLASIFICACIN ORDENADA DE DATOS
Si ordenamos los datos sin procesar, de la observacin ms
pequea a la ms grande, la secuencia ordenada obtenida,
se denomina clasificacin ordenada.
Ejemplo: en un estudio del crecimiento de varones, se
obtuvieron estas observaciones sobre el permetro ceflico
(en centmetros) de un nio al nacer:
33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

Ordenando los datos de manera ascendente, tenemos:

45

Manual de Estadstica General


33.1
33.4
33.6

33.7
33.7
33.8

33.9
34.0
34.1

34.2
34.2
34.2

34.2
34.2
34.3

34.3
34.5
34.5

34.6
34.6
34.6

34.7
34.7
34.8

34.9
35.1
35.1

35.2
35.2
35.3

35.6
35.8
36.0

36.1
36.5

Cules son las principales propiedades que se observa en


este conjunto de datos?
Las principales propiedades que se observan
conjunto de datos son:

en este

El nmero de datos es de 35.


La menor observacin es de 33,1 cms.
La mayor observacin es de 36,5 cms.
El rango de los valores observados es de 3,5 cms.
=(36,5
33,1)+ 0,1 cms.
El 51,43% (18 nios) de los datos estn alrededor de 34
cms.
Son muy pocos frecuentes los nios con permetro ceflico
mayor a 36 cms. (slo 3 nios).
Mientras mayor sea el nmero de observaciones presentes
en una serie de datos, mas laborioso es realizar la
clasificacin ordenada de los datos.
3.3 DIAGRAMA DE TALLO Y HOJAS
Un diagrama de tallo y hojas consiste en una serie de hileras
horizontales de nmeros. El nmero utilizado para designar
una hilera es un tallo, el resto de nmeros de la hilera se
denominan hojas.
Esta tcnica funciona bien, cuando el conjunto de datos no
tiene una gran dispersin
Se pueden considerar el siguiente proceso:
Elija algunos nmeros adecuados que puedan servir
de
tallo. Se requieren como mnimo 5 tallos. Los tallos elegidos

46

Jorge Crdova Egocheaga

generalmente son el primer o los dos primeros dgitos de


los datos.
Nombre las hileras mediante los tallos elegidos.
Organice grficamente los datos registrando el dgito,
siguiendo el tallo.
Trazar una curva a lo largo de la parte superior del diagrama.
Determinar las principales caractersticas.
Ejemplo:
Con los datos anteriores sobre el permetro ceflico,
construir un diagrama tallo-hoja.
33.1 34.6 34.2 36.1 34.2 35.6 34.5 35.8 34.5 34.2 34.3 35.1
35.2 33.7 36.0 34.2 34.7 34.6 34.3 33.4 34.9 33.8 33.6 35.3
35.2 34.6 33.7 34.8 33.9 34.7 35.1 34.2 36.5 34.1 34.0

Dato menor: 33,1


Dato mayor: 36,5
Tallos posibles: 33, 34, 35 y 36Slo existen 4 tallos,
debiendo ser el mnimo 5 tallos, entonces
los tallos
propuestos se desdoblan, de la siguiente manera:
33 (del 33,0 al 33,4)
33 (del 33,5 al 33,9)
34 (del 34,0 al 34,4)
34 (del 34,5 al 34,9)
35 (del 35,0 al 35,4)
35 (del 35,5 al 35,9)
36 (del 36,0 al 36,4)
36 (del 36,5 al 36,9)

47

Manual de Estadstica General

Luego clasificamos los datos en funcin al valor del


decimal.

33

1 4

33

8 6

34

2 2

2 2

34

7 6 7

35

2 2

35

36

36

25 datos

3
10 datos

Finalmente, se traza una lnea por el borde, a fin de delimitar


la forma de la distribucin.
Qu caractersticas se observan?.
Las principales propiedades de los datos :
- Son 35 casos.
- La menor observacin es de 33,1 cms.
- La mayor observacin es de 36,5 cms.
- El rango de los valores observados es de 3.5 cms. (36,5
33,1 + 0.1 cms.)
- El 51,43% (18 casos) de los datos estn alrededor de los
34 cms.
- Son muy poco frecuentes los casos mayores a 36 cms (3
casos) y menores a 33,5 cms (2 casos).
- La distribucin de datos est sesgada a la derecha (sesgo
positivo), es decir, hay una mayor concentracin de datos a
la izquierda.

48

Jorge Crdova Egocheaga

Ejercicio
Se realiza un estudio para ayudar a comprender el efecto de
fumar en los patrones de sueo. La variable es el tiempo que
tarda en quedarse dormido. La muestras de fumadores y no
fumadores producen estas observaciones :
FUMADORES
17,2
16,2
19,8
21,2
21,1
21,8
19,5

19,7
19,9
22,9
18,9
16,9
22,1
18,8

18,1
19,8
20,0
22,1
23,0
21,0
19,2

15,1
23,6
24,1
20,6
20,1
20,5
22,4

NO FUMADORES
18,3
24,9
25,0
23,3
17,5
20,4
19,3

17,6
20,1
21,4
20,2
21,3
20,7
17,4

15,1
16,8
22,8
25,8
24,3
23,2
15,7

20,5
21,2
22,4
24,1
25,7
25,1
15,3

17,7
18,1
19,4
15,0
15,2
16,1
19,9

21,3
22,1
25,2
24,1
18,0
17,2
23,1

16,0
15,9
18,3
21,6
23,8
24,9
23,0

24,8
25,2
25,0
16,3
17,9
19,9
15,1

Construya un diagrama tallo-hoja para cada uno de estos


conjuntos de datos. Utilice los valores enteros del 15 al 25
(inclusive) como tallos.
Se sorprendera si alguien le dijera que no existe diferencia
en la distribucin de esta variable en los dos grupos?.
Explique.
3.4 TABLA DE DISTRIBUCIN DE FRECUENCIAS
Pueden ser simples o cruzadas
A)

Tablas simples
1
2
3.
4.

Se utilizan para presentar una sola variable.


Pueden
representar
datos
cualitativos
o
cuantitativos.
Presentan por lo menos dos columnas: categora o
clase y el nmero de datos o frecuencia de clase.
Puede incluirse una columna de tasa porcentual.

Para datos cualitativos se siguen los pasos siguientes:

49

Manual de Estadstica General

(1) Identificar diferentes categoras.


(2) Realizar un conteo.
(3) Elaborar la tabla: titulo, cuerpo y fuente.
Ejemplo
Con la finalidad de mejorar la calidad del servicio de
emergencia en una clnica local, se ha formulado la
siguiente pregunta a 45 pacientes atendidos durante
una semana: Cmo califica la calidad de la atencin
que Ud, acaba de recibir en este Servicio de
Emergencia: muy bueno, bueno, aceptable, malo o muy
malo
Los datos recolectados se presentan a continuacin:
Muy bueno

Aceptable

Aceptable

Muy bueno

Bueno

Bueno

Bueno

Muy malo

Bueno

Bueno

Aceptable

Bueno

Aceptable

Malo

Muy bueno

Malo

Aceptable

Muy malo

Aceptable

Malo

Aceptable

Muy bueno

Bueno

Bueno

Aceptable

Bueno

Malo

Aceptable

Muy malo

Bueno

Malo

Bueno

Malo

Bueno

Aceptable

Bueno

Bueno

Muy malo

Muy bueno

Malo

Aceptable

Bueno

Aceptable

Malo

Bueno

Primero, se identifican las categoras:


Muy bueno
Bueno
Aceptable
Malo
Muy malo

50

Jorge Crdova Egocheaga

Segundo, se realiza el conteo de las frecuencias:


Muy bueno
Bueno
Aceptable
Malo
Muy malo

/////
///// ///// ///// /
///// ///// //
///// ///
////

Tercero, se presenta la tabla, considerando el ttulo y la


fuente.
Cuadro 1: Calidad del Servicio de Emergencia

C a t e g o ria

N m e ro d e
P a c ie n t e s

T asa
P o rc e n tu a l

M uy Bueno

1 1 ,1 1

Bu en o

16

3 5 ,5 5

A c e p ta b le

12

2 6 ,6 7

M a lo

1 7 ,7 8

M u y M a lo

8 ,8 9

45

1 0 0 ,0 0

T o tal

Fuente: Encuesta a los Pacientes, julio 2002


Para datos cuantitativos se sigue el procedimiento
siguiente:
(1) Se calcula el rango:(mayor - menor) + 1
(2) Se determina el nmero de clases, que mejor
representa a los datos (entre 4 y 20). Se realiza un
tanteo.
(3) Se determina el tamao o amplitud de clase.
51

Manual de Estadstica General

(4) Se elige el limite inferior de la primera clase.


(5) Se establecen los
siguientes clases.

lmites

inferiores

de

las

(6) Se establecen los limites superiores de cada una de


las clases.
(7) Se realiza un conteo, a fin de determinar cuantos
datos se incluyen en cada clase.
(8) Se elabora la tabla: titulo, cuerpo y fuente.
Ejemplo:
Revisemos el ejemplo sobre los niveles de colesterol en
suero presentado anteriormente.
231

199

209

236

259

248

183

269

212

194

191

260

197

265

261

159

227

245

214

275

186

234

262

230

212

163

220

202

221

223

203

180

292

198

201

174

223

186

200

192

236

186

188

234

230

304

197

216

214

189

138

269

197

222

202

213

163

241

218

242

248

228

154

218

243

192

191

243

230

248

231

262

177

207

276

238

189

212

200

179

249

225

223

289

280

235

220

194

205

206

209

233

222

223

267

212

263

159

243

230

253

192

200

232

222

193

195

259

186

229

184

215

254

233

229

263

163

212

271

216

225

252

218

265

218

155

222

173

228

214

266

172

203

262

213

244

177

242

180

241

261

221

222

189

204

229

212

192

257

248

190

166

216

197

250

224

257

220

255

241

245

212

225

201

209

229

194

174

184

192

249

216

250

248

187

222

195

247

161

188

209

250

180

228

196

254

208

265

234

219

203

Solucin
Se calcula el rango: R = Mayor menor + 1
Mayor = 317
Menor = 106
Rango = (317 106) + 1 = 212

52

Jorge Crdova Egocheaga

Se tantea el nmero de clases:


4 clases de 53 Rango corregido 212: No exceso
5 clases de 43 Rango corregido 215: Exceso 3
6 clases de 36 Rango corregido 216: Exceso 4
7 clases de 31 Rango corregido 217: Exceso 5
8 clases de 27 Rango corregido 216: Exceso 4
Se escoge 4 clases por tener el menor exceso.
La amplitud de clase es 53.
Como no hay exceso con 4 clases, el lmite inferior de la
primera clase es el menor nmero. En este caso 106.
5.

Los lmites inferiores de las clases siguientes se forman


sumando al lmite inferior de la primera clase, la
amplitud. En este caso, 53

NIVELES DE
El menor
valor

COLESTEROL

PERSONAS

Tasa
porcentual (%)

106 159 106 + 53

212 265 Total

1000

100,00

Fuente: Departamento de Salud

6.

Luego se calculan los lmites superiores de cada clase.


Para la primera clase se resta 1 al lmite inferior de la
segunda clase. Para las clases siguientes, se le suma la
amplitud, en este caso 53.

53

Manual de Estadstica General

Cuadro 2: Niveles de colesterol en Lima

NIVELES DE
COLESTEROL
106 - 158
159 - 211

PERSONAS

Tasa
porcentual (%)

159 - 1
158 + 53

212 - 264
265 - 317
Total

100,00

1000

Fuente: Departamento de Salud


7.

Finalmente se realiza el conteo de las frecuencias y se


presenta la tabla con un ttulo y fuente.
Se acostumbra presentar
frecuencias relativas (%)

una

columna

con

la

En algunas ocasiones se elaboran las tablas con clases


abiertas cuando los datos inferiores o superiores estn
muy dispersos

54

Jorge Crdova Egocheaga

Cuadro 3: Ventas diarias en la Farmacia


durante el mes de junio (en soles)

Ventas

Tasa

(en soles)

Dias

menos de 5000

porcentual
(%)
10,00

5000 - 8999

23,33

9000 - 12999

10

33,33

13000 - 16999

26,67

17000 - 20999

6,67

Total

30

100,00

Fuente: Registro de Ventas


Ejercicio
Los siguientes datos de refieren a la estatura (en metros) de 50
pacientes que se atienden en el servicio de reumatologa de la
Clnica Sagrado Corazn. Construya una tabla de distribucin de
frecuencias.
1,68
1,70
1,80
1,69
1,64
1,87

1,72
1,66
1,68
1,84
1,70
1,64

1,70
1,70
1,72
1,74
1,86
1,72

1,67
1,68
1,74
1,73
1,74
1,87

1,76
1,65
1,72
1,75
1,75
1,77

1,82
1,74
1,69
1,75
1,77

1,59
1,80
1,78
1,72
1,76

1,66
1,57
1,84
1,81
1,72

1,82
1,64
1,61
1,87
1,81

La tabla de distribucin de frecuencias completa, tiene la


siguiente estructura

55

Manual de Estadstica General


CLASE

Marca de

Frecuencia

Frecuencia

Frec. Absoluta

Frec. Relativa

Li

Clase: Xi

absoluta: fi

relativa: hi

Acumulada: Fi

Acumulada: Hi

Li
Ls
Xi
fi
hi
Fi
Hi

Ls

limite inferior
limite superior
Marca de la clase i
frecuencia absoluta de la clase i.
frecuencia relativa de la clase i.
frecuencia absoluta acumulada hasta la clase i.
frecuencia relativa acumulada hasta la clase i.

Ejercicio 2:
Complete la siguiente tabla que corresponde al
pacientes del Hospital Central.
PESO
(en kilos)
48,0 52,9

fi

Fi

hi

peso de 60

Hi

6
0,30

53,0 57,9
58,0 62,9
0,25

63,0 67,9
68,0 72,9

Total

Ejercicio 3
La siguiente informacin se refiere al peso (en Kg.) de 60
personas. Elabore una tabla de distribucin de frecuencias.
LS5=64 F2=20
h3=0,213
k=6
LI1=35
f6 = 5
f1=4
H4=0,799
56

Jorge Crdova Egocheaga

Ejercicio 4
Complete la siguiente tabla de distribucin de frecuencias:

n = f = 30
hi =

f
n

hi = 1.000
PESO
(en libras

Fi = fant + fact
Hi = h ant + h act
fi

128,6 - 135,4

135,5 - 142,3

142,4 - 149,2

10

149,3 - 156,1

156,2 - 163,0

Xi

f ant --> frecuencia anterior


f act --> frecuencia actual

Fi

hi

Hi

Total

Resumamos algunos conceptos


Una distribucin de frecuencias (fi) es un conjunto de
puntuaciones ordenadas en sus respectivas clases.
Las frecuencias relativas (hi) son tasas porcentuales de
casos en cada clase.
La frecuencia acumulada (Fi o Hi) son las frecuencias que se
van acumulando en cada clase, desde la ms baja hasta la
mas alta.
La marca de clase (Xi) es el punto medio de una clase

B)

Tablas cruzadas
Sirven para representar dos o ms variables cualitativas.
En cada celda se puede incluir la frecuencia absoluta y
relativa (por fila, columna y total).

57

Manual de Estadstica General

Ejemplo
Cuadro 4: Enfermedad por sexo
E n fe rm e d ad \S e x o

M asculino

F emenino

To tal

B ro nquitis

12

17

C o litis

11

19

N efritis

15

21

Aler gias

To tal

35

25

63

Fuente: Historia Clnica, julio 2002.

58

CAPTULO

ORGANIZACIN
GRFICA DE
DATOS

OBJETIVOS
Al finalizar el Captulo 4, el participante ser capaz de:
1.
2.
3.

Elaborar grficos para una sola variable: barras,


columnas, circulo.
Elaborar grficos para dos variables: dispersin,
lineal.
Elaborar grficos en tres dimensiones.

Manual de Estadstica General

Los grficos constituyen una forma muy efectiva de presentar


informacin. Su utilizacin ayuda a una mejor comprensin.
Todo grfico tiene tres partes:
El ttulo: especfico, pero completo.
El cuerpo: es el grfico en si mismo.
La fuente: especificar el origen de la informacin.
4.1 EL HISTOGRAMA
Son barras verticales presentadas una a continuacin de
otra. Permite presentar datos cuantitativos continuos. Es un
grfico muy utilizado. Propiedades:
1.

El ancho de cada columna es igual en todo el grfico y


representa la amplitud de clase).

2.

El ancho de cada columna es igual en todo el grfico y


representa la amplitud de clase).
Xi

fi

128,6 - 135,4

CLASE

132,0

135,5 - 142,3

138,9

142,4 - 149,2

145,8

10

149,3 - 156,1

152,7

156,2 - 163,0

159,6

TOTAL

Distribucin de frecuencias

3
30

12

Histograma

Frecuencia

10
8
6
4
2
0

132.0 138.9 145.8 152.7 159.6

Marca de Clase

60

Jorge Crdova Egocheaga

Ejemplo
Grfico 4: Peso de 100 Pacientes (en Kg.)
Nmero de
Pacientes

25
20
15
10
5
0
29.5

39.5

49.5

Fuente: Encuesta, julio 2001

59.5

69.5

7 9.5

89.5

9 9.5

Peso
(Kgs)

Cmo leer histogramas?


A)

Tipo general: El valor medio est al centro, que tiene la


mayor frecuencia. Es el ms frecuente tiene forma
simtrica

61

Manual de Estadstica General

B)

Tipo multimodal: Hay varios valores mayores.

C) Tipo sesgo positivo: Forma asimtrica la media est


localizada a la izquierda.

62

Jorge Crdova Egocheaga

D) Tipo precipicio a la izquierda: Forma asimtrica la


frecuencia disminuye bruscamente a la izquierda.

E)

Tipo planicie: Las clases


misma frecuencia.

tienen

ms

menos

la

63

Manual de Estadstica General

F)

Tipo bimodal: Se observa


mximos.

claramente dos valores

G) Tipo pico aislado: Presenta un pico aislado, adems de


un histograma general.

64

Jorge Crdova Egocheaga

4.2 EL DIAGRAMA DE BARRAS


Se utiliza para representar datos cuantitativos discretos o
datos cualitativos.

Las barras son de igual ancho.


La longitud es proporcional a la frecuencia de la
categora.
El espacio entre barras debe ser homogneo, para
evitar efecto visual.

Ejemplo:
Grfico 2: Nmero de hijos en edad escolar por mdico del
Hospital Central
N de
Mdicos

30
25
20
15
10
5
0
0

Fuente: Departamento de Personal

Nmero de
hijos
(escolares)

65

Manual de Estadstica General

Ejemplo
Grfico 3: Pacientes atendidos por especialidad

20
15
10
5
0
Nefrologa

Ginecologa

Oftalmologa

Neurologa

Traumatologa

Fuente: Hoja de Ingreso, julio del 2002


Ejemplo
Grfico 4: Profesionales de la salud por
Especialidad

especialidad

Medico
Enfermeras
Psiquiatras
Fisioterapeuta
Obstetriz

N de
profesionales
0

10

20

30

40

50

60

70

80

90

100

Fuente: Gerencia de Potencial Humano. Julio 2002

66

Jorge Crdova Egocheaga

4.3 EL POLGONO DE FRECUENCIAS


Es otra forma de conocer las distribucin de los datos. Se
construye uniendo los punto medios
del lado superior de
las barras del histograma.
25
20
15
10
5
0
29.5

39.5

49.5

59.5

69.5

79.5

89.5

99.5

Grfico N 5: Distribucin de los pesos de los Pacientes del


Servicio de cardiologa
Nmero de
Pacientes

Peso
(Kg.)
Fuente: Historia Clnica, julio del 2002

67

Manual de Estadstica General

4.4 DIAGRAMA DE DISPERSIN DE PUNTOS


Ejemplo

Grfico 6: Pacientes mensuales


400
Paciente
s

Meses

350
300

Enero

120

Febrer
o

210

Marzo

180

Abril

320

Mayo

280

100

Junio

200

50

Julio

350

250
200
150

0
0

En ero Feb2rero Ma rzo

Ab4ril

Mayo

J un
6 io

Ju li o

Fuente: Departamento de Admisin Clnica

4.5 DIAGRAMA LINEAL


Ejemplo
Grfico 7: Pacientes mensuales
400
350
300
250
200
150
100
50
0
Enero Febrero Marzo

Abril

Mayo

Junio

Fuente: Departamento de Admisin Clnica


68

Julio

Jorge Crdova Egocheaga

4.6 LAS OJIVAS


La frecuencia acumulada son las frecuencias que se van
acumulando en cada categora, desde la ms baja hasta la
mas alta.
Las ojivas, relaciona las puntuaciones con sus respectivas
frecuencias acumuladas.
4.7 EL DIAGRAMA CIRCULAR
El circulo se divide en segmentos circulares, de tamao
proporcional a la frecuencia de la categora.
Ejemplo
Grfico 10. Pacientes atendidos en consultorios
externos
1 e r tr im .
2 d o tr im .
3 e r tr im .
4 to tr im .

Fuente: Ficha de atencin. Julio del 2002

4.8 DIAGRAMA RADAR


til para visualizar, por ejemplo, el cumplimiento de
metas
(%) para la Prueba de Papanicolaou en el servicio de
ginecologa para pacientes de diferentes zonas

69

Manual de Estadstica General

Ejemplo
100
80
60
40
E ste

20

O e ste

N o r te
Sur

Fuente: Hoja de registro atencin, julio 2002


4.9 SUPERFICIE EN TRES DIMENSIONES
Ejemplo:
Metas alcanzadas en prestacin de servicios
mdicos

100
50
4to trim.
0

3er trim.

Fuente: Encuesta, julio 2002

70

3er trim.
4to trim.

CAPTULO

PROMEDIOS
Un motivo para hacer sospechar que la Estadstica es ms un
arte que una ciencia, gira en torno a la ambigedad con que se
usa el trmino promedio.

OBJETIVOS
Al finalizar el Captulo 5, el participante ser capaz de:
1.

2.

Diferenciar los diversos tipos de medidas de


resumen que se pueden aplicar a un conjunto de
datos
Calcular e interpretar las principales medidas de
tendencia central

Manual de Estadstica General

5.1 LA ESTADSTICA DE RESUMEN


Despus de construir tablas y grficos, a partir de una
coleccin de datos, se requieren medidas ms exactas.
La estadstica de resumen, proporciona medidas para
describir un conjunto de datos.
Existen tres tipos de medidas de resumen:

De tendencia central.
De dispersin.
De la forma de la distribucin.

(A) Las medidas de tendencia central


Se refieren al punto medio de una distribucin
Se conocen como medidas de posicin
Ejemplo: A partir del grfico siguiente, se observa que
la posicin central de la curva B est a la derecha de la
posicin central de las curvas A y C. Obsrvese que la
posicin central de la curva A es la misma que la curva
C.

72

Jorge Crdova Egocheaga

(B) Las medidas de dispersin


Se refieren a la extensin o amplitud de los datos de
una distribucin
Representan el grado de variabilidad de los datos.
Ejemplo: Observe que la curva A en el siguiente grfico
tiene una mayor dispersin que la curva B, a pesar que
la posicin central es la misma.

(C) Las medidas de la forma de la curva


Las curvas que representan a un conjunto de datos,
pueden ser analizadas de acuerdo a su:
a) Simetra

b) Curtsis

Las curvas simtricas, tienen una forma tal que con una
lnea vertical que pase por el punto ms alto de la curva,
dividir el rea de esta en dos partes iguales.

73

Manual de Estadstica General

Las curvas sesgadas son aquellas cuyos valores estn


concentrados en el extremo inferior o superior de la
escala de medicin del eje horizontal. La cola indica el
tipo de sesgo.

Cuando medimos la curtsis nos referimos al grado de


agudeza. Pueden ser: leptocrtica (concentracin al
centro) mesocrtica distribuidos simtricamente) o
platicrtica (aplanada).

5.2 PROPIEDADES DE LA SUMATORIA


ra

1 Regla: La suma de los n trminos de una serie constante,


es igual a n veces la constante.
n

c
i =1

74

= nc

Jorge Crdova Egocheaga

Ejemplo:
C = 10, n=3
3

c
i =1

= 10 + 10 + 10 = 3 (10) = 30

da

2 Regla: La suma de los productos de una constante por


una variable, es igual a la constante multiplicada por la suma
de la variable.

cx
i =1

= c x i
i =1

Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3

cx
i =1

5(2) + 5(4) + 5(6) = 60

ra

3 Regla: La suma de los valores de una variable ms una


constante es igual a la suma de los valores de la variable
ms n veces esa constante.

=1

=1

( x i + c ) = x i + nc

i
i
Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3

(xi + c) = (5 + 2) + (3 + 2) + (2 + 2) = 16
i =1

= (5 + 3 + 2) + 3(2) = 16

75

Manual de Estadstica General

5.3 LAS MEDIDAS DE TENDENCIA CENTRAL


1. En general se denominan promedios.
2. Los ms importantes son la media, la mediana y la moda.
Aritmtica
Media
Geomtrica
Medidas de
Mediana
Armnica
tendencia central
Moda

3. Tambin es til conocer los percentiles (o fractiles).


POR QU SON IMPORTANTES LAS MEDIDAS DE
TENDENCIA CENTRAL?
Porque la mayor parte de los conjuntos de datos muestran
una tendencia a agruparse alrededor de un dato central.
Las medidas de tendencia central son puntos en una
distribucin, los valores medios o centrales de sta y nos
ayudan a ubicarla dentro de la escala de medicin.
5.3.1 La Media
(A) La media aritmtica ( x )
a) Obtencin: Se obtiene sumando los valores
registrados y dividindolos entre el nmero de
datos.
Ejemplo:
La siguiente tabla muestra el nmero de reclamos y
quejas presentadas por pacientes en el Servicio
de Emergencias a lo largo de una semana.
Calcule e interprete la media.

Da/Semana
Reclamos/da

76

Lun Mar Mier Jue Vier Sab


8 10 5
12 10 15

Jorge Crdova Egocheaga

Media aritmtica

8 + 10 + 5 + 12 + 10 + 15 60
=
6
6
= 10 reclamos
b)

Interpretacin: Si elige al azar un da de la


semana, se espera que los pacientes del
servicio de emergencia realicen 10 reclamos en
ese da.

c)

Simbologa:
Media aritmtica
(equis barra)
(mu)

Tamao
n
N

Muestra
Poblacin
d)

Clculos a partir de datos no agrupados, se


utilizan las siguientes formulas.
Para una muestra
donde: x : media muestral
n

Xi x =

Xi

i =1

n
n

: suma de todos los datos


: nmero de datos (muestra)

Para una poblacin


N

donde: : media poblacional


Xi : suma de todos los datos
N : nmero de datos (poblacin)

Xi

= i =1
N

Se puede calcular la media aritmtica utilizando Excel.

77

Manual de Estadstica General

Media
aritmetica

e)

Clculo a partir de datos agrupados.


El clculo de la media aritmtica, cuando los
datos disponibles se encuentran en tablas de
distribucin de frecuencias, se realiza utilizando
la formula siguiente

= i = 1n

fiX

i=1

donde:

fi

x :media muestral
fi :frecuencia absoluta de la clase i
X i :marca de la clase i

Ejemplo:
La distribucin de frecuencias siguiente, representa
los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de un
Centro de Salud. El puntaje mximo en la prueba es
50. Calcule e interprete en media.

78

Jorge Crdova Egocheaga

D esem p e o

N m ero d e

(p unto s )

t c n ic o s

12 - 16

17 - 21

22 - 26

15

27 - 31

23

32 - 36

10

T O T AL

60

Primero se calcularn las marcas de clase ( Xi);


es decir, el valor intermedio de cada clase
clase
12 - 16
17 - 21
22 - 26
27 - 31
32 - 36

x=

Marca de
clase ( i)
14
19
24
29
34
Total

Frecuencia
absoluta(fi)
4
8
15
23
10
60

14(4) + 19 (8) + 24 (15) + 29 (23) + 34 (10)


x
4 + 8 + 15 + 23 + 10
x = 26.25

= 1575
60

Interpretacin: Si se elige al azar a un trabajador tcnico


de este hospital, se espera que tenga un puntaje de
26,25 en su evaluacin de desempeo.

79

Manual de Estadstica General

f) La media aritmtica ponderada ( x p )


donde:
n

xp =

wX
i =1
n

w
i =1

wi = factor de ponderacin
X i = datos

Ejemplo: Una empresa comercializadora de


Seguros Mdicos dispone de 3 representantes
para la zona de Miraflores, cada uno de los
cuales cobra diferente comisin por pliza
vendida, y realiza diferente nmero de
contratos. Calcule e interprete el valor medio de
la comisin

Vendedor

N de polizas de
Seguro Mdico

Comisin
por venta $

Pedro
Juan
Pablo

30
25
20

30
40
50

x p = 30(30) + 25(40) + 20(50) = 2900 = $38.67


30 + 25 + 20

75

Interpretacin:
Si se elige al azar un representante se espera que cobre
una comisin de $38.67 por pliza vendida.

80

Jorge Crdova Egocheaga

g)

Ventajas y desventajas de la media aritmtica


Ventajas:
Concepto familiar para muchas personas
Es nica para cada conjunto de datos
Es posible comparar medias de diferentes
muestras
Desventajas
Se ve afectada por los datos extremos
Si la muestra es grande y los datos no
estn agrupados, su clculo es tedioso
Si los datos estn agrupados en clases
con extremos abiertos, no es posible
calcular la media.

(B) La media geomtrica (

xg )

Se utiliza para calcular tasas medias de variacin,


como la tasa media de crecimiento poblacional, la
tasa media de inflacin mensual, la tasa media de
mortalidad, entre otros.
a)

Obtencin Se obtiene extrayendo la raz


ensima el producto de los n valores de una
serie.

xg = n X1 X 2 X3 .........X n
Ejemplo:

La siguiente tabla muestra la tasa de aumento


en las quejas durante los ltimos meses.
Calcule e interprete la tasa media mensual.
81

Manual de Estadstica General


Meses
Aumento de
quejas

Enero

Febrero

Marzo

Abril

Mayo

2.6%

5.4%

3.8%

0.5%

1.4%

La tasa 2,6% tambin se puede expresar como


0,026 , y puesto que se refiere a un aumento a
partir de una base de 100%, el factor de
variacin ser 1,026. Para los otros datos se
opera igual.
b)

Clculos
Por lo tanto, la media geomtrica se calcula:

xg

= n

x1, x 2 , x 3,...... x

x g = 5 (1.026) (1.054) (1.038) (1.005)(1.014)


x g = 5 1 . 143903377
x g = 1,0272540 ( Factor de crecimient o medio )

Tasa media =
(x g 1) 100
de variacin
= (1,0272540 - 1) x 100 = 2,72%
c)

Interpretacin
Si se selecciona al azar un mes entre enero y
mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.

(C) La media armnica (

xh )

Se utiliza para calcular el tiempo medio, velocidad y


aceleracin media, como por ejemplo, el tiempo
medio para realizar determinada ciruga.

82

Jorge Crdova Egocheaga

a)

Obtencin: se obtiene calculando el inverso de


la media aritmtica de los inversos de una
serie.

xh =

1
n

1
X
i =1

n
Ejemplo:
Los siguientes datos registran el tiempo que
utilizan cuatro mdicos al realizar una cierta
intervencin quirrgica. Calcule e interprete el
tiempo medio.

M d ic o
T ie m p o
(m in u t o s )

45

38

52

40

Conocer el tiempo medio permite contar con


una herramienta til en la planeacin de los
recursos, como la Sala de Operaciones.
Adems
de
poder
comparar
nuestro
desempeo con los estndares de calidad
internacionales.
xh = 1 1 4 1 1 = 1976 + 2340 +4 1710 + 2223
+ + +
45 38 52 40
88920

xh = 4 88920 = 43.117953 minutos


8249

xh = 43 minutos 7 segundos
83

Manual de Estadstica General

b)

Interpretacin:
Si se selecciona al azar a uno de los
cuatro mdicos, se espera que realice
este tipo de ciruga
en
43
minutos
aproximadamente.

5.3.2 La Mediana
Es la medida que divide en dos subconjuntos iguales a
datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.
a)

Obtencin: Se obtiene ordenando la serie de


datos (en forma ascendente o descendente) y
ubicando el dato central.
Ejemplo:
Los siguientes datos se refieren al nmero de
pacientes que llegaron a su cita, despus de la
hora programada durante los ltimos 11 das en el
Servicio de Pediatra. Calcule e interprete la
mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Primero se ordenan lo datos:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
5 datos menores

5 datos mayores

mediana

b)

84

Interpretacin: Durante 5 das llegaron menos de 11


pacientes tarde a su cita y durante 5 das, ms de
11 pacientes llegaron tarde a su cita.

Jorge Crdova Egocheaga

c)

Reglas
1 Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34

mediana =

18 + 23
= 20 .5
2

3 Sea la serie par o impar, la mediana ocupa el


lugar

d)

n + 1
2 ,de la serie previamente ordenada.

Clculo a partir de datos agrupados.

n +1
2 (F + 1)
Md = Li +
c
f
Md

donde:
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : nmero total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase

85

Manual de Estadstica General

Ejemplo: La tabla siguiente muestra la experiencia


laboral (aos) del personal de seguridad que labora
en un gran hospital. Calcule e interprete la mediana.

Lugar de la mediana:
E xp e rie nc ia
la b o ra l
(a o s )
0 - 3
4 - 7

N m e ro d e
tr a b a ja d o r e s
d e s e g urid a d
4
12

8 - 11

24

12 - 15
16 - 19
20 - 23

16
10
3
69

n + 1 69 + 1
=
= 35o
2
2

69 + 1 (16)
4
Md = 7,5 + 2
24

C la s e
M e d ia na

= 7,5 +

35 164
24

Mediana = 10,5 aos


Interpretacin:
La mitad del personal de seguridad que labora en
este hospital tienen una experiencia laboral igual o
menor a 10 aos 6 meses. La otra mitad de este
personal tiene una experiencia laboral igual o mayor
a 10 aos y 6 meses.
e)

Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.

86

Jorge Crdova Egocheaga

Para una serie amplia de datos no agrupados, el


proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
5.3.3 La Moda
La moda es el valor que ms se repite dentro de un
conjunto de datos.
a) Obtencin: se obtiene organizando la serie de datos
y seleccionando el o los datos que ms se repiten.
Ejemplo

4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
b) Clculo a partir de datos agrupados

Mo = L

1
+ c
1 2

donde:
M o : moda
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
:
frecuencia
de la clase modal menos la

1
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.

87

Manual de Estadstica General

Ejemplo: La tabla siguiente muestra los errores de


facturacin durante un mes, en una Clnica. Calcule
e interprete la moda.
Er r o r e s d e
f a c tu r a c i n

Da s

0 - 3

4 - 7

12

8 - 11

12 - 15

16 - 19

To ta l

30

=6
1

Cla s e
Mo d a l

=4
2

Clase moda : (4 - 7)
6
Mo = 3.5 +
4
6+4

Mo = 5,9

Interpretacin: Durante un mes, el nmero ms


frecuente de errores de facturacin en esta clnica
es 6.
e) Ventajas y desventajas de la moda.
Ventajas:
Se puede utilizar tanto para datos cualitativos como
cuantitativos.
No se ve afectada por los valores extremos.
Se puede calcular, a pesar de que existan una o
ms clases abiertas.
Desventajas:
No tiene un uso tan frecuente como la media.
Muchas veces no existe moda (distribucin
amodal).
En otros casos la distribucin tiene varias modas, lo
que dificulta su interpretacin.
5.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales a un
conjunto de datos

88

Jorge Crdova Egocheaga

a) Clculo: para datos agrupados.

( )

Kn F + 1

i
P = L + 100

c
K
i
f
P

K
donde:
P

: percentil

K : el percentil buscado

n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el
percentil K
f
P : frecuencia absoluta de la clase donde se
K
ubica el percentil K
c : amplitud de clase
Ejemplo:
La tabla muestra la experiencia (en aos) de las
enfermeras de un gran centro hospitalario
Experiencia Trabajadores
(aos)

0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27
Total

18
42
68
120
40
34
12
334

Sobre qu edad se ubica el 25% de las


enfermeras de mayor experiencia?

89

Manual de Estadstica General

75 %

25 %

P75

Menor
Experiencia

Mayor
Experiencia

K = 75

Lugar del P75 =

Kn 75(334 )
=
= 250 ,5o (de los nmeros ordenados )
100
100

Para saber en cul clase se halla este dato, se


calcul la frecuencia acumulativa.
E xperiencia
(aos)
0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27

N Trabajadores

F rec. A cumulada

fi

Fi
18
60
128
248
288
322
334

18
42
68
120
40
34
12
334

75(334) (248 + 1)

100
P = 15.5 +
4

75
40

F=248
En esta clase
se localizan del
249 - 288

P = 15.65 aos
75

Interpretacin: Para que una enfermera est


comprendida dentro del 25% de mayor experiencia
laboral debe tener al menos 15 aos, 7 meses y 24
das.

90

CAPTULO

MEDIDAS DE
DISPERSIN Y
ASIMETRA
OBJETIVOS
Al finalizar el Captulo 6, el participante ser capaz de:
Calcular e interpretar las principales medidas de
dispersin:
A) Rango
B) Rango intercuartlico
C) Varianza
D) Desviacin estndar
E) Coeficiente de variabilidad
Calcular e interpretar las principales medidas de la
forma de la distribucin.
A) Coeficiente de asimetra
B) Coeficiente de curtosis

Manual de Estadstica General

6.1 LAS MEDIDAS DE DISPERSIN


Llamadas tambin medidas de variabilidad
Son tiles porque:
Permiten juzgar la confiabilidad de la medida de tendencia
central.
Los datos demasiados dispersos tienen un comportamiento
especial.
Es posible comparar dispersin de diversas muestras.
6.1.1 El rango (R)
Llamado tambin recorrido, amplitud total o alcance.
a) Obtencin: se obtiene de la influencia entre el dato
mayor y el dato menor ms una unidad significativa,
a fin de incluir ambos valores extremos.
Ejemplo:
Los siguientes datos representan el peso de 10
nios al nacer, (en Kg.). Calcule e interprete el
rango.
2,860 3,150 3,450 2,950 3,780
4,170 3,920 3,280 4,050 3,120
Rango = (4,170 - 2,860) + 0.001
Rango = 1,311 Kg.
b) Interpretacin
La diferencia entre el bebe de mayor peso y el bebe
menor peso es 1,311 Kg.

92

Jorge Crdova Egocheaga

c) Clculo
A partir de datos agrupados, se utiliza la siguiente
frmula:
R= (Ls - Li ) + 1
donde:
Ls : Limite superior de la
ltima clase
Li : Limite inferior de la
primera clase
Ejemplo:
La distribucin de frecuencias siguiente representa
el tiempo que espera un paciente para ser atendido,
en un consultorio externo. Calcule e interprete el
rango

Tiempo N de Pacientes
(minutos)
(por da)
12 - 16
4
17 - 21
8
22 - 26
15
27 - 31
23
32 - 36
10
Total
60
Rango = (36-12) + 1
R = 25 minutos
Interpretacin: la diferencia de tiempo entre el
paciente que ms espera y el que menos espera
para ser atendido es 25 minutos.

93

Manual de Estadstica General

f) Ventajas y desventajas del rango


Ventajas
Fcil de calcular
Fcil de entender e interpretar
Desventajas
Slo considera los valores extremos
No toma en cuenta ni el nmero de datos ni el valor
de estos
No es posible calcular en tablas con extremos
abiertos.
6.1.2 El rango intercuartlico
Permite ubicar el 50% de los datos que se encuentran
en el centro de la distribucin, es decir, el 25% de los
datos son menores al primer cuartil y tambin 25% de
los datos son mayores al tercer cuartil.

94

Jorge Crdova Egocheaga

Ejemplo:
La tabla muestra la experiencia (en aos) del personal
que labora en el Hospital Central.

E xp e rie nc ia
T rab ajad o re s
(ao s )
0 -3
18
4 -7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
T o tal
334
A) Entre qu valores se encuentra el 50% intermedio
de estos datos?
B) Cul es el rango intercuartlico?
50 %

25 %

25 %
Q3

Q1
Rango
Intercuartlico

Lugar Q1 = P25

25(334 )
= 83 .5 o se ubica en la 3ra clase
100

25(334) (60 + 1)
4
100
Q = 7.5 +

1
68

Q = 8.82 aos
1

95

Manual de Estadstica General

Lugar Q 3 = P75

75(334 )
= 250 .5o se ubica en la 5ta clase
100

75(334) (248 + 1)

100
Q = 15.5 +
4

3
40

A. El 50% de los trabajadores con experiencia


intermedia se encuentran entre 8,82 y 15,65 aos.
B. El rango intercuartlico es 6 aos 10 meses
aproximadamente
6.1.3 La desviacin cuartlica
Es una medida de variabilidad fcil de calcular. Es la
mitad del rango intercuartil. Mide la dispersin del 50%
central de las observaciones respecto a la mediana.
Es imposible tener una DC negativa. Es raro, pero
podra tener un valor igual a 0, en el caso que los
percentiles sean iguales (P75 = P25). Cuando mayor
sea la diferencia entre los percentiles, mayor ser el
valor de la DC.

DC =

P75 P25
2

Ejemplo:
Si P25 = 7,2

DC =

13,4 7,2
= 3,1
2

P75 = 13,4
Interpretacin:
50% central de las observaciones vara en 3,1 con
respecto a la mediana.

96

Jorge Crdova Egocheaga

6.1.3 La varianza
Es una medida de desviacin promedio con respecto a
la media aritmtica
a) Clculos a partir de datos no agrupados.
Para una muestra
n

(X x )
i =1

n 1

Para un poblacin
N

(X )

= i=1

Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma
siguiente:

x
8

Xi x

(X i x )

8 - 10 = 2

10
5

10 - 10 = 0
5 - 10 = 5

12

12 - 10 = 2

10

10 - 10 = 0

15

15 - 10 = 5

25

X = 60

x=

25

60
6

x = 10

(X i x ) = 0 (X i x )

= 58

97

Manual de Estadstica General


(X i x ) = 58
2

S =

(X i x )

n 1

58
2
S = 6 1 = 11.6

6.1.4 La desviacin estndar


Llamada tambin desviacin tpica representa la
variabilidad (o desviaciones) promedio de los datos
con respecto a la media aritmtica. Es la raz
cuadrada de la varianza, sea poblacional o muestral.
a) Clculos a partir de datos no agrupados
Para la muestra
n

S=

(Xi x )

i =1

n 1

para la poblacin
N

= 2 =

(X i )

i =1

Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la desviacin estndar.
8, 10, 5, 12, 10, 15

98

Jorge Crdova Egocheaga

Ya sabemos por el ejemplo anterior que S2 = 11,6


Entonces

S=

S = 11,6
S = 3,4 radiografias
6.1.5 El coeficiente de variacin
Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o ms
conjuntos de datos expresados en unidades diferentes
(peso: Kg. y libras).
a) Clculos a partir de datos no agrupados
Para la muestra:

CV =

s
100
x

Para la poblacin:

CV =

100

Ejemplo:
A continuacin se presentan las tarifas (en unidades
monetarias) de dos laboratorios de anlisis clnicos.
El laboratorio I tiene sus tarifas en soles y el
laboratorio II en dlares Cul de ellos tiene un plan
tarifario ms homogneo o estable?.

99

Manual de Estadstica General

Laboratorio I (soles)
40,70,60,48,52,65,58

Laboratorio II (dlares)
70,35,150,140,82,110,140,120

Calculamos la media y desviacin estndar por


cada una de los laboratorios
Laboratorio I
n

Xi
i =1

393
= 56.14
7

40

-1 6.1 4

2 60 .5 0

70

1 3.8 6

1 92 .1 0

60

3 .8 6

1 4.9 0

48

-8 .1 4

6 6.2 6

52

-4 .1 4

1 7.1 4

65

8 .8 6

7 8.5 0

58

1 .8 6

3 .4 6

Si (X i x ) = 632.86
2

S=

(X i

i =1

CV =

x )2

n 1

S
100
x
CV =

100

632 .86
= 10 .27
7 1

10.27
100 = 18 . 29
56.14

Jorge Crdova Egocheaga

Laboratorio II
n

Xi

= i=1

847
= 105.87
8

70

-3 5.87

12 86.6 569

35

-7 0.87

50 22.5 569

15 0

44 .13

19 47.4 569

14 0

34 .13

11 64.8 569

82

-2 3.87

56 9.77 69

11 0

4.1 3

17 .056 9

14 0

34 .13

11 64.8 569

12 0

14 .13

19 9.65 69

Si (X i x ) = 11372 .88
n

i =1

S=

CV =

(X i

i =1

n 1

S
100
x

x )2

11372 ,88
= 40 . 30
8 1

CV =

40,30
100 = 30 , 06
105,87

El Laboratorio II presenta una mayor variabilidad en


el plan tarifario.
6.2 MEDIDAS DE ASIMETRIA O SESGO
6.2.1 Coeficiente de Asimetra
Es un indicador del grado de asimetra que presenta
una distribucin.

101

Manual de Estadstica General

S kp =

3 ( X Md )
S

Valores posibles

3 asimetra
S kp =
+ 3 asimetra

negativa
positiva

Si Skp tiende a 3 la distribucin es asimtrica hacia la


derecha o asimetra positiva.
Si Skp tiende a -3 la distribucin es asimtrica a la
izquierda o asimetra negativa.
En distribuciones simtricas, no existe sesgo, es decir
Skp = 0.
En la prctica, el coeficiente de Asimetra de Pearson
vara entre -1 y +1
6.2.2 Coeficiente de Curtsis
Es una medida del grado de apuntalamiento,
generalmente comparada con el apuntalamiento de la
distribucin normal.

Ku =

0 , 5 ( P0 , 75 P0 , 25 )
P0 , 9 P0 ,1

Valores posibles
a) Leptocrtica (concentracin al centro): Si el grado
de apuntalamiento de una distribucin es mayor que
el de la distribucin normal. K 0,5
102

Jorge Crdova Egocheaga

b) Mesocrtica (distribuidos simtricamente): Si el


grado de apuntalamiento de una distribucin es
igual que el de la distribucin normal. K 0,25
c) Platicrtica
(aplanada).Si
el
grado
de
apuntalamiento de una distribucin es menor que el
de
la
distribucin
normal.
K 0,25
Platicurtica
0,0

Mesocurtica

Leptocrtica

0,25

0,50

Ejemplo:
La tabla muestra la edad (en aos) de 70 pacientes
atendidos en el servicio de emergencia de un
hospital local.

4
3
5
6
7
25
13
2
4
5

67
85
6
7
7
10
12
15
16
17

18
15
16
17
15
13
13
14
20
14

15
15
15
16
17
17
13
14
16
17

11
14
13
10
6
4
8
14
18
20

3
5
7
8
12
15
17
18
20
21

24
26
21
22
17
16
9
9
15
12

103

Manual de Estadstica General

A) Calcular e interpretar la asimetra de la


distribucin
B) Calcular e interpretar la curtosis de la
distribucin.
Los resultados han sido obtenidos usando Microsoft
Excel
Media aritmetica
Desviacion estandar
Mediana
Cuartil 1
Cuartil 3
Percentil 90
Percentil10

104

14.27
3(14,27 13,50 )
= 0,202
11.42 S kp =
11,42
13.50
7.00
0,5(17,00 7,00)
17.00 Ku = 23,00 4,00 = 0,263
23.00
4.00

CAPTULO

NOCIONES DE
PROBABILIDAD

OBJETIVOS
Al finalizar el Captulo 7, el participante ser capaz de:
1.
2.
3.

Aplicar los conceptos de experimento, espacio


muestral y evento.
Discutir los principios para asignar probabilidad.
Utilizar las reglas de probabilidad para plantear y
resolver un problema real.

Manual de Estadstica General

7.1 IMPORTANCIA DE LAS PROBABILIDADES


Las probabilidades estn presentes en nuestras vidas ms a
menudo de que podramos sospechar. Todos tenemos una
gran intuicin probabilstica.
Por ejemplo, en das lluviosos, fros y con mucha humedad
es alta la probabilidad de coger un resfro. Si ingerimos
alimentos en lugares poco higinicos, en ambulantes es muy
probable que contraigamos una infeccin estomacal.
Cmo es la probabilidad de ganar el premio mayor en
Tinka?. Muy baja, pues hay muchas alternativas en juego.
Pero an sabiendo esto, compramos uno que otro nmero.
La decisin creo yo que es racional.
Si escuchamos una prediccin de 80% que lluvia, y Ud. tiene
planeado un paseo al campo con la familia. Qu hace?. Lo
mas racional es que cancele su paseo y se quede en su
casa viendo en video.
7.2 CONCEPTOS BSICOS
(A) Experimento: Ejecucin voluntaria de un fenmeno.
Se caracteriza por:
Tener varios resultados posibles
Existir incertidumbre sobre el resultado
Ejemplos:
Lanzar una moneda
Seleccionar de un lote un frasco de medicamentos
Extraer una muestra de sangre a una persona
(B) Espacio Muestral: conjunto de todos los resultados
posibles de un experimento. Se simboliza por
(omega).

106

Jorge Crdova Egocheaga

Ejemplos:
Lanzar una moneda
= {cara, sello}
Seleccionar
de
un
lote,
un
medicamentos.
={adecuado, inadecuado}
Extraer una muestra de sangre a una
= {grupo sanguneo}

frasco

de

persona.

Ejemplo:
Se lanzan tres monedas simultneamente. Los ochos
resultados posibles de este experimento pueden
detallarse de manera conveniente mediante un
diagrama de rbol:
Primera
Moneda

Segunda
Moneda

C
C
S
C
S

Tercera
Moneda

C
S
C
S
C
S
C
S

Resultado
Posible

CCC
CCS
CSC
CSS
SCC
SCS
SSC
SSS

={CCC, CCS, CSC, CSS, SCC, SCS, SSC, SSS}


(C) Suceso: subconjunto del espacio muestral, seleccionado
de acuerdo a una condicin. Se representan por letras
latinas maysculas.

107

Manual de Estadstica General

Ejemplo:
Se lanzan dos dados. El espacio muestral de este
experimento es:
=

{ (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)


(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)
(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)
(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)
(6,1) (6,2) (6,3) (6,4) (6,5) (6,6) }

Podemos considerar los siguientes sucesos:


A:

la suma de puntajes es 7, es decir


A = {(1,6) (2,5) (3,4) (4,3) (5,2) (6,1)}

B:

la suma de puntajes es 11, es decir


B={(5,6) (6,5)}

C: la suma de puntajes es 7 u 11, es decir


C={(1,6) (2,5) (3,4) (4,3) (5,2) (6,1) (5,6) (6,5)}
7.3 PROBABILIDAD
(A) Concepto: Ponderacin asignada a cada punto muestral
que mide la verosimilitud de su ocurrencia.
(B) Principios para asignar probabilidad:

108

a)

La probabilidad de cada punto muestral debe estar


entre 0 y 1

b)

La suma de las probabilidades de todos los puntos


muestrales deben ser iguales a 1.

Jorge Crdova Egocheaga

0,5

Improbable

Tan probable
como improbable

1
Probable

Ejemplos:
1. Se lanza una moneda
={cara, sello}
P(cara) = 0,5

P(sello) = 0,5

2. Se lanzan 3 monedas
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
1/8 1/8 1/8 1/8 /8 1/8 1/8
1/8
A: obtener exactamente 2 caras
A = {CCS, CSC, SCC}
1/8 + 1/8 + 1/8
P(A) = 3/8
(C) Conclusiones: De acuerdo a la definicin de
probabilidad de un suceso, y a los dos principios,
tenemos las siguientes conclusiones:
(1) P() = 1
(2) P( ) = 0
(3) P(A) = 1 - P(A)
PROBABILIDADES - EJEMPLOS
1.

Un investigador trabaja con un nuevo frmaco para


insensibilizar a los pacientes frente a picaduras de abejas.
De 200 sujetos sometidos a prueba, 180 presentaron una

109

Manual de Estadstica General

disminucin en la gravedad de los sntomas tras sufrir una


picadura, despus de ser sometidos al tratamiento.
2.

Un paciente sufre de clculos renales, y no se ha


conseguido mejora alguna a partir de mtodos ordinarios. Su
medico sta plantendose el llevar a cabo una intervencin
quirrgica y debe responder a la siguiente pregunta: Cul
es la probabilidad de que la operacin sea un xito?.

PROBABILIDAD DEL PUNTO ESTADISTICO


Quien emplea la estadstica aplicada prefiere pensar en la
probabilidad como el numero de veces en las que se presentar
determinada situacin si una experiencia fuera repetida
indefinidamente en situaciones de naturaleza repetitiva o que
pudiera concebirse de esa manera
7.4 REGLAS DE PROBABILIDAD
7.4.1 Regla de la Adicin

(A B)
U

P(AUB) = P(A) + P(B) - P(A B)


Ejemplo:
Un cliente ingresa a una farmacia. La probabilidad de
que compre (a) un antibitico es 0,60 (b) analgsico
110

Jorge Crdova Egocheaga

0,50, y c) antibitico y analgsico es 0,30 Cul es la


probabilidad de que compre un antibitico, analgsico
o ambos?.
Datos
P(P) = 0,60
P(L) = 0,50
P
= 0,30
P(PUL) = P(P) + P(L)
P(PUL) = 0,60 + 0,50 - 0,30
P(PUL) = 0,80
Regla de adicin para sucesos mutuamente
excluyentesDos
sucesos
son
mutuamente
excluyentes, si no tienen elementos comunes

P(AUB) = P(A) + P(B)

Si : (A B) =
Por lo tanto : P(A B) = 0
U
U

Ejemplo:
Se extrae una carta de una baraja. Cul es la
probabilidad de que sea un as o un rey?

P(AUR) = P(A) + P(R)


4
P(A) =
52
4
P(R) =
52

4 4
+
52 52
8
=
52
=

111

Manual de Estadstica General

Ejemplo 1: Se dispone de 11 historias clnicas,


pertenecientes a pacientes masculinos y femeninos
agrupados por su nivel de hemoglobina.

(Masculino)

(Blanca)

Total

A (Anmico)

N (Normal)

11

Estado

Total

a) Cul es la probabilidad de extraer una historia


perteneciente a un paciente anmico?
8
P(A) =
11
b) Cul es la probabilidad de extraer una historia
correspondiente a un paciente anmico y que sea
mujer?
3
P(A I F) =
11
Dado que la historia corresponde a un paciente
anmico, cul es la probabilidad que sea mujer?

P(F

)= 3
8

Derivacin de la frmula:

P (F

)=

P(F I B)
P(A)

Comprobando

P(F

112

) = 811
11

Jorge Crdova Egocheaga

P (F

)= 3
8

Ejemplo 2
Se recolect informacin sobre el peso del recin
nacido y si la madre fum o no durante el embarazo.
Los datos se presentan a continuacin:
CONDICIN

PESO R.N.

TOTAL

DE FUMADORA

BAJO

NORMAL

SI

30

10

40

NO

20

140

160

TOTAL

50

150

200

A. Cul es la probabilidad que el recin nacido tenga


bajo peso?

P(bajo) =

50
= 0,25
200

B. Cul es la probabilidad que una gestante fume?

P(si) =

40
= 0,20
200

C. Cul es la probabilidad que el nio seleccionado


tenga un peso normal?
150
= 0,75
P(normal) =
200
D. Cul es la probabilidad de que un recin nacido
tenga bajo peso o sea normal?
Como son mutuamente excluyentes:

113

Manual de Estadstica General

P(bajonormal) = P(bajo) + P(normal)


=

50
150
+
200
200

= 1

E. Cul es la probabilidad de que el recin nacido


tenga bajo peso o la madre haya fumado durante el
embarazo?
P(bajosi ) = P(bajo ) + P( si) P(bajoysi )
=

50
40
30
60
+

=
= 0,30
200 200 200 200

Aplicacin
La probabilidad de que el personal administrativo que
labora en una clnica local, llegue tarde el da lunes es
0,50 y la probabilidad de que llegue retrasado los das
lunes y martes es 0,20. Dado que cierto trabajador
lleg tarde el da lunes, cul es la probabilidad de
que llegue tarde el da siguiente?.
P (TM

P(TL ) = 0,50

P(T L I TM ) = 0,20

A partir de

P(A I B)
)
=
A
P(A)

Se despeja

( A)

P( A I B) = P( A) P B

114

) = P(T

M I TL )
P(TL )

7.4.3 Regla de la Multiplicacin

P( B

TL

0,20
= 0,40
0,50

Jorge Crdova Egocheaga

Aplicacin
Se sabe que en un lote de medicamentos de 50
frascos, hay 4 que no estn adecuadamente
empacados (defectuosos). Si se extraen al azar 2
frascos, uno a continuacin del otro, cul es la
probabilidad de que ambos sean defectuosos?.
P(D1 ) =
P(D 2

D1

4
50

)=

P ( D1 I D 2 ) = P ( D1 ) P D 2

3
49

D1

4
3
12

=
50 49 2450

Ejercicio
En una poblacin de pacientes hospitalizados, la
probabilidad de que uno de ellos, elegido
aleatoriamente tenga problemas cardiacos es 0,35. La
probabilidad de que un paciente con problemas
cardiacos sea un fumador es de 0,86. Cul es la
probabilidad de que el paciente elegido al azar de
entre la poblacin sea fumador y tenga problemas
cardiacos?.
Regla
de
la
independientes.

multiplicacin

para

sucesos

Los sucesos A y B se consideran independientes


cuando la ocurrencia de uno no influye sobre la
probabilidad de ocurrencia del otro; esto significa que,
independientemente de que A haya ocurrido o no, la
probabilidad asignada a B es siempre la misma.

P (B

) = P (B)

Cul es la probabilidad de que en una familia con


dos hijos, ambos sean varones?
115

Manual de Estadstica General

Ejemplo 1:
La Compaa de Seguros JL ha desarrollado un
novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.
Entonces:

P ( A I B ) = P ( A) P ( B )
Ejemplo
Cul es la probabilidad de que en una familia con
dos hijos, ambos sean varones?

P (V1 ) = 0,5
P (V2 ) = 0,5

P ( V1 I V2 ) = P ( V1 ) P ( V2 )
= (0,5) (0,5)
P ( V1 I V2 ) = 0,25

7.4.4 El teorema de Bayes


Consiste en una particin de la probabilidad total.

116

Jorge Crdova Egocheaga

Ejemplo 1:
La Compaa de Seguros JL ha desarrollado un
novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.
Dado que el producto de la Compaa JL tuvo xito,
cul es la probabilidad de que la firma competidora
haya comercializado su novedoso plan de seguro?
Solucin:
P(C)
= probabilidad de que
competidora comercialice el producto,

la

compaa

P(C) = probabilidad de que la compaa competidora


no comercialice el producto,
P(E) = probabilidad de que el plan de seguro familiar
de la compaa JL tenga xito.
P. Marginal

=0
P( C )

,40

P(C
) =
0,6
0

P. Condicional

P. Conjunta

P(E/C) = 0,30 P ( C I E) = 0,40 0,30 = 0,12

'
P(E/C) = 0,80 P ( C I E) = 0,60 0,80 = 0,48

P. Total P ( E) = 0,60

Luego, de acuerdo con el Teorema de Bayes


117

Manual de Estadstica General

P (C

)=
E

P ( C I E)
P ( C I E) + P ( C ' I E)

0 .12
0 .12
=
= 0 .20
0 .12 + 0 .48 0 .60

La probabilidad que la compaa de seguros haya


participado en el mercado, dado que JL tuvo xito es
de 0,20.
Ejemplo 2
El Director de la Clnica Santa Teresa est
considerando comprar un lote de 10000 equipos de
venoclisis de un proveedor nacional. El fabricante de
estos equipos estima la proporcin de equipos
defectuosas en el lote, en la siguiente forma.

Proporcin de
piezas defectuosas ()

Probabilidad
P()

1 = 0,10

P(1) = 0,20

2 = 0,15

P(2) = 0,30

3 = 0,25

P(3) = 0,50

Esto significa que el proveedor no est seguro acerca


de la proporcin de equipos defectuosos en el lote, sin
embargo, basndose en experiencias anteriores, cree
que hay una probabilidad de 0,20 de que el lote tenga
10% de piezas defectuosas, una probabilidad de 0,30
de que tenga 15%. Y finalmente, de 0,50 de que tenga
25% de piezas defectuosas. Supongamos que elige
un equipo de venoclisis al azar en el lote:

118

Jorge Crdova Egocheaga

A) Cul es la
defectuosa?

probabilidad

de

qu

esta

sea

B) Dado que el equipo resulta defectuoso, cul


es
la probabilidad de que el lote tenga 25% de piezas
defectuosas?
P. Condicional

P. Marginal

P(D/1)= 0,10

P ( 1 I D) = 0,20 0,10 = 0,0200

P(

1)

0,
20

1=0,10

P. Conjunta

P(2) = 0,30 =0,15


2

P(D/2)= 0,15

P ( 2 I D) = 0,30 0,15 = 0,045

P(
)=
3
50
0,

P(D/3)= 0,25
3=0,25

P ( 3 I D) = 0,50 0,25 = 0,1250

P ( D) = 0,1900
Respuesta A:
Hay tres maneras posibles de obtener un equipo
defectuosa del lote. Por lo tanto, la probabilidad de
obtener una pieza defectuosa, cualquiera que se la tasa
porcentual de defectuosos 10, 15 25 es:

P( D) = P( 1 I D) + P( 2 I D) + P( 3 I D)

= 0,0200 + 0,0450 + 0,1250


= 0,19

119

Manual de Estadstica General

Ejercicio B
De acuerdo con el Teorema de Bayes, la probabilidad
de que el lote contenga 25% de piezas defectuosas,
dado que la pieza elegida es defectuosa, es:

P( 3 / D) =

P( 3 I D) 0.1250
=
= 0.6579
P(D)
0.1900

Ejercicio
Un mdico ha decidido recetar dos nuevos
medicamentos a 200 pacientes enfermos del corazn de
la manera siguiente: 50 pacientes tomarn el
medicamento A, otros 50 tomarn el medicamento B y
los otros 100 restantes tomarn ambos medicamentos
El medicamento A reduce la probabilidad de un infarto
en 0,35 , el medicamento B reduce la probabilidad de un
infarto en 0,20 y los dos medicamentos, cuando se les
toma juntos, actan de manera independiente.
Los 200 pacientes fueron escogidos entre los que tenan
0,80 de probabilidad de sufrir un infarto. Si un paciente
elegido al azar sufre un infarto, cul es la probabilidad
de que haya tomado ambos medicamentos?

120

CAPTULO

DISTRIBUCIONES
DE
PROBABILIDADES
OBJETIVOS
Al finalizar el Captulo 8, el participante ser capaz de:
1.
2.
3.
4.

Identificar las distribuciones de probabilidad que


ms se utilizan en la toma de decisiones.
Utilizar el concepto de valor esperado para la toma
de decisiones.
Mostrar cul distribucin de probabilidad utilizar, y
como encontrar sus valores.
Comprender las limitaciones de cada una de las
distribuciones que utilice.

Manual de Estadstica General

8.1 TECNICAS DE CONTEO


Combinacin:
Es una seleccin de objetos con independencia en su
ordenamiento.
Ejemplo:
Un bilogo dispone de 10 plantas para un experimento. Slo
ocho son necesarias para realizarlo. Las ocho plantas
necesariamente son seleccionadas aleatoriamente.
Permutacin:
Es una distribucin de objetos en un orden determinado.
Ejemplo:
El numero del DNI.
PERMUTACIN
Clculo del nmero de permutaciones para n objetos
tomados de x

Pxn =

n!
donde x n
(n x)!

Ejemplo:
Los bilogos estn interesados en el orden en que cuatro
ribonucletidos adenina (A), uracilo (U), guanina (G) y
citosina (C) se combinan para formar una cadena. Cuntas
cadenas formadas por dos nucletidos pueden formarse?

122

Jorge Crdova Egocheaga

4!
4x3x2x1
P =
=
= 12
(4 2)!
2 x1
4
2

Hacer
Hacerun
undiagrama
diagramade
derbol
rbol
para
paraindicar
indicarlas
las12
12cadenas
cadenas

COMBINACIN
Numero de combinaciones de n objetos tomadas de r

C xn =

n!
donde x n
x !( n x ) !

Ejemplo:
Se realiza un estudio para determinar la opinin de los
profesores de la EPUNFV respecto al aborto; si se elige una
muestra de cuatro profesores de un total de 45. Cuntas
muestras distintas pueden seleccionarse
C 445 =

45!
45 x 44 x 43 x 42 x 41! 45 x 44 x 43 x 42
=
=
= 148, 995
4!(45 4)!
4! x 41!
4!

8.2 LAS DISTRIBUCIONES DE PROBABILIDAD


(A) Concepto: Es una distribucin de frecuencias terica
que describe la forma en que se espera que varen los
resultados.
Resultan tiles para realizar inferencias y tomar
decisiones bajo incertidumbre.
Ejemplo:
Se seleccionan en forma consecutivas dos bebes del
servicio de Neonatologa . El nmero de varoncitos ser:

123

Manual de Estadstica General


N de
Resultados Probabilidad
varones
0
V,V
0,25
1
VM,MV
0,50
2
MM
0,25

Probabilidad

0.50

0.25

(B) TIPOS DE DISTRIBUCIONES


DISCRETAS: La variable toma un nmero
valores. Abarca :

limitado de

- Distribucin binomial
- Distribucin de Poisson
- Distribucin hipergeomtrica
CONTINUAS: La variable puede tomar cualquier valor
dentro de un intervalo dado. Abarca:
- Distribucin normal
- Distribucin normal estndar o Z
- Distribucin t
2
- Distribucin Ji-cuadrada
- Distribucin F
8.3 VARIABLES ALEATORIAS
Una variable es aleatoria si toma diferentes valores como
resultado de un experimento .
Puede ser discreta o continua
Ejemplo: Se lanzan 3 monedas
X : variable aleatoria (ej : nmero de caras)
x : valores que puede tomar la variable
(ej : 0, 1, 2, 3)
124

Jorge Crdova Egocheaga

Esperanza matemtica : E (X)


Es el promedio de la variable aleatoria, si el experimento se
repite un nmero infinito de veces.
Ejemplo : Se lanzan 3 monedas
1/8
1/8
1/8
1/8
1/8
1/8
1/8
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
3 caras.

2 caras

P(x) XP(x)
0
1
2
3

1/8
3/8
3/8
1/8

0
3/8
6/8
3/8

1/8

1 cara
( X) =

XP( x )

12
8

= 1,5

12/8

Aplicacin: uso del valor esperado y las prdidas monetarias.


Supongamos que un distribuidor de medicinas muy que
rpidamente se deterioran (vacunas) compra cada cajita a
20 u.m. y las vende a 50 u.m.. No puede especificar el
nmero de cajitas que le solicitarn diariamente, pero
dispone de los siguientes datos:

Ventas
diarias
10
11
12
13

N de das
de venta
15
20
40
25
100

Probabilidad de venta
de cada cantidad
0.15
0.20
0.40
0.25
1.00

Tipo de prdidas

125

Manual de Estadstica General

(A) Prdidas por mermas (obsolescencia):


oferta > demanda (costo contable)
(B) Prdidas de oportunidad: oferta < demanda
(costo econmico)

Posibles N
de cajitas
pedidas/da
10
11
12
13

Alternativas de oferta
10

11

12

13

0
30
60
90

20
0
30
60

40
20
0
30

60
40
20
0

Clculo de la prdida esperada


Para un stocks de 10 cajitas, la prdida esperada ser:

Posibles N
de cajitas
pedidas/da
10
11
12
13

Probabilidad
Prdida
que se reciban
Condicional
estos pedidos
0
30
60
90

Prdida
esperada

0.00
0.15
6.00
0.20
24.00
0.40
22.50
0.25
Prdida esperada: 52.50

Solucin ptima: analizar otros tamaos de stocks y decidir


por aqul que genere la menor perdida

126

Jorge Crdova Egocheaga

8.4 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD


8.4.1 La distribucin binomial
Se utiliza para describir variables discretas.
Es una de las distribuciones mas utilizadas en la
estadstica aplicada. La distribucin se deriva de un
procedimiento llamado ensayo de Bernoulli, nombrado
as en honor del matemtico Suizo James Bernoulli
(1654 - 1785)
a) Caractersticas:
El experimento consiste en una serie de ensayos
repetidos.
Cada ensayo slo tiene dos resultados posibles:
xito y fracaso.
La probabilidad de xito, designado por p es la
misma para cada ensayo, la probabilidad de fracaso
q (igual a 1-p) es tambin constante.
1. Los ensayos sucesivos son independientes.
2. Puede ser simtrica o sesgada.
3. La informacin de la muestra se obtiene
con reposicin de una poblacin finita.
b) Frmula

P(X = x) =

n!
p xq n-x
x! (n - x)!

donde:
n : nmero de ensayos
x : nmero de xitos
p : probabilidad de xitos en un ensayo
q : probabilidad de fracaso en un ensayo
n - x : nmero de fracaso en el ensayo
Se aplica a la seleccin de una muestra, slo
cuando el resultado de cada solucin es
127

Manual de Estadstica General

independiente de los resultados de las selecciones


anteriores.
c) Aplicacin:
Una muestra de 4 frascos se selecciona sin
restitucin de un lote de 5,000 frascos de cierto
laboratorio farmacutico. Suponiendo que 20% de
los frascos de lote no cumplen con las
especificaciones mdicas, cul es la probabilidad
de que la muestra contenga exactamente 2 frascos
malos?
Datos:
n=4
x=2
p = 0,20
q = 0,80

P(X = x ) =

n!
p xq n-x
x! (n - x )!

P(X = 2) =

4!
(0.2 )2 (0.80 )2
2! (4 - 2)!

= 0,1536
Ejercicio
La escasez de glbulos rojos puede determinarse
examinando al microscopio una muestra de sangre.
Suponiendo que un volumen pequeo contenga por
trmino medio 4 glbulos rojos en personas
normales, cul es la probabilidad de que una
muestra de personas normales:

128

Jorge Crdova Egocheaga

contenga exactamente tres glbulos rojos?


Ninguno tenga glbulos rojos?
d) La distribucin
Cierto proceso mdico se repite cuatro veces.
Suponga que existe la probabilidad de 0.50 que el
proceso resulte deficiente. En cuatro repeticiones se
puede obtener 0,1,2,3 4 procesos deficientes. Se
puede calcular la probabilidad de cada uno de estos
posibles resultados mediante la distribucin
binomial.
X
(Nmero de
procesos deficientes)

P(X = x )

4! 1 1
= 116
0!4! 2 2

4! 1 1 4
= 16
1!3! 2 2

4! 1 1
= 6 16
2!2! 2 2

4! 1 1 4
= 16
3!1! 2 2

4! 1 1
= 116
4!0! 2 2

A estos resultados se denomina distribucin de


probabilidad.
e) La media y la desviacin estndar
Consideramos la distribucin del ejemplo anterior
(p = 1/2, n = 4)

X
P(X = x )

0
1/16

1
4/16

2
3
6/16 4/16

4
1/16

129

Manual de Estadstica General

La media

= XP ( x)
X

P(x)

XP(x)

0
1
2
3
4

1/16
4/16
6/16
4/16
1/16

0
4/16
12/16
12/16
4/16
32/16

32

XP ( x ) = 16

= 2 procesos

Tambin:
= np
= 4( 1 2 ) = 2

Interpretacin: Si seleccionamos 4 procesos mdicos al


azar, se espera encontrar 2 procesos deficientes, si este
experimento se repite un nmero infinito de veces.
La desviacin estndar

(x )

P( x)

P( x )

(x )

(x )2

( x ) 2 P( x)

0
1
2
3
4

1/16
4/16
6/16
4/16
1/16

-2
-1
0
+1
+2

4
1
0
1
4

4/16
4/16
0
4/16
4/16
16/16

2
(X ) P( x) =

= (X ) 2 P( x) =

130

16
16
16
= 1 proceso deficiente
16

Jorge Crdova Egocheaga

Tambin

=
=

npq
4 ( 0,5 )( 0 ,5) = 1

La distribucin binomial (p = 1/2, n = 4) tiene una media


de 2 y una desviacin estndar de 1.
Ejemplo
La Dra. Jimnez, Directora de Control de Calidad de un
gran hospital, se encuentra realizando su revisin
mensual a los procesos de emergencia peditrica. En el
procedimiento, se seleccionan 10 procesos y se les
analiza en busca de deficiencias administrativas. A lo
largo del tiempo,
slo 2% de las emergencias
peditricas
registran
deficiencias
administrativas
(suponga que las deficiencias se presentan de manera
independiente en diferentes procesos).

Cul es la probabilidad de que la muestra del


Dra. Jimnez contenga ms de dos procesos
con deficiencias administrativas?
Cul es la probabilidad de que en ninguno de los
procesos
seleccionados
registre
deficiencia
administrativa?

Ejemplo:
Supngase que en cierta poblacin el 52 por ciento de
todos los nacimientos que se registraron son varones. Si
aleatoriamente se escogen cinco registros de
nacimientos dentro de esa poblacin, cul es la
probabilidad de que exactamente tres de ellos
pertenezcan a varones?.

131

Manual de Estadstica General


P = 0.52
q = 1 - 0.52 = 0.48
n=5

P(3,5) =

r=3

5!
0.523 0.48(5 3) = 0.32 32%
3!(5 3)!

Uso de Tablas
Solucionando el problema anterior usando la tabla de
probabilidades binomiales
ta bla de proba bilida de s binom ia le s

p
n

0.37

0.38

0.39

0.40

0.41

0.42

0.43

0.44

0.45

0.46

0.47

0.48

0.49

0.50

0.0380

1
2
3
4
5

0.1755
0.3240
0.2990
0.1380
0.0255

4
3
2
1
0

0.63

0.62

0.61

0.60

0.59

0.58

0.57

0.56

0.55

0.54

0.53

0.52

0.51

0.50

La probabilidad de tener 3 inscritos varones de 5


registros realizados es del 0.324 o 32.4%.
8.4.2 Distribucin de Poisson:
Es una distribucin muy usada en medicina y biologa.
Se deriva del proceso de Poisson en honor al
matemtico francs Simeon Denis Poisson (17811840).
Debe cumplir las siguientes condiciones:
La ocurrencia de los eventos son independientes.
El nmero promedio de veces (l) que ocurre un
xito por cada unidad de tiempo o de espacio es
constante.

132

Jorge Crdova Egocheaga

La probabilidad de un suceso es una unidad de


tiempo o de espacio muy pequea.Ejemplos de
aplicaciones de Poisson:
Pacientes que llegan a la sala de urgencias de un
hospital durante un cierto da.
Defectos de un rollo de gasa.
Accidentes por hora en cierta parte de una
carretera.
Clientes que llegan a la caja registradora de una
farmacia en un determinado horario.
Si el tamao de la muestra es bastante grande (n>50) y
la probabilidad de un evento particular es muy pequeo
(p < 0,1) y se desea hallar la probabilidad de un nmero
determinado de xitos, se puede aplicar la distribucin
de Poisson, dada por la siguiente ecuacin.

P(X = x ) =

e
x!

donde

(lambda): media = np = variancia


: base de logaritmos naturales =2.71828

x!

Ejemplo:
Supongamos que estamos investigando la seguridad de
una peligrosa interseccin de calles, los registros
policacos indican un media de 5 accidentes mensuales
en esta interseccin. El nmero de accidentes esta
distribuido de acuerdo con una distribucin de Poisson y
el departamento de seguridad vial desea que
calculemos la probabilidad de que en cualquier mes
ocurra exactamente 3 accidentes.

133

Manual de Estadstica General


X = 3 acc/mes

P( x =3) =

= 5 acc/mes

53 2.71835
= 0.14042 14.04%
3!

Uso de Tablas
Solucionando el problema anterior usando la tabla de
distribucin de probabilidades de Poisson:

4 .1

.........

4 .5

..........

4 .9

0 .0 0 6 7

0 .0 3 3 7

0 .0 8 4 2

0 .14 0 4

0 .17 5 5

0 .17 5 5

La probabilidad de tener exactamente 3 accidentes en


un mes cualquiera es 0.1404
Aplicacin
La probabilidad de nmero equivocado a pesar de
haber marcado correctamente es 0,03. Si se toma una
muestra de 100 llamadas, cul es la probabilidad de
tener 2 nmero equivocado?
Solucin:
p = 0.03
n = 100

=3

134

P(X = 2 ) =

3 2 ( 2.71828) 3
2!

= 02240

Jorge Crdova Egocheaga

La aproximacin de Poisson a la distribucin Binomial


Consideremos una distribucin binomial con p=0.02 y
n = 100. Supongamos que nos interesa calcular la
probabilidad de que X = 3 utilizando la formula binomial,
podemos encontrar la probabilidad exacta de la forma
siguiente:
P(X = 3) =

100!
( 0,02 ) 3 ( 0,98 ) 97
3! 97!

= 0,1823

Los clculos son muy tediosos. Cuando p es pequeo y


n es lo suficientemente grande, la formula binomial
puede aproximarse mediante una distribucin de
Poisson con = np
Luego, utilizando una distribucin de Poisson
encontramos que la probabilidad de que X=3 es:

x e
P(X = 3) =
x!

= np = 100 (0,02) = 2

( 2 ) 3 ( 2 , 71828 ) 2
8
=
= 0 ,1805
3!
6 ( 2 , 71828 ) 2

La respuesta es muy prxima a la encontrada con la


distribucin binomial. La aproximacin se considera
vlida cuando

p 0.05 y n 20

135

Manual de Estadstica General

8.4.3 La distribucin hipergeomtrica


Se utiliza para describir variables discretas
a) Caractersticas
La informacin de la muestra se obtiene sin
reposicin de una poblacin finita, por lo tanto la
probabilidad de xito vara.
b) FormulaDonde

M N M

k n k

P(X = k ) =
N

n

donde:
M : nmero de xitos en la poblacin
k : nmero de xitos en la muestra
N : tamao de la poblacin
N-M: nmero de fracasos en la poblacin
n : tamao de la muestra
n-k : nmero de fracasos en la muestra

c) Aplicacin
Calcular la probabilidad de obtener 10 tubos
defectuosos en una muestra de 20 tubos de radio
tomados sin reemplazo de un lote de 30 tubos, de lo
cuales 15 son defectuosos.
Datos:
k = 10
n = 20
N= 30
M= 15

15 30 15

10 20 10

P(X = 1 0) =
30

20
=
136

( 3003 )( 3003 )
9018009
=
30045015
30045015

= 0 ,3001

Jorge Crdova Egocheaga

Si errneamente se usa la distribucin binomial con


n = 20 y p =15/30 = 1/2 para calcular la probabilidad
de tener 10 defectuosos, el resultado ser:

P(X = x ) =
=

( )( )

10
10
20!
1
1
2
10! (20 - 10)! 2

184756
= 0 ,1762
1048576

Una probabilidad considerablemente menor que la


probabilidad real.
d) Forma
Puede ser simtrica o sesgada. Cada vez que p =
0.5, la distribucin hipergeomtrica ser simtrica
sin tener en cuenta qu tan grande o pequeo sea
el valor de n; sin embargo, cuando p 0,5 la
distribucin ser sesgada. El grado de sesgo
variar, dependiendo de la proximidad del p a 0,5 y
del tamao de n.
e) La media y la desviacin estndar
La media:
La desviacin estndar:

Donde

np (1 p )

N n
N 1

N n
N 1

137

Manual de Estadstica General

es un factor de correccin de poblacin finita que se


produce debido al proceso de muestreo sin
reposicin de poblaciones finitas.
9.4 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
9.4.1 La distribucin normal
Tambin conocida como campana de Gauss en honor
al matemtico Karl Gauss ( siglo 19).
Es importante por:
Es muy aplicable para inferencia estadstica
Se ajusta (casi) a las distribuciones de frecuencias
reales observadas.
Se utiliza para describir el comportamiento de una
variable continua.
(a) Caractersticas
Tiene un slo pico (unimodal). Forma acampanada.
La media cae en el centro
La media, media y moda coinciden
Es asinttica al eje horizontal

138

Jorge Crdova Egocheaga

b) Frmula
La funcin de densidad: f(x), para la distribucin
normal tiene la siguiente formula:
donde:
e : constante matemtica: 2.71828
p
:constante matemtica: 3.14159
m : media de la poblacin
s
: desviacin estndar de la poblacin
x
: cualquier valor de la variable aleatoria
continua
Areas debajo de la curva normal
No importa cuales son los valores de m y s, para una
distribucin de probabilidad normal el rea total bajo
la curva es 1.00, de manera que podemos pensar en
reas bajo la curva como si fuesen probabilidades.
Matemticamente es verdad que:
1: Aproximadamente 68% de todos los valores de una
poblacin normalmente distribuida se encuentra
datos 1 desviacin estndar de la
media .

6 8 % d a to s
2: Aproximadamente 95.5% de todos los valores de
una poblacin normalmente distribuida se encuentra
datos 2 desviacin estndar de la media.

139

Manual de Estadstica General

+ 2

94.6% datos
3: Aproximadamente 99.7% de todos los valores de
una poblacin normalmente distribuida se encuentra
datos 3 desviacin estndar de la media

+ 3

9 9 % d a to s
8.5.2 La distribucin normal estndar (Z)
La distribucin normal tiene diferente y para
calcular probabilidades habra que integrar la funcin
de densidad. Por este motivo se estandariza la
variable.
La estandarizacin es un proceso estadstico que
consiste en restar la media a la variable y el resultado
dividirlo por la desviacin estndar.

140

Jorge Crdova Egocheaga

Z=

La tabla de distribucin normal estndar, es la siguiente:


z

0 .0 0

0 .0 1

0 .0 2

0 .0 3

0 .0 4

0 .0 5

0 .0 6

0 .0 7

0 .0 8

0 .0
0 .1
:
:
1 .1
1 .2
:
:
2 .4
2 .5
:

0 .0 0 0 0
0 .0 3 9 8
:
:
0 .3 6 4 3
0 .4 0 3 2

0 .0 0 4 0
0 .0 4 3 8
:
:
0 .3 6 6 5
0 .4 0 4 9

0 .0 0 8 0
0 .0 4 7 8
:
:
0 .3 6 8 6
0 .4 0 6 6

0 .0 1 2 0
0 .0 5 1 7
:
:
0 .3 7 0 8
0 .4 0 8 2

0 .0 1 6 0
0 .0 5 5 7
:
:
0 .3 7 2 9
0 .4 0 9 9

0 .0 1 9 9
0 .0 5 9 6
:
:
0 .3 7 4 9
0 .4 1 1 5

0 .0 2 3 9
0 .0 6 3 6
:
:
0 .3 7 7 0
0 .4 1 3 1

0 .0 2 7 9
0 .0 6 7 5
:
:
0 .3 7 9 0
0 .4 1 4 7

0 .0 3 1 9
0 .0 7 1 4
:
:
0 .3 8 1 0
0 .4 1 6 2

Cuando Z=1.27 entonces el rea vale: .....

= 2.5

= 10

15

141

Manual de Estadstica General

Ejercicio:
Un terapista fsico piensa que los puntajes en una
prueba de destreza manual tiene una distribucin
aproximadamente normal, con una media de 10 y una
desviacin estndar de 2,5. Si a un individuo, elegido
aleatoriamente, se le aplica el examen, cul es la
probabilidad de que logre un puntaje de 15 o mas
puntos?.
Obtenemos la siguiente informacin:

= 10

= 2.5

Calculando Z:

z=

= 2.5
15 10
=
=2
2.5

Para Z=2, buscamos en la tabla cual es la


probabilidad (o rea) que le corresponde:

= 10 15

rea = .4772
Como deseamos conocer esta rea:

= 2.5

P ( x 15) = 0.5 0.4772 = 0.0228 2.28%


= 10 15

Cul es la probabilidad de que se logre un pontaje


entre 11 y 14?
Calculando Z:

Cuando x = 11 z =

11 10
= 0.4 A = 0.1554
2.5

Cuando x = 14 z =

14 10
= 1.6 A = 0.4452
2.5
11 14

142

Jorge Crdova Egocheaga

El rea sombreada se encuentra restando del rea


mayor (0.4452) el rea menor (0.1554)

P (11 x 14) = 0.4452 0.1554 = 0.2898 28.98%


Aplicaciones
Una empresa aplica un programa de entrenamiento
diseado para mejorar la habilidades de supervisin en
los diferentes procesos que se desarrollan en un
hospital. Debido a que el programa es autoadministrado,
los supervisores requieren un nmero diferente de horas
para concluirlo Un estudio de los participantes anteriores
indica que el tiempo medio que se lleva completar el
programa es de 500 horas y que esta variable aleatoria
normalmente distribuida tiene una desviacin estndar
de 100 horas.
Pregunta 1. Cul es la probabilidad de que un
participante elegido al azar requiera ms de 500 horas
para completar el programa?
Solucin:
En la figura, podemos ver que la
mitad del rea bajo la curva est
localizada a ambos lados de la
media de 500 horas. Por lo tanto
podemos
deducir
que
la
probabilidad de que la variable
aleatoria tiene un valor mayor a
500 es el rea sombreada, es
decir, 0.5.

P(X>500)=0.5

Pregunta 2:Cul es la probabilidad de que un


supervisor elegido al azar se tome entre 500 y 650
horas para completar el programa de entrenamiento.

143

Manual de Estadstica General

P(500 X 650)=0.4332

Z=

Z=

Solucin:
La grfica se muestra la
respuesta
como
zona
sombreada, representada por
el rea entre la media (500
horas) y el valor de X, en el
cual estamos interesados
(650 horas). Estandarizando
la variable tenemos un valor
para Z

650 500
= 1.5
100

Si buscamos Z = 1.5 en la tabla, encontraremos una


probabilidad de 0,4332. En consecuencia, la
probabilidad de que un candidato escogido al azar
requiera entre 500 y 650 horas para terminar el
programa de entrenamiento es ligeramente mayor a 0,4
Pregunta 3:Cul es la probabilidad de que un
supervisor elegido al azar se tome ms de 400 horas en
completar el programa?
Solucin:
Estamos interesados en el rea a la derecha de 700.
Estandarizamos

Z=
Z =

144

700 500
=2
100

P(X >700)= 0..0228

Jorge Crdova Egocheaga

Tabla: si Z = 2.0 Area: 0.4772


En consecuencia, la probabilidad mayor a 700 ser
0,5 - 0,4772 = 0,0228
Por lo tanto hay un poco ms de 2 oportunidades en 100
de que un participante elegido al azar se lleve ms de
700 horas en completar el curso.
Pregunta 4:Suponga que el director del programa desea
saber la probabilidad de que un participante escogido al
azar requiera entre 550 y 650 horas para completar el
trabajo requerido en el programa.
Solucin:
Primero calculamos el valor de Z para 650

Z=

650 500
= 1 .5
Z=
100

P(550 X 650)

A
este
valor
le
corresponde un rea
de 0,4332
Despus calculamos un valor de Z para 550

Z=
Z=

550 500
= 0.5
100

Correspondindole un rea de 0,1915

145

Manual de Estadstica General

Para responde la pregunta debemos


estar restar las reas:
Probabilidad de que la variable aleatoria
est entre la media y 650 horas

0,4332

(-) Probabilidad de que la variable aleatoria


est entre la media y 550 horas

0,1915

(=) Probabilidad de que la variable aleatoria


est 550 y 650 horas

0,2417

As pues, la probabilidad de que un supervisor elegido al


azar se tome entre 550 y 650 horas para completar el
programa de entrenamiento es un poco menor de 1
entre 4
Ejemplo
Supngase que la estancia promedio de internacin en
un hospital es de 5,5 das con una desviacin estndar
de 1,8 das. Si se supone que la duracin de la
internacin se distribuye normalmente, encuentre la
probabilidad de que un paciente seleccionado al azar de
dicho grupo, tenga una duracin de internacin :
de ms de 6 das
entre 4 y 7 das
8.5.3 La distribucin t
a) Caractersticas
Al igual que la normal, tambin es simtrica es algo
ms plana que la distribucin normal hay una
distribucin t para cada tamao de muestra cuando
el tamao de la muestra es mayor a 30, la

146

Jorge Crdova Egocheaga

distribucin t se asemeja tanto a la normal que se


prefiere utilizar sta.

CUANDO UTILIZAR Z o t

SE CONOCE ?

SI
USAR

USAR

NO

es n 30?

SI

NO

USAR

147

Manual de Estadstica General

TABLA DE DISTRIBUCION t DE STUDENT


d.f. Grados de libertad

d. f . = n 1

d.f.

t .90

t .95

t .975

t .99

t .995

3.08

6.31

12.7

31.8

63.7

1.89

2.92

4.3

6.97

9.92

1.64

2.35

3.18

4.54

5.84

26

1.32

1.71

2.06

2.48

2.78

27

2.31

1.7

2.05

2.47

2.77

28

1.31

1.7

2.05

2.47

2.76

Ejemplo:

n= 28

N.C. = 95%

t=?

:
:

d.f. = 28 - 1 = 27
t = 2,0518

:
:
:

b) Frmula

t=

x
s
n

c) Grados de libertad
Se definen como el nmero de valores que
podemos escoger libremente.

8.5.4 La distribucin Ji-Cuadrada


a) Caractersticas
Es una distribucin asimtrica a la izquierda
Slo considera valores positivos

148

Jorge Crdova Egocheaga

b) Definicin
La distribucin Ji-cuadrada esta definida por

= Z i2
2

i =1

c) Aplicaciones
Las aplicaciones ms importantes estn en la
prueba de bondad de ajuste la prueba de
independencia estadstica
d) Distribucin

8.5.4 La Distribucin F
Caractersticas
Es una distribucin asimtrica a la derecha
Slo tiene valores positivos
Se utiliza para comparar variancias
poblaciones, con distribucin normal

de

dos

149

Manual de Estadstica General

Frmula

F=

2
S mayor
2
S menor

Existe una familia de distribuciones F.


Cada miembro de la familia est determinado por dos
parmetros: los grados de libertad (gl) en el
numerador y los grados de libertad en el denominador.
El valor de F no puede ser negativo y es una
distribucin continua.
La distribucin F tiene sesgo positivo.
Sus valores varan de 0 a . Con forme F la
curva se aproxima al eje X.

150

CAPTULO

MUESTREO Y
DISTRIBUCIONES
DE MUESTREO
OBJETIVOS
Al finalizar el Captulo 9, el participante ser capaz de:
1. Determinar el tamao de una muestra
2. Asegurarse que las muestras que se extraigan sean
representativas de la poblacin de la que provienen
3. Comprender las distribuciones del muestreo
4. Comprender la relacin entre el costo del tomar
muestras ms grandes y la precisin adicional que
esto le proporcione a las decisiones tomadas a
partir de ellas

Manual de Estadstica General

9.1 IMPORTANCIA DEL MUESTREO


En lugar de levantar un censo completo se realiza un
muestreo, debido a que un censo:

Requiere demasiado tiempo


Es muy costoso
Muy laborioso e ineficiente

9.2 TIPOS DE MUESTREO


A)

MUESTREO NO PROBABILSTICO:
inferencia estadstica.

No

permite

M. de Juicio: Abarca el juicio del experto, opiniones de


especialista
M. de Cuotas: Se decide la estructura del marco
muestral, sin tener en cuenta la estructura del marco
poblacional.
M. de Trozo: La eleccin de los racimos no se hace al
azar.
B) MUESTREO PROBABILSTICO: Permite
inferencia
estadstica. Cada elemento del marco poblacional tiene
una probabilidad conocida diferente de cero de
conformar o ser parte de la muestra.
1.

Muestreo Aleatorio Simple (MAS):


Concepto: Todas las unidades elementales tienen la
misma probabilidad de conformar la muestra. Dicho
de otro modo, significa que cada una de las
posibles muestras de tamao n, tenga a la misma
ser
seleccionada
probabilidad: 1/N CN de
(muestreo sin sustitucin). Es el caso de un sorteo.

152

Jorge Crdova Egocheaga

Tamao de la muestra: Depende de:


La magnitud del mximo error permisible (e) y, el
grado de confianza de que el error en la estimacin
no exceda del mximo error permisible (1- )
A. Para estimar una media poblacional:
Se calcula a partir de la formula siguiente

n =

Z S 2e

A mayor variabilidad de la muestra

s 2e , mayor

varianza. A mayor varianza mayor tamao muestral


representa el error de muestreo, llamado error de
estimacin o precisin de la estimacin. El valor
debe ser asumido por el investigador. En este caso

= ( x)
Para poblaciones finitas (se conoce N), el tamao
final (nf) queda definido por la siguiente relacin
Ejemplo 1:
A fin de conocer el gasto mensual en medicinas por
familia, el Gerente de Marketing de un laboratorio
farmacutico desea determinar el tamao de la
muestra que le proporcione un nivel de confianza de
0,95 (Z = 1,96). Adems conoce por estudios
anteriores que las compras medias por familia eran
de S/. 120 mensuales, con una desviacin estndar
de 30. El Gerente busca un tamao de muestra que
le permita estimar el nivel de gasto con un error de
10.
153

Manual de Estadstica General

n =

n=

Z S 2e
2

(1,96 )2 (3 0 )2
(1 0 )2

n = 36
Ejemplo 2
En cierta poblacin se 1200 escolares, se desea
estimar el nivel promedio de Hb con 0,95 de
confianza. Al realizar un estudio piloto se encontr
que x = 12,3 y

S = 1,6. Si los investigadores

estn dispuestos a asumir un


Z

N = 1200
Se = 1,6

n=

= 0 ,5

nf =

= 0,5 .Calcular n

= 1,96

n
n
1+
N

Z 2 2 s 2e

(1,96 )2 (1,6 )2
(0,5 )2

= 39,33

39,33
= 38,08 39
39,33
1+
1200

Interpretacin
El nmero mnimo necesario de escolares para
realizar el estudio es de 39, si se desea estimar el
nivel promedio de Hb en la poblacin con una
precisin de 0,5.

154

Jorge Crdova Egocheaga

Ejemplo 3
En cierta poblacin se 1200 escolares, de 9 11
aos se desea estimar el nivel promedio de hierro
srico. Con este fin se va a seleccionar una muestra
probabilistica. Si en un estudio similar se obtuvo
una media aritmtica de 60,6 mg/dl y S = 22,4
mg/dl. Calcular el tamao mnimo de la muestra si
la estimacin del parmetro se va a realizar con
0,95 de confianza y se asume un = 5

= 1,96

n=

N = 1200
Se = 22,4

Z 2 2 s 2e

(1,96 )2 (22,4 )2
(5 )2

= 77,10

= 5

nf =

n
1+

n
N

77,10
= 72,44 73
77,10
1+
1200

Interpretacin :
El nmero mnimo necesario de escolares para
realizar el estudio es 73, si se desea estimar el nivel
promedio de hierro srico en la poblacin con una
precisin 5
B. Para estimar una proporcin poblacional:

n =

Z 2 2 p e q e

155

Manual de Estadstica General

donde:
pe = proporcin estimada de sujetos con la
caracterstica de inters. Se puede obtener de
revisin bibliogrfica, estudio piloto o asumiendo
pe = qe= 0,50
qe = proporcin estimada de sujetos sin la
caracterstica de inters.

Error absoluto de muestreo o precisin. Debe

ser asumido por el investigador.

= ( p )

Si se conoce N:

nf =

n
1+

n
N

Ejemplo 1:
En una poblacin grande, se desea estimar la
prevalencia de DM con 0,95 de confianza. De la
literatura se sabe que p = 0,10 si se asume un error
muestral de 5%, calcular n
Datos
Z 2 = 1,96
p e = 10 % = 0,10
qe = 90 % = 0,90
= 0,05

156

n =

Z 2 2 p e q e

n =

(1,96 )2 (0 ,1 )(0 ,9 )
(0 ,05 )2

n =

0 ,345744
0 , 0025

= 138 , 3 139

Jorge Crdova Egocheaga

Interpretacin:
Si se desea estimar la prevalencia poblacional con
0,95 de confianza y un de 5% se deber evaluar
139 sujetos.
2. M. Sistemtico: Las unidades elementales son
seleccionadas dentro de un intervalo
(I)
de
igual tamao. Se extrae la muestra de acuerdo
a la lista de pacientes atendidos

I1 I2 I3 I4

X1
3. M. Estratificado: El marco poblacional se divide en
grupos homogneos (estratos); de cada uno se
extrae una submuestra, proporcional al tamao del
estrato. Muestreo por tipo de servicio
4. M. por Conglomerado: El marco poblacional se
encuentra agrupado en conglomerados o racimos
Se selecciona en forma aleatoria, el o los racimos.
Todos los pacientes que ingresaron un determinado
da.
ALEATORIO SIMPLE
SISTEMTICO
PROBABILISTCO

ESTRATIFICADO
POR CONGLOMERADO

MUESTREO
DE JUICIO
NO PROBABILSTICO

DE CUOTAS
DE TROZO

157

Manual de Estadstica General

El error estndar
Es una medida de dispersin de una distribucin muestral. Es
equivalente a la desviacin estndar.
Desviacin estndar de la
distribucin de medias de muestra

Error estndar
de la media

Desviacin estndar de la
de proporciones

Error estndar distribucin


de muestra de la proporcin

9.2 DISTRIBUCIONES DE MUESTREO


La totalidad de datos de una poblacin, constituye la
distribucin de poblacin original (PO)

PO
X1
X2
X3
.
.
.
XN

Media

Varianza

:x

z=

x-

De la PO se extraen muestras de tamao n. A cada una se


calcula su media. El conjunto de ese total de medias se
denomina poblacin derivada de medias (PDM)

158

Jorge Crdova Egocheaga


PDM

PO

x1
x2

X1
X2
X3

x3
.
.

.
..
XN

Media

xm
x

Varianza

: 2x

x2 =
x

x -

z =

2
n
=

Si se busca comparar dos poblaciones, se deriva de cada


poblacin una poblacin de medias y luego se comparan
PO1

x1

X2
X3
.

Media

PO2

PDM2

PDDM

X1

x1

( x1 x2 )

x2

X2

x2

(x x )

x3

X3

x3

(x x )
.
.

XN

xm

XN

Varianza

PDM1

X1

xm

( )

d = 1 2
12 22
+
n1 n2
( x x ) (1 2 )
z = 1 22
1 2 2
+
n1
n2
x21 x2 =

159

Manual de Estadstica General

9.3 EL TEOREMA DEL LMITE CENTRAL


Muestra la relacin entre la forma de la distribucin de la
poblacin y la forma de la distribucin de muestro. Se basa
en dos aspectos:
(1) La media de la PDM ser igual a la media de la PO, sin
importar el tamao de la muestra(n) incluso si la poblacin
no es normal

x = x
(2) Al incrementarse el tamao de la muestra, la PDM se
acercar a la normalidad, sin importar la forma de la
distribucin de la poblacin.
El teorema del lmite central nos permite utilizar las
propiedades de la distribucin normal en muchos casos en
los que los datos subyacentes pueden no estar distribuidos
normalmente.

160

You might also like