Professional Documents
Culture Documents
ESTADSTICA GENERAL
Manual de
Estadstica General
Jorge Crdova Egocheaga
1ra Edicin: Marzo del 2003
SOBRE EL AUTOR
Estudios Doctorales en Ciencias Administrativas (UNFV), Matre
en Administration des Affaires (MBA-UQAM, Canad), Magster
en Administracin (ESAN), Magster Scientiae (MSc) en
Economa (UNA), Especialista en Formulacin y Evaluacin de
Proyectos de Inversin (UNMSM), Profesor de Estadstica en la
Maestra en Administracin de la Universidad de San Martn de
Porres, Docente de Estadstica y de Informtica Aplicada en el
rea de Salud en la Escuela Universitaria de Post Grado de la
Universidad Nacional Federico Villarreal, Profesor Principal y Jefe
de la Divisin de Evaluacin y Estadsticas de la Escuela de
Sanidad Naval de la Marina de Guerra del Per, Profesor de
Estadstica y Mtodos Cuantitativos para los Negocios en el MBA
de la Universidad San Ignacio de Loyola, Consultor y Expositor
Independiente. Director Ejecutivo del Centro de Capacitacin y
Asesora de Negocios, CECAN.
CAPTULO
INTRODUCCIN
El pensamiento estadstico algn da ser tan necesario para la
ciudadana como la capacidad de leer y escribir...
H.G.Wells hace mas de 100 aos
OBJETIVOS
Al finalizar el Captulo 1, el participante ser capaz de:
1.
2.
3.
4.
5.
6.
7.
8.
1.1 SITUACIONES
ESTADSTICA
EN
LAS
QUE
SE
UTILIZA
LA
Ejemplos
Varias veces durante el da una enfermera toma la
temperatura a los pacientes en el Servicio de Emergencia de
un Centro Hospitalario local.
Un investigador mdico examina los efectos de un agente
cancergeno en las ratas. Tres semanas despus de
inyectado el agente en una rata, el investigador realiza una
intervencin quirrgica para extraer y pesar los tumores.
El Director de un Hospital registra el tiempo de recuperacin
por tratamiento.
El Director de un Hospital cuenta el nmero de camas a fin
de medir la tasa de ocupabilidad.
Un investigador mdico est interesado en conocer la
relacin entre el sexo y el riesgo de infarto.
El Jefe de Almacn de una Clnica revisa unos cuantos
frascos del lote de vacunas que acaba de llegar, y verifica su
fecha de expiracin.
El mdico responsable del Laboratorio Clnico del Hospital,
extrae una muestra de sangre a fin de determinar el nivel de
colesterol del paciente.
1.2 EL PENSAMIENTO ESTADSTICO
El profesional de la gestin de la salud debe de preocuparse
permanentemente en registrar informacin sobre las
caractersticas que le permitan conocer los factores que
inciden en la variabilidad del servicio y as estar en
condiciones de implementar acciones dirigidas a mejorar la
calidad del servicio que ofrece.
Debe medir
ORGANIZAR
ANALIZAR
INTERPRETAR
DATOS
8
N Pacientes
30 - 34
35 - 39
40 - 44
45 - 49
6
12
8
2
Diagrama Circular
12
10
8
6
Diagrama de
Barras
4
2
0
30-34
35-39
40-44
45-49
Unidad de
medida
aos
27
Edad del paciente
Kg.
3,750
Peso del recin nacido
das
5
Tiempo permanencia
C
37,5
Temperatura corporal
--Enfermera
Profesin
Caractersticas
Datos
10
11
1.
dicotmicas
(slo
pueden
tener
12
DATOS
CONSTANTES
VARIABLES
CUALITATIVAS
CUANTITATIVAS
DISCRETAS
CONTINUAS
Recoleccin de
datos
13
14
MARCO POBLACIONAL
(1200 pacientes de un hospital)
Caractersticas
de inters
Edad
Poblacin
Registro
de la
caracteP1
rstica (1200 datos)
Peso
Temperatura
corporal
Estado
Civil
Poblacin
Poblacin
P2
P3
(1200 datos)
...
Pn
Marco Muestral
Subconjunto del marco poblacional.
Comprende los elementos o estratos del marco poblacional
(es representativo).
En contraste con el marco poblacional es ms conveniente
porque se obtienen los datos en menor tiempo y reduciendo
los costos.
Ejemplo :
75 pacientes de un hospital.
15
Marco Poblacional
Marco Muestral
Tcnicas
de muestreo
Peso
Registro
de la POBLACIN
caracterstica.
P1
Temp. Corpor.
Estado civil
POBLACIN
P2
POBLACIN
P3
POBLACIN
...
Pn
Muestra
Registro de una caracterstica en todos los elementos del
marco muestral.
Tiene tantos datos como elementos el marco muestral.
Habrn tantas muestras como caractersticas se deseen
registrar en un marco muestral.
Las muestras no extraen de la poblacin, sino del marco
muestral
16
MARCO POBLACIONAL
(1200 pacientes de un hospital)
MARCO MUESTRAL
Tcnicas
de muestreo
Caracterstica
Edad
Peso
Estado
civil
Temp.
corporal
Edad
Peso
MUESTRA
MUESTRA
m1
m2
Estado
civil
MUESTRA
m3
MUESTRA
mn
75 datos
Registro
de la POBLACIN
caracterstica.
POBLACIN
P1
P2
POBLACIN
P3
POBLACIN
...
Pn
Estimador
Valor representativo de una muestra. Se llama tambin
estadgrafo o estadstico. Se simboliza por letras latinas.
Existen tantos estimadores como muestras se extraigan de
una poblacin.
17
Media muestral.
Varianza muestra.
s
p
Proporcin muestral
n1
n2
POBLACIN
x1
x2
n3
x3
.
.
.
.
nm
xm
PARMETRO
DIFERENTES MUESTRAS GENERAN DIFERENTES
VALORES DEL ESTIMADOR
18
Estadstica Inferencial
Tcnicas que permiten estimar un parmetro a partir de
datos muestrales.
POBLACIN
Muestra
Estimador
Parmetro
Estadstica
Descriptiva
d
as
nic
c
POBLACIN
Parmetro
: -
MUESTRA
ue
eM
Estimador :
o
stre
Estadstica
Inferencial
= Error de muestreo
19
(o unidad de anlisis)
: Diez trabajadores
La muestra
Tipo de dato
Un dato registrado
: 140
20
El estimador
El parmetro
Ejercicio 1
El Director de un Hospital sabe que en lo que va del ao, fueron
dados de alta 1000 pacientes hospitaliza-dos y desea conocer el
tiempo medio de permanencia en el hospital. Para ello selecciona
al azar la historia clnica de 100 pacientes. Una de las historias
permiti conocer que cierto paciente haba permanecido 6 das
hospitalizado. En esta situacin identifique los siguientes
trminos (no se pide la definicin):
Caracterstica. Unidad elemental. Marco poblacional Poblacin.
Marco muestral. Tipo de muestreo. Un dato. Unidad de medida.
Un estimador. Un parmetro
21
22
CAPTULO
2
1
RECOLECCIN
DE DATOS
Los datos no se recopilan como
un fin en s mismos, sino como
un medio para describir los hechos
que estn tras los datos
OBJETIVOS
1.
2.
3.
4.
5.
6.
Recopilar datos.
Identificar la escala adecuada para cada
caracterstica a recopilar.
Redondear datos cuantitativos.
Diferenciar mtodos y tcnicas de recoleccin de
datos.
Elaborar una encuesta
Elaborar una hojas de registro.
la
24
de
C.
CONSIDERAR
REGISTROS
LA
CONFIABILIDAD
DE
LOS
SELECCIONAR
FORMAS
RECOLECTAR DATOS.
APROPIADAS
DE
I.
II.
1: Masculino 2: Femenino
A B AB
O
1: Emergencia
2: Ginecologa
3: Traumatologa 4: Pediatra
ESCALA ORDINAL:
Los valores representan un orden. No son cuantitativos, slo
simbolizan una posicin. Se analizan a travs de la
desigualdad :mayor que o menor que (> y <).
25
Ejemplo:
Calificacin
Lugar (orden)
Dolor
:
:
:
A,B,C,D
A>B
1 , 2 , 3
1 > 2
leve, moderado, intenso
ESCALA DE INTERVALOS:
Se utilizan nmeros cardinales. El cero es relativo o
diferencial, es decir no indica ausencia de la propiedad. Se
pueden realizar operaciones aritmticas.(+ y -). Es una
escala creada por el hombre.
Ejemplo:
Hora
Temperatura ambiental
El ao en que vivimos
00:00
0 C
2003
ESCALA DE RAZN:
Se utilizan nmeros cardinales. Tienen unidad de medida
(cms, pulgadas). El cero es absoluto, indica ausencia de la
propiedad. Se pueden realizar operaciones aritmticas
(+,-,x ,),
Ejemplo:
Pacientes no atendidos hoy
:
N de hijos en edad de vacunacin :
Procesos deficientes
:
0
0
0
26
2 REGLA:
Si la cifra que sigue es mayor a 5, se aumenta 1. Si la cifra
que sigue es menor a 5, el nmero no vara.
Ejemplo: Redondeo a 2 decimales
6,176 .
6,18
4,123 .
4,12
3 REGLA:
Si la cifra que sigue es 5 y el nmero
anterior es par no
se modifica. Pero si el nmero es impar, aumenta 1.
Ejemplo: Redondeo a 2 decimales
6,545 .
6,54
1,975 .
1,98
27
que
disponen
de
B) FUENTES PRIMARIAS
1.
2.
28
Ejemplo
La observacin del desempeo de una enfermera
durante sus labores en el Servicio de Emergencia.
(b) La experimentacin
Se registra un dato bajo condiciones provocadas
simulando el proceso lo ms real posible.
Ejemplo:
Un mercado prueba para introducir un tipo jabn de
antisptico con fragancia .
B) MTODOS INDIRECTOS
1
2.
29
Ejemplo:
Se pregunta a un paciente el tiempo que esper antes
que sea atendido en el consultorio externo.
Comprende 2 tcnicas: la encuesta y la entrevista.
(a) La encuesta
1.
2.
Plantear preguntas
Ejemplo:
Encuesta para conocer el grado de satisfaccin de
los asegurados a una clnica.
(b) La entrevista
1. Permite recolectar datos o partir de un dialogo
2. Puede se estructurada o no estructurada
Ejemplo:
Entrevista al Director de una Clnica sobre la
aplicacin de norma de calidad.
METODOS Y TCNICAS DE RECOLECCION DE DATOS
FUENTE
METODOS
SECUNDARIA
PRIMARIA
30
TECNICAS
FICHAS
DIRECTO
OBSERVACION
EXPERIMENTACION
INDIRECTO
ENCUESTA
ENTREVISTA
para
cada
FUENTE
Secundaria
Primaria
Primaria
TECNICA
Fichas
Encuesta
Entrevista
2.6 EL CUESTIONARIO
Consiste en un conjunto de preguntas diseadas de acuerdo
a la necesidad de informacin.
Junto con las hojas de registro, es la tcnica ms comn
para la recopilacin de datos de fuentes primarias.
Recomendaciones para su elaboracin
Las preguntas deben ser coherentes con el objetivo de la
investigacin. No hay preguntas de carcter general.
La extensin (nmero de preguntas) depende de la
necesidad de informacin a recolectar por esta tcnica.
31
Si 1
No 2
Preguntas cerradas
Las posibles respuestas se presentan como alternativas.
Facilita la codificacin y operatividad de los datos.
Ejemplo :
Posee Ud. un seguro mdico?
Si 1
No 2
Preguntas abiertas
Los encuestados tienen libertad para emitir su opinin.
Se utilizan cuando no se tiene precisin sobre las
posibles respuestas.
Dificulta la recoleccin de datos (incomoda al
encuestado).
Dificulta la interpretacin de datos.
32
Ejemplo:
Qu opinin tiene sobre la poltica de salud del
actual Gobierno ?
2.7 LA ELABORACIN DE DATOS: EL CONTROL DE
CALIDAD
Una vez que se han recolectado los datos referidos a las
diferentes variables necesarias para la investigacin, se
debe proceder a revisarla y presentarla de manera que
facilite su anlisis. A este proceso se denomina elaboracin
de datos.
Las etapas que abarca son: edicin, tabulacin
codificacin.
A)
b)
c)
33
B.
para
la
distribucin
del
en
EJEMPLO 2:
Hoja de registro de tems defectuosos
Permiten identificar el tipo de defecto ms frecuente.
Un producto puede presentar ms de un defecto.
Es necesario tipificar con antelacin los defectos posibles.
Caso: Hoja de registro de inspeccin final de cierto producto
plstico moldeado.
35
EJEMPLO 3
Hoja de registro de las causas del defecto
Permite una estratificacin adicional con el fin de encontrar
las causas de los defectos.
Caso: Hoja de registros de ocurrencias de los defectos en
ciertos accesorios utilizados en la elaboracin de prtesis
dental, asignables a maquinaria, trabajadores, da y tipo de
defecto.
36
37
38
CAPTULO
ORGANIZACIN
TABULAR DE
DATOS
OBJETIVOS
Al finalizar el Captulo 3, el participante ser capaz de:
1.
2.
3.
4.
40
199
236
259
183
269
191
260
197
159
227
245
214
275
186
234
262
230
212
163
220
202
221
223
243
203
180
292
198
201
174
223
186
200
192
236
186
188
234
230
170
304
197
216
214
189
138
269
197
222
202
213
163
241
218
242
197
248
228
154
218
243
192
191
243
230
248
231
262
177
207
276
230
238
189
212
200
179
249
225
223
289
280
235
220
194
205
206
194
232
222
209
209
248
194
192
200
261
238
233
222
223
267
263
159
243
230
193
195
259
186
229
184
215
254
233
229
263
163
212
271
216
230
252
218
265
218
155
222
173
228
214
266
172
203
262
213
249
244
177
242
180
241
261
221
222
189
204
229
212
192
257
248
243
190
166
216
197
250
224
257
220
255
241
245
212
225
201
209
155
249
253
265
225
192
212
212
174
184
227
216
250
248
187
222
195
247
161
188
229
194
209
250
180
228
196
254
208
265
234
219
203
230
232
212
236
191
161
258
252
169
249
231
170
233
161
189
191
209
229
246
274
215
215
206
218
234
248
222
175
202
154
249
189
171
263
238
177
261
265
224
249
252
220
199
239
221
221
221
232
218
239
205
196
211
221
276
251
189
286
258
227
236
167
184
245
243
218
173
220
231
196
196
200
221
217
270
261
248
254
232
231
219
225
265
222
226
208
219
189
226
292
192
172
186
264
211
240
237
156
228
241
171
223
185
199
188
263
208
199
259
272
202
214
201
231
210
223
210
209
239
203
212
295
202
195
218
218
253
239
272
216
221
208
225
175
239
191
214
215
227
221
208
224
208
181
187
179
234
262
216
221
152
180
193
244
184
183
226
266
242
220
266
269
223
198
204
179
209
215
222
196
228
195
160
261
177
232
224
203
265
238
247
225
169
172
187
199
245
183
171
246
187
222
278
212
250
174
220
188
223
241
200
193
226
243
206
142
277
244
210
258
207
267
254
136
231
253
229
240
204
187
202
209
238
240
190
253
203
271
281
226
244
182
146
251
277
184
240
239
185
201
259
234
174
226
246
222
205
211
216
230
220
201
231
183
214
219
206
276
215
195
209
258
287
182
176
275
204
183
212
237
249
142
256
258
213
208
202
244
41
NIVEL
OPININ
TOTAL
Analfabeta
10
Primaria
15
20
Secundaria
23
30
Superior
12
15
TOTAL
58
17
75
3.2.1 Ventajas
Se pueden apreciar propiedades de los datos.
Permite establecer asociaciones entre variables
Se ahorra espacio en un informe escrito.
3.2.2 Elementos:
A. El Ttulo: enunciado breve e informativo acerca del
contenido del cuadro. Un buen ttulo debe
responder a las siguientes interrogantes:
1. Qu contiene la tabla?
Ej.: La opinin de 75 pacientes sobre calidad
de atencin.
2. Cmo estamos presentando el contenido?
Ej.: Por nivel educativo de las pacientes
42
Ejemplo
NIVEL DE
INSTRUCCIN
OPININ
Favorable
TOTAL
Desfavorable
Analfabeta
Para datos
categricos
Primaria
Secundaria
Superior
TOTAL
EDAD
N de pacientes
Tasa porcentual :%
(en aos)
(fi)
(hi)
39 - 46
47 - 54
55 - 62
63 - 70
71 - 78
Total
43
NIVEL
EDUCATIVO
TOTAL
Favorable
Desfavorable
Analfabeta
10
Primaria
15
20
Secundaria
23
30
Superior
12
15
TOTAL
58
17
75
44
OPININ
NIVEL
TOTAL
10
Primaria
15
20
Secundaria
23
30
Superior
12
15
TOTAL
58
17
75
45
33.7
33.7
33.8
33.9
34.0
34.1
34.2
34.2
34.2
34.2
34.2
34.3
34.3
34.5
34.5
34.6
34.6
34.6
34.7
34.7
34.8
34.9
35.1
35.1
35.2
35.2
35.3
35.6
35.8
36.0
36.1
36.5
en este
46
47
33
1 4
33
8 6
34
2 2
2 2
34
7 6 7
35
2 2
35
36
36
25 datos
3
10 datos
48
Ejercicio
Se realiza un estudio para ayudar a comprender el efecto de
fumar en los patrones de sueo. La variable es el tiempo que
tarda en quedarse dormido. La muestras de fumadores y no
fumadores producen estas observaciones :
FUMADORES
17,2
16,2
19,8
21,2
21,1
21,8
19,5
19,7
19,9
22,9
18,9
16,9
22,1
18,8
18,1
19,8
20,0
22,1
23,0
21,0
19,2
15,1
23,6
24,1
20,6
20,1
20,5
22,4
NO FUMADORES
18,3
24,9
25,0
23,3
17,5
20,4
19,3
17,6
20,1
21,4
20,2
21,3
20,7
17,4
15,1
16,8
22,8
25,8
24,3
23,2
15,7
20,5
21,2
22,4
24,1
25,7
25,1
15,3
17,7
18,1
19,4
15,0
15,2
16,1
19,9
21,3
22,1
25,2
24,1
18,0
17,2
23,1
16,0
15,9
18,3
21,6
23,8
24,9
23,0
24,8
25,2
25,0
16,3
17,9
19,9
15,1
Tablas simples
1
2
3.
4.
49
Aceptable
Aceptable
Muy bueno
Bueno
Bueno
Bueno
Muy malo
Bueno
Bueno
Aceptable
Bueno
Aceptable
Malo
Muy bueno
Malo
Aceptable
Muy malo
Aceptable
Malo
Aceptable
Muy bueno
Bueno
Bueno
Aceptable
Bueno
Malo
Aceptable
Muy malo
Bueno
Malo
Bueno
Malo
Bueno
Aceptable
Bueno
Bueno
Muy malo
Muy bueno
Malo
Aceptable
Bueno
Aceptable
Malo
Bueno
50
/////
///// ///// ///// /
///// ///// //
///// ///
////
C a t e g o ria
N m e ro d e
P a c ie n t e s
T asa
P o rc e n tu a l
M uy Bueno
1 1 ,1 1
Bu en o
16
3 5 ,5 5
A c e p ta b le
12
2 6 ,6 7
M a lo
1 7 ,7 8
M u y M a lo
8 ,8 9
45
1 0 0 ,0 0
T o tal
lmites
inferiores
de
las
199
209
236
259
248
183
269
212
194
191
260
197
265
261
159
227
245
214
275
186
234
262
230
212
163
220
202
221
223
203
180
292
198
201
174
223
186
200
192
236
186
188
234
230
304
197
216
214
189
138
269
197
222
202
213
163
241
218
242
248
228
154
218
243
192
191
243
230
248
231
262
177
207
276
238
189
212
200
179
249
225
223
289
280
235
220
194
205
206
209
233
222
223
267
212
263
159
243
230
253
192
200
232
222
193
195
259
186
229
184
215
254
233
229
263
163
212
271
216
225
252
218
265
218
155
222
173
228
214
266
172
203
262
213
244
177
242
180
241
261
221
222
189
204
229
212
192
257
248
190
166
216
197
250
224
257
220
255
241
245
212
225
201
209
229
194
174
184
192
249
216
250
248
187
222
195
247
161
188
209
250
180
228
196
254
208
265
234
219
203
Solucin
Se calcula el rango: R = Mayor menor + 1
Mayor = 317
Menor = 106
Rango = (317 106) + 1 = 212
52
NIVELES DE
El menor
valor
COLESTEROL
PERSONAS
Tasa
porcentual (%)
1000
100,00
6.
53
NIVELES DE
COLESTEROL
106 - 158
159 - 211
PERSONAS
Tasa
porcentual (%)
159 - 1
158 + 53
212 - 264
265 - 317
Total
100,00
1000
una
columna
con
la
54
Ventas
Tasa
(en soles)
Dias
menos de 5000
porcentual
(%)
10,00
5000 - 8999
23,33
9000 - 12999
10
33,33
13000 - 16999
26,67
17000 - 20999
6,67
Total
30
100,00
1,72
1,66
1,68
1,84
1,70
1,64
1,70
1,70
1,72
1,74
1,86
1,72
1,67
1,68
1,74
1,73
1,74
1,87
1,76
1,65
1,72
1,75
1,75
1,77
1,82
1,74
1,69
1,75
1,77
1,59
1,80
1,78
1,72
1,76
1,66
1,57
1,84
1,81
1,72
1,82
1,64
1,61
1,87
1,81
55
Marca de
Frecuencia
Frecuencia
Frec. Absoluta
Frec. Relativa
Li
Clase: Xi
absoluta: fi
relativa: hi
Acumulada: Fi
Acumulada: Hi
Li
Ls
Xi
fi
hi
Fi
Hi
Ls
limite inferior
limite superior
Marca de la clase i
frecuencia absoluta de la clase i.
frecuencia relativa de la clase i.
frecuencia absoluta acumulada hasta la clase i.
frecuencia relativa acumulada hasta la clase i.
Ejercicio 2:
Complete la siguiente tabla que corresponde al
pacientes del Hospital Central.
PESO
(en kilos)
48,0 52,9
fi
Fi
hi
peso de 60
Hi
6
0,30
53,0 57,9
58,0 62,9
0,25
63,0 67,9
68,0 72,9
Total
Ejercicio 3
La siguiente informacin se refiere al peso (en Kg.) de 60
personas. Elabore una tabla de distribucin de frecuencias.
LS5=64 F2=20
h3=0,213
k=6
LI1=35
f6 = 5
f1=4
H4=0,799
56
Ejercicio 4
Complete la siguiente tabla de distribucin de frecuencias:
n = f = 30
hi =
f
n
hi = 1.000
PESO
(en libras
Fi = fant + fact
Hi = h ant + h act
fi
128,6 - 135,4
135,5 - 142,3
142,4 - 149,2
10
149,3 - 156,1
156,2 - 163,0
Xi
Fi
hi
Hi
Total
B)
Tablas cruzadas
Sirven para representar dos o ms variables cualitativas.
En cada celda se puede incluir la frecuencia absoluta y
relativa (por fila, columna y total).
57
Ejemplo
Cuadro 4: Enfermedad por sexo
E n fe rm e d ad \S e x o
M asculino
F emenino
To tal
B ro nquitis
12
17
C o litis
11
19
N efritis
15
21
Aler gias
To tal
35
25
63
58
CAPTULO
ORGANIZACIN
GRFICA DE
DATOS
OBJETIVOS
Al finalizar el Captulo 4, el participante ser capaz de:
1.
2.
3.
2.
fi
128,6 - 135,4
CLASE
132,0
135,5 - 142,3
138,9
142,4 - 149,2
145,8
10
149,3 - 156,1
152,7
156,2 - 163,0
159,6
TOTAL
Distribucin de frecuencias
3
30
12
Histograma
Frecuencia
10
8
6
4
2
0
Marca de Clase
60
Ejemplo
Grfico 4: Peso de 100 Pacientes (en Kg.)
Nmero de
Pacientes
25
20
15
10
5
0
29.5
39.5
49.5
59.5
69.5
7 9.5
89.5
9 9.5
Peso
(Kgs)
61
B)
62
E)
tienen
ms
menos
la
63
F)
64
Ejemplo:
Grfico 2: Nmero de hijos en edad escolar por mdico del
Hospital Central
N de
Mdicos
30
25
20
15
10
5
0
0
Nmero de
hijos
(escolares)
65
Ejemplo
Grfico 3: Pacientes atendidos por especialidad
20
15
10
5
0
Nefrologa
Ginecologa
Oftalmologa
Neurologa
Traumatologa
especialidad
Medico
Enfermeras
Psiquiatras
Fisioterapeuta
Obstetriz
N de
profesionales
0
10
20
30
40
50
60
70
80
90
100
66
39.5
49.5
59.5
69.5
79.5
89.5
99.5
Peso
(Kg.)
Fuente: Historia Clnica, julio del 2002
67
Meses
350
300
Enero
120
Febrer
o
210
Marzo
180
Abril
320
Mayo
280
100
Junio
200
50
Julio
350
250
200
150
0
0
Ab4ril
Mayo
J un
6 io
Ju li o
Abril
Mayo
Junio
Julio
69
Ejemplo
100
80
60
40
E ste
20
O e ste
N o r te
Sur
100
50
4to trim.
0
3er trim.
70
3er trim.
4to trim.
CAPTULO
PROMEDIOS
Un motivo para hacer sospechar que la Estadstica es ms un
arte que una ciencia, gira en torno a la ambigedad con que se
usa el trmino promedio.
OBJETIVOS
Al finalizar el Captulo 5, el participante ser capaz de:
1.
2.
De tendencia central.
De dispersin.
De la forma de la distribucin.
72
b) Curtsis
Las curvas simtricas, tienen una forma tal que con una
lnea vertical que pase por el punto ms alto de la curva,
dividir el rea de esta en dos partes iguales.
73
c
i =1
74
= nc
Ejemplo:
C = 10, n=3
3
c
i =1
= 10 + 10 + 10 = 3 (10) = 30
da
cx
i =1
= c x i
i =1
Ejemplo:
C = 5, X1 = 2, X2 = 4, X3 = 6
3
cx
i =1
ra
=1
=1
( x i + c ) = x i + nc
i
i
Ejemplo:
C =2, x1 =5, x2 =3, x3 =2
3
(xi + c) = (5 + 2) + (3 + 2) + (2 + 2) = 16
i =1
= (5 + 3 + 2) + 3(2) = 16
75
Da/Semana
Reclamos/da
76
Media aritmtica
8 + 10 + 5 + 12 + 10 + 15 60
=
6
6
= 10 reclamos
b)
c)
Simbologa:
Media aritmtica
(equis barra)
(mu)
Tamao
n
N
Muestra
Poblacin
d)
Xi x =
Xi
i =1
n
n
Xi
= i =1
N
77
Media
aritmetica
e)
= i = 1n
fiX
i=1
donde:
fi
x :media muestral
fi :frecuencia absoluta de la clase i
X i :marca de la clase i
Ejemplo:
La distribucin de frecuencias siguiente, representa
los puntajes obtenidos en una evaluacin del
desempeo, aplicado al personal tcnico de un
Centro de Salud. El puntaje mximo en la prueba es
50. Calcule e interprete en media.
78
D esem p e o
N m ero d e
(p unto s )
t c n ic o s
12 - 16
17 - 21
22 - 26
15
27 - 31
23
32 - 36
10
T O T AL
60
x=
Marca de
clase ( i)
14
19
24
29
34
Total
Frecuencia
absoluta(fi)
4
8
15
23
10
60
= 1575
60
79
xp =
wX
i =1
n
w
i =1
wi = factor de ponderacin
X i = datos
Vendedor
N de polizas de
Seguro Mdico
Comisin
por venta $
Pedro
Juan
Pablo
30
25
20
30
40
50
75
Interpretacin:
Si se elige al azar un representante se espera que cobre
una comisin de $38.67 por pliza vendida.
80
g)
xg )
xg = n X1 X 2 X3 .........X n
Ejemplo:
Enero
Febrero
Marzo
Abril
Mayo
2.6%
5.4%
3.8%
0.5%
1.4%
Clculos
Por lo tanto, la media geomtrica se calcula:
xg
= n
x1, x 2 , x 3,...... x
Tasa media =
(x g 1) 100
de variacin
= (1,0272540 - 1) x 100 = 2,72%
c)
Interpretacin
Si se selecciona al azar un mes entre enero y
mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes
anterior.
xh )
82
a)
xh =
1
n
1
X
i =1
n
Ejemplo:
Los siguientes datos registran el tiempo que
utilizan cuatro mdicos al realizar una cierta
intervencin quirrgica. Calcule e interprete el
tiempo medio.
M d ic o
T ie m p o
(m in u t o s )
45
38
52
40
xh = 43 minutos 7 segundos
83
b)
Interpretacin:
Si se selecciona al azar a uno de los
cuatro mdicos, se espera que realice
este tipo de ciruga
en
43
minutos
aproximadamente.
5.3.2 La Mediana
Es la medida que divide en dos subconjuntos iguales a
datos, de tal manera que 50% de los datos es menor a
la mediana y el otro 50% es mayor a la mediana.
a)
5 datos mayores
mediana
b)
84
c)
Reglas
1 Si la serie es impar, la mediana ocupa el lugar
central de la serie previamente ordenada.
Ejemplo: 5, 10, 10, 12, 15 , 17, 20, 21, 24
2 Si la serie es par, la mediana se obtiene de la
semisuma de los dos valores centrales de la serie
previamente ordenada.
Ejemplo: 8, 10, 14, 18, 23, 24, 32, 34
mediana =
18 + 23
= 20 .5
2
d)
n + 1
2 ,de la serie previamente ordenada.
n +1
2 (F + 1)
Md = Li +
c
f
Md
donde:
Md : mediana
L i : limite real (o frontera) inferior de la clase
mediana.
n : nmero total de datos.
F : suma de todas las frecuencias hasta, pero
sin incluir, la clase mediana.
f Md : frecuencia de la clase mediana
c : amplitud de clase
85
Lugar de la mediana:
E xp e rie nc ia
la b o ra l
(a o s )
0 - 3
4 - 7
N m e ro d e
tr a b a ja d o r e s
d e s e g urid a d
4
12
8 - 11
24
12 - 15
16 - 19
20 - 23
16
10
3
69
n + 1 69 + 1
=
= 35o
2
2
69 + 1 (16)
4
Md = 7,5 + 2
24
C la s e
M e d ia na
= 7,5 +
35 164
24
Ventajas y desventajas
Ventajas:
Los valores extremos no afectan a la mediana como
en el caso de la media aritmtica.
Es fcil de calcular, interpretar y entender.
Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal.
Desventajas:
Como valor central, se debe ordenar primero la
serie de datos.
86
4, 5, 7, 8, 8 , 10, 12, 15
4, 7, 12,12 , 15, 16, 20, 20 , 24, 27
7, 12, 15, 18, 25, 30, 31, 38
b) Clculo a partir de datos agrupados
Mo = L
1
+ c
1 2
donde:
M o : moda
L : limite real (o frontera) inferior de la clase
i
modal (la de mayor frecuencia)
:
frecuencia
de la clase modal menos la
1
frecuencia de la clase anterior
: frecuencia de la clase modal menos la
2
frecuencia de la clase siguiente
c : amplitud de clase
Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes.
87
Da s
0 - 3
4 - 7
12
8 - 11
12 - 15
16 - 19
To ta l
30
=6
1
Cla s e
Mo d a l
=4
2
Clase moda : (4 - 7)
6
Mo = 3.5 +
4
6+4
Mo = 5,9
88
( )
Kn F + 1
i
P = L + 100
c
K
i
f
P
K
donde:
P
: percentil
K : el percentil buscado
n : nmero de datos
Fi : frecuencia acumulativa hasta la clase
anterior a la clase donde se ubica el
percentil K
f
P : frecuencia absoluta de la clase donde se
K
ubica el percentil K
c : amplitud de clase
Ejemplo:
La tabla muestra la experiencia (en aos) de las
enfermeras de un gran centro hospitalario
Experiencia Trabajadores
(aos)
0-3
4-7
8 - 11
12 - 15
16 - 19
20 - 23
24 - 27
Total
18
42
68
120
40
34
12
334
89
75 %
25 %
P75
Menor
Experiencia
Mayor
Experiencia
K = 75
Kn 75(334 )
=
= 250 ,5o (de los nmeros ordenados )
100
100
N Trabajadores
F rec. A cumulada
fi
Fi
18
60
128
248
288
322
334
18
42
68
120
40
34
12
334
75(334) (248 + 1)
100
P = 15.5 +
4
75
40
F=248
En esta clase
se localizan del
249 - 288
P = 15.65 aos
75
90
CAPTULO
MEDIDAS DE
DISPERSIN Y
ASIMETRA
OBJETIVOS
Al finalizar el Captulo 6, el participante ser capaz de:
Calcular e interpretar las principales medidas de
dispersin:
A) Rango
B) Rango intercuartlico
C) Varianza
D) Desviacin estndar
E) Coeficiente de variabilidad
Calcular e interpretar las principales medidas de la
forma de la distribucin.
A) Coeficiente de asimetra
B) Coeficiente de curtosis
92
c) Clculo
A partir de datos agrupados, se utiliza la siguiente
frmula:
R= (Ls - Li ) + 1
donde:
Ls : Limite superior de la
ltima clase
Li : Limite inferior de la
primera clase
Ejemplo:
La distribucin de frecuencias siguiente representa
el tiempo que espera un paciente para ser atendido,
en un consultorio externo. Calcule e interprete el
rango
Tiempo N de Pacientes
(minutos)
(por da)
12 - 16
4
17 - 21
8
22 - 26
15
27 - 31
23
32 - 36
10
Total
60
Rango = (36-12) + 1
R = 25 minutos
Interpretacin: la diferencia de tiempo entre el
paciente que ms espera y el que menos espera
para ser atendido es 25 minutos.
93
94
Ejemplo:
La tabla muestra la experiencia (en aos) del personal
que labora en el Hospital Central.
E xp e rie nc ia
T rab ajad o re s
(ao s )
0 -3
18
4 -7
42
8 - 11
68
12 - 15
120
16 - 19
40
20 - 23
34
24 - 27
12
T o tal
334
A) Entre qu valores se encuentra el 50% intermedio
de estos datos?
B) Cul es el rango intercuartlico?
50 %
25 %
25 %
Q3
Q1
Rango
Intercuartlico
Lugar Q1 = P25
25(334 )
= 83 .5 o se ubica en la 3ra clase
100
25(334) (60 + 1)
4
100
Q = 7.5 +
1
68
Q = 8.82 aos
1
95
Lugar Q 3 = P75
75(334 )
= 250 .5o se ubica en la 5ta clase
100
75(334) (248 + 1)
100
Q = 15.5 +
4
3
40
DC =
P75 P25
2
Ejemplo:
Si P25 = 7,2
DC =
13,4 7,2
= 3,1
2
P75 = 13,4
Interpretacin:
50% central de las observaciones vara en 3,1 con
respecto a la mediana.
96
6.1.3 La varianza
Es una medida de desviacin promedio con respecto a
la media aritmtica
a) Clculos a partir de datos no agrupados.
Para una muestra
n
(X x )
i =1
n 1
Para un poblacin
N
(X )
= i=1
Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la varianza. 8, 10, 5, 12, 10, 15
Primero, elaboramos un cuadro de la forma
siguiente:
x
8
Xi x
(X i x )
8 - 10 = 2
10
5
10 - 10 = 0
5 - 10 = 5
12
12 - 10 = 2
10
10 - 10 = 0
15
15 - 10 = 5
25
X = 60
x=
25
60
6
x = 10
(X i x ) = 0 (X i x )
= 58
97
S =
(X i x )
n 1
58
2
S = 6 1 = 11.6
S=
(Xi x )
i =1
n 1
para la poblacin
N
= 2 =
(X i )
i =1
Ejemplo:
La siguiente informacin se refiere al nmero de
radiografas reprocesadas durante una semana.
Calcule la desviacin estndar.
8, 10, 5, 12, 10, 15
98
S=
S = 11,6
S = 3,4 radiografias
6.1.5 El coeficiente de variacin
Es una medida relativa de variabilidad de los datos.
Permite comparar la variabilidad de dos o ms
conjuntos de datos expresados en unidades diferentes
(peso: Kg. y libras).
a) Clculos a partir de datos no agrupados
Para la muestra:
CV =
s
100
x
Para la poblacin:
CV =
100
Ejemplo:
A continuacin se presentan las tarifas (en unidades
monetarias) de dos laboratorios de anlisis clnicos.
El laboratorio I tiene sus tarifas en soles y el
laboratorio II en dlares Cul de ellos tiene un plan
tarifario ms homogneo o estable?.
99
Laboratorio I (soles)
40,70,60,48,52,65,58
Laboratorio II (dlares)
70,35,150,140,82,110,140,120
Xi
i =1
393
= 56.14
7
40
-1 6.1 4
2 60 .5 0
70
1 3.8 6
1 92 .1 0
60
3 .8 6
1 4.9 0
48
-8 .1 4
6 6.2 6
52
-4 .1 4
1 7.1 4
65
8 .8 6
7 8.5 0
58
1 .8 6
3 .4 6
Si (X i x ) = 632.86
2
S=
(X i
i =1
CV =
x )2
n 1
S
100
x
CV =
100
632 .86
= 10 .27
7 1
10.27
100 = 18 . 29
56.14
Laboratorio II
n
Xi
= i=1
847
= 105.87
8
70
-3 5.87
12 86.6 569
35
-7 0.87
50 22.5 569
15 0
44 .13
19 47.4 569
14 0
34 .13
11 64.8 569
82
-2 3.87
56 9.77 69
11 0
4.1 3
17 .056 9
14 0
34 .13
11 64.8 569
12 0
14 .13
19 9.65 69
Si (X i x ) = 11372 .88
n
i =1
S=
CV =
(X i
i =1
n 1
S
100
x
x )2
11372 ,88
= 40 . 30
8 1
CV =
40,30
100 = 30 , 06
105,87
101
S kp =
3 ( X Md )
S
Valores posibles
3 asimetra
S kp =
+ 3 asimetra
negativa
positiva
Ku =
0 , 5 ( P0 , 75 P0 , 25 )
P0 , 9 P0 ,1
Valores posibles
a) Leptocrtica (concentracin al centro): Si el grado
de apuntalamiento de una distribucin es mayor que
el de la distribucin normal. K 0,5
102
Mesocurtica
Leptocrtica
0,25
0,50
Ejemplo:
La tabla muestra la edad (en aos) de 70 pacientes
atendidos en el servicio de emergencia de un
hospital local.
4
3
5
6
7
25
13
2
4
5
67
85
6
7
7
10
12
15
16
17
18
15
16
17
15
13
13
14
20
14
15
15
15
16
17
17
13
14
16
17
11
14
13
10
6
4
8
14
18
20
3
5
7
8
12
15
17
18
20
21
24
26
21
22
17
16
9
9
15
12
103
104
14.27
3(14,27 13,50 )
= 0,202
11.42 S kp =
11,42
13.50
7.00
0,5(17,00 7,00)
17.00 Ku = 23,00 4,00 = 0,263
23.00
4.00
CAPTULO
NOCIONES DE
PROBABILIDAD
OBJETIVOS
Al finalizar el Captulo 7, el participante ser capaz de:
1.
2.
3.
106
Ejemplos:
Lanzar una moneda
= {cara, sello}
Seleccionar
de
un
lote,
un
medicamentos.
={adecuado, inadecuado}
Extraer una muestra de sangre a una
= {grupo sanguneo}
frasco
de
persona.
Ejemplo:
Se lanzan tres monedas simultneamente. Los ochos
resultados posibles de este experimento pueden
detallarse de manera conveniente mediante un
diagrama de rbol:
Primera
Moneda
Segunda
Moneda
C
C
S
C
S
Tercera
Moneda
C
S
C
S
C
S
C
S
Resultado
Posible
CCC
CCS
CSC
CSS
SCC
SCS
SSC
SSS
107
Ejemplo:
Se lanzan dos dados. El espacio muestral de este
experimento es:
=
B:
108
a)
b)
0,5
Improbable
Tan probable
como improbable
1
Probable
Ejemplos:
1. Se lanza una moneda
={cara, sello}
P(cara) = 0,5
P(sello) = 0,5
2. Se lanzan 3 monedas
= {CCC, CCS, CSC, SCC, CSS, SCS, SSC, SSS}
1/8 1/8 1/8 1/8 /8 1/8 1/8
1/8
A: obtener exactamente 2 caras
A = {CCS, CSC, SCC}
1/8 + 1/8 + 1/8
P(A) = 3/8
(C) Conclusiones: De acuerdo a la definicin de
probabilidad de un suceso, y a los dos principios,
tenemos las siguientes conclusiones:
(1) P() = 1
(2) P( ) = 0
(3) P(A) = 1 - P(A)
PROBABILIDADES - EJEMPLOS
1.
109
(A B)
U
Si : (A B) =
Por lo tanto : P(A B) = 0
U
U
Ejemplo:
Se extrae una carta de una baraja. Cul es la
probabilidad de que sea un as o un rey?
4 4
+
52 52
8
=
52
=
111
(Masculino)
(Blanca)
Total
A (Anmico)
N (Normal)
11
Estado
Total
P(F
)= 3
8
Derivacin de la frmula:
P (F
)=
P(F I B)
P(A)
Comprobando
P(F
112
) = 811
11
P (F
)= 3
8
Ejemplo 2
Se recolect informacin sobre el peso del recin
nacido y si la madre fum o no durante el embarazo.
Los datos se presentan a continuacin:
CONDICIN
PESO R.N.
TOTAL
DE FUMADORA
BAJO
NORMAL
SI
30
10
40
NO
20
140
160
TOTAL
50
150
200
P(bajo) =
50
= 0,25
200
P(si) =
40
= 0,20
200
113
50
150
+
200
200
= 1
50
40
30
60
+
=
= 0,30
200 200 200 200
Aplicacin
La probabilidad de que el personal administrativo que
labora en una clnica local, llegue tarde el da lunes es
0,50 y la probabilidad de que llegue retrasado los das
lunes y martes es 0,20. Dado que cierto trabajador
lleg tarde el da lunes, cul es la probabilidad de
que llegue tarde el da siguiente?.
P (TM
P(TL ) = 0,50
P(T L I TM ) = 0,20
A partir de
P(A I B)
)
=
A
P(A)
Se despeja
( A)
P( A I B) = P( A) P B
114
) = P(T
M I TL )
P(TL )
P( B
TL
0,20
= 0,40
0,50
Aplicacin
Se sabe que en un lote de medicamentos de 50
frascos, hay 4 que no estn adecuadamente
empacados (defectuosos). Si se extraen al azar 2
frascos, uno a continuacin del otro, cul es la
probabilidad de que ambos sean defectuosos?.
P(D1 ) =
P(D 2
D1
4
50
)=
P ( D1 I D 2 ) = P ( D1 ) P D 2
3
49
D1
4
3
12
=
50 49 2450
Ejercicio
En una poblacin de pacientes hospitalizados, la
probabilidad de que uno de ellos, elegido
aleatoriamente tenga problemas cardiacos es 0,35. La
probabilidad de que un paciente con problemas
cardiacos sea un fumador es de 0,86. Cul es la
probabilidad de que el paciente elegido al azar de
entre la poblacin sea fumador y tenga problemas
cardiacos?.
Regla
de
la
independientes.
multiplicacin
para
sucesos
P (B
) = P (B)
Ejemplo 1:
La Compaa de Seguros JL ha desarrollado un
novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.
Entonces:
P ( A I B ) = P ( A) P ( B )
Ejemplo
Cul es la probabilidad de que en una familia con
dos hijos, ambos sean varones?
P (V1 ) = 0,5
P (V2 ) = 0,5
P ( V1 I V2 ) = P ( V1 ) P ( V2 )
= (0,5) (0,5)
P ( V1 I V2 ) = 0,25
116
Ejemplo 1:
La Compaa de Seguros JL ha desarrollado un
novedoso seguro mdico familiar. De acuerdo con una
investigacin hecha en el mercado, la probabilidad de
que el producto tenga xito es 0,80 si una compaa
competidora no introduce un plan similar en el
mercado, en tanto que la probabilidad de xito es 0,30
si la empresa competidora lanza al mercado un seguro
similar. Adems, la compaa JL estima que hay una
probabilidad de 0,40 de que la firma competidora
comercialice el producto.
Dado que el producto de la Compaa JL tuvo xito,
cul es la probabilidad de que la firma competidora
haya comercializado su novedoso plan de seguro?
Solucin:
P(C)
= probabilidad de que
competidora comercialice el producto,
la
compaa
=0
P( C )
,40
P(C
) =
0,6
0
P. Condicional
P. Conjunta
'
P(E/C) = 0,80 P ( C I E) = 0,60 0,80 = 0,48
P. Total P ( E) = 0,60
P (C
)=
E
P ( C I E)
P ( C I E) + P ( C ' I E)
0 .12
0 .12
=
= 0 .20
0 .12 + 0 .48 0 .60
Proporcin de
piezas defectuosas ()
Probabilidad
P()
1 = 0,10
P(1) = 0,20
2 = 0,15
P(2) = 0,30
3 = 0,25
P(3) = 0,50
118
A) Cul es la
defectuosa?
probabilidad
de
qu
esta
sea
P. Marginal
P(D/1)= 0,10
P(
1)
0,
20
1=0,10
P. Conjunta
P(D/2)= 0,15
P(
)=
3
50
0,
P(D/3)= 0,25
3=0,25
P ( D) = 0,1900
Respuesta A:
Hay tres maneras posibles de obtener un equipo
defectuosa del lote. Por lo tanto, la probabilidad de
obtener una pieza defectuosa, cualquiera que se la tasa
porcentual de defectuosos 10, 15 25 es:
P( D) = P( 1 I D) + P( 2 I D) + P( 3 I D)
119
Ejercicio B
De acuerdo con el Teorema de Bayes, la probabilidad
de que el lote contenga 25% de piezas defectuosas,
dado que la pieza elegida es defectuosa, es:
P( 3 / D) =
P( 3 I D) 0.1250
=
= 0.6579
P(D)
0.1900
Ejercicio
Un mdico ha decidido recetar dos nuevos
medicamentos a 200 pacientes enfermos del corazn de
la manera siguiente: 50 pacientes tomarn el
medicamento A, otros 50 tomarn el medicamento B y
los otros 100 restantes tomarn ambos medicamentos
El medicamento A reduce la probabilidad de un infarto
en 0,35 , el medicamento B reduce la probabilidad de un
infarto en 0,20 y los dos medicamentos, cuando se les
toma juntos, actan de manera independiente.
Los 200 pacientes fueron escogidos entre los que tenan
0,80 de probabilidad de sufrir un infarto. Si un paciente
elegido al azar sufre un infarto, cul es la probabilidad
de que haya tomado ambos medicamentos?
120
CAPTULO
DISTRIBUCIONES
DE
PROBABILIDADES
OBJETIVOS
Al finalizar el Captulo 8, el participante ser capaz de:
1.
2.
3.
4.
Pxn =
n!
donde x n
(n x)!
Ejemplo:
Los bilogos estn interesados en el orden en que cuatro
ribonucletidos adenina (A), uracilo (U), guanina (G) y
citosina (C) se combinan para formar una cadena. Cuntas
cadenas formadas por dos nucletidos pueden formarse?
122
4!
4x3x2x1
P =
=
= 12
(4 2)!
2 x1
4
2
Hacer
Hacerun
undiagrama
diagramade
derbol
rbol
para
paraindicar
indicarlas
las12
12cadenas
cadenas
COMBINACIN
Numero de combinaciones de n objetos tomadas de r
C xn =
n!
donde x n
x !( n x ) !
Ejemplo:
Se realiza un estudio para determinar la opinin de los
profesores de la EPUNFV respecto al aborto; si se elige una
muestra de cuatro profesores de un total de 45. Cuntas
muestras distintas pueden seleccionarse
C 445 =
45!
45 x 44 x 43 x 42 x 41! 45 x 44 x 43 x 42
=
=
= 148, 995
4!(45 4)!
4! x 41!
4!
123
Probabilidad
0.50
0.25
limitado de
- Distribucin binomial
- Distribucin de Poisson
- Distribucin hipergeomtrica
CONTINUAS: La variable puede tomar cualquier valor
dentro de un intervalo dado. Abarca:
- Distribucin normal
- Distribucin normal estndar o Z
- Distribucin t
2
- Distribucin Ji-cuadrada
- Distribucin F
8.3 VARIABLES ALEATORIAS
Una variable es aleatoria si toma diferentes valores como
resultado de un experimento .
Puede ser discreta o continua
Ejemplo: Se lanzan 3 monedas
X : variable aleatoria (ej : nmero de caras)
x : valores que puede tomar la variable
(ej : 0, 1, 2, 3)
124
2 caras
P(x) XP(x)
0
1
2
3
1/8
3/8
3/8
1/8
0
3/8
6/8
3/8
1/8
1 cara
( X) =
XP( x )
12
8
= 1,5
12/8
Ventas
diarias
10
11
12
13
N de das
de venta
15
20
40
25
100
Probabilidad de venta
de cada cantidad
0.15
0.20
0.40
0.25
1.00
Tipo de prdidas
125
Posibles N
de cajitas
pedidas/da
10
11
12
13
Alternativas de oferta
10
11
12
13
0
30
60
90
20
0
30
60
40
20
0
30
60
40
20
0
Posibles N
de cajitas
pedidas/da
10
11
12
13
Probabilidad
Prdida
que se reciban
Condicional
estos pedidos
0
30
60
90
Prdida
esperada
0.00
0.15
6.00
0.20
24.00
0.40
22.50
0.25
Prdida esperada: 52.50
126
P(X = x) =
n!
p xq n-x
x! (n - x)!
donde:
n : nmero de ensayos
x : nmero de xitos
p : probabilidad de xitos en un ensayo
q : probabilidad de fracaso en un ensayo
n - x : nmero de fracaso en el ensayo
Se aplica a la seleccin de una muestra, slo
cuando el resultado de cada solucin es
127
P(X = x ) =
n!
p xq n-x
x! (n - x )!
P(X = 2) =
4!
(0.2 )2 (0.80 )2
2! (4 - 2)!
= 0,1536
Ejercicio
La escasez de glbulos rojos puede determinarse
examinando al microscopio una muestra de sangre.
Suponiendo que un volumen pequeo contenga por
trmino medio 4 glbulos rojos en personas
normales, cul es la probabilidad de que una
muestra de personas normales:
128
P(X = x )
4! 1 1
= 116
0!4! 2 2
4! 1 1 4
= 16
1!3! 2 2
4! 1 1
= 6 16
2!2! 2 2
4! 1 1 4
= 16
3!1! 2 2
4! 1 1
= 116
4!0! 2 2
X
P(X = x )
0
1/16
1
4/16
2
3
6/16 4/16
4
1/16
129
La media
= XP ( x)
X
P(x)
XP(x)
0
1
2
3
4
1/16
4/16
6/16
4/16
1/16
0
4/16
12/16
12/16
4/16
32/16
32
XP ( x ) = 16
= 2 procesos
Tambin:
= np
= 4( 1 2 ) = 2
(x )
P( x)
P( x )
(x )
(x )2
( x ) 2 P( x)
0
1
2
3
4
1/16
4/16
6/16
4/16
1/16
-2
-1
0
+1
+2
4
1
0
1
4
4/16
4/16
0
4/16
4/16
16/16
2
(X ) P( x) =
= (X ) 2 P( x) =
130
16
16
16
= 1 proceso deficiente
16
Tambin
=
=
npq
4 ( 0,5 )( 0 ,5) = 1
Ejemplo:
Supngase que en cierta poblacin el 52 por ciento de
todos los nacimientos que se registraron son varones. Si
aleatoriamente se escogen cinco registros de
nacimientos dentro de esa poblacin, cul es la
probabilidad de que exactamente tres de ellos
pertenezcan a varones?.
131
P(3,5) =
r=3
5!
0.523 0.48(5 3) = 0.32 32%
3!(5 3)!
Uso de Tablas
Solucionando el problema anterior usando la tabla de
probabilidades binomiales
ta bla de proba bilida de s binom ia le s
p
n
0.37
0.38
0.39
0.40
0.41
0.42
0.43
0.44
0.45
0.46
0.47
0.48
0.49
0.50
0.0380
1
2
3
4
5
0.1755
0.3240
0.2990
0.1380
0.0255
4
3
2
1
0
0.63
0.62
0.61
0.60
0.59
0.58
0.57
0.56
0.55
0.54
0.53
0.52
0.51
0.50
132
P(X = x ) =
e
x!
donde
x!
Ejemplo:
Supongamos que estamos investigando la seguridad de
una peligrosa interseccin de calles, los registros
policacos indican un media de 5 accidentes mensuales
en esta interseccin. El nmero de accidentes esta
distribuido de acuerdo con una distribucin de Poisson y
el departamento de seguridad vial desea que
calculemos la probabilidad de que en cualquier mes
ocurra exactamente 3 accidentes.
133
P( x =3) =
= 5 acc/mes
53 2.71835
= 0.14042 14.04%
3!
Uso de Tablas
Solucionando el problema anterior usando la tabla de
distribucin de probabilidades de Poisson:
4 .1
.........
4 .5
..........
4 .9
0 .0 0 6 7
0 .0 3 3 7
0 .0 8 4 2
0 .14 0 4
0 .17 5 5
0 .17 5 5
=3
134
P(X = 2 ) =
3 2 ( 2.71828) 3
2!
= 02240
100!
( 0,02 ) 3 ( 0,98 ) 97
3! 97!
= 0,1823
x e
P(X = 3) =
x!
= np = 100 (0,02) = 2
( 2 ) 3 ( 2 , 71828 ) 2
8
=
= 0 ,1805
3!
6 ( 2 , 71828 ) 2
p 0.05 y n 20
135
M N M
k n k
P(X = k ) =
N
n
donde:
M : nmero de xitos en la poblacin
k : nmero de xitos en la muestra
N : tamao de la poblacin
N-M: nmero de fracasos en la poblacin
n : tamao de la muestra
n-k : nmero de fracasos en la muestra
c) Aplicacin
Calcular la probabilidad de obtener 10 tubos
defectuosos en una muestra de 20 tubos de radio
tomados sin reemplazo de un lote de 30 tubos, de lo
cuales 15 son defectuosos.
Datos:
k = 10
n = 20
N= 30
M= 15
15 30 15
10 20 10
P(X = 1 0) =
30
20
=
136
( 3003 )( 3003 )
9018009
=
30045015
30045015
= 0 ,3001
P(X = x ) =
=
( )( )
10
10
20!
1
1
2
10! (20 - 10)! 2
184756
= 0 ,1762
1048576
Donde
np (1 p )
N n
N 1
N n
N 1
137
138
b) Frmula
La funcin de densidad: f(x), para la distribucin
normal tiene la siguiente formula:
donde:
e : constante matemtica: 2.71828
p
:constante matemtica: 3.14159
m : media de la poblacin
s
: desviacin estndar de la poblacin
x
: cualquier valor de la variable aleatoria
continua
Areas debajo de la curva normal
No importa cuales son los valores de m y s, para una
distribucin de probabilidad normal el rea total bajo
la curva es 1.00, de manera que podemos pensar en
reas bajo la curva como si fuesen probabilidades.
Matemticamente es verdad que:
1: Aproximadamente 68% de todos los valores de una
poblacin normalmente distribuida se encuentra
datos 1 desviacin estndar de la
media .
6 8 % d a to s
2: Aproximadamente 95.5% de todos los valores de
una poblacin normalmente distribuida se encuentra
datos 2 desviacin estndar de la media.
139
+ 2
94.6% datos
3: Aproximadamente 99.7% de todos los valores de
una poblacin normalmente distribuida se encuentra
datos 3 desviacin estndar de la media
+ 3
9 9 % d a to s
8.5.2 La distribucin normal estndar (Z)
La distribucin normal tiene diferente y para
calcular probabilidades habra que integrar la funcin
de densidad. Por este motivo se estandariza la
variable.
La estandarizacin es un proceso estadstico que
consiste en restar la media a la variable y el resultado
dividirlo por la desviacin estndar.
140
Z=
0 .0 0
0 .0 1
0 .0 2
0 .0 3
0 .0 4
0 .0 5
0 .0 6
0 .0 7
0 .0 8
0 .0
0 .1
:
:
1 .1
1 .2
:
:
2 .4
2 .5
:
0 .0 0 0 0
0 .0 3 9 8
:
:
0 .3 6 4 3
0 .4 0 3 2
0 .0 0 4 0
0 .0 4 3 8
:
:
0 .3 6 6 5
0 .4 0 4 9
0 .0 0 8 0
0 .0 4 7 8
:
:
0 .3 6 8 6
0 .4 0 6 6
0 .0 1 2 0
0 .0 5 1 7
:
:
0 .3 7 0 8
0 .4 0 8 2
0 .0 1 6 0
0 .0 5 5 7
:
:
0 .3 7 2 9
0 .4 0 9 9
0 .0 1 9 9
0 .0 5 9 6
:
:
0 .3 7 4 9
0 .4 1 1 5
0 .0 2 3 9
0 .0 6 3 6
:
:
0 .3 7 7 0
0 .4 1 3 1
0 .0 2 7 9
0 .0 6 7 5
:
:
0 .3 7 9 0
0 .4 1 4 7
0 .0 3 1 9
0 .0 7 1 4
:
:
0 .3 8 1 0
0 .4 1 6 2
= 2.5
= 10
15
141
Ejercicio:
Un terapista fsico piensa que los puntajes en una
prueba de destreza manual tiene una distribucin
aproximadamente normal, con una media de 10 y una
desviacin estndar de 2,5. Si a un individuo, elegido
aleatoriamente, se le aplica el examen, cul es la
probabilidad de que logre un puntaje de 15 o mas
puntos?.
Obtenemos la siguiente informacin:
= 10
= 2.5
Calculando Z:
z=
= 2.5
15 10
=
=2
2.5
= 10 15
rea = .4772
Como deseamos conocer esta rea:
= 2.5
Cuando x = 11 z =
11 10
= 0.4 A = 0.1554
2.5
Cuando x = 14 z =
14 10
= 1.6 A = 0.4452
2.5
11 14
142
P(X>500)=0.5
143
P(500 X 650)=0.4332
Z=
Z=
Solucin:
La grfica se muestra la
respuesta
como
zona
sombreada, representada por
el rea entre la media (500
horas) y el valor de X, en el
cual estamos interesados
(650 horas). Estandarizando
la variable tenemos un valor
para Z
650 500
= 1.5
100
Z=
Z =
144
700 500
=2
100
Z=
650 500
= 1 .5
Z=
100
P(550 X 650)
A
este
valor
le
corresponde un rea
de 0,4332
Despus calculamos un valor de Z para 550
Z=
Z=
550 500
= 0.5
100
145
0,4332
0,1915
0,2417
146
CUANDO UTILIZAR Z o t
SE CONOCE ?
SI
USAR
USAR
NO
es n 30?
SI
NO
USAR
147
d. f . = n 1
d.f.
t .90
t .95
t .975
t .99
t .995
3.08
6.31
12.7
31.8
63.7
1.89
2.92
4.3
6.97
9.92
1.64
2.35
3.18
4.54
5.84
26
1.32
1.71
2.06
2.48
2.78
27
2.31
1.7
2.05
2.47
2.77
28
1.31
1.7
2.05
2.47
2.76
Ejemplo:
n= 28
N.C. = 95%
t=?
:
:
d.f. = 28 - 1 = 27
t = 2,0518
:
:
:
b) Frmula
t=
x
s
n
c) Grados de libertad
Se definen como el nmero de valores que
podemos escoger libremente.
148
b) Definicin
La distribucin Ji-cuadrada esta definida por
= Z i2
2
i =1
c) Aplicaciones
Las aplicaciones ms importantes estn en la
prueba de bondad de ajuste la prueba de
independencia estadstica
d) Distribucin
8.5.4 La Distribucin F
Caractersticas
Es una distribucin asimtrica a la derecha
Slo tiene valores positivos
Se utiliza para comparar variancias
poblaciones, con distribucin normal
de
dos
149
Frmula
F=
2
S mayor
2
S menor
150
CAPTULO
MUESTREO Y
DISTRIBUCIONES
DE MUESTREO
OBJETIVOS
Al finalizar el Captulo 9, el participante ser capaz de:
1. Determinar el tamao de una muestra
2. Asegurarse que las muestras que se extraigan sean
representativas de la poblacin de la que provienen
3. Comprender las distribuciones del muestreo
4. Comprender la relacin entre el costo del tomar
muestras ms grandes y la precisin adicional que
esto le proporcione a las decisiones tomadas a
partir de ellas
MUESTREO NO PROBABILSTICO:
inferencia estadstica.
No
permite
152
n =
Z S 2e
s 2e , mayor
= ( x)
Para poblaciones finitas (se conoce N), el tamao
final (nf) queda definido por la siguiente relacin
Ejemplo 1:
A fin de conocer el gasto mensual en medicinas por
familia, el Gerente de Marketing de un laboratorio
farmacutico desea determinar el tamao de la
muestra que le proporcione un nivel de confianza de
0,95 (Z = 1,96). Adems conoce por estudios
anteriores que las compras medias por familia eran
de S/. 120 mensuales, con una desviacin estndar
de 30. El Gerente busca un tamao de muestra que
le permita estimar el nivel de gasto con un error de
10.
153
n =
n=
Z S 2e
2
(1,96 )2 (3 0 )2
(1 0 )2
n = 36
Ejemplo 2
En cierta poblacin se 1200 escolares, se desea
estimar el nivel promedio de Hb con 0,95 de
confianza. Al realizar un estudio piloto se encontr
que x = 12,3 y
N = 1200
Se = 1,6
n=
= 0 ,5
nf =
= 0,5 .Calcular n
= 1,96
n
n
1+
N
Z 2 2 s 2e
(1,96 )2 (1,6 )2
(0,5 )2
= 39,33
39,33
= 38,08 39
39,33
1+
1200
Interpretacin
El nmero mnimo necesario de escolares para
realizar el estudio es de 39, si se desea estimar el
nivel promedio de Hb en la poblacin con una
precisin de 0,5.
154
Ejemplo 3
En cierta poblacin se 1200 escolares, de 9 11
aos se desea estimar el nivel promedio de hierro
srico. Con este fin se va a seleccionar una muestra
probabilistica. Si en un estudio similar se obtuvo
una media aritmtica de 60,6 mg/dl y S = 22,4
mg/dl. Calcular el tamao mnimo de la muestra si
la estimacin del parmetro se va a realizar con
0,95 de confianza y se asume un = 5
= 1,96
n=
N = 1200
Se = 22,4
Z 2 2 s 2e
(1,96 )2 (22,4 )2
(5 )2
= 77,10
= 5
nf =
n
1+
n
N
77,10
= 72,44 73
77,10
1+
1200
Interpretacin :
El nmero mnimo necesario de escolares para
realizar el estudio es 73, si se desea estimar el nivel
promedio de hierro srico en la poblacin con una
precisin 5
B. Para estimar una proporcin poblacional:
n =
Z 2 2 p e q e
155
donde:
pe = proporcin estimada de sujetos con la
caracterstica de inters. Se puede obtener de
revisin bibliogrfica, estudio piloto o asumiendo
pe = qe= 0,50
qe = proporcin estimada de sujetos sin la
caracterstica de inters.
= ( p )
Si se conoce N:
nf =
n
1+
n
N
Ejemplo 1:
En una poblacin grande, se desea estimar la
prevalencia de DM con 0,95 de confianza. De la
literatura se sabe que p = 0,10 si se asume un error
muestral de 5%, calcular n
Datos
Z 2 = 1,96
p e = 10 % = 0,10
qe = 90 % = 0,90
= 0,05
156
n =
Z 2 2 p e q e
n =
(1,96 )2 (0 ,1 )(0 ,9 )
(0 ,05 )2
n =
0 ,345744
0 , 0025
= 138 , 3 139
Interpretacin:
Si se desea estimar la prevalencia poblacional con
0,95 de confianza y un de 5% se deber evaluar
139 sujetos.
2. M. Sistemtico: Las unidades elementales son
seleccionadas dentro de un intervalo
(I)
de
igual tamao. Se extrae la muestra de acuerdo
a la lista de pacientes atendidos
I1 I2 I3 I4
X1
3. M. Estratificado: El marco poblacional se divide en
grupos homogneos (estratos); de cada uno se
extrae una submuestra, proporcional al tamao del
estrato. Muestreo por tipo de servicio
4. M. por Conglomerado: El marco poblacional se
encuentra agrupado en conglomerados o racimos
Se selecciona en forma aleatoria, el o los racimos.
Todos los pacientes que ingresaron un determinado
da.
ALEATORIO SIMPLE
SISTEMTICO
PROBABILISTCO
ESTRATIFICADO
POR CONGLOMERADO
MUESTREO
DE JUICIO
NO PROBABILSTICO
DE CUOTAS
DE TROZO
157
El error estndar
Es una medida de dispersin de una distribucin muestral. Es
equivalente a la desviacin estndar.
Desviacin estndar de la
distribucin de medias de muestra
Error estndar
de la media
Desviacin estndar de la
de proporciones
PO
X1
X2
X3
.
.
.
XN
Media
Varianza
:x
z=
x-
158
PO
x1
x2
X1
X2
X3
x3
.
.
.
..
XN
Media
xm
x
Varianza
: 2x
x2 =
x
x -
z =
2
n
=
x1
X2
X3
.
Media
PO2
PDM2
PDDM
X1
x1
( x1 x2 )
x2
X2
x2
(x x )
x3
X3
x3
(x x )
.
.
XN
xm
XN
Varianza
PDM1
X1
xm
( )
d = 1 2
12 22
+
n1 n2
( x x ) (1 2 )
z = 1 22
1 2 2
+
n1
n2
x21 x2 =
159
x = x
(2) Al incrementarse el tamao de la muestra, la PDM se
acercar a la normalidad, sin importar la forma de la
distribucin de la poblacin.
El teorema del lmite central nos permite utilizar las
propiedades de la distribucin normal en muchos casos en
los que los datos subyacentes pueden no estar distribuidos
normalmente.
160