You are on page 1of 149

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE CIENCIAS DE LA SALUD


SECCIN DE POST GRADO

BIOESTADISTICA

Ing. Oswaldo Daniel Casazola Cruz

Aspectos generales
Estadstica es la ciencia de la:
Sistematizacin, recogida, ordenacin y presentacin de
datos referentes a un fenmeno que presenta variabilidad
o incertidumbre para su estudio metdico, con el objeto
de (Descriptiva).
Deducir las leyes que rigen esos fenmenos (Probabilidad)
Y poder de esa forma hacer previsiones sobre los mismos,
tomar decisiones u obtener conclusiones (Inferencia)
La estadstica es un lenguaje para comunicar informacin basada en datos
cuantitativos, el cual cobra cada vez mayor importancia.

Con conocimientos de Estadstica podemos en


general hacer mucho ms que cuadros y
grficos. La estadstica nos proporciona los
mtodos adecuados para determinar:
Como debe planearse un programa para
obtener datos de manera que de ellos se pueda
extraer conclusiones dignas de confianza.
Como debe organizarse los datos.
Como debe analizarse los datos
Que conclusiones se puede obtener de los
datos.
Cuanta confianza se puede tener en estas
conclusiones.

CLASIFICACIN DE LA ESTADSTICA.- Comprende dos grandes


grupos:

ESTADSTICA DESCRIPTIVA.- Se puede definir como los mtodos


que implican recoleccin, presentacin y caracterizacin de un
conjunto de datos, con el objeto de describir en forma apropiada las
diversas caractersticas de dicho conjunto. En otras palabras
podemos expresar que un estudio estadstico se considera
descriptivo cuando solo se pretende analizar y describir los datos.

ESTADISTICA INFERENCIAL.- Es un conjunto de mtodos o


tcnicas que posibilitan la generalizacin o toma de decisiones en
base a una informacin parcial obtenida mediante tcnicas
descriptivas. Es decir un estudio estadstico, se considera
inferencial cuando se pretende inferir o predecir conclusiones que
ataen a toda la fuente de informacin de donde provienen los
datos. Esta prediccin se hacen con cierto grado de confianza; este
grado de confianza se mide probabilsticamente; el clculo de
probabilidades, piedra angular de la inferencia estadstica esta
como puente entre las dos partes de la Estadstica.

CONCEPTOS ESTADISTICOS BASICOS.-

POBLACION.- Es el conjunto de observaciones medidas o descrita


presentando caractersticas comunes susceptibles a ser observadas, las
decisiones y conclusiones basadas en ellos pueden hacerse con absoluta
certeza y el riesgo de decisiones incorrectas no existe.

Las observaciones medibles se denominan observaciones cuantitativas.


Las observaciones descritas se denominan observaciones cualitativas.
Adems la poblacin segn el nmero de sus observaciones pueden ser:
FINITA.- Cuando se conoce el nmero de elementos observados o medidos.
INFINITA.- Cuando se desconoce el nmero de elementos observados o
medidos.

MUESTRA.- Es el conjunto de medidas o conteos que se obtienen de


alguna poblacin con el propsito de obtener informacin acerca de
ella., se le da el nombre de muestra . Se suelen tomar muestras
cuando es difcil o costosa la observacin de todos los elementos de la
poblacin estadstica. Al nmero de elementos de la muestra se le
llama Tamao de muestra. Las estimaciones y conclusiones se pueden
generalizar hacia la poblacin en estudio, dando un margen de
probabilidad e incurriendo en un pequeo margen de error.

MUESTREO.- Es el proceso mediante el cual se trata de


seleccionar una muestra representativa. Esta seleccin
puede ser mediante: Muestreo simple aleatorio, muestreo
sistemtico, muestreo estratificado, etc..
PARMETRO.- Funcin definida sobre los valores
numricos de caractersticas medibles de la poblacin.
ESTADSTICO: Funcin definida sobre los valores
numricos de una muestra.
CARACTERES: Propiedades, rasgos o cualidades de los
elementos de la poblacin. Estos caracteres pueden
dividirse en cualitativos y cuantitativos.
DATO.- Son nmeros o medidas que han sido recopilados
como resultado de la observacin de una caracterstica o
variable.
Dichos
valores
pueden
ser
medidos
(cuantitativamente) y/o observados (cualitativamente).

APLICACIONES
TALENTO HUMANO.- Para la seleccin de personal. Con la
aplicacin de los test de aptitud y conocimiento. Las tcnicas
descriptivas son instrumentos adecuados para el tratamiento de
puntuaciones.

MARKETING.-Los estudios de mercado son dirigidos al


conocimiento de la demanda de productos, productos
competidores, efectos de campaas de publicidad , que
regularmente realiza la empresa. Las tcnicas estadsticas
permiten inferir parmetros poblacionales a partir de informacin
muestral.
PARMETRO.- Funcin definida sobre los valores numricos de
caractersticas medibles de la poblacin.

SALUD.- En el proceso de atencin de salud intervienen


innumerables factores ( Mdicos, Enfermeras, Paciente,
personal administrativo, etc.) que afectan a la calidad del
cuidado y la atencin. Hoy en da el control de calidad es
bsico para que los servicios de salud cumplan los
requisitos de calidad establecidos por las normas tanto
nacionales como internacionales. Los mtodos
estadsticos son una herramienta eficaz en est rea
para mejorar los procesos en el cuidado y la atencin.
FINANZAS.- El conocimiento de las fuentes de
financiamiento y los movimientos de los tipos de inters
son esenciales para que una empresa decida si se
somete algn tipo de endeudamiento. As como las
decisiones de inversin de nuevo producto vendrn
condicionados por los precios esperados. Para ello son
de gran utilidad las tcnicas de prediccin.

POBLACIN
DEFINICIN

MUESTRA

COLECCIN TOTAL

VARIABLE ESTADSTICA
POBLACIONAL

DEFINICIN

VARIABLE ESTADSTICA
MUESTRAL

SIMBOLOGIA

CARACTERES
ALFABETICOS EN
MAYUSCULAS

SIMBOLOGIA

EXACTITUD

VALORES REALES
UNICOS

PRECISION

PARAMETROS

CONSTANTES
ESTADSTICAS
2

PARTICIN DE LA
POBLACIN

ESTIMADORES

CARACTERES
ALFABETICOS EN
MINUSCULAS

VALORES ESTIMADOS

2
ni ~ xi ,
^ i

PRESENTACION DE DATOS
La informacin recopilada es necesario presentarlo
en forma resumida, elaborando tablas y grficas. Se
presentan todas las tcnicas de organizar y presentar
de manera ms efectiva estos datos masivos , que
pueden ser tanto cuantitativos como cualitativos .
Al incrementar el nmero de observaciones, se hace
necesario condensar los datos en tablas apropiadas
de resumen. Para ello se acomodan en diferentes
grupos (categoras), clasificando en forma
conveniente las observaciones. A este arreglo de
datos en forma tabular se le denomina distribucin
de frecuencias.

DISTRIBUCION DE
FRECUENCIAS
Es una tabla- resumen en la que se disponen los
datos
divididos
en
grupos
ordenados
numricamente, y que se denominan clases o
categoras.
Cuando se agrupan los datos , o se les condensa
en tablas de distribucin de frecuencia es ms
manejable y significativo el proceso de anlisis e
interpretacin de datos. En esta forma
resumida es muy sencillo describir las principales
caractersticas de los datos.
El propsito de organizar los datos es permitir ver
rpidamente todas las caractersticas de los
datos reunidos.

Ejemplo
Los datos presentados en la tabla 1 son el
resultado de una investigacin cuyo
propsito era conocer el nivel de desempleo
de una importante ciudad de su pas, segn
el sexo y el nivel acadmico de las personas
desempleadas.

1. DISTRIBUCION DE FRECUENCIAS

Tabla 1. Nivel de desempleo en la ciudad Kio , segn el


sexo y nivel acadmico de la poblacin

Nivel acadmico del


desempleado

SEXO
HOMBRES

MUJERES

TOTAL
N

PROFESIONAL
TCNICO
BACHILLER
SIN BACHILLER

740
580
2300
2190

987
470
2950
2420

1 727
1 050
5 250
4 610

13,7
8,3
41,5
36,5

TOTAL
PORCENTAJE

5810
46%

6827
54%

12 637

100,0

INTERPRETACION :
Los datos de la tabla 1 muestran que de un
total de 12 637 personas desempleadas
entrevistadas en la ciudad , el mayor ndice de
desempleo se da entre bachilleres ( 41,5% ) ,
seguido de personas con el nivel educativo
inferior al bachillerato ( 36,5% ) y el menor nivel de
desempleo se da en el de tcnicos profesionales
( 8,3%) .En relacin con el sexo ,el mayor
desempleo en la ciudad se presenta en la mujeres
con 54% del total de los entrevistados .

TABLAS DE FRECUENCIAS

1 A o R DMAX DMIN
2 K 1 3,32LogN
3 IC

A o R

Log 15 1,17

Log 30 1,48

Log 45 1,65

Log 20 1,30
Log 25 1,39

Log 35 1,54
Log 40 1,60

Log 50 1,69

Cuestionario de Autovaloracin de la
Ansiedad de ZUNG
CUESTIONARIO

Sexo
:
......................
Edad
:
.........................
Lugar de Nacimiento
:
..........................
Grado de Instruccin
:
.....................
Fecha :
..............................
Instrucciones :
A continuacin se le entregar un cuestionario que deber responder lo
ms sinceramente posible ya que al ser annimo
no se juzgarn sus respuestas .
Existen cuatro columnas encabezadas por Nunca o Raras Veces", "Algunas
Veces", " Buen Numero de Veces" y "La Mayora de las Veces". Usted deber
marcar con una X en el espacio de la columna de acuerdo a su forma de
pensar y sentir .

Nunca o
Raras
Veces
1.- Me siento mas nervioso y
ansioso que de costumbre
2.- Tengo miedo de las cosas o
personas
3.- Me siento como si fuera a
reventar y partirme en pedazos
4.- Siento que todo esta bien y que
nada malo puede sucederme

5.- Me tiemblan los brazos y piernas


6.- Me mortifican los dolores de
cabeza , cuello o cintura
7.-Despierto con facilidad o siento
pnico
8.- Me siento dbil o me canso
fcilmente

Algunas
Veces

Buen
Mayora
Nmero de de Veces
Veces

Nunca o
Raras
Veces
9.- Me siento tranquilo y puedo
permanecer calmado
10.-Puedo sentir agitacin en el
corazn
11.-Sufro de mareos
12.- Sufro de desmayos

13.-Puedo inspirar y expirar


fcilmente
14.- Sufro de adormecimiento e
hinchazn de manos y pies
15.-Sufro de indigestin
16.- Sensacin de miccin con
mucha frecuencia

Algunas
Veces

Buen
Nmero
de Veces

Mayora
de
Veces

Nunca o
Raras
Veces

Algunas
Veces

Buen
Mayora
Nmero de de Veces
Veces

17.- Generalmente mis manos


estn secas y calientes
18.- Siento bochornos
19.-Me quedo dormido con
facilidad y descansado en el
tiempo de sueo
20.-Tengo pesadillas

Muchas Gracias por su colaboracin !

RANGOS Y NIVELES DE ANSIEDAD DEL


CUESTIONARIO

Rangos

Niveles de Ansiedad

Debajo de 35 :

Normal Sin ansiedad

35 a 49

Ansiedad Mnima a Moderada

50 a 74

Ansiedad Marcada a Severa

75 a ms

Grado Mximo de ansiedad

NIVELES DE ANSIEDAD
MUESTREO ESTRATIFICADO EN HOMBRES :
ESTRATOS

NIVELES
DE
ANSIEDAD

N
HOMBRES

NORMAL

MINIMO A
MODERADA

MARCADA A
SEVERA

GRADO
MAXIMO

TOTAL

15

MUESTREO ESTRATIFICADO EN MUJERES :

ESTRATOS

NIVELES
DE
ANSIEDAD

N
MUJERES

NORMAL

12

MINIMO A
MODERADA

MARCADA A
SEVERA

GRADO
MAXIMO

TOTAL

16

SONDEO PILOTO
HOMBRES
1.- Paso :

Xi
38

39

29
36

23
34
33

36

25

23
36

31

36

n = 15

36
41

Xi = 496

DISTRIBUCION DE FRECUENCIA
1.- AMPLITUD O RANGO :

A o R = 41 23 = 18

2.- K = 1 + 3,32 log 15


K = 1 + 3,32 (1,17)
K = 1 + 3,88 4,88 5
3.- INDICE DE VARIACION :

= A o R = 18 = 3.6 4
k
5

CUADRO DE DISTRIBUCIN DE FRECUENCIA

FRECUENCIAS
N

CLASES

M. C.

F. ABS.

F.A. MA F.A. ME

F.R.

19 - 23

21

ll=2

15

2/15

24 - 28

26

l =1

13

1/15

29 - 33

31

l l l =3

12

3/15

34 - 38

36

llll ll = 7

13

7/15

39 - 43

41

ll=2
FA = 15

15

2/15

HISTROGRAMA N 1
F.Ai

HISTOGRAMA DE
FRECUENCIA

POLIGONO DE
FRECUENCIA

M.C. i

SONDEO

PILOTO

MUJERES
1.- Paso :

Xi
47
52
28

36
27
24

29

28

24

32

24

34

27
30
26
43

Xi = 511

DISTRIBUCION DE FRECUENCIA

1.- AMPLITUD O RANGO :

2.- K = 1 + 3,32 log 16


K = 1 + 3,32 (1,20)
K = 1 + 3.98 4.98 5

3.- INDICE DE VARIACION :

4.- INTERVALO DE VARIACION :

5.- INTERVALO DE CLASE :

A o R = 52 24 = 28

= A o R = 28 = 5.6 6
k
5
2 = 52 + 6 = 58
1 = 24 - 6 = 18

58 18 = 8
5

CUADRO DE DISTRIBUCIN DE FRECUENCIA

FRECUENCIAS
F. ABS. F.A. MA F.A. ME

F.R.

CLASES

M. C.

18 - 25

21.5

lll=3

16

3/16

26 - 33

29.5

llll lll = 8

11

13

8/16

34 - 41

37.5

ll=2

13

2/16

42 - 49

45.5

ll=2

15

2/16

50 - 57

53.5

l =1

16

1/16

FA = 16

HISTROGRAMA N 2
F.Ai

POLIGONO DE
FRECUENCIA

HISTOGRAMA DE
FRECUENCIA

M.C. i

2.

HISTOGRAMAS

Las distribuciones de frecuencia se


presentan muy a menudo en forma de figuras
graficas denominadas histogramas ( grafica de
barras) o en graficas circulares .

Para el caso del ejemplo de la


investigacin sobre el desempleo en la ciudad
Kio , la grafica de barras o histograma puede
presentarse as :

Desempleo en la ciudad de Kio, segn nivel


acadmico y sexo de las personas .

GRACIAS

DRA. ARCELIA ROJAS S.

MEDIDAS DE TENDENCIA
CENTRAL O DE
POSICIONAMIENTO

Las medidas de tendencia central son cantidades tpicas o representativas de un


conjunto de datos ; las principales medidas son : moda, mediana y media o
promedio .

LA MEDIA O PROMEDIO ARITMTICO


La media es el valor representativo de la serie, se
representa para una muestra o una poblacin.
Xi=cada uno de los datos en medicin.
n=nmero de datos sumados
n

x1 x2 x3 .... xn

i 1

xi

EJEMPLO
HALLAR LA MEDIA DE EDADES DE
UNA
POBLACION
6
PACIENTES
INGRESADOS AL CENTRO DE SALUD
X: 18, 24, 45, 12, 89, 12

x = (18+24+45+12+89+12)/6
=33.33

LA MEDIA PONDERADA
X : ES LA TALLA DE 65
PACIENTES
DE
UN
CENTRO DE SALUD, SE
QUIERE SABER CUAL ES
LA ESTATURA PROMEDIO
n

x
x

xi f i

i 1

= (109.15/65)
= 1.679

Xi

Fi

(metros)

XiFi

1.55

4.65

1.60

12.8

1.65

22

36.3

1.70

17

28.9

1.75

10

17.5

1.80

9.00

65

109.15

LA MEDIANA
La mediana es el punto medio de un conjunto de
datos; o es aquel valor de la variable que divide al
conjunto de valores en dos partes iguales.
CARACTERISTICAS
Localiza el mejor centro de distribucin, para lo
cual es necesario ordenar.
Su clculo es fcil y sensible a los valores
extremos

Me X ( n 1) / 2

Datos impar

Se tiene los gastos de 7 personas


X: S/. 120, S/. 140, S/. 100, S/. 150, S/. 145, S/. 135, S/. 160
CALCULAR LA MEDIANA
PASOS
En la mediana se ordenan los datos
X: S/. 100, S/. 120, S/. 135, S/. 140, S/. 145, S/. 150, S/. 160
En datos impar se toma el valor central de acuerdo a la formula
(n=7)
Me=140

Datos par

Me 1 / 2( X ( n / 2) X ( n 1) / 2 )

Se tiene los pesos de 8 personas


X: 70, 65, 83, 62, 94, 75, 79, 86 Kg
CALCULAR LA MEDIANA
PASOS
En la mediana se ordenan los datos
X: 62, 65, 70, 75, 79, 83, 86, 94 Kg
En datos impar se toma el valor central de acuerdo a la formula
(n=7)
Me=77 Kg

LA MODA
La moda es el valor de la variable que
mayor veces se repite o con mayor
frecuencia sucede.
Un grupo de datos puede tener una moda,
dos modas, etc., en tales casos la
distribucin se la unimodal, bimodal, etc.
Tambin la moda puede no existir, en caso
de haber valores que no se repitan.

Ejemplo.
Hallar la moda de los nmeros: 2,2,3,4,5,5,5,5, 6,7,7.
El nmero que mas veces se repite es el 5, por lo tanto 5 es la
moda; unimodal
Hallar la moda de los nmeros:
2,3,4,5,6,7
Ningn nmero se repite ms que los otros por lo tanto no hay
moda
Hallar la moda de las calificaciones de los estudiantes:
16,15,17,18,19,15,16,10
Las calificaciones que ms veces se repiten son 15, 16; por lo
tanto 15, 16 son las calificaciones moda(bimodal)

MEDIDAS DE DISPERSION

Las medidas de dispersin dan idea de la


separacin de los datos numricos
alrededor de un valor medio
Tipos de medidas de dispersin
Rango
Estndar
Varianza
Desviacin estndar
Coeficiente de Variacin
Variable estandarizada

RANGO
El Rango o recorrido es la diferencia entre los valores
extremos mximo y mnimo.
R=Xmax Xmin
Ejemplo: Hallar el rango de la siguiente serie de nmeros:
4,5,7,9,9,10,12,15
R=15 4 = 11

La dispersin de los datos ser mayor cuanto mayor sea el recorrido. El rango no es una
buena medida de dispersin puesto que basta con que un dato se aleje de la media para
que el rango resulte muy afectado, ya que nicamente depende de dos valores, sin que
influyan para nada los datos restantes

ANALISIS DE REGRESION Y CORRELACION


El anlisis de regresin y correlacin es un mtodo
estadstico utilizado para calcular la relacin entre
dos o mas variables y su grado de relacin .
1 . ANALISIS DE REGRESION LINEAL
Para ejemplificar este mtodo de anlisis de datos,
se plantea el siguiente ejemplo :
El gerente de un Hospital de las ciudad APQ realizo
una investigacin con el propsito de analizar
entre el numero de Pacientes atendidos y el
numero de quejas recibidas en cada uno de los
ultimos 6 meses de ao en curso .
Los datos de clientes y quejas de los seis meses
objeto del estudio de muestran en la tabla 6 .

ANALISIS DE REGRESION Y CORRELACION


1 . ANALISIS DE REGRESION LINEAL
Tabla 6 . Numero de Pacientes atendidos y quejas
recibidas por el Hospital
Mes de actividad

Numero de Pacientes
atendidos por mes
(miles)

Numero de
quejas recibidas
por mes

6,6

75

5,3

69

4,9

71

7,4

86

7,1

78

5,6

73

ANALISIS DE REGRESION Y CORRELACION

1 . ANALISIS DE REGRESION LINEAL


A . El primer paso en le anlisis de regresin es
recurrir al mtodo de mnimos cuadrados , que
es una tcnica matemtica que permite
construir con los datos X y la lnea que
representa mejor la relacin entre las dos
variables .

La ecuacin general del mtodo de los mnimos


cuadrados que se emplea en el anlisis de
regresin es :

= a + bx

ANALISIS DE REGRESION Y CORRELACION


1 . ANALISIS DE REGRESION LINEAL
Donde :

: variable dependiente (para este caso,


numero de quejas )
a : interseccin estimada de la lnea de
regresin con el eje .
b : pendiente estimada de la lnea de
regresin : coeficiente de regresin
X : variable independiente , numero de Pacientes
que reciben atencin medica.

ANALISIS DE REGRESION Y CORRELACION

1 . ANALISIS DE REGRESION LINEAL

B . El siguiente paso en le anlisis de regresin es


calcular los valores apropiados de a y b para
sustituirlos en la ecuacin de mnimos
cuadrados ;
entonces :
( y ) ( x 2 ) ( x) ( xy )


( n) ( x ) ( x )
2

(n ) ( xy) ( x) ( y )
( n) ( x 2 ) ( x ) 2

ANALISIS DE REGRESION Y CORRELACION

1 . ANALISIS DE REGRESION LINEAL


Donde:
n : numero de datos
x : suma de los valores X .
y : suma de los valores
x : suma de los valores
xy : suma de los productos de X por
a : interseccin de la lnea de regresin
con el eje
b : pendiente estimada de la lnea de
regresin : coeficiente de regresin .
2

ANALISIS DE REGRESION Y CORRELACION


1 . ANALISIS DE REGRESION LINEAL
Calculo de la ecuacin :
Tabla 7.Calculo de regresin lineal para el numero de
clientes atendidos y quejas recibidas por el hotel
Mes de
actividad

x2

XY

Y2

6,6

75

43,56

495,0

5 625

5,3

69

28,09

365,7

4 761

4,9

71

24,01

347,9

5 041

7,4

86

54,76

636,4

7 396

7,1

78

50,41

553,8

6 084

5,6

73

31,36

408,8

5 329

n= 6

36,9

452

232,19

2 807,6

34 236

ANALISIS DE REGRESION Y CORRELACION


1 . ANALISIS DE REGRESION LINEAL
C . Se reemplaza los datos en la ecuacin de mnimos
cuadrados y se obtiene la ecuacin de regresin
lineal :
Y = a + bx
Donde :
a

( y ) ( x 2 ) ( x) ( xy )
( n) ( x 2 ) ( x ) 2

(n) ( xy ) ( x) ( y )
( n)

(x

) ( x) 2

(452) (232,19) (36,9) (2807,6)


42,8
2
(6)232,19 (36,9)

(6) 2 807,6 (36,9) (452)


(6)232,19 (36,9) 2

y 42,8 5,29 x

ANALISIS DE REGRESION Y CORRELACION


1 . ANALISIS DE REGRESION LINEAL
La grafica para esta ecuacin es la siguiente :
Relacin entre pacientes atendidos y quejas
recibidas por mes .
Y

Numero
De quejas
recibidas

80
75
70
65
60
55
50

y 42,8 5,29 x

45 50
55 60 65 70 75
nmero de clientes atendidos (miles)

ANALISIS DE REGRESION Y CORRELACION

1 . ANALISIS DE REGRESION LINEAL


Los datos de la grafica indican que existe una
relacin directa (positiva) entre el numero de
Pacientes atendidos y el numero de quejas
recibidas , es decir , que a medida que
aumenta el numero de pacientes atendidos por
el hospital , aumenta el numero de quejas
recibidas por el servicio prestado a sus
clientes .

ANALISIS DE REGRESION Y CORRELACION


2 . COEFICIENTE DE CORRELACION
El anlisis de correlacin sirve para medir la
fuerza o el grado de correlacin entre las
variables objeto de estudio en le anlisis de
regresin .
La ecuacin para medir el coeficiente de
correlacin es la siguiente :

(n) ( xy ) ( x) ( y )

( n) x

( x ) 2 ( n) y 2 ( y ) 2

Donde :
r = coeficiente de correlacin

ANALISIS DE REGRESION Y CORRELACION


2 . COEFICIENTE DE CORRELACION
El coeficiente de correlacin es un numero que,
en determinado conjunto de datos , se
encontrara entre -1 y +1 y que indica :
A . Direccin de correlacin
Si es positiva , significa que X y Y aumentaran y
disminuirn simultneamente ; por ejemplo, si X
se incrementa , Y tendera entonces a aumentar
tambin . Si r es negativa , las variables tendern
a moverse en direcciones opuestas ; por
ejemplo, si X se incrementa , Y tendera a
decrecer, o viceversa .

ANALISIS DE REGRESION Y CORRELACION


2 . COEFICIENTE DE CORRELACION
B . Fuerza de la relacin
Cuanto mayor sea el valor absoluto de r, mas
estrecha ser la relacin de las dos variables y
mejor ajustara los datos el diagrama de
dispersin la ecuacin de mnimos cuadrados .
En los extremos ( esto es , si r es +1 -1 ) ,la
ecuacin contendr todos los puntos de datos .
Esto es , que cuanto mas se aproxime r a +1 ,
mayor ser la relacin directa entre las variables,
y cuanto mas se aproxime r a -1 , mas inverso es
el grado de relacin entre las variables .

ANALISIS DE REGRESION Y CORRELACION


2 . COEFICIENTE DE CORRELACION
B . Fuerza de la relacin
Cuando r = 0 , no hay relacin lineal entre las
variables .
Se calcula entonces el valor de r para el caso de
la relacin entre el numero de pacientes
atendidos y numero de quejas recibidas por el
hospital objeto de estudio :

(6) (2807,6) (36,9) (452)

(6) (232,19) (36,9) (6) (34 236) (452)


2

166,8

0,89
187,24

ANALISIS DE REGRESION Y CORRELACION


2 . COEFICIENTE DE CORRELACION
Interpretacin
Como el valor de r calculado ( 0,89) es positivo,
entonces la relacin entre el numero de
pacientes atendidos y el numero de quejas
recibidas es directa , es decir, que cuando
aumenta el numero de pacientes atendidos por el
hospital aumenta el numero de quejas recibidas .
Tambin, como el valor de r ( 0,89) se acerca al
valor +1 , significa que hay una relacin muy
estrecha entre el numero de pacientes y el
numero de quejas en el hospital.

ANALISIS DE REGRESION Y CORRELACION


3 . COEFICIENTE DE DETERMINACION
El coeficiente de determinacin es el cuadrado
del coeficiente de correlacin y asume un
significado especial porque su valor representa
la proporcin de la variacin de Y que es
explicado por la variable independiente X por
medio de la ecuacin e regresin .
Siguiendo el caso del hospital :

r2

= r

r = 0,89 x 0,89

= 0,7921

ANALISIS DE REGRESION Y CORRELACION


3 . COEFICIENTE DE DETERMINACION
Donde:
r = coeficiente de correlacin
2 = coeficiente de determinacin

INTERPRETACIN DEL VALOR 0,7921 :


El valor 0,7921 significa que 79,21% de la
varianza en las quejas recibidas por el hospital
se explican por los cambios en el numero de
pacientes atendidos mensualmente por el
hospital .

ANALISIS DE REGRESION Y CORRELACION


3 . COEFICIENTE DE DETERMINACION
INTERPRETACIN DEL VALOR 0,7921 :
La otra parte de la varianza en las quejas ( 21%)
se debe a otros factores diferentes al cambio en
el numero de pacientes atendidos .
Otra formula para calcular 2 es:

var ianza en Y exp licada por X


r
Variacin total en Y
2

GRACIAS

PRUEBA DE HIPTESIS
PRUEBA DE HIPOTESIS
Recordemos que una hiptesis es una suposicin
respecto al problema de investigacin , y lo que
se hace en la prueba de hiptesis es determinar
si la proposicin es consistente con los datos
obtenidos una vez realizada la investigacin. Si
la hiptesis o proposicin no es consistente con
los datos obtenidos , se rechaza la hiptesis.
PASOS PARA APROBAR UNA HIPOTESIS
A. Formulacin de la hiptesis.
Las hiptesis se plantean de dos maneras
fundamentales: la hiptesis nula H0 y la hiptesis
alterna Ha.

PASOS PARA PROBAR UNA HIPTESIS


A. Formulacin de la hiptesis.
Por ejemplo, el director del Hospital XPQ
considera que sus procedimientos operativos
garantizan que el paciente promedio solo tiene
que esperar 7 minutos en la fila de solicitar y
obtener una cita.
La hiptesis nula y la hiptesis alterna pueden
formularse de la siguiente manera :
- Hiptesis nula H0 : tiempo promedio de espera
en la fila para ser atendido mayor a 7 minutos .
- Hiptesis alterna HA: tiempo medio de espera en
la fila para ser atendido 7 minutos .

B. Eleccin de la prueba estadstica adecuada .


Es muy importante saber que para la prueba de
hiptesis existen varias pruebas estadsticas por
lo que el investigador debe escoger la apropiada
teniendo en cuenta las caractersticas del caso
que va a investigar .
C. Definir el nivel de significancia .
Por ejemplo : = 0,05

D.

Recolectar los
representativa

datos

con

una

muestra

En el caso del estudio del tiempo de espera por


los pacientes del hospital XPQ, se lleva a cabo
una investigacin con Base en la observacin en
momentos aleatorios de 850 pacientes en
oficinas del hospital elegidas aleatoriamente. El
tiempo promedio de espera de los pacientes fue
de 8,2 minutos y la desviacin estndar de 2,6
minutos .

E. Estimar la desviacin estndar de la distribucin


muestral de la media .
Se utiliza la siguiente formula :

Sx
Donde :

S
n

SX = desviacin estndar de la distribucin muestral


de la media .
S = desviacin estndar de la muestra.
= tamao de la muestra

E. Estimar la desviacin estndar de la distribucin


muestral de la media .
Entonces :

Sx

2,6
0,089
850

Para transformar la media de la muestra en una


puntuacin Z, con el contexto de la distribucin
muestral:

x
8
,
2

7
,
0
Z

13

sx

0,089

E. Estimar la desviacin estndar de la distribucin


muestral de la media .
Entonces, se compara el valor calculado (en este
caso Z=13) con el valor critico de la prueba
estadstica (tomada de la tabla de valores Z) segn el
nivel de significacin elegido. Si el valor calculado
(Z=13) es menor que el valor critico (Z=1,96 con el
nivel de significacin = 0,05 ), no se rechaza la
hiptesis nula. Si el valor calculado es mayor que el
valor critico , se rechaza la hiptesis nula .

E. Estimar la desviacin estndar de la distribucin


muestral de la media .

Zona de
rechazo

Zona de
rechazo

-1.96

O
z

1.96
valor
critico

13
Valor
Estimado

F. Decisin Estadstica .
Para el caso en mencin, como el valor calculado
Z=13 es mayor que el valor critico 1,96 ; entonces
se rechaza la hiptesis nula .
G. Conclusin .
Con un nivel de significancia del 0,05 o 95% de
confianza , no es adecuado afirmar que el tiempo
promedio de espera en la fila por un paciente del
hospital XPQ es de 7 minutos .

PRUEBA Z
La prueba Z es una prueba e distribucin normal que
tiene como fin comparar los puntajes de distribuciones
que son diferentes entre si .
Para Salkind los valores de los puntajes Z tienen que
ver con la probabilidad de que un puntaje dado aparezca
en una distribucin.
El valor de Z es el resultado de dividir la desviacin de
un puntaje individual respecto a la media , entre la
desviacin estndar , utilizando la formula siguiente :

La formula para calcular la prueba Z es :

xi x
Z
s
Donde :

xi

= puntuacin o valor de medicin para


transformar
x en unidades de desviacin estndar
= medida de la distribucin o promedio de las
mediciones .

S = la desviacin estndar de las mediciones o datos


obtenidos
Z= puntuacin de la medicin transformada a unidades
de desviacin estndar:
La estandarizacin de valores que permite comparar
puntuaciones de 2 distribuciones .
Veamos un ejemplo de aplicacin de las
puntuaciones Z o estandarizacin de mediciones .
Ejemplo
Supongamos que va a compararse una distribucin
obtenida en la medicin del valor promedio mensual
de gastos per capita en alimentacin por los
pacientes de un Hospital A , con una distribucin de
medicin de la misma variable en el hospital B

Supongamos tambin que un paciente del hospital A


gasta en promedio mes para el rubro alimentacin. S/.270
(la media de gasto en alimentacin para esta ciudad es
de S/.305 y la desviacin estndar de S/.39), en el
hospital B, otro paciente destina en alimentacin S/.295
por mes (el promedio e gasto mensual per capita de los
pacientes del hospital B es de S/.285 con una desviacin
estndar de S/.30) .
Esta en mejores condiciones de gasto en alimentacin
el paciente del hospital B respecto al paciente del
hospital A ?

ZA

270.000. 305.000
39.000

0.89

ZB

295.000. 285.000
30.000

0.33

Como los valores de Z tanto para el Hospital A como


para el Hospital B son inferiores a 1,96 ;entonces no
existen diferencias significativas entre el gasto de
los pacientes de los hospitales respecto a la otra ,
porque ambos estn alrededor del valor Z= 1,96.

5.

Aparecen diferencias cuando uno de los valores Z es


inferior a 1,96 y el otro es superior
En la distribucin de puntuaciones Z estos valores se
ubican as:
S = desviacin Standard

AGRUPA EL
AGRUPA
EL
68.6% DE LOS
68.6%
DE
DATOS
LOS
DATOS

3S

2S

-1S

+1S

Agrupa 95.44% de los datos

Agrupa 99.74% de los datos

+2S

+3S

PRUEBA T
La prueba t de Student es una prueba estadstica
para evaluar hiptesis en torno a una media
cuando los tamaos de la muestra son
menores de 30 mediciones ( < 30) y se quiere
saber si existe diferencia significativa entre la
media de la muestra y la media poblacional .
El valor t se obtiene mediante la siguiente
formula :

media de la muestra - (media poblacional segun hipotesis nula ) x Error estandar estimado de la media

Sx

APLICACIN
Supngase que el gerente comercial de una firma
farmacutica estima que es necesario vender 750 cajas
de Tamifl por semestre, en cada una de 9 ciudades
del pas , para que la venta sea rentable.
El gerente quiere probar la hiptesis de que las
ventas por ciudad son superiores a los 750 cajas de
Tamifl por semestre .

A. Para ello se formulan las siguientes hiptesis


.
H0 : las ventas promedio de cajas de Tamifl por semestre
por ciudad es menor o igual a 750 cajas .
HA : las ventas promedio de cajas de Tamifl por semestre
por ciudad es mayor de 750 cajas .
Planteada la hiptesis, el siguiente paso es establecer el
nivel de significancia (valor de ) permitido . Para =
0,05; el valor tabulado de t (valor critico) con 8 grados
de libertad ( n 1, donde n es el numero de ciudades ),

B. Para obtener la informacin se efectu el estimativo


en cada una de las nueve ciudades y se encontr
que las ventas promedio por semestre fueron de
890 cajas de Tamifl con una desviacin estndar
de 118 cajas.
C. Con los datos anteriores se calcula el error
estndar de la media Sx con la siguiente formula :

Sx

S
118

39,3
n
9

D. Luego se calcula el valor estadstico de la prueba t.

media de la muestra - (media poblacional segun hipotesis nula )


Error estandar estimado de la media

t 890 - 750 3,50


39,3

Para saber si se rechaza o no la hiptesis nula , es


necesario comparar el valor t estimado (t= 3,50)
con el valor t critico o valor en tabla (t= 1,86).

E. Como el valor t estimado (t = 3,50) es mayor que el


valor t critico (t =1,86) ; entonces la hiptesis nula se
rechaza .
F. Conclusin
Aunque las ventas medias por semestre (X= 890) son
superiores a 750 cajas de Tamifl, la diferencia basada
en la muestra de 9 ciudades, no es estadsticamente
significativa . Segn estos datos, la decisin de vender
el volumen estimado de cajas de Tamifl no es efectiva
, lo que indica que la venta de cajas de Tamifl puede
ser inferior a 750 semestrales por ciudad .

7. HIPOTESIS SOBRE PROPORCIONES


El Director de una clnica particular mas
importantes de la ciudad CTMC llevo a cabo una
encuesta entre 450 turistas que visitaban la
ciudad y encontr que 73% de encuestados
gastaban valores superiores a US$ 3 500 al ao en
sus visitas a la ciudad y que estaran interesados
en utilizar los servicios de ciruga esttica para l
hotel.
La clnica esta interesada en desarrollar un
paquete especial de servicios para este grupo de
turistas si los datos son reales .

L clnica desarrollara su plan si el porcentaje verdadero de


turistas con gastos superiores a los US$ 3 500 es mayor al
60% .
A. Se plantea la hiptesis de trabajo :
Hiptesis Nula
H0 = P 60% H0 0,60
Hiptesis Alterna HA = P > 60% Ha > 0,60
B. Se establece el nivel de significancia (valor )
permitido. Para = 0,05; el valor tabulado de Z
(valor critico) = 1,64.

C. Se calcula el error estndar estimado empleando el


valor P especificado en la hiptesis nula .

Sp

P(1 P)
(0,60 ) (0,40 )

0,02309
n
450

D. Se calcula la prueba estadstica como sigue :

P 0,73 0,60
z PSp
0,02309

5,6301

E. Decisin
Como el valor calculado para Z = 5,63 es mayor
que el valor critico de Z (1,64 ) ; se rechaza la
hiptesis nula .
F. Conclusin
Por los datos obtenidos en el estudio, se concluye
que con un nivel de confianza de 95% ( 1- =
0,95); mas de 60% de los turistas de la ciudad de
realizan gastos superiores a US$ 3 500 al ao en
sus viajes a esta ciudad .Por lo tanto , la gerencia
puede introducir el paquete de servicios en su
clnica y dirigirlos a este grupo de turistas .

PRUEBA CHI CUADRADO PARA


PRUEBA DE HIPOTESIS
La prueba de Chi cuadrado X
( 2 ) permite
determinar si el patrn de frecuencia observado
corresponde o se ajusta al patrn esperado ;
tambin sirve para evaluar hiptesis acerca de la
relacin entre dos variables categricas .
Prueba de chi cuadrado ( X 2 ) para una muestra
unica :

APLICACIN
Ejemplo
Supngase que el director de servicio de salud
necesita probar la eficacia de tres campaas de
vacunacin a la poblacin infantil en su ciudad,
en los ltimos tres aos . El director desea medir
el efecto de cada campaa en los padres de
familia que lleven a sus nios a los centros de
salud que prestan el servicio de vacunacin
durante el tiempo de la respectiva campaa .

El numero de nios atendidos en estos tres ltimos aos


fue :
Tabla 5. Atencin de nios en vacunacin en los
ltimos 3 aos en la ciudad .

Ao de campaa

No. de nios
atendidos en mes de
campaa

Mes de campaa

2005

11 700

Julio

2006

12 350

Mayo

2007

10 900

Septiembre

Total

34 950

El director necesita saber si el numero de nios


atendidos durante el periodo en que estuvo
vigente cada campaa difiere en forma
significativa. Este problema se resuelve aplicando
la prueba
) d la siguiente
X 2 de chi cuadrado (
forma :

A . Se plantean la hiptesis nula y la hiptesis alterna


Hiptesis Nula H0 = no existen diferencias
significativas en el numero de infantes atendidos
en las ultimas tres campaas de vacunacin
infantil.
Hiptesis
Alterna
HA
=
existen
diferencias
significativas en la cantidad de nios atendidos
en las campaas de vacunacin en los ltimos
tres aos.

B . Se determina el numero de nios atendidos en cada ao de


campaa, si la hiptesis fuera correcta (Ei). Por lo tanto , es
de esperarse que haya un numero igual de infantes
atendidos en el curso de cada campaa .El numero
esperado se calcula sumando el total de infantes atendidos
en las tres campaas y dividiendo este valor sobre el
numero de campaas (3).plantean la hiptesis nula y la
hiptesis alterna .

TA
Total inf antes atendidos
34 950
Ei

11650 nios (as)


n
numero de campaas
3

C . Se calcula el valor de

x2

mediante la ecuacin

(0i Ei )
X
Ei
2

Donde :
Oi : numero observado en la i- esima categora o
campaa
Ei : numero esperado en la i- esima categora
Kk : numero de categoras , en este caso 3 ( campaas )

X2

(11 700 11 650) 2 (12 350 11 650) 2 (10 900 11 650) 2

90,55
11650

D . Se escoge el nivel de significancia permitido . Para


el nivel de significancia = 0,05 ; es el valor
tabulado de x 2 con dos grados de libertad ( k-1) es
5,99

E . Decisin.
2 con el valor
Comparamos el valor calculado
critico (valor en tabla) de
x 2 .Como el valor
calculado para x 2 (90,55) es mayor que el valor
tabulado (5,99) ; entonces se rechaza la hiptesis
nula que afirma que no existe diferencia
significativa en el numero de nios atendidos por
campaa de vacunacin .

F . Conclusin .
Se concluye que con 95% de confianza en los datos
obtenidos en las campaas de vacunacin infantil,
en los ltimos tres aos en la ciudad objeto del
estudio, existen diferencias significativas en el,
numero de nios atendidos entre cada una de las
distintas campaas de vacunacin .

TECNICAS DE MUESTREO

Importancia del muestreo


En lugar de levantar un censo
completo se realiza un muestreo,
debido a que un censo:
1. Requiere demasiado tiempo
2. Es muy costoso
3. Aumenta la magnitud de los errores al
tener que realizar ms mediciones.

Seleccin Muestral
Definicin de los individuos a ser
medidos
Definicin de la poblacin.
Definicin del tipo de muestreo.
Determina del tipo de muestreo.
Obtencin de la Muestra.

PROCESO DE MUESTREO
POBLACIN

-OBSERVACIONES
POBLACIONALES
-TIEMPO
-ESPACIO

MARCO MUESTRAL

TAMAO DE
MUESTRA

Procedimiento de
seleccin de
la muestra

SELECCIN DE LA
MUESTRA

Conceptos Bsicos

Poblacin:
Todos y cada uno de los individuos o
elementos
de los cuales se desea
obtener informacin.

Muestra:
Conjunto de Elementos escogidos para
obtener
informacin
y generalizar al
resto.

Elemento Muestral:
Cada uno de los orgenes de la Informacin
o Suceso que se desea medir mediante
muestreo.

Unidad Muestral:
Cada uno de los posibles componentes de
la Muestra.

Censo:
Estudio de todos los Elementos de una
Poblacin.

Marco Muestral:
Enumeracin exhaustiva de todas las
unidades mustrales.

Muestreo:
Procedimiento de Seleccin de
Elementos,
Sujetos
Mustrales
Encuestados.
Parmetro:

Valor de una constante en la Poblacin


(Ejm: Media poblacional )

los
o

Estadstico o Estimador:
Valor de una medida estadstica en la
Muestra (Ejm: Media Muestral x )

Error de precisin: (e)


Diferencia entre Estimador y Parmetro.

e (x )

Coeficiente de Elevacin (N/n):


Cociente entre el tamao de la Poblacin
(N) y el de la Muestra (n), da lugar a la
cantidad de elementos poblacionales que
representan cada elemento Muestral.

Fraccin de Muestreo (n/N):


Porcentaje de la Poblacin que forma
parte de la Muestra.

PROCEDIMIENTOS DE MUESTREO
ALEATORIO SIMPLE
SISTEMTICO

PROBABILSTICO

ESTRATIFICADO
POR CONGLOMERADO
POLIETAPICO

MUESTREO
CUOTAS

NO PROBABILSTICO

JUICIO O DISCRECIONAL
ACASO
BOLA DE NIEVE
RUTAS ALEATORIAS

MUESTREO
PROBALISTICO

Muestreo Probabilstico
Cada Elemento del Universo tiene una
Probabilidad

conocida de formar

parte de la Muestra.
Los Componentes de la Muestra son
elegidos

al azar.

Los Componentes de la Muestra entran


a

formar

parte

de

la

misma,

independientemente de la voluntad del


Investigador.
El Cientfico permite fijar el error y
medir la Confianza de obtener buenas
estimaciones.

ALEATORIO SIMPLE
Todos lo Miembros de la Poblacin tienen
la misma Probabilidad de ser elegidos en
la Muestra.
De una Lista exhaustiva de los miembros
de la Poblacin (elementos o individuos)
se seleccionan tantos como el tamao
definido
de
la
Muestra
por
un
procedimiento
que
asegure la
Equiprobabilidad.

MUESTREO ALEATORIO SIMPLE

APLICACIN :
En un lote de frascos para medicina , con
una poblacin de 8000 unidades , se desea
estimar la medida de la capacidad en
centmetros cbicos de los mismos.
A travs de un sondeo piloto se ha estimado
que la desviacin estndar es de 2 cm3. Si
queremos tener una precisin 0.25 cm3 , y un
nivel de significancia del 5% . De que
tamao debe ser la muestra ?

Datos
= 2 cm3 ; N = 8000 ; e = 0.25 cm3 ; = 0.05(5%)
Z /2 = 1.96

n=

NZ2 2
N e 2 + Z2 2

n = 238 frascos

8000(1.96)2(2)2
8000(0.25)2 +(1.96)2(2)2

APLICACIN :
DE

UNA

POBLACION

DE

5000

ESTUDIANTES, SE DESEA ESTIMAR EL


RENDIMIENTO

ACADEMICO.

MEDIANTE

UNA ENCUESTA PILOTO SE DETERMINO


UNA DESVIACION STANDARD DE 3; SI SE
DESEA UN ERROR DE PRECISION DE 0.5 Y
UN NIVEL DE SIGNIFICANCIA DEL 5%. DE
QUE TAMAO DEBE SER LA MUESTRA.

DATOS :
= 3 ; N = 5000 ; e = 0. 5 ; = 5%

n=

NZ22
N e 2 + Z2S 2

n=

172872

Z = 1.96

5000(1.96)2(3)2
5000(0.5)2 +(1.96)2(3)2

134.57531

1284.5744

n=

135

LA SELECCIN EN BASE
A LA TABLA NUMEROS AL AZAR

Muestreo Aleatorio Sistemtico


Consiste en dividir el nmero total de
elementos de
la Poblacin (N) por el de la
muestra (n), y as
determinar cada
cuantos elementos de la Poblacin se debe
elegir uno para componer la muestra
(Coeficiente de Elevacin), eligiendo el
primero al azar (Simple) entre 1 y el nmero
resultante,
y
al
resto
sumando
sucesivamente dicho cociente.

APLICACIN :
Se plantea un estudio descriptivo que
desea estimar , a partir de la revisin de
historias clnicas , la proporcin de
fumadores
entre
los
pacientes
atendidos en la consulta odontolgica
de una rea de salud; suponiendo que
hubiera 10 000 historias . Se necesita
un listado completo de todos los
individuos de la poblacin.

En el estudio realizado se ha tomado un


nivel de confiabilidad del 95% , adems
queremos un error mximo de 30 y una
desviacin tpica de 270 .
Con ello hallaremos el tamao de la
muestra de la siguiente manera
Datos :
N

= 10 000
= 270

;
;

= 30 ; = 95%
Z = 1.96

Operacin :

n =

Z2 2
=
2

(1.96)2(270)2
311.1696
2=
30

n 311 historias

APLICACIN :
Se propone un estudio sobre la
proporcin de estudiantes que cuentan
con pcs la poblacin esta
conformada por 1000 estudiantes; los
cuales estn listadas totalmente nivel =
5%; siendo el error de precisin de 10 y
una desviacin Standard de 25.
Determinar el tamao de muestra.

DATOS :
= 25 ; N = 1000 ; = 10

Z22
n=

n 24

= 95%

Z = 1.96

(1.96)2(25)2
=

(10)2

= 24.01

COEFICIENTE DE ELEVACIN

N
C.E = n

1000
= 24 =

41.66

SE ELIGE AL AZAR ENTRE


1 Y 42

K + 42

Muestreo Estratificado
Definicin:
Cuando la poblacin no es homognea
respecto a la variable aleatoria objeto de
estudio, para mejorar las estimaciones,
conviene distinguir en ella, clases o
estratos, y proceder a lo que se llama un
muestreo aleatorio estratificado.
En este tipo de muestreo los estratos se
deben elegir de manera que sean lo ms
homogneos posible respecto a la
variable aleatoria a estudiar y que entre
ellos exista la mayor diferencia posible.

DISEO DE MUESTREO ESTRATIFICADO


N = 53

X X X Y Y Y Z Y
X X X X Y Z Y Z Y
Z YYYXZX Z Y Z Z
X Y Y Z X X Z Y X
X Y Z X Y Z X Y
X X X Y Y Z Z Y

XXXXX
XXXXXXXXX
XXXXX

N1 = 19

YYYYYY
YYYYYY
YYYYY
YYY

N2 = 20

Z Z Z Z
Z Z Z Z ZZ
Z Z Z Z

N3 = 14

LEYENDA:
N = 53

N1 = 19
N2 = 20
N3 = 14

N = Tamao de la Poblacin

ni= Tamao de Estrato


K = Nmero de Estratos =3
k

N
i1

N1 N2 ... Nk N

VARIABILIDAD

ENTRE LOS

ESTRATOS

E1
E2
E3

HOMOGENIDAD

EK
:

CADA ESTRATO

EN

DENTRO DE

APLICACIN :
El universo formado por 1000 hombres y 4000 mujeres
sector : empleados empresas de servicios de salud
por muestreo al azar simple se estim.
TAMAO DE MUESTRA

n = 50

Operacin :
Poblacin

Estratos

Probabilidad

Tamao
muestral
C/ estrato

5000

1000
4000

0.20
0.80

10
40

5000

1.000

n = 50

APLICACIN
Una compaa de mercados est
investigando a 500 grandes empresas. El
objetivo es determinar su rentabilidad y
se toma una muestra de 50 empresas.

TABLA

MUESTREO ESTRATIFICADO

- DIVISIN EN SUB-POBLACIONES
- MUESTREO DE c/u INDEPENDIENTE

ESTRATIFICACIN DE EMPLEADOS
ESTRATO
A
(1)

CLASIF.
EMPLEA.
(2)

NMERO
DE EMP.
(3)

PROPORCIN

1
2
3

PLANTA
OFICINAS
OTROS
TOTAL

800
150
50
1000

0.80
0.15
0.05
1.00

DE j EN Pj
(4)

OBRERO

SELECCIONANDO:

EMP.

n = 80
AUX.

SE GENERAN:

x1 ; x 2 ; x 3

64
12
4

MUESTREO ALEATORIO SIMPLE


Ejemplo 1
-Suponga que usted es contratado por un gobierno
regional interesada en conocer los hbitos alimenticios
de los habitantes a la ciudad de Ica, con el propsito de
ofrecer un programa de nutricin .
2

-Para tal fin , usted procedi a elaborar un cuestionario


dirigido a los habitantes de la zona , el cual va aplicar.
- Para su encargo, usted necesita encuestar una muestra
de habitantes y para ello tomara un tamao de muestra
mediante un sistema de muestreo aleatorio simple, cuya
formula es :

MUESTREO ALEATORIO SIMPLE


2

Z
S
2

2
2

Donde :
n
= tamao necesario de la muestra
Z/2 = margen de confiabilidad o numero de unidades de
desviacin estndar en la distribucin normal que
producir el nivel deseado de confianza ( para una
confianza de 95% o un =0,05 ; Z=1,96; para
confianza de 99% o un =0,01; Z=2,58)
S
= desviacin estndar de la poblacin ( conocida o estimada
a partir de anteriores estudios o de una prueba piloto ).

= error o diferencia mxima entre la media muestral y la


media de la poblacin que se esta dispuesto aceptar con el
nivel de confianza que se ha definido .

MUESTREO ALEATORIO SIMPLE


Para este caso, usted ha decidido tomar un margen de
confiabilidad de 95% (1-) (que corresponde a Z=1,96),
con desviacin estndar S=0,4 ; un error de estimacin
E = 5% y se supone que no conoce el tamao de la
poblacin ( N = infinito ) .
Entonces , el numero de habitantes por encuestar , si
la poblacin N no se conoce , seria :

z2

2
S
2

1,96 2

3.84 (0.16) 0.61


(0.4) 2

(0.05)(0.05)
0.0025
0.0025

246

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA
MUESTREO ALEATORIO SIMPLE

El valor obtenido de n indica que se necesitara


encuestar 246 personas de la ciudad , para tener una
informacin confiable respecto a los hbitos
alimenticios .
Ahora , si usted conoce el tamao de la poblacin (N) ,
entonces, la formula que va utilizar para estimar el
tamao de la muestra mediante el sistema de muestreo
aleatorio simple seria :

2
S2

2
N
Z

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA

MUESTREO ALEATORIO SIMPLE


Donde :
N = tamao de la poblacin
Suponga que el numero total de personas que habitan
la ciudad , cuando se realiza la encuesta , es de 2 000 ;
el tamao de la muestra seria :

(0.4)

219 turistas
2
2
)2
2

S
(0.05
(0.04)

2
2
Z
N
(1.96)
2000
Con una poblacin de 2 000 personas, usted necesita
entrevistar 219 personas para obtener informacin
confiable respecto a los hbitos alimenticios en la
ciudad.

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA
MUESTRA ESTADISTICA
MUESTREO PROPORCIONAL

Ejemplo:
Suponga que una compaa de seguros mdicos
cuenta con 200 asegurados en el pas . Por una
investigacin piloto se supo que 73% de las personas
aseguradas declaran una excelente aceptacin de los
seguros de la empresa . Esta desea conocer el grado
de aceptacin e un nuevo seguro con un margen de
confiabilidad de 95% y u error de estimacin de 5%
.Calcule el tamao de muestra de los asegurados para
este nuevo tipo de producto .

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA
MUESTREO PROPORCINAL
z 2 PQN
2
2

2
( N 1) z PQ

(1.96) 2 ( 0.73) (0.27) (200)


(0.05) 2 (200 1) (1.96) 2 (0.73) (0.27)

121Personas

Donde:
n = tamao de la muestra necesaria
Z/2 = 1,96
P
= probabilidad de que el evento ocurra 0,73 o 73%
Q
= probabilidad de que el evento no ocurra
1-P = 1- 0,73 =0,27 o 27%

= 0,05 o 5%
N : tamao de la poblacin : 200 asegurados .

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA
MUESTREO PROPORCIONAL
La empresa necesita entrevistar a 121 de sus
asegurados para conocer el grado de aceptacin de su
nuevo producto.
Ahora, cuando no se conoce la probabilidad de
ocurrencia de un evento , a P se le da un valor mximo
que es de 0,5 ; lo mismo que a Q , e igualmente E no
debe ser mayor de 6% .
Para el caso de la empresa de seguros , el tamao de
las muestra , si no se conoce P ( porcentaje de
personas con buena aceptacin por los seguros de la
compaa ), la formula seria :

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA
MUESTREO PROPRCIONAL

2
z 2 PQN
(
1
.
96
)
( 0.5) (0.5) (200)
2
2

2
( N 1) z PQ
(0.05) 2 (200 1) (1.96) 2 (0.5) (0.5)

134 Personas

El dato 134 dice que la empresa necesitara entrevistar


134 de sus asegurados para conocer la aceptacion de
su nuevo producto .

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA
MUESTRA ESTADISTICA
TAMAO DE LA MUESTRA EN EL
MUESTREO ESTRATIFICADO

Suponga que estamos interesados en saber


cuanto es el promedio anual que invierten
en libros los estudiantes de universidad de
cierta ciudad, suponiendo que existen
universidades de tres estratos, cada una
con una variabilidad en su capacidad de
compra .

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA
MUESTRA ESTADISTICA
TAMAO DE LA MUESTRA EN EL MUESTREO
ESTRATIFICADO
ESTRATO DE LA
UNIVERSIDAD

NUMERO DE
ESTUDIANTES

DESVIACION
ESTANDAR DE
LOS ESTRATOS

Universidad del estrato A

7 500 estudiantes

$100 000

Universidad del estrato B

9 700 estudiantes

$ 60 000

Universidad del estrato C

12 000 estudiantes

$ 30 000

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA

TAMAO DE LA MUESTRA EN EL MUESTREO


ESTRATIFICADO
La desviacin se obtuvo de muestras piloto realizadas
a estudiantes de universidades de distintos estratos
(el valor $100 000 es la desviacin estndar o variacin
del promedio de gastos en libros entre el que mas
gasta y el que menos gasta en libros en las
universidades del estrato A ) .
Veamos entonces cual seria el tamao de la muestra
para cada uno de los estratos , si queremos tener una
muestra total de 500 estudiantes :

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA

TAMAO DE LA MUESTRA EN EL
MUESTREO ESTRATIFICADO

(n) ( NA) ( SA)


A
( NASA NB SB NCSC )

Donde :
A = tamao optimo de la muestra que se
extrae del estrato A .
n = tamao total de la muestra
NA = numero de elementos del estrato A

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA

TAMAO DE LA MUESTRA EN EL
MUESTREO ESTRATIFICADO

SA = desviacin estndar de los elementos en el


estrato A
NB = numero de elementos del estrato B
SB = desviacin estndar de los elementos del
estrato B.
NC = numero de elementos del estrato C
SC = desviacin estndar de los elementos del
estrato C

EJEMPLOS QUE ILUSTRAN COMO


ESTIMAR EL TAMAO DE UNA MUESTRA
ESTADISTICA

TAMAO DE LA MUESTRA EN EL MUESTREO


ESTRATIFICADO
Numero de estudiantes de universidades del estrato A
que deben entrevistarse :

(500) ( 7.500) (100.000)


(7.500) (100.000) (9.700) (60.000) (12.000)(30.000)

222 Estudiantes
Numero de estudiantes de las universidades del
estrato B que deben entrevistarse:

(500) ( 9.700) (60.000)


(7.500) (100.000) ( 9.700) (60.000) (12.000)(30.000)

172 Estudiantes