Professional Documents
Culture Documents
JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide
range of content in a trusted digital archive. We use information technology and tools to increase productivity and
facilitate new forms of scholarship. For more information about JSTOR, please contact support@jstor.org.
Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at
https://about.jstor.org/terms
Ediciones UC is collaborating with JSTOR to digitize, preserve and extend access to MÉTODOS
BIOESTADÍSTICOS.
4.1. Introducción
La inferencia es una rama de la estadística cuyos métodos y herramientas nos per-
miten generalizar los resultados obtenidos a partir de una muestra, a la población
de la cual procede y representa. Los problemas fundamentales que estudia la in-
ferencia estadística son la estimación puntual, estimación intervalar y el contraste
de hipótesis.
En capítulos anteriores nos hemos enfocado al problema de estimación pun-
tual, donde las medidas resumen poblacionales fueron denominadas parámetros,
mientras que las medidas resumen calculadas en una muestra las llamamos estima-
dores, estadísticos o parámetros estimados.
Los estimadores puntuales reciben este nombre, ya que su cálculo entrega
un único valor numérico que estima al parámetro poblacional. Se espera que estos
estimadores tengan algunas características deseables, como insesgamiento y efi-
ciencia, los cuales son revisados en el punto 4.2.
Un intervalo de confianza es una alternativa a la estimación puntual, al pro-
veer un rango de valores en el cual se sitúa el parámetro poblacional, con una
probabilidad determinada. La teoría detrás de los intervalos de confianza es vista
en el punto 4.3.
El contraste de hipótesis será desarrollado en detalle en el capítulo 5.
117
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
[ FIGURA 4.1 ]
E
P
S
A
T
x µ R
I
Á
M
M
A s2 σ2 E
D
T
O p P R
R
O
E
S
S Muestra Población
118
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
Tanto x1 como x– son insesgados (y desde este punto de vista ambos son bue-
nos estimadores de µ). Sin embargo, la varianza de x– es menor que la varianza
de x1 (a menos que el tamaño de la muestra sea n = 1). Por lo tanto, preferimos
x– como estimador de µ si n > 1, ya que es insesgado y más eficiente que un solo
dato muestral.
Ejemplo 4.2. Un estimador natural para la varianza poblacional σ2 es:
Sin embargo, se puede demostrar que S*2 es sesgado. Por este motivo se usa
habitualmente la llamada cuasi varianza muestral S2 como estimador de σ2:
[ FIGURA 4.2 ]
Eficiencia y sesgo. Podríamos tener estimadores con poca variabilidad entre ellos (a la
izquierda), pero estar lejos del valor real del parámetro (a la derecha).
119
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
120
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
[ FIGURA 4.3 ]
1-α
α/2 α/2
Zα/2 Z1α/2
121
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
[ FIGURA 4.4 ]
1-α
α/2 α/2
tα/2 t1α/2
Distribución t de Student con n-1 grados de libertad, con percentiles α/2 y 1-α/2
122
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
Por lo tanto, el perímetro de cintura poblacional varía entre 68,6 y 75,8 cm,
con confianza 95%.
Al construir un intervalo de confianza para µ cuando σ es desconocido, siem-
pre se debiera utilizar la distribución t de Student. Sin embargo, este intervalo se
puede aproximar usando percentiles de la distribución normal, de la forma:
Esta aproximación solo sirve si n es muy grande (por ejemplo, n > 100). Para
ilustrarlo, observe el percentil 97,5 en la tabla t de Student y notará que a medida
que los grados de libertad aumentan, el percentil t(n-1); 0,975 es cada vez más parecido
al percentil z0,975 (para detalles, ver punto 3.11) Por ejemplo, para ν = 1 grado de
libertad, el percentil es 12.706 y para ν = 120 el percentil es 1,98, el cual ya es muy
similar a z0.975 = 1,96.
Los intervalos anteriores, para σ2 conocido o desconocido, requieren que
–
X tenga distribución normal, lo cual se tiene gracias a datos normales o por el teo-
rema central del límite.
–
Si n es pequeño y la variable aleatoria X es normal, entonces X tiene distri-
bución normal y la construcción del intervalo de confianza sigue siendo como se
describió antes.
La situación más compleja se presenta cuando n es pequeño y la variable
aleatoria X no es normal. En este caso, es posible construir intervalos de confianza
123
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
[ TABLA 4.1 ]
A B C D E F G H I J K L M N
1 64 66 46 71 65 73 61 70 27 80 52 61 39 76
2 75 58 90 73 85 75 44 74 52 80 50 65 45 78
3 64 76 73 50 59 54 74 60 42 74 83 60 83 73
4 84 65 41 73 57 73 69 91 70 47 54 29 51 55
5 73 59 63 66 48 60 55 62 55 63 75 80 67 92
6 79 75 93 45 72 60 78 72 47 65 77 57 50 64
7 63 73 75 49 61 41 70 72 43 64 69 43 63 57
8 71 42 45 71 62 38 79 50 50 49 54 67 65 49
9 76 44 72 65 64 49 60 71 61 71 59 59 62 58
10 51 50 73 78 58 76 53 71 44 53 70 74 72 66
11 49 63 68 62 71 67 60 80 63 30 81 81 39 81
12 51 63 59 67 33 62 61 63 51 45 56 43 49 79
13 65 38 40 80 63 57 67 42 57 71 46 58 92 53
14 68 76 81 65 50 79 42 81 47 79 46 77 69 62
15 49 63 72 62 62 53 86 69 60 66 70 53 86 65
16 84 59 40 57 67 48 54 74 54 44 65 52 58 49
17 60 67 70 44 52 68 76 69 63 86 62 82 61 56
18 68 47 59 73 63 61 59 43 58 65 48 50 51 50
19 63 63 72 95 61 61 86 60 63 58 46 82 57 72
20 33 52 63 69 51 53 54 45 71 45 39 53 46 73
21 53 62 61 71 59 45 79 70 63 51 51 67 53 56
22 67 85 84 52 42 68 49 56 69 66 63 66 68 39
23 73 57 67 77 66 56 48 61 49 51 75 64 68 63
24 25 56 65 67 88 63 60 68 69 52 70 56 67 48
25 57 49 62 61 49 52 70 68 59 51 55 88 58 61
124
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
[ TABLA 4.2 ]
La variable X es normal La variable X no es normal
σ2 conocido σ2 desconocido σ2 conocido σ2 desconocido
n pequeño IC usando z IC usando t Transformar los Transformar los
y el valor de σ y el valor de s datos o IC datos o IC
no paramétrico no paramétrico
n grande IC usando z IC usando t TCL: usar z TCL: usar t
y el valor de σ y el valor de s (*) y el valor de σ y el valor de s (*)
125
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
Este intervalo de confianza es válido solo bajo el teorema central del límite,
el cual asegura que p̂ distribuye normal si n es suficientemente grande.
Si n es pequeño (menor a 30), no se puede asumir normalidad por el teore-
ma central del límite y dado que los datos originales no pueden tener distribución
normal (ya que es una variable categórica que indica la presencia o ausencia de la
característica de interés), se debe construir un intervalo de confianza para P y usar
otras metodologías que están fuera del alcance de este texto.
Ejemplo 4.8. La Encuesta Nacional de Salud (ENS) 2009-2010 arrojó que
237 personas de 65 o más años padecía de cataratas de un total de 998 personas
muestreadas en ese grupo etario. Calculemos un intervalo de confianza al 95%
para la prevalencia de cataratas poblacional.
La prevalencia de cataratas es 237/998 = 23,7%. Luego, un intervalo de 95%
de confianza para la proporción poblacional P está dado por:
[ TABLA 4.3 ]
Estadísticos descriptivos
N Mínimo Máximo Media Desv. típ.
TALLA 264 118,00 200,00 167,3144 17,52470
N válido (según lista) 264
126
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
[ TABLA 4.4 ]
Estatura en rangos
Frecuencia Porcentaje Porcentaje
acumulado
Válidos <160 90 34,1 34,1
160-170 57 21,6 55,7
171-180 41 15,5 71,2
>180 76 28,8 100,0
Total 264 100,0
127
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
[ TABLA 4.5 ]
IC (1-α) para µ con IC (1-α) para µ con IC (1-α) para P
σ2 conocido σ2 desconocido
128
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
Por lo tanto, se necesitan 62 casos para estimar la media poblacional del peso
de nacimiento bajo las condiciones descritas.
129
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
Ejemplo 4.12. Tener información acerca del valor de P puede disminuir bas-
tante el tamaño de la muestra. Verbigracia, si se cree que el porcentaje de obesos
en la población no supera 20%, entonces conviene tomar P = 0,2. Con esto, el
tamaño muestral, con error de estimación no superior a cinco puntos porcentuales
y confianza 95%, está dado por:
Ejemplo 4.13. Supongamos que se quiere estimar una prevalencia que por
estudios previos se ha reportado en 80%, con confianza del 95% y error de estima-
ción de cinco puntos porcentuales.
Solución. Notemos que el valor del producto es el mismo para P = 8,0 que
para P = 0,2. Luego, si se mantiene constante el error de estimación y la confianza,
el tamaño muestral es igual al del ejemplo 2 (n = 246 casos).
En consecuencia, observamos que debido a la simetría de en torno a P = 0,5,
el tamaño muestral mínimo necesario para estimar una proporción P es el mismo
que se requiere para estimar la proporción 1-P.
130
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
Ejercicios
4.1 Se cree que el peso de nacimiento promedio de cierta población es µ = 3.500
gramos. Para verificarlo, se tomó una muestra aleatoria de 18 niños recién na-
cidos, cuyos pesos fueron los siguientes:
3.211 2.405 3.073
2.872 3.050 3.466
3.318 2.205 3.884
3.738 3.034 3.263
2.691 2.304 3669
3.733 3.423 3.425
19 19 19 19 19 19 19 20 20
131
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
MÉTODOS BIOESTADÍSTICOS
4.4 La Encuesta Nacional de Salud 2009-2010 (ENS 2009-2010) arrojó que la pre-
valencia de cataratas fue 6,6% en zona urbana y 6,5% en zona rural, en base a
una muestra de 4.842 y 781 personas en cada zona, respectivamente.
Cataratas
Zona NO SÍ Total
Urbana 4.186 (93,4%) 296 (6,6%) 4.482
Rural 730 (93,5%) 51 (6,5%) 781
Total 4.916 (93,4%) 347 (6,6%) 5.263
132
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
Intervalos de confianza [4]
133
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms
This content downloaded from
132.174.251.250 on Tue, 01 Aug 2023 18:34:21 +00:00
All use subject to https://about.jstor.org/terms