1m Rev Méd Chile 2005; 133: 1111-1115
Mepicina Basapa EN EviDENcIA
Intervalos de confianza
Roberto Candia B, Gianella Caiozzi A.
Confidence intervals
Bie gine, Bee Benes stestade come
janalizar en forma critica Ia validez de un
estudio de terapia’ y cémo expresar los resulta-
dos con distintas medidas de efecto (riesgo
absoluto, riesgo relativo, mimero necesario para
teatar)*, Asi, al momento de aplicar los resultados
de un estudio, lo hacemos utilizando el niimero
gue se nos entrega, lo que conocemos como
estimador puntual, Si el estudio se volviera a
realizar en condiciones idénticas, pero con una
nueva muestra, es probable que el resultado no
sea exactamentte igual, ya que el valor que se nos
entyega es una aproximacién del valor real. El
valor real es el que se obtendsia al aplicar la
intervencién a la poblacién completa’, enten:
diendo poblacién como el total de pacientes
idénticos a los del estudio dentro de Ia poblacién
general, Este es el valor que realmente nos
interesa aplicar en la practica clinica
Utilizando los datos de un estudio podemos
estimar un rango en el que se encuentra con alta
probabilidad el valor real, y es precisamente este
rango lo que conocemos como intervalo de
confianza,
Este asticulo pretende ayudar a los clinicos a
comprender e interpretar un intervalo de confian-
za, sti relacién con el tamaiio muestral y advertit
las diferencias comparativas con el valor P.
Recibide of 2 de junio, 2005. Aceptado el 5 de julio, 2005)
Isrenvato bE conmuasza (IC)
DefixiciOw ¥ PROPIEDADES
Fl intervalo de confianza describe la variabilidad
entre In medida obtenida en un estudio y Ia
medida real de Ia poblacién (el valor real)
Coscesponde a un rango de valores, cuya distribu-
cidn es normal y en el cual se encuentra, con alta
probabilidad, el valor real de una determinada
variable. Esta valta probabilidady se ha establecido
por consenso en 95%, Asi, un
confianza de 95% nos indica que dentro del rango
dado se encuentra el valor real de un parimetzo
con 95% de certeza®
Para comprender y hacer intuitive el concepto
de interval de confianza utilizaremos un ejemplo
clisico®
Supongamos que tenemos una moneda, la
cual puede o no estar balanceada. Asi, después de
varios lanzamientos, la probabilidad que el resul-
tado sea sello variari desde 0 (todas las veces
cara, es decir, una moneda balanceada) hasta 1
(todas las veces sello, nuevamente balanceada),
pasando por 0,5 (la mitad de las veces sello y las
otras cara, lo que eqnivale 2 una moneda no
balanceada). Como no conocemos Ia verdadera
naturaleza de la moneda, vamos a experimentar
con ella
interval de
Unidad de Medicine Basada en Evidencia, Pontificia Universidad Catélica de Chile. Santiago, Chile
11141m Rey Méd Chile 2005; 133: 1111-1115
Iniciamos el experimento con 2 lanzamientos,
uno es cara y el otto es sello. La probabilidad de que
el resultado sea sello fue 0,5, con lo que podsiamos
concluir que In moneda no esti balanceada, sin
embargo, :con s6lo 2 lanzamientos podemos con-
cluir con total certeza que esa es la naturaleza de la
moneda’ La respuesta es no, por lo tanto seul es el
rango de valores donde se encuentsa el valor real?
Dado que el azar pudo influir en este resultado, uno
acepta que el rango de valores reales posibles es
amplio, incluso desde uno tan bajo como 0 a uno
tan alto como 1, por lo tanto atin no estamos
seguros de Ia naturaleza de nuestra moneda.
Considerando lo anterios, ampliamos el expesi
mento y realizamos 8 nuevos lanzamientos (10 en,
total), resultando 5 caras y 5 sellos. Nuevamente el
resultado es 0,5, sin embasgo, ahora intuitivamen-
te nos percatamos que Ia verdadera naturaleza de
la moneda se encuentra en un tango menos
amplio. Por ejemplo, es poco probable gue
después de 10 lanzamientos 9 sean sello, menos
atin que todos lo sean, sin embargo, atin es
factible que 8 6 7 6 6 silo sean. Asi, nuestro
nuevo rango puede variar entre 0,2 y 0,8, pero
con un aleance: todos advertimos que si bien 0,8
0,2 son posibles, los valores centrales (0,4 y 0,6) lo
son mis atin, siendo 0,5 el mis probable.
Decidimos seguir experimentando, realizando
90 nuevos lanzamientos (100 en total), resultando
50 caras y 50 sellos. Nuevamente el resultado es
0,5, advirtiendo que cada vez es mis probable
que la verdadera naturaleza de nuestea moneda es
el de una no balanceada, pero atin con un rango
de variabilidad que podsiamos estimar entre 0,4
0,6 (es decir, que después de 100 lanzamientos, el
resultado real varie entre 40 y 60 sellos)
Realizamos 1.000 Ianzamientos, resultando 500
sellos y 500 caras, con lo que estamos atin mas
seguros qne nuestra moneda no esti balanceada
(auesteo rango puede ser 0,45 2 0,55 0 menor)
El ejemplo anterior nos permite aclarar varios
conceptos
+ La werdadera naturalezar de nuestra moneds
(i esti balanceada 0 no) corresponde al valor
real.
+ Elcango de valores reales posibles, es decir, el
rango donde se encuentra la verdadera natura-
Jeza de nuestra moneda, corresponde al IC
+ El valor real mis probable corresponde al
estimador puntual del estdio, en este caso 05.
+ Finalmente, advertimos Ia relacién inversa en-
te la amplitud del IC y el tamaiio amesteal: si
coasideramos que el atimeso de lanzamientos
gepresenta el a de la muestea, observamos que
mientras mas pequeiio es el n més amplio es el
IC. A mayor mimero de lanzamientos (mayor
1n) més certeza tenemos que el resultado del
experimento se acerca al valor seal, por lo
tanto el IC es mas estrecho.
Para llevar a la peictica el concepto vamos a
secuttir al ejemplo utilizado en el asticulo anterior:
Ja compasacién de una aueva droga A versus una
droga B en la prevenciéa de AVE ea pacientes con
antecedente de accidente isquémico teansitocio
(AIT (Tabla 1)4
‘Tabla 1. Resultados de un ensayo clinico
hipotético!
‘Tratamiento AVE Total
si No
Droga A 10 260
Droga B 522
Total 52 782
Alanalizar estos datos se obtiene una redueci6n
absoluta del riesgo (RRA) de 4.2% con 95% de
interval de confianza de 0,9% a 7,5%. Esto quiere
decir que el valor real, es decir, el resultante al
aplicar la intervenciéa a In poblacién total de
pacientes con AIT, esti con 95% de probabilidad
entre un RRA de 0,9% a 7,5%, siendo el valor mas
probable 4,2%, Si aumentamos el n de la muestra a
20,000 obtendriamos auevamente un RRA de 4.2%,
pero con tin intervalo de confianza mis estrecho,
de 3,5% a 4,9% (Formula en apéndice 1).
Apéndice 1. Formula de intervalo de confianza:
Escadoc prota = 96x Vf pkgs + pL
al m2
Donde:
pl Tass de eventos grupo 1
p2Tasa de eventos grupo 2
AL ngmpo 1
2 n grupo 2
1112INTERPRETACION DE UN IC
El intervalo de confianza es una medide de
precision que permite al clinico evaluar 2 aspectos
de un resultado (estimador puntua
1. Si existe diferencia estadistica significativa
2. Sital diferencia es relevante para recomendar-
a a mis pacientes (relevancia clinica)
Para analizar si existe 0 no diferencia estadisti-
a significativa debemos observar los extremos del
IC. Independiente si el estimador puntual muestra
beneficio o dao, debemos verificar si alguno de
los extremos del IC pasa sobre Ia linea del no
efecto. Si es asi, existe Ia posibilidad de que el
valor real corresponda al no efecto o incluso
tenga un efecto opuesto al esperado. En este caso
no existitia diferencia estadisticamente significati-
va entre aplicar o no la intervencion (Figura 1)”
Cuando un estudio demuestra un efecto con
signiticacién estadistica (es decir el extremo del IC
no eruza ni toca la linea del no efecto), el elinico
debe definic cual es el beneficio minimo necesario
para recomendar la terapia, 1 que llamaremos
umbral. Asi, nuestro estudio hipotético demnes-
tea beneficio estadistico significativo, siendo el
beneficio minimo probable un RRA de 0,9%. El
que este beneficio tenga relevancia clinica depen-
de del tipo de evento prevenido o favorecido, los
efectos adversos de Ia droga A v/s la droga B, el
costo, las cigcunstancias clinicas, etc. Si el evento a
prevenir es banal, 0 si Ia droga A tiene muchos
efectos adversos y es mis cara que B, nuestro
umbral va a ser alto, por lo tanto el beneficio
demostrado en auestso estudio no seria relevan-
te" (Figura 2)
Al contrario, si el evento a prevenir es relevante
en si mismo (por ej: mortalidad o invalidez), 0 si la
nueva droga es mis barata y sin efectos adversos,
tal vez con demostrar un RRA de s6lo 0,5% nos
basta para recomendarla (umbral), por lo tanto
nuestro estudio no s6lo demuestra diferencia est
sticamente significativa, sino que también benei
cio relevante para el paciente (Figura 3)
Asi, para evaluar beneficio elinico, primero
debemos establecer un umbsal minimo de beneti-
cio, el que depende del tipo de evento a prevenir 0
favorecer los efectos adversos, costos, ete. de la
aueva droga, y nego obsecvar el beneticio minimo
probable que muestea el estudio, que corresponde
I INTERVALOS DE CONFIANZA - R Candia et al
LL Beneficio
Figura 1. Estudio hipatética euyo estimador puntial
informa un RRA 2,8%, pero cuyo IC sobrepasa la
linea del no efecto, por lo tanto es posible que el
valor real sea daiio, No existe diferencia estadistica
significativa en este estudio.
Dato | Beneficio
Fumest
RRA
Figura 2. Estudio hipotético que informa benelicio
estadistico significativo, sin embargo, el IC pasa
sobre el benelicio minimo necesario para recomen-
dar la terapia (ambeal, RRA 3%). El beneficio minimo
demostrado (RRA 0,9%) no es suliciente para reco-
mendar Is terapia,
Umbrai
“RRA
Figura 3. Estadio hipotético que informa benclicio
cstadistico signficativo. ELIC no sobrepasa el benef
tio minimo necesatio parm recomendar a terapia
(umbral, RRA 0,5%). El beneficio minimo demostrado
(BRA 0,9") es suficiente para cecomendar ls tapi
Msoicina Basaon
en Ev
11131m Rey Méd Chile 2005; 133: 1111-1115
al extremo del IC mis cercano a Ia linea del a0)
efecto. Si el extremo del IC no sobrepasa el umbral
se asume que el beneficio minimo probable es
suficiente para recomendar Ia nueva tesapin
Existe la posibilidad que la nueva droga hiciese
dafio (RRA negativo). El proceso es similar al
anterior, estableciendo un umbral maximo de daiio
tolerable, y observando el extremo del IC que mis
se acerca a Ia linen del no efecto. Sila nueva droge
genera mis dafio con una diferencia estadistica-
mente significativa, debemos observar si el extromo
del IC sobrepasa ese umbral. Si no lo hace se
asume que el dafio minimo probable es més alto
que lo tolerable, por lo tanto se esti en condiciones
de rechazar In nueva terapia’® (Figura 4)
aio | Beneficio
Lumevas
“RRA
Figura 4. Estudio hipotético que informa daio estadistico
significativo. El IC no sobrepasa el daiio minimo
estublecide como umbsal. EI datio minimo demosteado
8 suficientemente importante para sechazar la terapia,
Vator P
Al comparar dos grupos en un estudio podemos
demostrar que no existe diferencia entre ambos
(hipstesis nula) o que si le hay (hipstesis
alternativa)”"°, El valor P es un test de hipétesis
qe nos aynda a afirmar con cierto nivel de
seguridad (por consenso se usa 95%, que se expres
como P <0,05) que una de las hipdtesis es la
correcta, Para nuestro ejemplo, Ia hipétesis nula
coresponde a Ia igualdad de resultados al usar la
droga A o B, mientras que la hipétesis alternativa
snpone que una de ellas es mejor que la oa en
prevenis In enfermedad.
EL valor P representa la probabilidad que una
diferencia observada entre 2 gmpos sea sélo debida
al azar, es deci, la probabilidad que la hipétesis mula
sea verdadera a pesar de observar diferencia en un
estudio”. Como toda probabilidad, puede tener
valores desde 0 a 1, Valores mis cercanos a 1
indican que existe una alta probabilidad que las
diferencias observadas sean sélo por azaz, es decis,
apoya Ia hipétesis mula, En cambio, valores mis
cescanos « 0 apoyan la hipétesis alternativa
Apliquemos este concepto a nuestro ejemplo,
en que se obtiene un RRA de 4,2% con un valor P
<0,05 (p=0,039). $i asumimos como valor real que
la droga A es igual a B (hipdtesis aula) y
pudiéramos sepetis el estudio muchas veces, el P
<0,05 nos dice que en menos de 5% de las
ocasiones se observaria tal diferencia entre ambas,
s6lo por azar. Dicho de otra forma, en la mayor
parte de las ocasiones Ia diferencia observada no
se debe al azar, por lo tanto rechazamos Ix
hipétesis nula y establecemos que existe diferen-
cia estadistica signiticativa™!®
El valor P se correlaciona en forma muy
estrecha con el intervalo de c
nnfianza, ya que si
uno muestra diferencia estadistica significativa el
otro también Lo hace, y viceversa, Sin embargo, el
valor P, a diferencia del IC, no nos entrega
informacién sespecto al rango en el que se
encuentra la magnitnd del efecto de un determi-
nado tratamiento (valor real), por lo que s6lo nos
habla de diferencias estadisticas significativas, sin
permitirnos evaluar si esta diferencia es relevante
para mi paciente. Por ejemplo, un resultado
significativo (P <0,05) podria incluir diferencias
clinicamente intelevantes, y resultados no signiti-
cativos (P >0,05) podsian esconder una diferencia
clinicamente importante entre 2 tratamientos si el
esmdio no ineluye un tamaiio muestzal adecuado
(aa estudio con bajo poder puede no mostrar una
diferencia que realmente si existe)®
De esta forma, annque el valor P mide Ia
fuerza de una asociacién, siempre es titi el
intervalo de confianza para _complementar Ia
evaluacién de la magnitud del etecto de una
intervencién y poder realizar uaa interpretacién
adecuada de los resultados de un estudio.
Coxewwsioxes
Al leer un estudio es muy importante interpeetar
Jos resultados en forma correcta, Esto supone
1114comprender el significado del estimador puntual y
de sus medidas de precision, lo que permite
extezpolar los datos 2 la poblacién de intesés.
Tanto el anilisis de un intervalo de confianza
como el de un valor P nos permiten determinar
RereReNcas
1. Pesazoza B, Caxpia R. Por qué vale la pena
randomizar un estudio de terapia? Rev Méd Chile
2004; 132; 1007-14.
2. Lereuee LM, Masniguez JJ, Cito JC. El sciegor en
los ensayos clinicos importa? Rer Méd Chile
2004; 132: 1137-9.
Carerao D, Gasami L, Leteuen IM. Impostancia
de Ia intencién de tratar y el segnimiento en la
valides interaa de sa estidio clinico randomiza-
do. Rev Méd Chile 2004, 132: 1537-60.
4. Rivsna S, Lamsoxno F, Oareca J. Evaluscion de
resultados de ua artieulo de tatamiento, Rev Méd
Chile 2008; 133: 593-6
Wamey E, Bat J. Statistics review 2: Samples and
populations. Critical Care 2002; 6: 143-8
6. Gevarr G, Jarscrxe R, Heo:
#, Ware
= N, Cook D, Sxaxxow
S. Basic statistics for clinicians 2.
I INTERVALOS DE CONFIANZA -R Candia et al
diferencias estadisticas significativas, sin embargo
sélo el IC nos permite evalnar el rango de valores
donde posiblemente se encuentra el valor seal, y
por lo tanto, permite cealizar waa mejor i
cidn y aplicacién clinica de los resultados.
expreta-
Interpreting study results: confidence intervals
CALAT 1995; 152: 169-73,
Mowrom V, Kisnsarr J, Newauss T, Kerrz S, Weer P,
Movea V, Guyart G. Tips for learners of evidence-
based medicine: 2, Measures of precision (confi-
dence intervals), CALA] 2004; 171: 611-5.
8. Mostoai V, Kisisaarr J, Newuan T, Kerrz S, Wver P,
Mover V er al. Tips for teachers of evidence-
based medicine 2: Confidence intervals and p
values, CMAJ 2004; 171, Online 1-12 (hup
‘sewn emaj.ca/egi/data/17L/6/611/DC1/1).
9. Wamay E, Bat J. Statistics review 3: Hypothesis
testing and P values. Critical Care 2002; 6: 222-5.
10. Snaxespesre T, Gessir V, VeNess M, Snses J. Impro-
ving intexprctation of clinical studies by use of
confidence levels, clinical significance curves,
and tisk-benefit contours. Lace? 2001; 357: 1349-
53,
1115