You are on page 1of 13

3.SzkloM,NietoFJ.

Epidemiologa
intermedia.Conceptosyaplicaciones.Espaa:
EdicionesDazdeSantos,2003:320327.

Porcentaje de concordancia
El porcentaje de concordancia entre dos conjuntos de observaciones se obtiene al
dividir el nmero de observaciones emparejadas que se hallan en las celdas en las que
hay concordancia, entre el nmero total de observaciones emparejadas (Figura 8.5).
Como ejemplo del clculo del porcentaje de concordancia, la Tabla 8_9 muestra los
resultados de lecturas repetidas de imgenes de Ultrasonido modo B de la bifurcacin
de la cartida izquierda, realizadas para examinar la fiabilidad de la identificacin
de placas ateroesclerticas en el estudio ARIC"). Cuando se utiliza una defini-
ASEGURAM'ENTO y CONTROL DE LA CALm AD 32'
Observacin n.O 1
Prueba +
Prueba -
N Prueba +
a
D

Observaciones concordantes
Porcentaje de concordancia: (a + d) x 100
(a + b + e + d)
Figura 8.5. Porcentaje de concordancia para resultados de una prueba emparejada
binaria (positivo frente a negati vo; por ejemplo, aquellos obtenidos por dos observadores o
mtodos diferentes o por el mi smo observador en dos momentos diferentes); proporcin de
resultados concordantcs entre lodos los evaluados.
cin binaria de la variable (presencia de plac,' o normal), como en el ej emplo mos-
trado en la tabla, el porcentaje de concord.nc. A puede calcularse simplemente como:
. 140+725
Porcentaje de concordanc,a =x 100 = 87,7 %
986
El porcentaje de concordancia no solam n e es el mtodo ms simple de resumir
el concordancia para variables categri cas, .... ml' que tiene la ventaja adicional de que
puede compularse para cualquier nmero de ca tegoras, no solamente para dos como
en el ejemplo precedente. Por ,anto, en el esrudio de fi abilidad de las lecturas del
ultrasonido carotdeo(lli, a los lectores que detectaban una placa se les peda tambin
Tabla 8.9
Concordancia entre la primera y la segunda lecturas para identificar placa
de arteriosclerosis en la bifurcacin carotdea izquierda mediante examen
de ultrasonido modo B en el estudio de riesgo de Ateroesclerosis en Comunidades ARIC
Primera lectura
Pl acas Normal Total
Segunda lectura Placas 140 52 192
Normal 69 725 794
Total 209 777 986
Fuente: R li et al., Reproducibilily 01 Exlracrania! Carotid Alherosc!erosis Lesions Assessed by S-Mode Ultra-
sound: The Atherosclerosis Aisk in Communities Study, Ultrasound Med Biol, Vol 22, 791-799, <CI 1996.
322
EPIDEMlOLOGfA INTERMEDI A: CONCEPTOS y APLICACIONES
que evaluaran la presencia de sombras acsti cas (una atenuacin de los ecos detrs
de las placas que a menudo reflejan la presencia de calcificacin de las placas: por
ejemplo, una placa ateroesclertica avanzada) . Los resul tados de las lecturas de
reproducibilidad de la bifurcacin carotdea izquierda en este estudio cuando se uti-
li za la defi nicin ms fina de la placa se muestran en la Tabla 8.10; el porcentaje de
concordancia en este caso puede calcularse como:
17 + lO4 + 725
Porcentaje de concordancia = x 100 = 85,8%
986
Tabla 8. 10
Concordancia entre la primera y segunda lectura para identificar placas
de arteriosclerosis con o sin sombra acstica en la bifurcacin cartida izquierda
Primera lectura
p + S Solo Placas Normal Tolal
Segunda lectura p + S 17 14 6 37
Solo Placas 5 104 46 155
Normal 5 64 725 794
Total 27 182 777 986
"Pl aca + sombra (acstica).
Fuente: A U et al. , Reprod:.Jcibility 01 Extracranial Carolid Alherosc!erosis lesions Assessed by B-Mode Ultra-
sound: The Al herosclerosis Risk in Communities Sludy, Ultrasaund Med Bial, Vol 22, 791-799, :11996.
Los resultados de otra evaluacin de fiabilidad, basados en los datos de un
eSludio de la relacin enlre la superexpresin de la protena p53 y el perfil de fac-
lores de riesgo de cflcer de mama, se muest ran en la Tabla 8. 1 ](32) . Como parto
de los procedimientqs de control de la cali dad en este est udio, 49 secciones ~
lumores de mama se tieron 2 veces y la tabla cruzada resultante de los datos des,
pus de las primeras dos tinciones muestra que el porcentaje de concordancia. es
de 100 x (14 + 7 + 21)/49 = 85,7%. '
Aunque el porcentaje de concordanci a es el paradigma de los ndi ces de t,abili-
dad para variables categri cas, tambin puede uti lizarse para evaluar la validez: esto
es, puede utili zarse para examinar el concordancia entre los resultados de la prueba y
una pres unta prueba de oro. En tal caso, el clculo se reali za obviamente sin con-
dicionamientos sobre este ltimo (como es el caso de los clculos de sensibil idad y
especifi cidad). Por ejempl o, en la Tabla 8. 5, el porcentaje de concordancia es mera-
mente el porcentaje de las observaciones que caen en las celdas de concordancia
entre el lotal , o 100 x (J 8 + 11 ) / 49 = 59,2%. De forma parecida, en los resultados
del estudio de validez mostrados en la Tabla 8.6, el porcentaje de concordancia entre
las categoras del peso basadas en la comunicacin brindada por los propios sujetos
y las medidas de peso y lalla es 100 x (462 + 2.868 + 2.086 + 809)/7.455 = 83,5 %.
Una limitacin del enfoque con el porcentaje de concordancia es que sus valores
tienden a ser altos siempre que la proporcin de resultados negativo-negativo es alta
(resultante de una baja prevalencia de positividad en la poblacin de estudio) , particu-
larmente cuando la especificidad es alta. Por ejemplo, en la Tabla 8.7, el porcentaje de
ASEGURAMIENTO Y CONTROL DE LA CALIDAD
323
Tabla 8.11
Reproducibilida,d del procedimiento para sobre expresin de pS3 en 49 secciones cncer
de mama: estudio de Los Pases Bajos sobre contraceptivos orales.
Primera Uncin
p53+ p53 p53 Total
Segunda tincin p53+ 14 1 15
p53 7 2 9
p53 4 21 25
Total 14 12 23 49
Fuente: K van der Kooy el al. , p53 Prolein Overexpression in Relalion lo Risk Factor$ tor Breas! Caneer, Ameri-
can Journal o( Epidemiology, Vol 144, 924-933, :J1996, The Johns Hopkins Universily School of Hygiene & Public
Health
concordancia es mayor para la definicin B (95,4%) que para la A (91,4%), aun cuan-
do la sens ibilidad fue 12 puntos ms baja en B que en A (74% y 86% respectivamen-
te); esto puede explicarse en parte por el hccho de que la prevalencia de la condicin es
menor en B que en A, lo que infla la celda negativo-negativo, y en parte por el hecho
de que la especificidad es mayor en B que en A (est cercana al 100% para el primero).
Como una ilustracin ms, la Tabla 8. 12 muestra la situaci n hipott ica de una pobla-
cin en la cual la prevalencia de obesid"d fue 20 veces menor que la observada en la
poblacin LRC, pero los ni veles de sensibilidad y especificidad eran los mismos que
los observados en la Tabla 8.7, definicin B (excepto por redondeo). En esta situacin,
el porcentaje de concordancia aumenlari del 95,4% a cerca del 99%; esto es, ser casi
TIbia 8.12
Resultados hipotticos basados en el ej , nlplo de la Tabla 8.7 (definicin B) suponiendo
los mismos valores de validez pero pre alencia aproximadamente 20 veces menor
que la hallada en el estudio
Categora segn IMe basado en medicin
IMe basado en la comunicacin
de los propios participantes
Obesos No obesos Total
Obesos 41 69 110
No obesos 14 7.331 7.345
Total 55 7.400 7.455
(41 + 7.331 )
Porcentaje de concordancia: x 100 = 98,9%
7.455
2 x 41
PCP= x 100=49,7%
(55 + 110)
41
Porcentaje de concordancia positiva de Chamberlain: ::: x 100::: 33,1 %
(41 + 69 + 14)
Porcentaje de concordancia positiva
324
EPIDEMIOLOGA INTERMEDIA, CONCEPTOS Y APLICACIONES
perfecto soJo como resultado de Ja di sminucin de la prevalencia. Ntese que, de for-
ma anloga, el porcentaje de concordancia tambin tiende a ser alto cuando la preva-
lencia de la condicin es muy alta (lo que da lugar a una abultada proporcin de obser-
vaciones posi tivo-positivo), particulmmente cuando la sensibilidad es alta.
AJ igual que con la sensibilidad y la especificidad, Jos errores estndar y los lmi-
tes de confianza para el porcentaje de concordancia se calculan como para cualquier
proporcin (vase Apndice A, Seccin A. IO) .
Porcentaje de concordancia positivas
En parte para superar Jas limitaciones del porcentaje de concordancia como ndi,ce
de fiabilidad cuando la prevalenci a de la condicin es muy baja (o muy alta), se han
propuesto por lo menos dos medidas de concordancia positiva(33):
l. Porcentaje de concordancia positiva: nmero de unidades para las que ambos
observadores comunican un resultado positivo, entre el nmero promedio de
positivos dados por ambos observadores. Utilizando la notacin de la Tabla
8.4, esto se fOlmula como sigue:
PCP
a
2a
--,----,--- x 100
(2a+h+c)
2a
x 100=--- - --x 100=
[(a + el + (a + b)]
2. Porcentaje de concordancia positiva de Chamber/ain: nmero de unidades
para las que ,ambos observadores comunican resu.ltados positivos entre ,.el
nmero de observaciones para las que al menos un observador lo hace(34J. jo
l.;! r.i
PCP de Chamber/ain
__ a _ _
x
100
(a + b + e)
El clculo de estos dos ndices se ilustra en el ejempl o de la Tabla 8. 12. Ntese
que los dos indices estn relacionados algebraicamente:
PCP de Chamber/ain
PAP
(2 -PAP)
Estadstico kappa
Las medidas de concordancia anteriormente expuestas ti enen una limitacin
importante. No ti enen en cuenta la concordancia que puede ocurrir solo por azar:
esto es, no toman en consideracin el hecho de que aunque ambas lecturas no
tuvieran ninguna relacin (por ejemplo, ambos observadores clasifican al azar) ,
existir algn grado de concordancia debido solamente al azar. Una medida que
corrige el resultado teniendo en cuenta esta realidad es el estadstico kappa(6! (K),
ASEGURAMIENTO Y CONTROL DE LA CALJDAD
325
definido como la fraccin de la concordancia observada que no es debido al azar
con relacin a la concordancia mxima posible no debida al azar cuando se utiU-
za una clasificac in categri ca de una variabl e(35.37J. Esta defini.cin se entiende
fcilmente si se considera la frmula para el clcul o de K:
K=
Po- P,
1,0 - P,
donde P
u
es la proporcin de concordancias obsen'adas y P, es la concordancia debida al
azar; esto es, la proporcin de concordancias que se espera ocurran solo por obra del azar.
El K se calcula a partir de las celdas mostradas en la diagonal de una tabla cruza-
da, que representa concordancia completa entre dos conjuntos d observaciones. La
concordancia por azar es el que se esperara si ambos observadores clasificaran las
respuestas al azar. La concordancia total por azar es la suma de la concordancia por
azar para cada celda en la di agonal. El nmero esperado solo por este concepto en
cada celda es el producto de los totales margi nal es correspondientes dividido por el
gran total. (Ntese que ste es el mi smo mtodo empleado para calcular los valores
esperados baj o la hi ptesis nula para una prueba de Ji -cuadrado en una tabla de con-
tingencia) . Por ej emplo, la concordancia atribuibl e al azar para la celda placa-pla-
ca en la Tabla 8.9 es (209 x 192)/986 o 40,7, Y cl de la celda normal- norma"
es (777 x 794)/986 o 625,7. La concordancia total esperada por azar es por tanlo
(40,7 + 625,7)/986 = 0,676. (Una va rpida para el clculo de la proporcin de
concordancia por azar para cada celda consiste en dividir los productos de los mrge-
nes por el cuadrado del total: esto es, combinar ambos pasos --el clcul o delllmero
esperado y el de la proporcin esperada- -- en uno. Por ejemplo, para los datos de la
Tabla 8.9, la proporci n esperada para la celda placa-placa es [209 x 192]/986', y el
de la celda normal-nonna! es [777 x 794]/986' . La concordancia total por azar es
por lo tanto [209 x 1-92 + 777 x 794]/986
2
= 0,676). Puesto que la concordancia
observada para esta tabla fue 0,877 (vase anteriormente), se tiene
"
K = 0 8 7 7 ~ 0,676 = O 62
1,0 --' 0,676 '
Las frmulas para el error estndar y el intervalo de confi anza para kappa se dan
en el Apndice A, Seccin A. 12.
Los valores posibles de kappa oscil an entre - 1 y 1, aunque los valores por debajo
de O no son muy reali stas en la prcti ca (l a concordancia observada sera peor que
el que producira solamentc el azar). Para la interpretacin de un valor dado de
kappa se han propuesto diferentes c1asificac iones() ".40) (Figura 8.6). De stas, la
ms ampliamente utili zada probabl emente sea la de Landi s y Koch(38). Es impor-
tante tener en cuenta, sin embargo, que estas clas ificaciones son arbitrarias(41 );
para cualquier valor dado de kappa , el grado de sesgo por error de clasificacin
que res ultara de apli car el instrumento/lector correspondi ente depender de otras
circ unstancias, tales como la prevalencia de la condic in y la di stribucin de los
mrgenes (vase ms adelante).
Al igual que el porcentaje de concordancia, kappa puede estimarse a partir de tablas
3 x 3, 4 x 4 o k x k. Por ejemplo, el valor de kappa para las lecturas repeti das de los
exmenes ultrasonogrficos de la bifurcacin carotdea en el estudio ARIC mostra-
das cn la Tabla 8.10 pueden calcularse como sigue:
326
1,0
0,8
0,6
0,4
0,2
0,0
I
-1 ,0 -
EPIDEMIOLOGA INTERMEDIA: CONCEPTOS y APLICACIONES
Landis
Koch (1977)
Casi
pertecta
Notable
Moderada
Aceptable
Reducida
Pobre
Altman (1991)
Mu'y
buena
Buena
Moderada
Aceptable
Pobre
Fleiss (1981)
Excelente
f---------l(0, 75)
De
aceptable
a
buena
Pobre
Byrt (1996)
Excelente
Muy buena
Buena
Aceptable
Reducida
Pobre
Concor-
dancia
I mexlstente I
______ 1
( 0,92)
Figura 8.6. Clasificaciones propuestas para la interpretacin un valor de kappa.
Acuerdo observado (vase antes) = 0,858
Acuerdo por azar =
[(27 x 37) + (182 x 155) + (777 x 794)]
(986)'
= 0,665
K=
(0,858 - 0,665) = O 576
(l - 0,665) ,
Tambin que el porcentaje de concordancia, kappa se utiliza
te para la de la fiabilidad: esto es, cuando no hay un estndar ,aro y
resulta apropiado darle igual peso a ambos conjuntos de lecturas, Sin embarg', tam-
bin se utiliza ocasionalmente para la evaluacin de la validez, en la comparacin de
los resultados de una prueba con los de una prueba de oro, En la Tabla 8,6 la
concordancia observada entre categoras de IMe basado en la comunicacin brinda-
da por los propios suj etos y las de la prueba de oro (IMe basado en mediciones)
es 0,835 (vase texto anterior). La concordancia esperada por azar sera:
[(534 x 640) + (3.180 x 3.447) + (2.650 x 2,500) + (1,091 x 868)]
7.455'
Por tanto,
(0,835 - 0,340)
K = = O 75
(1 - 0,340) ,
= 0,340
Kappa tambin se utili za frecuentemente en situaciones en las cuales, aunque
existe una prueba de oro, sta est sujeta a enores no despreciables y, por tanto, el
ASEGURAMIENTO Y CONTROL DE LA CALlDAD
327
investi gador es reti cente con respecto a tomarlo tal como se observa (como se supo-
ne cuando se calcul an ~ sens.i bilidad y la especificidad de la prueba). (Como se
mencion previamente, en esta situacin, puede ser preferible referirse a la compa-
racin entre la prueba de oro y la prueba examinada como una evaluacin de la
fiabilidad intermtodos y no de la validez). Un ej emplo es un estudio que utili za
niveles srico s de cotinina como prueba de oro para evaluar la vali dez del
hbito de fumar reportado por mujeres embarazadas!"); en este ejemplo la prueba
de oro tambi n cst suj eta a errores que vienen del laboratori o y tambin de la
variabilidad intra-i ndividual , y el clculo de kappa que result ser de 0,83. Adems,
para evaluar indirectamente que mtodo (comunicacin brindada. por los propios
sujetos o nivel de colinilla sri ca) tena mayor validez predictiva (y fiabilidad), los
autores compararon la magnitud de su correlacin con un resultado que, como es
bi en conocido, est fuertemente relacionado con el hbito de fumar de la madre: el
peso del ni o al nacer. La correlacin entre la cotinina s rica y el peso al nacer (r ==
0,246) fue solo ligeramente mayor que la observada entre el hbito de fumar comu-
nicado por los propios parti cipantes y el peso al nacer (r = 0,20), lo que sugiere que,
en esta poblacin, la cOl inina srica y la comuni cacin brindada por los propios
sujetos son similarmente adecuadas como marcadores de expos icin actual al hbi-
to de fumar. (Las limitaciones de las inferencias basadas en el valor del coeficiente
de correlacin se discut en ms adelante; vase Seccin 8.4.2).
Otro ejemplo de la apli cacin de kappa para eval uar la fi abilidad intenntodos lo
tenemos en un estudi o que compara la capacidad funcional basada en el desempeo
y la que resulta de una autoevaluacin en una poblacin anciana de Barcelona, Espa-
a!4". Algunos resultados seleccio"ldos de este estudi o se muestran en la Tabla 8.1 3.
Ntese que los autores comunica!' medidas de validez (sensibilidad y especificidad)
y fiabilidad (porcentaj e de concordancia y kappa); por tanto, dejan a cargo del lector
la elaboracin del j ui cio acerca de s la evaluaci n de desempeo en un momento
dado constituy o no una prueb' .jo oro apropiada.
Se di spone de extensiones del csudst ico kappa para la evaluacin de cl asificaciones
mltiples (o medidas repetidas mltiples)!36). Un ejempl o de esta aplicacin de kappa
puede encontrarse en un estudio que evala la fiabil idad de la clasifi cacin diagnstica
de visitas de emergencia y sus implicaciones para estudi os de polucin del ambi ent e!44).
La concordancia (kappa) entre el diagnstico obtenido a partir de la base de datos del
hospital y la real izada por seis clasificadores ex temas (mdicos de emergencia a tiempo
completo) de concordancia a la categora di agnstica y el nivel de polucin del da se
presenta efi cientemente por los autores (como se muestra en la Figura 8.7).
Kappa ponderado
Cuando los desenlaces del estudi o pueden expresarse con ms de dos categoras,
unos desacuerdos pueden ser ms marcados que otros; en esta situacin, debe consi-
derarse el uso del kappa ponderado. Una ejemplo de su aplicacin es la comparacin
entre el IMC comunicado por los propios participantes y el que se basa en medi cio-
nes, discutido anteriormente (vase Tabl a 8. 6). Cuando el estadstico kappa se calcu-
l para estos datos (K = 0,75), se supuso que solo vala la pena considerar el concor-
dancia total (la diagonal en la Tabl a 8.6): esto es, cualqui er tipo de desacuerdo,
independientemente de su magni tud, se tomaba como tal. Un enfoque alternativo

Tabla 8, 13
Concordancia entre invalidez comunicada y desempeo observado en una muestra de 626 individuos de 72 aos o ms de edad,
en Barcelona, Espaa.
.. Necesidad de ayuda .. para caminar comunicada Desempeo al caminar 4 metros
Incapaz Capaz Sensibi lidad Especi ficidad % de concordancia Kappa
Si
No
15
11
12
571
Dificultad al caminar comunicadaDesempeo al caminar 4 metros
0,58 0,98 96 0,55
Despacio
t
Rpido
t
Sensibilidad Especificidad % de concordancia Ka ppa
Si
No
85
56
75
367
0,60
Dificultad .. al levantarse de una sitia comunicadaDesempeo al levantarse 5 veces de una si lla
0,83 78 0,41
Incapaz Capaz Sensibilidad Especificidad % de concordancia Kappa
Si
No
71
42
41
455
0,63
(0,54 - 0,72)'
0,92
(0,89 - 0,94)'
La sensibi lidad y la especificidad se calcularon considerando el examen de desempeo fsico como .. prueba de oro".
I .. Despacio y .. rpidon se definieron de acuerdo a si el sujeto camin 4 metros en ms o en menos de 7.5 segundos respectivamente,
I los intervalos de confianza para estos estimados y una ilustracin de su clculo pueden verse en el Apndice A, Secciones A 1 O Y A 12.
86
(83 - 89)'
0,55
(0,47 - 0,63)'
Fuente: M Ferrer et al., Comparison 01 Performance-Based and Sel l -Relal ed Functional Capacity in Spanish Elderl y, American Joumal of Epidemiology, Vol 149, 228-235,
1999, The Johns Hopkins Universi ty Schoo\ 01 Hygiene & Publ ic Health
;:' ..:... ' ...
W
N
00
m
...
6
ro
:;:
6
g
'>
Z
-i
m
"
:;:
m
O
>.
8
z
n
ro

-<
,.
..,
r

,.
n
6
z
3l
ASEGURAMJENTO y CONTROL DE LA CALIDAD
329

0,9
0,8
0,7
0,6
0,5
0,4 -
f
0,3..L-----------'
Todos los avaluadores
Figura 8.7. Fiabilidad de la clasificacin diagnstica de las visitas de emergencia segn
categora diagnc'lstica: la clasi ficacin se hada segn la base de datos del hospital y seis
evaluadores externos. Base de datos del departamento de emergencia del Hospital Regional
Sant ]ohn, Saint Jot-n. New Brunswick, Canada, J 994. Los smbolos oscuros represent<:f
das de alta polucin y Jo:; claros representan das de baja polucin. "', P (das de baja
cin vs das de alta = 0,002. e, asma; _ , enfermedad pulmonar obsrrucriva
ca; A , infeccin respirat'oria; .... enfermedades cardiacas; +, otras. '(,
Fuente: DM Stieb et al., Assessing Diagnostic Classification in an Emergency Department lmpli-
cations lar DaiJy Time Series Studies of Air Pollulion, American Journal of Epidemi%gy, Vol 148,
666-670, 1998, The Johns Hopkins Universily School of Hygiene & PubJic Health.
cuando se calcul a el valor de kappa es asignar pesos distintos a diferentes niveles de
desacuerdo. Por ejempl o, la Tabla 8.14 muestra los mismos datos que la Tabla 8.6,
pero tambin indica que el peso total (1,0) se le asign a las celdas de la diagonal
que representan el acuerdo perfecto, un peso de 0,75 se les asign a los desacuerdos
entre categorfas adyacentes, uno de 0,5 a los desacuerdos correspondientes a una
distancia de dos categorfas, y un peso de a los desacuerdos de 3 categoras. El cl-
culo del acuerdo observado en la Tabl a 8. 14 es anlogo al de una media ponderada
en el sentido dc que consiste meramente en multiplicar el nmero en cada celda por
el peso correspondi ente, sumar todos los productos y dividir la suma por el gran
total. Comenzando en la primera fila con la celda que denota bajo peso para
ambos ensayos y procediendo de izqui erda a derecha en cada fila, el acuerdo obser-
330
EPIDEMIOLOGlA INTERMEDI A: CONCEPTOS Y APLICACIONES
Tabla 8. 14
Clculo de kappa ponderado: tabulacin cruzada de cuat.'o categoras de ndice
de masa corporal comunicada por los propios participantes y basada en mediciones.
7.455 participantes adultos del Estudio Familiar de Clnicas de Investigacin de Lpidos,
1975-1978. (Vase Tabla 8_6)
Categora segn lMe medido
IMe basado
Bajo peso Normal Sobrepeso Obeso Total
en autorreporte
Bajo peso 462 (1 ,Or 178 (0,75) 0(0,5) O (O) 640
Normal 72 (0,75) 2.868 (1,0) 505 (0,75) 2 (0,5) 3.447
Sobrepeso 0(0,5) 134 (0,75) 2.086 (1,0) 280 (0,75) 2.500
Obeso O (O) 0(0,5) 59 (0,75) 809(1,0) 868
Total 534 3.180 2.650 1.091 7.455
N.o observado (peso para el clculo de kappa) .
vado (Por' en el que las letras o y p denotan observado y ponderado respectiva-
mente) es
Po, = (462 x 1 + 178 x 0,75 + O + O + 72 x 0,75 + 2.868 x I + 505 x 0,75 + 2 x 0,5 +
O + 134 x 0,75 + 2.086 x 1 + 280 x 0,75 + O + O + 59 x 0,75 + 809 x
1 )/7.455 = 0,959
El clculo de Po, puede simplificarse reorgani zando esta ecuacin, agrupando las
celdas con pesos igual es (y omitiendo las que tienen ceros):
Po, " [(462 + 2.868 + 2.086 + 809) x 1 + (178 + 72 + 505 + 134.+ 280 + 59) x
. 0,75 + (2) x 0,5]/7.455 = 0,959 '
, 1 '
El clculo del acuerdo por azar (P", en el que la letra e denota 2sperado slo
por el azar) en este ejemplo, se realiza como sigue: 1) multiplique los totales margi-
nales correspondientes a las celdas con un peso de 1,0; entonces sume estos produc-
tos y multiplique esta suma por el peso de 1,0; 2) haga lo mi smo con las celdas con
pesos igual a 0,75 as como para las celdas con pesos de 0,5 (es decir, incluyendo
aquellas con valores observados iguales a cero); y 3) sume todos los resultados ante-
riores y divida la suma por el cuadrado del gran total como sigue:
P" = [(534 x 640 + 3.180 x 3.447 + ... ) xl + (534 x 3.447 + ... ) x
0,75 + (2.650 x 640 + 1.091 x 3.447 + 534 x 2.500 + 3.180 x
868) x 0,5]/7.455' = 0,776
Una vez que se obtienen los valores ponderados de acuerdos observados y por
azar, la fnnula para el kappa ponderado es idntica a la del no ponderado:
P
ow
- P
ew
Kw = - - : - - - = ~
1,O-P
ew
ASEGURAMIENTO Y CONTROL DE LA CALIDAD
33 1
Utilizando esta frmula para calcular el kappa ponderado de la Tabla 8.4 se
tiene:
Kw =
0,959 - 0,776
1,0 - 0,776
0,82
Ntese que en el ejemplo anterior, el peso de 0,5 asignado a un desacuerdo de dos
categoras se utiliz solo como ejemplo hipottico para el clculo del kappa pondera-
do; en la realidad, uno estara poco inclinado a darle peso alguno a desacuerdos entre
tales categoras extremas como obeso versus nonnal o sobrepeso \'ersus bajo
peso. En general los pesos asignados a las celdas, aunque algo arbitrarios, deberan
ser seleccionados sobre la base de la percepcin del investigador acerca de cun serios
son los desacuerdos para el contexro en que sern utilizados. Por ejemplo, en un
ambiente clnico donde un diagnstico confinnatorio de cncer de mama a partir de
biops ias puede ser seguido de una mastectoma, no es aceptable nada fuera de un
acuerdo perfecto. (En la prctica, en esta situacin el desacuerdo entre dos observado-
res se juzga y dirime por un observador u observadores adicionales). Un ej emplo de
naturaleza diferente es la inclusin de casos de infarto del miocardio definitivos o
probables en el numerador de tasas de incidencia para analizar asociaciones con fac-
tores de riesgo en un estudio de cohortes (vase, por ejemplo, White el aI.
(51
); esto pue-
de ser aceptable, lo que justi fica el uso de un ndice ponderado similar al mostrado en
la Tabla 8.15 para el clculo de Iwppa entre dos evaluadorcs. Ntese que en este ejem-
plo, el esquema de ponderaciones se determin reconociendo que el desacuerdo entre
probable o definitivo por un lado y ausente por otro, parece ser ms serip que el
que existe n t r ~ '-<definitivo y probable. Obviamente, el invesligador deber{d asig-
nar ms peso a OS desacuerdos menos extremos que a los ms extremos. En d ejem-
plo hipotti co de la Tabla 8. 15, al acuerdo perfecto en el diagnstico de infarto de mio-
caldio entre dos observadores se le asign un peso de 1,0 (como en el clculo del
kappa no ponderado); al desacuerdo defmitivo verSllS probable se le asi,'Ji arbi-
trariamente ur p 'so de acuerdo de 0,75, lo que reconoce la seriedad menor J0:1 rela-
cin al peso dc' U asignado al desacuerdo entre ausente y las otras categorns. Si se
utilizara una cdtegora diagnstica adicional y aun ms suave, posi ble, al desa-
cuerdo entre, por ejemplo, definitivo y posibl e podra drsele un peso ms peque-
o (ej, 0,5) que el que se asign a las celdas definitivo-probable. Un enfoque similar
podra uti li zarse para los datos mostrados en la Tabla 8.10, en la cual el desacuerdo
entre las lecturas placa + sombra y placa podra no considerarse tan notable como
el que existe entre cualquiera de las dos y la normal.
Tabla 8. 15
Ponderaciones de acuerdo para el clculo de kappa: un ejemplo hipottico de clasifica-
cin del infarto de miocardio mediante certeza de diagnstico
Observador N. O 1
Observador N.O 2
Definitivo Probable Ausente
Definitivo 1,0 0,75
O
Probable 0,75 1,0
O
Ausente O O
1,0
33? EPIDEMI OLOGA INTERMEDIA, CONCEPTOS Y APLICACIONES
En cualquier caso, el valor del kappa ponderado depender obviamente del
esquema de ponderaciones elegi do. Esta arbitrariedad ha sido criticada y es una de
las debilidades del kappa poriderado(45 ), parti cularmente cuando se agrupan varia-
bles continuas en mltipl es categoras ordinal es (por ejemplo, las categoras del
Me en la Tabla 8.6). En este ltimo caso, ser mejor utilizar ciertos esquemas de
ponderaciones para kappa* que son equi valentes al coeficiente de correlacin
intradase descrito en la Seccin 8.4.2,
Devendencia de kavpa de la prevalellcia

You might also like