1

ESTUDIOS INTERLABORATORIOS
Notas
Indice
1. PLANIFICACIÓN DE LOS ESTUDIOS INTERLABORATORIOS....................................1
2. ELECCIÓN DE LOS LABORATORIOS...........................................................................2
3. MATERIALES PARA LAS PRUEBAS..............................................................................4
3.1. Número de niveles de las pruebas............................................................................................................. 4
3.2. Número de replicados ................................................................................................................................ 4
3.3. Especímenes reservados........................................................................................................................... 4
3.4. Homogeneización de especímenes ........................................................................................................... 5
4. DISTRIBUCIÓN DE LOS ESPECÍMENES......................................................................5
4.1. Aleatorización de especímenes.................................................................................................................. 5
4.2. Expedición .................................................................................................................................................. 5
5. INSTRUCCIONES, PROTOCOLO DEL EXPERIMENTO ...............................................5
5.1. Instrucciones del experimento.................................................................................................................... 5
5.2. Protocolo del experimento.......................................................................................................................... 6
6. PROCEDIMIENTO ESTÁNDAR PARA EL ANÁLISIS ESTADÍSTICO DE LOS
RESULTADOS DEL ESTUDIO............................................................................................6
6.1. Modelo estadístico básico .......................................................................................................................... 6
6.2. Cálculos estadísticos iniciales.................................................................................................................... 7
6.3. Tests de consistencia............................................................................................................................... 10
6.4. Expresión de la precisión de los resultados............................................................................................. 16
7. UNA APROXIMACIÓN ALTERNATIVA, EL ANÁLISIS ESTADÍSTICO DE YOUDEN...17
7.1. Análisis de Youden................................................................................................................................... 17
7.2. Gráfico de Youden.................................................................................................................................... 17
7.3. Análisis de Youden: cálculos.................................................................................................................... 19
8. APLICACIÓN DE LOS RESULTADOS DE LA PRUEBA DE PRECISIÓN....................23
8.1. Generalidades .......................................................................................................................................... 23
8.2. Comparación de diferentes métodos analíticos ....................................................................................... 24
9. VALORACIÓN DE LAS PRESTACIONES DE LOS LABORATORIOS .........................26
9.1. Tipos de valoración .................................................................................................................................. 27
9.2. Procedimientos estadísticos y criterio...................................................................................................... 27
10. BIBLIOGRAFÍA............................................................................................................28
1. Planificación de los estudios interlaboratorios
Antes de empezar un estudio interlaboratorios, un grupo de trabajo (llamado “panel” en la norma ISO 5725)
se necesita con total responsabilidad para la planificación de dicho estudio incluyendo costes, número de
laboratorios, materiales para las pruebas, etc. Este grupo de trabajo constaría de expertos familiarizados
con los métodos analíticos y sus aplicaciones.
Se elegirá un coordinador con la responsabilidad para la planificación detallada, incluyendo invitación,
preparación de las muestras, hojas de respuestas, resultados, valoración preliminar y contacto directo con
los laboratorios participantes.
Una persona con adecuada competencia en métodos estadísticos y conocimiento de la materia será
designado como estadístico. Esta persona será la responsable para el diseño estadístico y análisis de
experimentos.
2
2. Elección de los laboratorios
Según la opinión del responsable a algunos de los laboratorios considerados cualificados se les ofrecería la
oportunidad de participar en el estudio. Un laboratorio cualificado tendría:
• facilidades apropiadas del laboratorio y equipamiento de pruebas
• operadores competentes
• familiaridad con el método
• reputación de hacer análisis fiables, y
• suficiente tiempo e interés para hacer bien las cosas
En lo concerniente a la elección de los laboratorios, los patrones presentan ligeramente diferentes
opiniones:
Los términos anteriores proceden de ASTM E 691. Sin suficiente familiaridad con el método analítico puede
usarse un proceso de familiarización incluyendo una prueba piloto. “La importancia de este paso de
familiarización no debe ser sobreenfatizado... Muchos estudios interlaboratorio resultan esencialmente
inútiles debido a la falta de familiarización”.
La norma ISO 5725-1: 1994 establece que “Los laboratorios participantes no consistirían exclusivamente de
aquellos que haya adquirido especial experiencia durante el proceso de estandarización del método.
Ninguno resultará un laboratorio de “referencia” especializada en orden a demostrar la exactitud para la cual
el método puede `restar en manos expertas.
Uno puede concluir de lo dicho que, en orden s minimizar riesgos de algún sesgo, es importante incluir todo
tipo de laboratorios que usen el método de una forma regular o hayan adquirido suficiente experiencia por
un pre-prueba.
Desde el punto de vista estadístico, los laboratorios participantes en un estudio interlaboratorio para estimar
la precisión serán elegidos de forma aleatoria de entre todos los laboratorios que usen el método de prueba.
El número de laboratorios participantes en un estudio interlaboratorios será suficientemente grande para
que resulte un corte transversal de la población de laboratorios cualificados. De este modo la pérdida o
pobres prestaciones de uno pocos no será fatal para el estudio.
En la práctica, la elección del número de laboratorios será un compromiso entre la disponibilidad de
recursos y el deseo de reducir la incertidumbre de los estimados a un nivel satisfactorio. El número de
laboratorios y el número de resultados de prueba (replicados) de cada laboratorio a cada nivel de la prueba
son interdependientes. El factor de incertidumbre A, a un nivel de probabilidad del 95 %, puede expresarse
mediante las siguientes ecuaciones:
Para repetibilidad:
( )
1
1, 96
2 1
r
A
p n
=

Para la reproducibilidad:
( ) ( )( )
( )
2
2
4 2
1 1 1 1
1, 96
2 1
R
p n n p
A
n p p
γ
γ
(
+ − + − −
¸ ¸
=

donde: r y R representan respectivamente repetibilidad y reproducibilidad,;
p es el número de laboratorios
n es el número de resultados de prueba (replicados)
γ γ es la razón de la desviación típica de reproducibilidad a la desviación típica de repetibilidad.
La relación entre el factor de incertidumbre y el número de laboratorios se ilustra en las figuras 1 y 2. Se
puede ver como un número grande de laboratorios participantes reduce siempre la incertidumbre de los
estimados. Sin embargo, a veces el número de laboratorios cualificados para algunos métodos recién
desarrollados es muy limitado. Una forma de resolver este problema es incrementar el número de
replicados, si la proporción de reproducibilidad a repetibilidad no es muy grande, por ejemplo, inferior a 2, es
habitual elegir el número de laboratorios entre 8 y 15. Si la precisión de un método de prueba se basa en
resultados previos aceptables, desde 6 laboratorios. La incertidumbre de los estimados será mencionada
claramente en el informe final de la precisión.
3
Figura 1. Relación entre la incertidumbre de la desviación típica de repetibilidad
y el número de laboratorios
4
Figura 2. Relación entre la incertidumbre de la desviación típica de reproducibilidad
y el número de laboratorios
3. Materiales para las pruebas
3.1. Número de niveles de las pruebas
Los materiales que utilizados en los estudios interlaboratorio deberán ser representativos de aquellos para
los cuales se espera aplicar el método analítico. Es de esperar que diferentes materiales con diferentes
niveles de propiedad, produzcan valores más altos o más bajos de esta propiedad. El número de niveles de
prueba que deban incluirse en los estudios interlaboratorios dependerá de los siguientes factores:
• el rango de niveles en la clase de materiales para ser analizados y la adecuada relación de la precisión
para cada nivel del rango;
• el número de diferentes tipos de materiales a los que se aplicará el método;
• las dificultades y costos implicados en la obtención, procesamiento, y distribución de las muestras;
• la dificultad o período de tiempo requerido para de ejecución de las pruebas y los costos que suponga;
• la necesidad legal o comercial de obtener una estimación de la precisión completa y fiable; y
• la incertidumbre de la información previa en algunos de los puntos anteriormente mencionados.
En casos normales, deberían incluirse en un estudio interlaboratorio al menos tres materiales diferentes
representando tres diferentes niveles. Si el propósito es determinar la precisión de un método de prueba,
deberían incluirse cinco o más niveles. Puede reducirse el número de niveles si ya se conoce que la
precisión es relativamente constante o proporcional para el nivel medio del rango de valores de interés, o si
se trata de una investigación piloto de un método analítico recién desarrollado. El análisis de Youden es una
excepción, ya que usa solamente materiales a dos niveles.
3.2. Número de replicados
El número de replicados es generalmente de tres o cuatro. Se pueden usar dos replicados en los siguientes
casos:
• el material se espera que sea muy homogéneo;
• se conoce que la desviación típica de reproducibilidad es significativamente mayor que la desviación
típica de repetibilidad, por ejemplo el valor de γ es mayor que 2;
• el número de laboratorios es 15 o más.
Si el material se espera que sea muy heterogéneo, pueden ser necesarios hasta 10 replicados según el
nivel de la incertidumbre.
3.3. Especímenes reservados
Se debe preparar suficiente cantidad de material para cubrir el experimento y reservar por si se producen
roturas accidentales o errores en la obtención de algunos resultados que requieran material
complementario. Dependiendo del tipo de material y el número de laboratorios participantes, la cantidad de
material a reservar sería del 10 al 50 % del que se use directamente en el experimento. El coordinador
5
deberá tomar las correspondientes decisiones sobre la cantidad de especímenes complementarios,
consultando con el grupo de trabajo.
3.4. Homogeneización de especímenes
Cuando un material tiene que ser homogeneizado, se hará de la manera mas apropiada para ese material.
Después de la homogeneización, muestreo estadístico será analizado respecto a su homogeneidad. Si esta
prueba conduce a un considerable retraso en el programa se puede usar una prueba alternativa para la
valoración indirecta de la homogeneidad. Si la subdivisión o reducción de la muestra es una parte de los
procedimientos de la prueba, deberá hacerse constar claramente en las instrucciones.
Cuando las pruebas tengan que ser realizadas en especímenes sólidos que no pueden ser
homogeneizadas (tales como cálculos, tejidos, etc.) y cuando las pruebas no puedan repetirse en la misma
pieza, la heterogeneidad en el material de prueba formará un componente esencial de la precisión del
método. En este caso es importante distribuir los especímenes a cada laboratorio con la propiedad o
heterogeneidad tan similares como sea posible.
Debido a la heterogeneidad de algunos materiales concretos, la variación entre especímenes puede ser a
veces muy grande. Esto se deberá tener en cuenta en la evaluación de la precisión de las técnicas de
medida.
4. Distribución de los especímenes
4.1. Aleatorización de especímenes
Todos los grupos de especimenes serán etiquetados y aleatorizados antes de la distribución. La
aleatorización se puede hacer mediante una tabla de números aleatorios, lotería o numeración aleatoria por
ordenador.
Para algunos estudios interlaboratorios puede ser importante los aspectos de confidencialidad de los
resultados. En tal caso se puede contratar una empresa externa para la aleatorización y codificación.
4.2. Expedición
Los especímenes serán adecuadamente envasados para prevenir daños por impacto o sobrepeso y para
proteger su estabilidad y características durante el transporte. Si la propiedad del material es muy sensible a
la temperatura, deberá utilizarse un medio de locomoción con temperatura acondicionada.
En el envase deberá constar clara y correctamente el nombre y dirección del receptor para asegurar la
pronta entrega. Si el envío se va hacer a un país donde es necesaria una declaración del usuario, el
coordinador preparará suficiente documentación, por ejemplo, facturas pro forma, unidas al envase.
Preferiblemente, el coordinador enviará previamente una copia de la documentación relevante para la
declaración de usuario del receptor. En ocasiones, dificultades en la declaración del usuario pueden
provocar considerables retrasos en la entrega, y por tanto en el experimento.
Después el envío de los especímenes, el coordinador informará a los receptores (contacto personal con los
laboratorios participantes) del envío incluyendo fecha de envío, nombre del correo, forma y peso del
paquete, manipulación de los especímenes a la llegada, etc. A vuelta de correo, los receptores le informarán
de la llegada y condiciones de los especímenes.
5. Instrucciones, protocolo del experimento
5.1. Instrucciones del experimento
Es de suma importancia para el coordinador escribir claramente las instrucciones del experimento
incluyendo preparación, calibración y análisis, especialmente cuando:
• hay varias opciones en el método;
• el método se ha desarrollado recientemente y algunos de los participantes pueden no tener experiencia;
• existe alguna duda en la versión actual del método estándar; o
• la prueba consiste en una modificación del método estándar.
En las instrucciones se especificará el número de dígitos significativos. Generalmente, el número de dígitos
significativos en un estudio interlaboratorio es, si posible, uno más que requerido en el método estándar.
6
puede ser de gran ayuda para los operadores el disponer de utilizar tablas, figuras o fotografías, cuando sea
apropiado, para tener presente el procedimiento.
5.2. Protocolo del experimento
Es prudente por parte del coordinador preparar hojas “estándar” de protocolo para recordar los datos e
informar los resultados. Las unidades de medida y los dígitos significativos requeridos deben ser
expresados en el protocolo. La dirección de contacto del coordinador constará en el protocolo para facilitar
al operador contactar con él cuando surja alguna duda durante la prueba. En el protocolo habrá suficiente
espacio para que el operador pueda tomar nota durante el procedimiento. Estas notas constituirán una
información útil para la interpretación la inconsistencia en los resultados de la prueba.
6. Procedimiento estándar para el análisis estadístico de los resultados del estudio
6.1. Modelo estadístico básico
El modelo estadístico básico dado en la norma ISO 5725 para la estimación de la inexactitud (inveracidad e
imprecisión) de un método es:
y m B e = + +
Donde y es el resultado de la prueba;
m es la media general;
B es la componente del sesgo del laboratorio bajo condiciones de repetibilidad;
e es el error aleatorio que ocurre en cada medida bajo condiciones de repetibilidad.
El término B se considera constante bajo condiciones de repetibilidad, pero difiere en valor bajo otras
condiciones. En general, B puede considerarse como la suma de ambos componentes sistemático y
aleatorio incluyendo diferentes condiciones climáticas, variaciones en el equipamiento e incluso diferencias
en las técnicas en los cuales los operadores son entrenados en sitios diferentes. De este modo la varianza
de B se llama varianza interlaboratorio y se expresa como:
( )
2
var
L
B σ =
donde
2
L
σ es el verdadero valor de la varianza interlaboratorio e incluye las variabilidades entre
operadores y entre equipamientos;
e representa el error aleatorio que ocurre en cada resultado de la prueba.
La varianza de un laboratorio simple, bajo condiciones de repetibilidad, se llama varianza intralaboratorio y
se expresa como:
( )
2
var
w
e σ =
donde
2
w
σ es el valor verdadero de la varianza intralaboratorio.
Es de esperar que
2
w
σ tenga diferentes valores en diferentes laboratorios debido a diferencias tales como
las habilidades de los operadores, pero se asume que para un método de análisis adecuadamente
estandarizado tales diferencias entre laboratorios serían pequeñas. De este modo se establecería un valor
común de la varianza intralaboratorio para todos los laboratorios a través de la media aritmética de las
varianzas intralaboartorio. Este valor común se llama varianza de repetibilidad y se designa como:
( )
2 2
var
r w
e σ σ = =
y se obtiene a partir de todos los laboratorios participantes en el experimento de la exactitud después de
eliminar los extremos (outliers).
De acuerdo con lo expuesto, la varianza de repetibilidad se mide directamente como la varianza del término
e , pero la varianza de reproducibilidad depende de la suma de la varianza de repetibilidad y la varianza
interlaboratorio. Como medida de la imprecisión, se requieren dos cantidades: la desviación típica de
repetibilidad
r
σ y la desviación típica de reproducibilidad
2
R
s :
7
( )
2
var (1)
r w
e σ σ = =
y
2 2 2
(2)
R L r
σ σ σ = +
En estas ecuaciones σ representa el valor verdadero de la desviación típica poblacional. En la práctica,
estas desviaciones estándar no son conocidas debido a que se utilizan poblaciones limitadas. Deben
hacerse estimaciones de los valores de la imprecisión a partir de muestras relativamente pequeñas de todos
los posibles laboratorios y dentro de estos laboratorios a partir de una pequeña muestra de todos los
posibles resultados de la prueba. En la práctica, el símbolo σ es sustituido por s para denotar que es una
estimación.
6.2. Cálculos estadísticos iniciales
6.2.1. Datos originales
Los resultados originales informados por los diferentes laboratorios son recogidos en hojas de trabajo y
generalmente organizados de tal manera que cada columna contiene los datos obtenidos de todos los
laboratorios para un nivel de prueba del material, y cada fila contiene los datos de un laboratorio para todos
los niveles. Un ejemplo se muestra en la tabla 1.
Tabla 1. Ejemplo de hoja de trabajo para la colección de los datos originales.
6.2.2. Media de celda y desviación típica de celda
La media de celda y la desviación típica de cada nivel de prueba son definidas por las siguientes
ecuaciones:
8
( )
1
2
1
1
1
1
1
i
i
n
i i j
j
i
n
i i j i
j
y y
n
s y y
n
=
=
=
= −



donde
i
y es la media de la celda en el laboratorio i ;
i
n es el número de resultados de prueba en el laboratorio i ;
i
s es la desviación típica de los resultados de prueba en el laboratorio i .
Los valores calculados de
i
y y
i
s serán expresados con un dígito significativo más que los datos originales.
Estos valores calculados serán también tabulados de la misma forma que los datos originales. Algunos
ejemplos se muestran en las tablas 2 y 3.
Tabla 2. Ejemplo de hoja de trabajo para la colección de las celdas de medias
(calculadas a partir de los datos de la tabla 1)
9
Tabla 3 Ejemplo de hoja de trabajo para la colección de las celdas de las desviaciones típicas
( calculadas a partir de los datos de la tabla 1)
6.2.3. Media general, repetibilidad y reproducibilidad
La media general ˆ m es el promedio de las medias de las celdas, y se expresa como:
1
1
ˆ
p
i i
i
p
i
i
n y
m
n
=
=
=


donde p es el número de laboratorios.
De acuerdo con las ecuaciones (1) y (2), la estimación de la desviación típica de repetibilidad es:
2
r w
s σ =
y la estimación de la desviación típica de reproducibilidad es:
2 2
R L r
s s s = +
El valor de
2
w
s se calcula como:
( )
( )
2
1 2
1
1
1
p
i i
i
w p
i
i
n s
s
n
=
=

=



Es obvio que, si el número de resultados es uniforme a través de todos los laboratorios participantes la
desviación típica de repetibilidad puede ser expresada sencillamente como:
2
1
p
i
i
r
s
s
p
=
=

El valor de
2
L
s se calcula como:
2 2
2 2
2
2
2
ˆ ˆ
0
ˆ
r r
m m
L
r
m
s s
s s
n n
s
s
s
n
¦
− >
¦
¦
=
´
¦

¦
¹
10
donde
m
s es la desviación típica de las medias de las celdas:
( )
2
1 2
2
1
1
1
ˆ
1
ˆ 1
1
ˆ
1
p
i i
i
m
p
i
p
i
i p
i
i
i
n y m
s
p n
n
n n
p
n
=
=
=
=

=

| |
|
|
= −
| −
|
\ .




Si el número de resultados es uniforme a través de los laboratorios participantes,
2
m
s se puede simplificar:
( )
2
2
1
1
ˆ
1
p
m i
i
s y m
p
=
= −


De este modo la desviación típica de reproducibilidad sería:
2 2
1
R m r
n
s s s
n

= +
6.3. Tests de consistencia
Se pueden usar varias técnicas para estudiar la consistencia de los resultados de las pruebas procedentes
de varios laboratorios. ASTM E 691 recomienda una técnica gráfica (los estadísticos k y h de Mandel),
mientras que la NORMA ISO 57 25 recomienda ambas la gráfica (estadísticos k y h de Mandel) y la
numérica (tests de Cochran y tests de Grubbs)
6.3.1.Consistencia entre laboratorios: estadístico h
El estadístico de consistencia h es un indicador de cómo el promedio de los resultados de un laboratorio
particular compara con el promedio del resto de los laboratorios. Está definido por:
x
d
h
s
=
dónde: ( ) d x m = − ;
2
1
1
p
i
x
i
d
s
p
=
=


;
i
d desvío del promedio de cada laboratorio i respecto al promedio global m;
x
s desviación típica de los promedio de todos los laboratorios;
p número de laboratorios participantes.
El valor crítico de h se determina de acuerdo a:
( )
( )
2
1
2
crítico
p t
h
p t p

=
+ −
dónde: t es la t de Student con 2 p − grados de libertad, al nivel de significación de 0,5 % a dos
colas.
11
6.3.2. Consistencia intra laboratorios, estadístico k
El estadístico de consistencia k es un indicador de cómo la variabilidad intra laboratorio de un laboratorio
particular (bajo condiciones de repetibilidad) compara con el resto de los laboratorios combinados. Está
definido por:
r
s
k
s
=
dónde:
( )
2
1
1
p
i
i
x x
s
n
=

=


;
2
1
p
i
i
r
s
s
p
=
=

;
2
i
s desviación típica de los resultados de cada laboratorio particular;
r
s desviación típica de repetibilidad;
n número de replicaciones.
6.3.2.1.Valor crítico de k
El valor crítico de k se determina de acuerdo a:
1
1
crítico
p
k
p
F
=

+
dónde F es el valor de la distribución de Fisher-Snedecor con ( ) 1 n− y ( )( ) 1 1 p n − − grados de
libertad al nivel de significación de 0.5 %.
Los resultados aberrantes son eliminados utilizando los estadísticos de consistencia h y k conforme a la
norma ASTM E691.
h
estadístico de consistencia entre-laboratorios. Compara el promedio de las réplicas con el valor
asignado (promedio global). A mayor valor absoluto de h
( )
h , menor consistencia entre los
resultados de un laboratorio particular respecto al resto de los laboratorios.
k
estadístico de consistencia intralaboratorio. Compara la desviación típica de las réplicas con la
desviación típica combinada o de repetibilidad. Si 1 k = , la variabilidad de ese laboratorio es igual
a la del resto. Si 1 k > su variabilidad es mayor y si 1 k < su variabilidad es menor. Valores altos
de k representan variabilidad intralaboratorio, valores muy pequeños de k pueden indicar
escasa sensibilidad en las escalas de medición u otros problemas asociados a las mediciones.
Los estadísticos k y h calculados de se comparan con sus respectivos valores críticos:
crítica
h y
crítica
k
Los resultados con desvíos significativos se descartan y se vuelven a recalcular nuevamente los
estadísticos anteriores. El proceso anterior se repite hasta que no haya valores que excedan los valores
críticos, de esta forma se obtiene un grupo de resultados finales, estadísticamente consistente.
Una ventaja de los estadísticos de Mandel es que los resultados de las pruebas de consistencia se pueden
ilustrar gráficamente como se muestran en las figuras 3 y 4
12
Figura 3. Ejemplo del gráfico del estadístico k de Mandel
(calculado a partir de los datos de la tabla 1)
Figura 4. Ejemplo del gráfico del estadístico h de Mandel
(calculado a partir de los datos de la tabla 1)
6.3.3. Técnica numérica
En la norma ISO 5725-2 se recomienda el test de Cochran para examinar la consistencia intralaboratorio y
el test de Grubbs para examinar la consistencia interlaboratorio. El test de Grubbs también se puede usar
como test de consistencia de los resultados medidos en un laboratorio usando materiales idénticos.
El estadístico C de Cochran se define como:
2
2
1
máx
p
i
i
s
C
s
=
=

donde
máx
s es la desviación típica mayor del conjunto de las desviaciones típicas determinadas.
El test de Cochran es un test de valores aberrantes de una cola porque examina solamente el valor más alto
en una serie de desviaciones típicas.
En el test de Grubbs, los datos a ser analizados deben ser ordenados en orden ascendente, que es, para
una serie de p valores { } 1, 2, ,
j
x j k = = … , donde
1
x es el menor y
k
x el mayor. Para examinar la
significación del valor mayor, el estadístico
k
G es:
k
k
x x
G
s

=
13
donde:
1
1
k
j
j
x x
k
=
=

( )
2
1
1
1
k
j
j
s x x
k
=
= −


Para examinar el valor más pequeño:
1
1
x x
G
s

=
Para examinar los dos valores mayores:
2
1,
1, 2
0
k k
k k
s
G
s


=
donde
( )
2
2
0
1
k
j
j
s x x
=
= −

( )
2
2
2
1, 1,
1
k
k k j k k
j
s x x

− −
=
= −

2
1,
1
1
2
k
k k j
j
x x
k


=
=


De modo similar, para examinar los dos valores más pequeños:
2
1, 2
1, 2 2
0
s
G
s
=
donde
( )
2
2
1, 2 1, 2
3
k
j
j
s x x
=
= −

1, 2
3
1
2
k
j
j
x x
k
=
=


Cuando el test de Grubbs se aplica a las medias d las celdas (para ensayar la consistencia
interlaboratorios), x y = y k p = , mientras que cuando se aplica a los datos originales (para determinar la
consistencia de n resultados en un laboratorio), x y = y k n = .
Las tablas 4 y 5 contienen respectivamente los valores críticos para el test de Cochran y el test de Grubbs.
14
Tabla 4. Valores críticos para el test de C de Cochran.
p es el número de laboratorios; n es número de resultados de prueba por celda.
15
Tabla 5. Valores críticos para el test de Grubbs.
p es el número de laboratorios a un nivel dado
Normalmente, los valores críticos con un nivel de significación 1% α = y 5% α = se usan como criterios
para valores aberrantes y extraños, respectivamente. En otras palabras,
• si el test estadístico es mayor que el valor crítico del 1 %, el ítem ensayado es llamado un estadístico
aberrante;
• si el test estadístico es mayor que el valor crítico del 5 % pero menor que el valor crítico del 1 % se
llama un estadístico extraño;
• si el test estadístico es menor o igual que le valor crítico del 5 %, el ítem ensayado se acepta como
correcto.
Si como consecuencia de los tests de consistencia se encuentra un valor aberrante o extraño, el laboratorio
que produce ese valor aberrante o extraño deberé ser consultado para posible error técnico (por ejemplo,
error tipográfico, muestra equivocada, calibración impropia, un error en la ejecución del experimento, etc.).
Si la explicación del error técnico es tal que hace imposible reemplazar el ítem sospechoso, el aberrante
16
será rechazado (descartado) del estudio al menos que haya una buena razón para mantenerlo, mientras
que un valor extraño puede ser retenido en el estudio.
Si varios valores extremos o aberrantes se encuentran con el estadístico k o con el test de Cochran a
diferentes niveles de prueba dentro de un laboratorio, esto puede ser una fuerte indicación de que la
varianza intralaboratorio es excepcionalmente alta (debido a falta de familiarización para el método analítico,
diferentes operadores, equipamiento impropio para las pruebas, pobre mantenimiento, o descuidada
ejecución), y el total de los datos de este laboratorio será rechazado.
Si varios valores extraños o aberrantes son encontrados con el estadístico h o el test de Grubbs a
diferentes niveles dentro de un laboratorio, esto puede ser una fuerte indicación de que el sesgo del
laboratorio es excepcionalmente alto ( debido a un error sistemático alto en calibración, o errores de
ecuación al computar los resultados). En este caso los datos pueden ser corregidos después de rehacer la
calibración o computación. En los demás casos todos los datos de este laboratorio serán también
rechazados.
Después de rechazar los aberrantes el test de consistencia puede ser repetido pero la aplicación repetida
de los tests de consistencia debe ser usado con gran precaución, porque este proceso repetido a veces
conduce a excesivos rechazos. Además hay que tener en cuenta que un rechazo de mas de un 22,2 % (dos
de nueve) del número original de laboratorios sin una explicación se considera excesivo y el estudio debe
mantener datos válidos de al menos ocho laboratorios.
6.4. Expresión de la precisión de los resultados
Después de rechazar los aberrantes los datos remanentes se usan para calcular la precisión final de los
resultados, incluyendo la media general, la desviación típica de repetibilidad y la desviación típica de
reproducibilidad. Otra información puede incluir el número de laboratorios válidos (después de rechazar los
laboratorios aberrantes), el cociente
R
r
s
s
, el límite de repetibilidad 2, 8
r
s (valor por debajo del cual se
encuentra, con una probabilidad del 95 %, el valor absoluto de la diferencia entre dos resultados, obtenidos
bajo condiciones de repetibilidad), y el límite de reproducibilidad 2, 8
R
s (valor por debajo del cual se
encuentra, con una probabilidad del 95 % el valor absoluto de la diferencia entre dos resultados, obtenidos
bajo condiciones de reproducibilidad). La información acerca del rechazo de los aberrantes puede también
ser incluida. Un ejemplo de los resultados de la precisión se da en la tabla 6.
nivel j
nivel 1 nivel 2 nivel 3 nivel 4 nivel 5 nivel 6
Número de laboratorios válido p
11 9 11 11 11 11
Media general m 3,483 4,601 6,995 9,121 11,802 15,159
Varianza de repetibilidad
2
r
s 0,00675 0,0335 0,05587 0,13574 0,32228 0,25746
Varianza entre laboratorios
2
i
s 0,05959 0,01962 0,08876 0,15221 0,26336 0,37035
Varianza de reproducibilidad
2
R
s 0,066 0,053 0,145 0,288 0,586 0,628
Desviación típica de repetibilidad
r
s
0,082 0,183 0,236 0,368 0,568 0,507
Desviación típica de reproducibilidad
R
s
0,257 0,230 0,381 0,537 0,766 0,792
Repetibilidad
( )
cov
r
s 2,4 % 4,0 % 3,4 % 4,0 % 4,8 % 3,3 %
Reproducibilidad
( )
cov
R
s 7,4 % 5,0 % 5,4 % 5,9 % 6,5 % 5,2 %
r
R
s
s
γ =
3,13 1,26 1,61 1,46 1,35 1,56
Límite de repetibilidad 2, 8
r
r s =
0,230 0,512 0,661 1,030 1,590 1,420
Límite de repetibilidad 2, 8
R
R s =
0,72 0,64 1,07 1,50 2,14 2,22
17
nivel j
nivel 1 nivel 2 nivel 3 nivel 4 nivel 5 nivel 6
Número de datos extremos excluidos 0 2 0 0 0 0
Tipo de dato extremo
1
k , h
Laboratorios extremos (outliers) #4, #11
Número de desviados excluidos 0 0 0 0 0 0
Tipo de desviación
Laboratorios desviados
Tabla 6. Ejemplo de la expresión de los resultados de la precisión (calculados a partir de los datos
listados en la tabla 1, después de rechazar los aberrantes.
7. Una aproximación alternativa, el análisis estadístico de Youden
7.1. Análisis de Youden
El análisis de Youden está especialmente dirigido a comparaciones interlaboratorios. La ventaja del análisis
de Youden es su habilidad para separar los errores aleatorios de los sistemáticos utilizando un diseño
simple y con requerimientos de un mínimo esfuerzo analítico por parte de los participantes.
Para su implementación se requieren dos materiales similares (muestras A y B) con pequeñas diferencias
en la concentración de las características (magnitudes) a determinar. Este requisito es necesario, ya que,
tanto los errores aleatorios como los sistemáticos pueden depender tanto de la concentración de la
característica considerada, como de posibles interferencias de la matriz presente.
Para una característica dada, cada laboratorio participante genera un resultado de X para el caso de la
muestra A y un resultado Y para el caso de la muestra B. Estos resultados permiten la construcción del
gráfico de Youden a partir del cual se obtiene el diagnóstico de aptitud motivo del ensayo.
7.2. Gráfico de Youden
El gráfico de Youden se prepara a partir de un eje X como abscisa con una escala adecuada para cubrir el
rango de los resultados de la característica evaluada en el material A y un eje Y como ordenada, con escala
en las mismas unidades, para incluir el rango de los resultados de la misma característica en el material B.
El par de resultados de cada laboratorio es así un punto del gráfico. Habrá una cantidad de puntos igual a la
de laboratorios participantes y un punto origen cuyas coordenadas son las medianas de X y de Y (valores
de consenso). Una vez representados los resultados, se dibuja una línea mediana horizontal, paralela al eje
X. De esta forma habrá puntos por encima de esta línea y puntos por debajo. Una segunda línea mediana
se dibuja paralela al eje de las Y que deja puntos a su izquierda y a su derecha. Completan el gráfico una
línea diagonal de 45° y un círculo con centro en el origen. En la figura 5 se muestran los componentes del
gráfico y en la tabla 7 se describen los mismos.
Figura 5. Componentes del gráfico de Youden.

1
k , conforme al test estadístico k de Mandel; h , conforme al test estadístico h de Mandel
18
Origen
Es el punto de coordenadas
( )
,
Me Me
x y , siendo
Me
x e
Me
y las medianas
respectivas de los resultados de X y de Y de todos los laboratorios
participantes. Se utiliza la mediana por ser menos vulnerable a la
presencia de resultados aberrantes
Ejes XY Coordenadas con escala adecuada para representar todos los resultados
de los laboratorios participantes
Líneas medianas Líneas paralelas a los ejes que pasan por el punto origen y dividen al
gráfico en cuatro cuadrantes
Línea de 45º Línea diagonal a 45º que pasa por el origen bisectando los cuadrantes
inferior izquierdo y superior derecho
Resultados del laboratorio i
Punto de coordenadas
( )
,
i i
x y , siendo
i
x e
i
y resultados de las
concentraciones de la característica determinada por el laboratorio i en
las muestras A y B respectivamente
Círculo límite del 95 % Círculo con centro en el origen (valores de consenso) y radio igual a la
desviación típica multiplicada por un factor de confianza, de tal forma que
el círculo contendría al 95 % de los resultados si los errores sistemáticos
fueran eliminados
Tabla 7. Descripción de los componentes del gráfico de Youden
En el caso hipotético de ausencia de errores sistemáticos y si sólo operaran errores aleatorios, los puntos
de los resultados se distribuirían alrededor del origen o valores de consenso ocupando regularmente los
cuatro cuadrantes, ya que los errores positivos y negativos son igualmente probables. Si por el contrario, en
el caso hipotético de ausencia de errores aleatorios y operando sólo errores sistemáticos, los puntos de
resultados se alinearían sobre la línea de 45°, ya que se espera que si un laboratorio tiene desvíos positivos
o negativos en sus resultados, tendrá desvíos con similar magnitud y sentido en ambas muestras
analizadas. Operando ambos tipos de errores, se obtendría una combinación de ambos casos extremos y
los resultados ocuparían un espacio elíptico con la mayoría de los puntos en los cuadrantes inferior
izquierdo y superior derecho.
Una simulación por computadora ilustra los casos hipotéticos planteados. Los gráficos obtenidos se
muestran en las figuras 6 (a), (b) y (c) y se explican por sí mismos.
Nota: Los datos utilizados en la construcción de las figuras 6 (a), (b) y (c) simulan un ensayo
interlaboratorios con 11 participantes. Los resultados informados por los laboratorios para los valores de X
y de Y correspondientes a las muestras A y B respectivamente son muestras aleatorias tomadas de sendas
poblaciones de distribución normal de media 30 µ = y desviación típica 1 σ = para el caso de la muestra A
y 40 µ = y 1 σ = para el caso de la muestra B. Los errores sistemáticos simulados van de –2.5 a +2.5 para
los laboratorios 1 a 11 respectivamente como se muestra en la tabla 8.
laboratorio número
1 2 3 4 5 6 7 8 9 10 11
error sistemático – 2,5 – 2,0 – 1,5 – 1,0 – 0,5 0,0 + 0,5 + 1,0 + 1,5 + 2,0 + 2,5
Tabla 8. Errores sistemáticos simulados para los laboratorios participantes.
19

Figura 6. Gráfico de Youden (Laboratorios 1 a 11, respectivamente). (a) errores aleatorios (σ = ± 1),
errores sistemáticos = 0. (b) errores aleatorios (σ = 0), errores sistemáticos –2,5 a +2,5. (c) errores
aleatorios (σ = 1), errores sistemáticos –2,5 a + 2,5.
Nota: Los datos generados y los cálculos utilizados para la construcción de la figura 6(c) se muestran en el
apartado 7.3.3.
La distribución de los puntos en el gráfico de Youden ponen en evidencia posibles problemas, resultando
una excelente herramienta de diagnóstico.
• Puntos conformando una elipse angosta y alargada señalan problemas con el método analítico utilizado
e indican la necesidad de su modificación;
• Puntos alejados de ambos ejes indican resultados erráticos;
• El punto cercano a un eje pero alejado del otro indican resultados bastante buenos en un material pero
bastante malos en el otro;
• Puntos en el cuadrante inferior izquierdo y superior derecho pero alejados del origen reflejan una
tendencia de resultados altos o bajos en ambos materiales;
• Puntos cercanos a la línea de 45° pero alejados del origen indican errores sistemáticos importantes.
• Puntos alejados de la línea de 45° indican errores aleatorios grandes y son evidencia clara de
desviación importante con el método de ensayo utilizado;
• Puntos fuera del círculo de confianza (95 %) indican errores totales grandes;
• Alta proporción de puntos fuera del círculo de radio igual a 2, 448s y cercanos a la línea de 45 º
indican presencia general de errores sistemáticos.
7.3. Análisis de Youden: cálculos
En la figura 7 se representan nuevamente los resultados del laboratorio i ,
( )
,
i i
x y en un gráfico de
Youden y los vectores involucrados en los cálculos.
20
Figura 7. Errores aleatorios y sistemáticos. Se representa los puntos: R, de coordenadas (x
i
,y
i
):
resultados informados por el laboratorio i; O, de coordenadas (x
Me
,y
Me
): resultados de las medianas ó
valores de consenso utilizado; P, de coordenadas (x’
i
,y’
i
): distancia de R a la línea de 45°.
Los vectores generados y sus ecuaciones de cálculo resultan:
OR

Error total
( )
T
ε cometido por el laboratorio i . Es una medida de la desviación entre los valores de
consenso y los resultados del laboratorio i ., con
( ) ( )
2 2
T i Me i Me
x x y y ε = − + − ;
OP

Componente sistemático del error
( )
S
C , con
( ) ( )
2
i Me i Me
s
x x y y
C
− + −
= ;
PR

Componente aleatorio del error
( )
A
C , con
2 2
1 1
2 2
S S
A
Me Me
C C
C x y
x y
| | | |
| | = − + −
| |
+ +
\ . \ .
.
7.3.1. Ajuste de los componentes sistemático y aleatorio calculados
Los componentes sistemático y aleatorio calculados requieren ser proporcionados de tal forma que su suma
sea igual al módulo del vector error total, de esta forma se obtienen los errores sistemático y aleatorio
correspondientes:
Error sistemático
S
S T
S A
C
C C
ε ε =
+
Error aleatorio
A
A T
S A
C
C C
ε ε =
+
De esta forma el valor absoluto del error sistemático sumado al error aleatorio resulta igual al error total:
T S A
E ε ε = +
7.3.2. Desviación típica, círculo de confianza y puntuación z
La desviación típica combinada, s se obtiene sumando el cuadrado de los errores aleatorios de todos los
laboratorios, dividiendo el resultado por el número de laboratorios menos 1 y extrayendo la raíz cuadrada:
2
1
1
n
Ai
i
n
ε
σ
=
=


Para el cálculo de radio r del círculo de confianza se utilizan los factores mostrados en la tabla 9.
21
% f % f
10 0,459 70 1,552
20 0,668 75 1,665
25 0,759 80 1,794
30 0,845 90 2,146
40 1,011 95 2,448
50 1,177 99 3,035
60 1,350 – –
Tabla 9. Tabla de probabilidad para una distribución normal circular. % = porcentaje de puntos
dentro del círculo; f = factor de multiplicación de la desviación típica.
El radio del círculo que demarca un intervalo de confianza del 95 % será:
( )
2 2
2, 448 r s
y x y
=
= −
La puntuación z es una medida internacionalmente aceptada de la desviación de los resultados informados
por cada laboratorio, respecto al valor de consenso. Se expresa en unidades de desviación típica. Este
parámetro es conveniente por su cálculo directo y fácil interpretación. En este caso se define una
puntuación z para cada resultado analítico como el cociente entre la desviación respecto al valor asignado
( )
i Me
x x − dividido por la desviación típica
z
s :
i Me
z
x x
z
s

=
La puntuación utilizada se muestra en la tabla 10.
2 z ≤ “satisfactorio”
2 3 z < ≤ “cuestionable
3 z > “insatisfactorio”
Tabla 10. Tabla de presentación de resultados y cálculos
En la tabla 12 se muestran los datos originales y los resultados en forma generalizada
laboratorio
número
muestra
A
muestra
B
T i
ε
S i
ε
Ai
ε
2
Ai
ε
1
1
x
1
y
1 T
ε
1 S
ε
1 A
ε
2
1 A
ε
2
2
x
2
y
2 T
ε
2 S
ε
2 A
ε
2
2 A
ε
... ... ... ... ... ... ...
n
n
x
n
y
T n
ε
S n
ε
An
ε
2
An
ε
mediana
Me
x
Me
y
2
1
1
n
Ai
i
desviación típica s
n
radio r f s
ε
=
= =

= = ×

Tabla 11: Datos originales y cálculos
22
7.3.3. Datos originales y cálculos utilizados en la simulación mostrada en la figura 6 (c)
laboratorio
número
muestra A
i
x
muestra B
i
y
error sistemático
S i
ε
error aleatorio
Ai
ε
1 27,3 37,7 – 2,5 ± 1
2 29,1 37,2 – 2 ± 1
3 29,7 38,3 – 1,5 ± 1
4 30,6 38,9 – 1,0 ± 1
5 29,1 38,9 – 0,5 ± 1
6 29,4 39,7 0 ± 1
7 29,0 41,5 0,5 ± 1
8 30,7 40,4 1,0 ± 1
9 32,7 41,9 1,5 ± 1
10 30,9 42,5 2,0 ± 1
11 31,5 42,8 2,5 ± 1
Tabla 12: Datos simulados a partir de poblaciones normales de medias 30 y 40 respectivamente y
desviaciones típicas igual a ±1. A = N(30,1) y B = N(40,1)
Los resultados obtenidos están en línea con los observados en el gráfico de Youden y reflejan muy bien las
condiciones impuestas, resultando insatisfactorios aquellos laboratorios cuyos errores sistemáticos son
relativamente altos respecto a los errores aleatorios.
lab
i
x
i
y
i
x′
i
y′
T
ε
A
C
S
C
A
ε
S
ε
2
A
ε
T
z
s
ε
=
1 27,3 37,7 25,50 37,50 3,12 0,28 –3,11 0,26 –2,86 0,068 3,9
2 29,1 37,2 28,15 38,15 2,57 1,34 –2,19 0,98 –1,59 0,954 3,3
3 29,7 38,3 29,00 39,00 1,40 0,99 –0,99 0,70 –0,70 0,490 1,8
4 30,6 38,9 29,75 39,75 1,20 1,20 0,07 1,14 0,07 1,293 1,5
5 29,1 38,9 29,00 39,00 1,00 0,14 –0,99 0,13 –0,87 0,016 1,3
6 29,4 39,7 29,55 39,55 0,30 0,21 –0,21 0,15 –0,15 0,023 0,4
7 29,0 41,5 30,25 40,25 1,93 1,77 0,78 1,34 0,59 1,799 2,4
8 30,7 40,4 30,55 40,55 1,22 0,21 1,20 0,18 1,04 ,034 1,5
9 32,7 41,9 32,30 42,30 3,72 0,57 3,86 0,50 3,22 0,246 4,7
10 30,9 42,5 31,70 41,70 3,05 1,13 2,83 0,87 2,18 0,785 3,9
11 31,5 42,8 32,15 42,15 3,58 0,92 3,46 0,75 2,83 0,565 4,5
Mediana 29,7 39,7 suma 6,240
6, 240
0, 79
11 1
s = =

2, 448 0, 79 1, 936 r = × =
Tabla 13. Análisis de Youden y cálculo de la puntuación z
En la figura 8, reproducción de la figura 6 (c), se representan los resultados mostrados en la tabla 13.
23
Figura 8: repetición de la figura 6 (c).
Los resultados indican errores sistemáticos importantes en los laboratorios 1, 2, 9, 10 y 11. Nótese que el
laboratorio 3, a pesar de habérsele impuesto los mismos errores que al laboratorio 9 cayó dentro del círculo
de confianza del 95 %. Esto puede ocurrir también en la realidad y es propio de un análisis estadístico de
este tipo. Los resultados de la puntuación z se muestran en la tabla 14.
laboratorio número
z puntuación z
1 3,9 insatisfactorio
2 3,3 insatisfactorio
3 1,8 satisfactorio
4 1,5 satisfactorio
5 1,3 satisfactorio
6 0,4 satisfactorio
7 2,4 satisfactorio
8 1,5 satisfactorio
9 4,7 insatisfactorio
10 3,9 insatisfactorio
11 4,5 insatisfactorio
Tabla 14. Puntuación z
Los resultados obtenidos están en línea con los observados en el gráfico de Youden y reflejan muy bien las
condiciones impuestas, resultando no satisfactorios aquellos laboratorios cuyos errores sistemáticos son
relativamente altos respecto a los errores aleatorios.
8. Aplicación de los resultados de la prueba de precisión
8.1. Generalidades
Los resultados de la prueba de precisión se usan generalmente para comparar diferentes métodos
analíticos y para asegurar las prestaciones de las pruebas de los laboratorios. Además, los datos de la
precisión se usan también para el control de la calidad y garantía de la calidad. Por ejemplo, chequear la
aceptabilidad de los resultados de las pruebas o monitorizar la estabilidad de los resultados de las pruebas
dentro de un laboratorio. La aplicación práctica de los datos de la precisión es descrita con detalle en la
norma ISO 5725-6. Aquí veremos algunos ejemplos de aplicación comparando diferentes métodos
analíticos y asegurando las prestaciones de las pruebas de los laboratorios.
24
8.2. Comparación de diferentes métodos analíticos
Por ejemplo, se trata de comparar tres métodos analíticos para la determinación del contenido en un
determinado constituyente. Muestras de referencia conteniendo una cantidad conocida (0,071 % por masa
de muestra con una incertidumbre expandida de 0, 004% U = por masa de muestra, el factor de cobertura
2 k = ) fueron analizadas en diferentes laboratorios usando tres diferentes métodos nominalmente método
A, B y C, respectivamente. De ellos, B es un método estandarizado, A es un método alternativo modificado,
y C es una prueba simplificada apropiada para una determinación rápida. Puesto que el método B es un
método estandarizado, fue utilizado como método de referencia, con el que se compararon los otros dos
métodos. Los resultados de la prueba de precisión se dan en la tabla 15.
método A método B
2
método C
Número de laboratorios válido p
6 7 11
Número de replicados n 2 2 2
Datos de la precisión
Media general m 0,0696 0,0649 0,0583
Varianza de repetibilidad
2
r
s 0,00000061 0,00001192 0,00000850
Varianza interlaboratorios
2
L
s 0,00000359 0,00003697 0,00006284
Varianza de reproducibilidad
2
R
s 0,00000420 0,00004888 0,00007134
Desviación típica de repetibilidad
r
s
0,00078 0,00345 0,00292
Desviación típica de reproducibilidad
R
s
0,00205 0,00699 0,00845
Tabla 15. Datos de la imprecisión a partir del ejemplo
8.2.1. Comparación de la precisión intra-laboartorio
La siguiente ecuación será aplicable para la comparación de la precisión intralaboratorio:
2
2
r x
r
r B
s
F
s
=
donde el subíndice x representa los otros métodos A ó C,
( )
( )
1 2
1 2
1 , , 3
2
, , 4
2
r límite bajo
r límite alto
F F f f
F F f f
α
α
¦ ¹ | |
= −
´ `
|
\ . ¹ )
¦ ¹ | |
=
´ `
|
\ . ¹ )
donde { } F es el inverso de la distribución F con
( )
1
1
x x
f p n = − y
( )
2
1
B B
f p n = − grados de
libertad a un nivel de significación 0, 05 α = , como se recomienda en la NORMA ISO 5725-6.
• Si
r límite bajo r r límite alto
F F F ≤ ≤ no hay evidencia de que los métodos tengan diferentes precisiones
intralaboratorio
• Si
r r límite bajo
F F < , hay evidencia de que el método X tiene mejor precisión intralaboratorio que el
método B

2
Método estándar establecido.
25
• Si
r r límite alto
F F > , hay evidencia de que el método x tiene peor precisión intralaboratorio que el
método B
Los resultados calculados se presentan en la tabla 16.
método A método B
3
método C
Grados de libertad
r
f
6 7 11
r
F
0,051 1 0,713
r límite inferior
F
0,176 0,200 0,266
r límite superior
F
5,119 4,995 4,709
Notas mejor – similar
Tabla 16. Resultados de la comparación de la precisión intralaboratorio.
8.2.2. Comparación de la precisión total
La siguiente ecuación se utiliza para la comparación de la precisión total:
2 2
2 2
1
1
1
1
R x r x
x
R
R B r B
B
s s
n
F
s s
n
| |
− −
|
|
\ .
=
| |
− −
|
|
\ .
Los valores límites del inverso de la distribución F ,
R límite inferior
F y
R límite superior
F son similares a los de las
ecuaciones (3) y (4), respectivamente, pero con grados de libertad
1
1
x
f p = − y
2
1
B
f p = −
• Si
R límite inferior R r límite superior
F F F ≤ ≤ , no hay evidencia de que los métodos tengan diferentes
precisiones totales
• Si
R R límite inferior
F F < , hay evidencia de que el método x tiene mejor precisión total que el método B
• Si
R R límite superior
F F > , hay evidencia de que la precisión total del método x es peor que la del método
B.
Los resultados calculados se presentan en la tabla 17.
método A método B
4
método C
Grados de libertad
R
f 5 6 10
R
F 0,091 1 1,563
R límite inferior
F 0,143 0,172 0,2466
R límite superior
F 5,988 4,820 5,461
Notas mejor – similar
Tabla 17. Resultados de la comparación de la precisión total.

3
Método estándar establecido como referencia.
4
Método estándar establecido como referencia.
26
8.2.3. Comparación de veracidades
La siguiente ecuación es aplicable para la comparación de inveracidades
ˆ m δ µ = −
donde µ es el verdadero valor, en este caso 0, 071% µ = por masa de muestra,
2 2
1
2 1
R x r x
x
crítica
x
s s
n
p
δ
| |
− −
|
|
\ .
=
• Si
crítica
δ δ ≤ la diferencia entre la media general y el verdadero valor no es estadísticamente
significativa;
• Si
crítica
δ δ > la diferencia entre la media general y el verdadero valor es estadísticamente significativa.
En tal caso:
− Si
2
m
δ δ ≤ no hay evidencia de que el método analítico es inaceptablemente sesgado;
− Si
2
m
δ δ > hay evidencia de que el método analítico es inaceptablemente sesgado.
Donde
2
m
δ es la diferencia mínima entre el valor esperado del método analítico y el valor verdadero.
En este ejemplo se asume que 0, 004%
m
U δ = = por masa de muestra. La tabla 18 presenta una lista de
resultados.
método A método B
5
método C
Diferencia absoluta δ 0,0014 0,0061 0,0127
Diferencia crítica
crítica
δ
0,0007 0,0019 0,0015
Diferencia mínima
mínima
δ
0,0040 0,0040 0,0040
Notas sesgo no significativo sesgo significativo sesgo significativo
Tabla 18. Resultados de la comparación de veracidades.
8.2.4. Comentarios sobre los resultados de la comparación
En las tablas 16, 17 y 18 se puede ver que el método A tiene mejor precisión intralaboratorio y total que el
método estándar establecido (método B) y su media general está muy próxima al valor verdadero. De este
modo puede usarse como una alternativa al método estándar.
De acuerdo con estos resultados, el método C tiene precisiones similares a las del método B. En la tabla 18
se puede ver, sin embargo, que ambos métodos muestran un sesgo significativo (sobreestimación de los
resultados del contenido en la sustancia analizada), especialmente el método C. Después de haber
estudiado las posibles causas, se halló que, en el método B se utilizaba un filtrado en papel que pudiera
puede contener cantidades significativas de la sustancia, produciendo una sobreestimación de su contenido.
Respecto al método C, se halló que el procedimiento analítico implica estrictamente un error sistemático.
Con un procedimiento analítico modificado, el método C funciona bien como una prueba rápida.
9. Valoración de las prestaciones de los laboratorios
Una de las importantes aplicaciones de los estudios interlaboratorios es valorar las prestaciones o
habilidades de los laboratorios, especialmente de los laboratorios acreditados.

5
Método estándar establecido como referencia.
27
La valoración de las prestaciones de un laboratorio trabaja en ambas vías. Hay una posibilidad para un
segundo (usuario) o tercera parte (por ejemplo, entidad de acreditación) para valorar las prestaciones en
relación con otros laboratorios. Es posible también comparar la incertidumbre del laboratorio con los
resultados de la participación en las pruebas de intercomparación. Un usuario necesita conocer la
incertidumbre en los resultados de las pruebas y tener esto en cuenta cuando hace un informe de la
tolerancia de un producto.
Los beneficios para los laboratorios participantes son obvios. La participación en pruebas de
intercomparación es una buena herramienta para mantener y mejorar la calidad en el laboratorio y también
para producir mejoramiento en el método. El tipo de error puede en muchos casos ser deducido para un
cierto tipo de problemas en el laboratorio o en el método.
9.1. Tipos de valoración
Hay tres tipos de valoración dependiendo de la existencia de materiales de referencia o de un laboratorio de
referencia:
• Valoración individual usando materiales de referencia. Cuando existen materiales de referencia en un
adecuado número de niveles, la valoración puede hacerse con la participación del laboratorio individual
solamente;
• Valoración individual por comparación con un laboratorio de referencia. Cuando coexisten materiales de
referencia, el laboratorio ha de ser comparado con un laboratorio de muy buena calidad el cual es
ampliamente reconocido por su prestigio;
• Valoración continua de los laboratorios por su participación en pruebas de intercomparación. Este es el
caso para la valoración anual o bianual de los laboratorios acreditados.
Para la valoración individual los datos de la precisión deben ser conocidos previamente, por ejemplo, de
pruebas previas de intercomparación, mientras que para la valoración continua los datos de la precisión
pueden obtenerse de las mismas pruebas de intercomparación si las pruebas se organizan de tal manera
que satisface los requerimientos para la determinación de la precisión, o desde las pruebas de
intercomparación si la escala de la prueba es limitada.
9.2. Procedimientos estadísticos y criterio
Los resultados de las pruebas de habilidad (o aptitud) necesitan a menudo ser transformadas en
ejecuciones estadísticas para ayudar a la interpretación y para permitir la comparación con objetivos
definidos. Dependiendo del tipo de valoración, se pueden usar diferentes ejecuciones estadísticas.
Para la valoración individual usando materiales de referencia, la ejecución estadística será un error absoluto
δ . Según la norma ISO 5725-6, el criterio de aceptación es:
2 2
1
2 1
R r
y
n
δ µ σ σ
| |
= − ≤ − −
|
\ .
Para la valoración individual por comparación con un laboratorio de referencia, la ejecución estadística será
una diferencia absoluta D. Según la norma ISO 5725-6, el criterio de aceptación es:
2 2
1 2
1
2 2 1
R r
D y y
n
σ σ
| |
= − ≤ − −
|
\ .
Para la valoración continua por participación en una prueba de intercomparación, el estadístico mas
comúnmente usado es la llamada puntuación z ( z -scores):
2 2
ˆ
1
1
i i
i
R r
x X y m
z
s
s s
n
− −
= =
| |
− −
|
\ .
donde
i
x es el resultado de la prueba del laboratorio i ;
X es la media del grupo; y
S es la desviación típica del grupo.
Debe reseñarse que los datos de la precisión en la ecuación anterior deben ser fiables, esto es, basada en
bastantes observaciones para permitir detección de aberrantes y tener bajo error estándar. Los aberrantes
28
significativos deben excluirse antes de hacer los cálculos. De acuerdo con ASTME E 1301-95, los siguientes
criterios son apropiados:
• Si 2 z ≤ la prestación es satisfactoria;
• Si 2 3 z ≤ ≤ , la prestación es cuestionable;
• Si 3 z > , la prestación es insatisfactoria.
Un ejemplo de prestaciones estadísticas z -scores se muestran en la figura 8.
Figura 8. Ejemplo de prestaciones estadísticas z -scores (datos procedentes de una prueba de
intercomparación nacional sueca para la resistencia a la helada del hormigón).
10. Bibliografía
1. ISO. International Standard ISO 5725-4-1994. Accuracy (Trueness and precision) of measurement
methods and results — Part 2: Basic method for the determination of repeatability and reproducibility of a
standard measurement method. Geneva, 1994.
2. ISO. International Standard ISO 5725-4-1994. Accuracy (trueness and precision) of measurement
methods and results—Part 4: Basic methods for the determination of the trueness of a standard
measurement method, Sections 1–4, 6. Geneva, 1994
3. ISO. International Standard ISO 5725-4-1994. Accuracy (trueness and precision) of measurement
methods and results—Part 4: Basic methods for the determination of the trueness of a standard
measurement method. Sections 1–3, 5–6. Geneva, 1994.
4. ISO/IEC Guide 43-1:1997 (E). Proficiency testing by interlaboratory comparisons: Part 1: Development
and operation of proficiency testing schemes.
5. Pocklington WD, Guidelines for the development of standard methods by collaborative study, 3rd Ed.,
London:Laboratory of the Government Chemist.1986.
6. ISO. International Standard ISO 5725-6-1994, Accuracy (trueness and precision) of measurement
methods and results. Geneva, 1994.
7. ISO Guide 35:1989 (E), Certification of reference materials general and statistical principles. Geneva,
1989.
8. ISO /IEC Guide 43-1: 1996. Proficiency testing by interlaboratory comparison. Geneva 1996.
9. ISO. International Standard ISO 5725-1986, Precision of test methods — determination of repeatability
and reproducibility for a standard test method by interlaboratory tests. Geneva, 1986.
10. Collaborative international pesticides analytical council limited (CIPAC): Guidelines for CIPAC
collaborative study procedures for assessment of performance of analytical methods, 1989.
11. Guidelines for collaborative study procedures, J Ass Off Anal Chem 1989; 72:694–704.
29
12. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions, Protocol for the design, conduct and interpretation of collaborative studies. Pure Appl Chem
1988;60:855–964.
13. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions, Protocol for the design, conduct and interpretation of method-performance studies. Pure Appl
Chem1995; 67:331–43.
14. Association of Analytical Communities (AOAC). Guidelines for collaborative study procedures to validate
characteristics of a method of analysis. 2005.
15. Centro Nacional del Medio Ambiente de la Universidad de Chile (CENMA). Red Nacional de Metrología
de Chile (RNM). Materiales de referencia y comparaciones interlaboratorios. 2006
16. International Union of Pure and Applied Chemistry (IUPAC). Analytical, applied and clinical chemistry
divisions. Protocol for the design, conduct and interpretation of collaborative studies, Pure Appl Chem
1988;60:855–964.
17. CPQ. COFILAB. Ley 7020/65. Ensayo de metodología Interlaboratorios. EMI Coordinación y Análisis
Estadístico.
18. CPQ. COFILAB. Ley 7020/65. Evaluación estadística. Comparación interlaboratorios – Análisis de
Youden.
19. SP Sveriges Provning – och Forskningsinstitut SP Rapport 2000- 35. SP Swedish National Testing and
Research Institute SP Report 2000 – 35. Methodology of Inter-comparison test and statistical analysis of the
test results – Nordtest project No. 1483 – 99.
20. National Institute of Public Health and the Environment. RIVM – report nº 219101005. Statistic and the
assessment of interlaboratories studies. Bilthoven. The Netherlands, 1996
21. ASTM E 691-99. Standard practice for conducting an interlaboratory study to determine the precision of
test method.
22. ASTM E 1301-95. Proficiency testing programs by interlaboratory comparisons.
22. Cofino WP, Wells DE. Design and evaluation of the QUASIMEME interlaboratory performance studies: a
test case for robust statistics. Mar Pollut Bull 1994;29:149-58
23. Hund E, Massart DL, Smeyers-Verbeke J. Interlaboratory studies in analytical chemistry. Ann Chim Acta
2000;423:145-65.
24. Lysiak-Pasttuszak E. Interlaboratory analytical performance studies: a way to estimate measurement
uncertainty. Oceanologia 2004;46(3):427-38.

Sign up to vote on this title
UsefulNot useful