You are on page 1of 113
RSTADISTICA Fs (UIMICA ANALITICA f= ae LesearVe zy Pare . J.C. Miller e J.N. Miller oe ths we ESTADISTICA PARA QUIMICA ANALITICA Segunda Edicion J.C. MILLER Wyggeston and Queen Elizabeth I College, Leicester y J.N. MILLER Decano de ciencias puras y aplicadas Loughborough University of Technology Versidn en espaiiol de Roberto Izquierdo Hornillos Profesor de Quimica Analitica Universidad Complutense de Madrid y Carlos Maté Jiménez Profesor de Estadistica ICAI, Universidad Pontificia Comillas Con la colaboracién de Santiago Capella Vizcaino Universidad Nacional Auténoma de México A VV ADDISON-WESLEY IBEROAMERICANA Argentina + Brasil - Chile « Colombia « Ecuador - Espatia Estados Unidos - México - Peri - Puerto Rico « Venezuela Version en espatiol de la obra Statistics for Analytical Chemistry, Second Edition, de J.C. Miller y J.N. Miller, publicada originalmente en inglés por Ellis Horwood, Londres, Inglaterra. © 1988 por J.C. Miller y J.N. Miller/Ellis Horwood Limited. Esta versidn en espanol es la tinica autorizada, Portada: Ricardo Arriaga © 1993 por Addison-Wesley Iberoamerican, S.A. Wilmington, Delaware, E.U.A. Innpreso en Estados Unidos. Printed in U.S.A. ISBN 0-201-60140-0 123456789 10-AL-97 96 95 94.93, Indice general Prefacio Prefacio a In segunda edici Glosario de simbolos 1 Introduccion LI Problemas analiticos 1.2 Ewrores en el anzlisis cuantitativo 1.3 Tipos de errores 1.4 Errores sistemiticos y aleatorios en el analisis volumétrico 15 El manejo de errores sistematicos 1.6 Planificacién y diseno de experimentos 1.7. Calculadoras y computadores en los eilculos estadisticos Bibliografia Ejercicios 2. Errores en el aniilsis elisico. Estat 2.1 Media y desviacion estindar 2.2. Distribucidn de errores . 2.3. Ladistribucién muestral de la media 2.4 Limites de confianza de la media 2.5. Presentacién de resultados . 2.6 Otros usos de los limites de confianza 2.7 Propagacién de errores aleatorios 2.8 Propagacién de errores sistematicos Bibliografia Ejercicios 20 2 25 28 31 32 32 36 37 37 3.1. Introduccion 3.2 Comparacién de una media experimental con un valor conocido - 3.3. Comparacién de las medias de dos muestras 3.4. La prueba ¢ por parejas 3.5. Las pruebas de una y dos colas 3.6. La prueba F pora la comparacion de desviaciones estandar 3.7. Valores anémalos 3.8 Analisis de la varianza 3.9. Comparacién de varias medias 3.10 La aritmética de los calculos ANOVA. 3.11 La prueba chi cuadrada 3.12 Prueba de Ia normatidad de una disteibueién 3.13 Conclusiones a partir de las pruebas de significacion Bibliografia Ejercicios Control de calidad y muestreo 4.1 Introduceién 4.2, Muestreo 4.3. Estimacisn y separaeidn de varianzas wilizando ANOVA 4.4. Estrategia de muestreo 4.5 Ensayos de colaboracién: introduecién 4.6. Representaciones grifieas de dos muestras 4.7 La preparacion de un ensayo de colaboracion 4.8 Caileulos en ensayos de eolaboracién 4.9. Diagramas de control Bibliogratia Ejercicios Errores en anilisis instrumental; rege’ 5.1. Anilisis instrumental 5.2. Grificas de calibracion en anslisis instrumental 5.3 Bl coeficiente de correlacién momento-producto 54 La recta de regresion de y sobre x 5.5. Brrores en la penidiente y ordenada en el origen de la recta de regresion, 5.6 Calculo de una concentracion 5.7. Limites de deteccién 5.8 El método de las adiciones estindar : 5.9. Eluso de rectas de regresion para comparar métodos analiticos 5.10 Rectas de regresién ponderadas 5.11 Regresidn curvilinea Bibliografia Bjercicios ycorrelaciin ‘Métodos no paramétricos y de ejecuetn ripi 6.1 Introduecién 100 40 40 42 44 46 47 49 51 52 55 57 58 6 63 68 o7 o7 0 70 1 n B 15 B 84 84 87 88 90 os 96 98 103 106 Ho ng 19 no 6.2 Lamediana 63. La prueba de signos 64 La prueba de rachas de Wald-Wolfowitz 6.5. Pruchas basadas en el recorrido de los resultados 6.6 La prueba de rangos y signos de Wilcoxon 6.7 La prueba de suma de rangos de Wilcoxon y métodos relacionados. 6.8 Pruebas no paramétricas sobre mis de dos muestras. 6.9 Cortelacién ordinal 6.10 Métodos de regresin no paramétricos 6.11 La prueba de bondad del ajuste de Kolmogorov 6.12 Conclusiones Bibliografia Ejercicios 7. Diseio experimental, optimi 7.1 Introduceién 7.2. Aleatorizacion 7.3. Experimentos con bloques 74 ANOVA de dos factores 7.5. Cuadrados latinos 7.6 Disefios anidacos y de clasificacion eruzada 7.7. Interaccién 7.8 El diseno factorial frente al de un factor cada vez, 7.9. Diseio factorial y optimizacién 7.10 Incapacidad del método de un factor cada vez para lograr el éptimo 7.11 Método de la méxima pendiente o del gradiente 7.12 Optimizacién por ef método simplex 7.13 Reconocimiento de pautas 7.14 Métodos de aprendizaje supervisados 7.15 Métodos de aprendizaje no supervisados Bibliografia Ejercicios jn y reconocimiento de pautas Soluciones a los ejercicios Apéndice I Resumen de pruebas estadisticns Apéndice 2 Tablas estadisticas indice de materias 123 124 126 127 129 131 135 137 139 1 14s 145 143 147 148 . 148 . 149 152 153 153 159 159 163 168 168 m1 173 176 178 179 Isl 196 199 210 Prefacio Ahadir otro Volumen a los numerosos textos de estadistica pudiera parecer una tarea sin) excesivas garantias de éxito; no obstante, ia realidad es que por desgracia muchos jentificos altamente ealificados ignoran hasta los mnétodos estadisticos mas elementales. Es ms asombroso atin que los quitnicos analiticos, quienes practican una de las ciencias nis cuantitativas de todas las existentes, no estén més prevenidos que otros contra este imal peligeoso, pero sin lugar a dudas curable. Por lo tanto, es de esperar que este libro pueda beneficiar a los cientifieos analiticos que deseen disefar y realizar sus experimentos 1,Y extraer tanta informacion de los resultados como puedan, Asi mismo, pretede atraer al creciente mimero de estudiantes que se espeeializan en quimica anilitica, y Tos que utilizan métodos analiticos en forma rutinaria en el trabajo de laboratorio, Existen otras das razones que nos han alentado a escribir este libro, Una es el enorme ;npacto de la microeleetrSnica, en forma de miicrocomputadores y calculadoras de bolsillo, mediante estos aparates, os cientificos activos han resuelto los, anteaban los procedimientos analiticos difieles. La segunda es el rapido desarrollo de los nuevos procedimientas “quimiométricos”, incluyendo el reconocimiento de pautas, 0} filtrado numérico, simulaciones, etc., todos ellos Tactibles gracias a las facilidades que aportan les computadores. En el Glkimo capitulo de este libro se intenta proporcionar al lector cuando menos una introxuceién del poteneial e algunos de estos métodos estadisticos mis novedasos. Sin embargo, no se ha incluido ningun programa de computador en el libro; esto se debe, en parte, a las dificultades de presentar programas que pedan ejecutarse en todos los tipos conocids de microcompu- ludores, y en parte a fa existencia de una cantidad considerable de libros y programas de natadlor aclecuados y accesibles al piblico. La disponibilidad de este enorme poteneial de en forina correct sobre la estadisti problemas que imizacion, técnicas d los computadores hace que el ciemtifico, notursimente, aplique métodos estadisticas de manera racional y correcta. Para limitar la sus aspectos pricticos, no hemos intentado snostrar eon dtalle las bases tedricas de las pruebas estadisticas deseritas. No obstante, hentos intentado este libro, y reca aclarar al analista wiles son Ins pruebas apropiadas para los tipos de problemas que probabemente encontrara en el laboratorio. En el texto se incluyen ejemplos resueltos y, al final de cada capitulo, ejercicios para el lector. Muchos de ellos se basan en los datos proporeionados por trabajos de investigacion publicados en The Analyst. Nuestro profundo agradecimiento al editor Phil Weston, por permitirnos hacer uso de su distinguida revista. ‘También agradecemos a nuestros colegas, amigos y familia su paciencia durante la preparacién del libro; por otro lado en los apénclices Se citan individualmente las fuentes de las tablas estadisticas; al editor de la serie, doctor Bob Chalmers; y a nuestros editores por su eficiente cooperacién y consejos, IC. Miller IN. Miller Prefacio a la segunda edicién | s gran aceptacién que ha tendo la primera edicién de este libro nos ha animado a preparar uti segunda edieién revisada y ligeramente ampliada, Agradecemos en especial a quienes ‘nn intdicaco errores de la primera edicién y nos sugirieron posibles mejoras, El profesor . Thorburn Bums nos ha ayudado mucho al setialamos los crrores; también agradecemos profesor J. E, Colbec por sus comentarios constructivas acerca de la nomenclatura Los prinelpales cambios introdueidos en esta edicion forman tun nuevo capitulo (4), en cl cual se trata por primera vez. los ensayos de colaboracién y se cubre en gran medida el niuestreo y los diagramas de control. Se anadié material sobre errores de tipo 1 y tipo 2; cl uso secuencial de las pruebas de significacién; los métodos no paramétricos, y las, zriffeas de calibracién no lineales. Por iltimo, se ampli el estudio del reconocimiento de psutas y dl diseiio factorial, y se incorporaron soluciones mis detalladas a algunos de los proble De nuevo, agradecemos a nuestros editores; los editores de la serie, los doctores Bob vlmers y Mary Masson; y Phil Weston, editor de The Analyst, su ayuda y cooperacién uieionales para la produccién de esta edicién. ©. Miller Miller Za Glosario de simbolos condenada en el origen de la recta de regresin pendiente de la recta de regresion ridimero de columnas en el ANOVA de dos Factores \érmino de correccidn en ANOVA de dos factores razén de dos vatianzas, razén de intervalos mimero de muestras en el ANOVA de un factor media aritmética de una poblacien rnimera de signos menos en la prueba de rachas de Wald-Wolfowit, tamano muestral riimeto de signos més en la prueba de rachas de Wald-Wolfowitz rnimero total de mediciones en ANOVA de dos factores rndimera de grados de libertad probabilidad de r Q de Dixon, uilizada para pruebas de valores andinalos coeficiente de correlacién momento-producto :imero de filas en ANOVA de dos factores coeficiente de correlacion de intervalos de Spearman sviacion estindar de ‘una muestra Ios residuos de desvineion estindar de la pendiente de la recta de regresién desvincion estindar de la ordenada en el origen de la recta de regresion Jesviacion estindar de los residuos de y de rectas de regeesién ponderadas desviacion estindar de los valores de x estimados utilizando reetas de regresion desviacion estindar de un blanco desviacion estindar de un valor de xextrapolado desvineién estindar de un valor de xestimado utilizando reetas de regresion ponderadas desviacion estindar de una poblacion varianza de una medicién varianiza muestral cantidad wtilizada en los céleulos de los limites de confianza y en pruebas de significacion de la mnedia (véase la See. 2.4) ran total en el ANOVA, antidad wtilizada en pruchas de significacién de Ia media (véase la See, 6.5) estadisticos utlizados en Ia prueba de la suma de ranges de Wilcoxon itervalo ese dado um puntoen la recta de egresion valor de estinado utlizando retas de regresion valor de ¥ exrapolado media ariuntiea de valores dex ponderados conti uuitizada en contrastes de bondad del ajuste presi dl valor dey orl ela de vegrestn seal del blanco: " " Hy peniera variable normal estindar Introduccion 1.1 PROBLEMAS ANALETICOS Un quimico analitico puede enfrentarse a dos tipos de problemas: en ocasiones se le pice gua destilada es muy Contiene boro esta solo una respuesta cualitativa; por ejemplo, la presencia de boro en a perjudicial en In produccién de componentes microclectrénicos ( nuestra de agua destilada?”), Por otro lado un problema comin en la ciencia forense es la comparacion de muestras de suelo (“ZEstas ds muestras de suelo puecen proceder del mismo Iugar?"). En otros casos, lot problemas que se le plantean son cu ("Cuanta albiimina hay en esta muestra de sucto sanguineo?”,“eunto plomo hay en esta muestra de agua del grifo?", “esta muestra de acero contiene pequeiias cantidacles de ccromo, tungsteno y manganeso; jeuanto de cada uno”) de analisis cuantitativos de uno o varios componentes. La quimica analitica modema es una ciencia predominantemente nesta cuantitativa ser mucho mas valiasa que una stos son ejemplos tipicos nitativa. Es obvio que en muchos easos uns re cualitativa; para un analista puede ser itl decir que ha detectado boro en una muestra de gna destilada, pero es mucho mas itil para él poder definir cuanto boro se encuentra presente en dicha muestra, La persona que solicita el anslisis podria, una vez. que cuenta racién de boro es preocupante, consi con esta respuesta cuantitativa, juegar si la con derar cémo se puede reducir, ee.; pero si slo supiera que hay algo de boro le seria dificil estimar la significacién del resultado. En otros casos sdlo tiene valor un resultado cuanti lativo, Por ejemplo, pricticamente todas las muestras de suero sanguineo humano contie. nen albiimina; la pregunta es, zeusnta? Es importante observar que aun cuando se requiera una respuesta cualitativa, se utilizan étodos cuantitativos para obtenerla, Esto se ilustra en los ejemplos expuestos al principio de esta seceion, En realidad, un analista nunca diria simplemente "Yo puedo o no puedo detectar boro en esta muestra de agua”. Utilizaria un método cuantitativo eapaz de detectar boro a niveles, supongamos, de I ig/ml. Si la prucba diese un resultado negativo, podtia deseribirse en la forma “Esta muestra contiene menos de 1 jig/ml de boro”. Si el ensayo dio un resultado positive, se podria decir que la muestra contiene al menos | pg/ml de boro ara comparar dos muestra de suelo se podria utilizar aproximaciones cuantitativas mucho ins complejas. Por ejemplo, las muestras podrian estar sujetas a un ansilisis de tame particulas que determinaria las proporciotes de particulas de suelo clasificadas en cierto iimero de tamanos, digamos diez, Entonces cada muestra se caracterizaria por estos diez datos. Se puiede usar procedimientos muy complejos (véase el Cap. 7) para brindar una vahtacidn euantitativa de su similitud, y se puede obtener una estimacién de la probabilidad de que las muestras tengan un origen comtin, si se dispone de datos comparables de imiuestras de suelo que se sabe que son compatibles. 1.2. ERRORES EN EL ANALISIS CUANTITATIVO ‘Una vez que aceptamos que los anilisis cuamtitativos jugaran un papel predominante en. cualquier laboratorio analitico, debemos aceptar también que los errores que aparezcan cen tales estudios son de gran importancia, Nuestro principio guia seri que no existen resultados cuantitativos validos si no van acompariados de alguna estimacisn ele tos erreves visierontee @ ellos. Desde luego, este principio se aplica no solo a la quimica sino a cualquier eampo de estudio en el que se obtengan resultados numéricos texperimentales. Podemos examinar ripidamente una serie de ejemplos sencillos que ilustran el principio y que ademas plantean los tipos de problemas estadisticos que encon- traremos y resolveremos en los pr6ximos capitis. Supongamios que un quimico sintetiza un eactivo analitico ereyendo que es comple- tamente ntevo; loestucdia utilizando un método espectromeétrico y el compuesto da un valor de 104 (normalimente, la mayoria de nuestros resultados se citaran en unidades elegidas ‘con todo cuidlaclo, pero en este ejemplo hipotético pueden utilizarse unidades arbitrarias).. Al revisar los libros de referencia, el quimico encuentra que ningiin compuesto descubierto hasta el momento ha arrojado un valor de mas de 100 cuando se ha estudiado con el mismo étodo en Tas mismas condiciones experimentales. La pregunta que surge naturalmente est gntestro quiimico descubrié en realidad un compuesto nievo? Por suptesto, la respuesta ‘esta pregunta reside en el grado de confianza que podemos asignar al valor experimental de 104, ;Qué errores estan asocindos con él” Si el estudio posterior indica que el resultado es correcto denteo de 2 unidades (arbitrarias), es decir, que el verdadero valor se encuentra en el intervalo 104 * 2, entonces es posible que se haya caracterizado un nuevo material Perossi las investigaciones muestean que el error puede aleanzar hasta 10 unidades (es deci 104 + 10), entonces es muy probable que el verdadero valor sea en realidad menor que 100, en euyo caso el nuevo deseubrimiento dista mucho de ser cierto. En otras palabras, es cesencial conocer los errores experimentales (en este caso como en cualquier otto) para interpretar adecuadamente las resultados. En términos estadistices, este ejemplo conlleva- ria la comparacion de los resultados experimentales con un valor supuesto o de referencia: este tema se estudia con detalle en et capitulo 3 ‘Una sitiacion mas comin es la del apalista que Heva a eabo varias determinaciones. repetidas en el curso de un solo analisis. (El valor y la significacion de tales repeticiones se veri con detalle en el proximo capitulo.) Suponga que un analista efectiia cuatro veces unexperimento voluméttico y obtiene valores de 24.69, 24.73, 24.77 y 25.39 ml. El primer aspecto por sefialnt es que los valores de titulacién se redondean a 0.01 ml; este aspecto tambiense analiza en el eapitulo 2, Tambign es evidente de inmediato que los cuatro valores son distintos debido a los errores inherentes a las medidas, y que el cuarto valor (25.39 ml) es sustancialmente diferente de los otros tres. Aqui surge la pregunta: zpuede rechazarse sin riesgo este cuarto valor de manera que, por ejemplo, el valor medio se presente como 24.73 mI? En términos estadisticos, jel valor de 25.39 ml es un resultado anomale? El importante tema del rechazo de los resultados andmalos se analiza con detalle en el capitulo 3 Ciro problema frecuente es Ia comparacién de dos © mas conjuntos de resultados, Suponga que un analista mide el contenilo de vanadio en una muestta de acero usando das todos distintos. Con el primero obtiene un valor medio de 1.04%, con un error estimad del 0.07%; con el segundo obtiene un valor medio del 0.95% y um error del 0.09%. Al comparar estos resultados surgen varias preguntas: los dos valores medios son significa. tivamente diferentes, o son indistinguibles dentro de los limites de error experimental? {Uno de fos métodas es bastante menos propenso a errores que el otro? {Cus de los dos valores medios esta en realidad mas cerea de la verdad? De nuevo, en el capitulo 3 se cestudian éstasy otras preguntas relacionadas. Para concur esta scecion notemos que muchos andliss se basan en métodos grificos En lugar de medir repetidamente la misma muestra, realizamos wa serie de mediciones sobre un pequeio grupo de estindares los cuales tienen concentraciones conocidas que cuibten un intervalo considerable; de esta manera establecemos una curva de calibracign 4que puede utlizarse para estimar Ia concentracién de muestras estudiadas con el mistno, procedimicnto, En la prictica, por supuesto, todas las mediciones (las que se basan en estandates y las que se efectian en muestras) estarin sujetas a errors, Por ejemplo, es necesario calcular los errotes en que se incurte al trazar la curva de ealibracisn, estimar el certor de la concentracién de una muestra determinada uilizandoTa curva, yestimarel Kimite de deteceidn del méiodo, es decir, la cantidad de analito mas pequetia que puede detectarse con un grado de confianza concreto. Estos procedimientos, especialmente frecuentes en anilisis instrumental, se deseriben en el capitulo 5. sos ejemplos representan sdlo una parte de los problemas que pueden surgi de la ccurrencia de evrotes experimentales en el anslisis cuantitativo. No obstante, como hemos visto, los problemas deben resolverse si deseamos que ls datos cuanttativos tengan alsin significado real, Por lo tanto, resulta evidente que debemos estudiar con mas detalle los diferentes tipos de ertores. 1.3 TIPOS DE ERRORES: Los cientificos experimentaleshacen una distineion fundamental entre tres tipos de errores: {emitieos. Los erroreserasos se descriten con facilidad; pueden tacaaunse como errores fan graves que no queda otra altemativa mis que abandonar ef expetimento y empezar de ntevo. Como ejemplos se podrien inchir a averia total de un instumento, la caida o el derramamiento accidental de una muestra muy importante, 0 dlescubrit durante el desarrollo de un experimento que un reactivo que se suponia puro, en realidad estaba contaminado. Tales errores (jque ocurren ccasionalmente incluso en los laboratories mejor conttolados!) normalmente se reconocen con mucha facitidad. En consecuiencia en nuesto anlisis slo tenemos que distinguit con detenimiento entre los cestores aleatorios y los sistemiticos. Podenios hacer mejor esta distineién mediante el estudio euidadoso de wna situa- ign experimental real, Cuatro estudiantes (A-D) realizan un anilisis en el que ttulan exactaniente 10.00 wil de hidréxido de sodio exactamente 0.1M* con :icido clorhii ‘co exacramente 0.1M. Cada uno realiza cinco réplicas del andlisis y obtiene los resultados {que se muestran en la tabla 1. Los resultados obtenidos por el estudiante A tienen dos caracteristicas importantes, Primero, tosios estan muy proximos; todos caen entre 10.08 y 10.12 ml. En términos generales, diriamos que los resultados son altamente reproducibles. La segunda caracte- ristiea distintiva es que todos son demasiado altos; en este experimento (algo inusual) conocemos de antemano la respuesta correcta: 10,00 ml. Resulta evidente que han surgido dos tipos de errores completamente distintos en el experimento de este estudiante, En primer lugar existen errores aleatorios, os cuales provocan que los resultados individua- les caigan a ambos lados del valor medio (en este caso 10.10 ml). Los estadisticos afirman que los rores alestoriosafectan 1a precision, o reproducibilidad ce un expesimento, En clcaso del estudiante A, queda claro que fos erroresalcatorios son pequetios y, por lo tanto, decimos que los resultados son preeisos. Sin embargo, también existen errores sistem ticos, los cuales provocan que todos ios resutados sean erréneos en el mismo sentido (en este caso todes son demasiado altos), Loserrores sistematicos afectan laexaetitud, es deci, la prnximitad of valor verdadero. En muchos experimentos, los errores aleatorios y sistemiticos no se detectan facilmente con sélo observar los resultados, sino que también tienen origenes muy distintos en cuanto la técnica experimental y al equipo que se utiliza. Antes de examinar las causas de los errores en este experimento, podemos analizar brevemente los resultados obtenidos por los estudiantes B a D. El estudiante B ha obtenido resultados que se encuentran en contraposicion directa con los del estudiante A. El ppromedio de los cinco resultados (10.01 mi) esti: muy préximo al valor verdadero, de manera que podemos caracterizar los datos como exaetos, si errores sistemiticos sustan- ciales. Sin embargo, la variedad de los resultados es muy grande, o que indica una precision, insatisfactoria y In presencia de errores aleatorios sustanciales. La comparacién de estos resullados con los obtenidos por el estudiante A muestra con claridad que los errores aleatorios y los sistemtiticos pueden ocurrir independientemente uno del otro. Esta conclu- sidn se refuerza con los datos de los estudiantes C y D. El trabajo del estudiante C no es ni preciso intervalo de 9.69 a 10.19 ml) niexacto (media 9.90 ml). Elestudiante D ha logrado «Ia ver resultados precisos (intervalo de 9.97 a 10.04 mi) y exaetos (media 10.01 ml). La distinci6n entre errores aleatorios y sistemticos, y entre precisién y exactitud, se resume cent Ta figura 1.1 FI experimento aparentemente sencillo, descrito en los pitrafos anteriores, merece ‘atios comentarios adicionales. Es muy importante menefonar que las palabras precisién ¥y exactitud tienen significados completamente diferentes en la teoria de errores, mientras que se usan de manera indistinta en el lenguaje cotidiano. Por ejemplo, en varios diccio- narios se meneiona la exactitud como una definicién de precision, y viceversa. Esta desafortunada confusién hace més dificil recordar la diferencia principal entre los errores sistemiticos y los aleatorios, a los cuales se refieren las palabras exactitud y precision, respectivamente. Mencionaremos dos problemas adicionales de nomenelatura, En algunos textos se habla de ertores “determinadlos” e “indeterminados” con el mismo significado {que errores sistematicos y aleatorios, respectivamente. Asi mismo, aunque utilizamos con anterioridad la palabra “reprodueibilidad” como una definici6n aproximada de la precision, el convenio actual hace una distincion ciudadosa entre reproducibilidad y repetitividad. * El simbolo {AM indica 1 mol del material especificado por litto de solucién Tabla LI Errore sisteméticos y aleatorios Estudiante Resultados (mi) Comentario 10.08 10.11 A 10.09 Preciso 10.10 pero inexacto 10.12 988 10.13 B 10.02 Exacto 9.80 pero impreciso 1021 10.19 979 c 9.09 Inexacto 10.05 impreciso 978 10.08 9.98 D 10.02 Exacto 997 vy preciso 10.08 Podemos aclarar esta diferencia con una extension del experimento anterior. Por el camino normal el estudiante A, por ejemplo realizaria las cinco medidas repetidas en una sucesiGn rapida; pero es probable que no tardara més de una hora en realizar el ejercicio completo, Usilizaria la misma serie de disoluciones y el mismo material de vidrioa lo largo del experimento; afiadiria la misma preparacién del indicador a cada matraz de ttulacién, ¥ permanecerian iguales la temperatura, a humedad y demas condiciones de laboratorio. En tales circunstancias, la precisién medida seria la precision dentro de rachas; esto se denomina repetitividad. Sin embargo, suponga que por alguna razén el mismo estudiante realiz6 ls titulaciones en cinco ocasiones diferentes, Es probable que en tales circunstan- cias usara recipientes de vidrio y preparaciones de indicador diferentes; asi mismo, las condiciones del laboratorio también pudieron cambiar de una ocasién a otra. Por eso en este caso no seria sorprendente encontrar una gran variabilidad en los resultados. Este conjunto de datos reflejaria la precisién entre rackas del método, y esto es a lo que se deberia asignar el término reproducibilidad, En la tabla 1.2 se resumen las definiciones de los términos wilizados y las relaciones entre ellos. Se debe aprender otra leccidn del experimento de titulacién, Es facil apreciar que los valores obtenidos por el estudiante C son inaceptables, y que los del estudiante D son los mas aceptables. Sin embargo, en ocasiones puede ocurrir que haya dos métodos disponibles para un anilisis conereto, de fos cuales se piense que uno sea preciso pero inexacto, mientras que el otro, exacto pero imprecise. En otras palabras, es posible que tengamos que elegir entre los tipos de los resultados obtenidos por los estudiantes A y B respectivamente. Entonces, ,qué tipo de resultado es preferible? No es posible dar una respuesta categorica a esta pregunta, aunque sélo sea porque Ia eleccién del método analitico se basari, en a prictica, en el costo, la facilidad de automatizacién, la rapidez del Resultado correcto 2 | 11 1 te pees eee Leet Lee |e [eee eee 9.70 10.00 10.30 Volumen de titulador en mt Figura 1.1 Exactitud y precision; representacin grifiea de los datos de la tabla 1. En (a) los datos Son precisos pevo inexactos; en (b} exactos pero impreeisos; en (¢) inexactos e imprecisos,y en (2) ‘exactos y precisos anilisis y otros factores que se encuentran fuera de nuestra evaluacién elemental. Sin ‘embargo, es importante darse cuenta de que un método que se encuentre sustancialmente libre de errores sistemsticos puede tn, si es muy impreciso, proporcionar un valor medio {que esté (por azar) bastante alejado del valor correcto. Por otra pate, un método que es preciso, pero inexacto (estudiante A) puede convertirse en uno que sea preciso y exacto (cstudiante D), si se descubren y eliminan los errores sistematicos. También existirin casos en donde, debido a que las medidas que se obtienen son absolutamente nuevas, no sea factibte controlar alguno de los erroressistemsticos. Los erroresaleatorios nunca se pueden climinae, aunque mediante una teniea cuidadosa se pueden aninitizar, y realizando medidas repetidas se puede medir y evaluar su imporiancia, En muchos casos pueden climinarse fos errors sistematicos mediante controles adeeuados de nuestra técnica expe- Tabla 1.2 Resumen de definiciones ‘Tipos de errores Sistemitions ‘Aectan la precision Afectan la exactitud La precision dentro de Ia rachas es la repetitividad Proximidad ala verdad {a eis ete las rachas es a rproduel ‘Tambicn se conocen como exrores determinsdos rimental y de nuestro equipo. En la proxima seccién se analiza esta importante distincion adicional entre los dos grandes tipos de errores. 1.4 ERRORES SISTEMATICOS Y ALEATORIOS EN EL ANALISIS- Mediante cl ejemplo del experimento volumétrico de los estudiantes se muestra con clatidad que los erroressistemsticos y leatorios pueden ocurrir indepenlientemente unos de ottos y surgir en diferentes etapas del experimento. Ya que la volumetria es un procedimicnto relativamente simple y todavia ampliamente usado, es importante exa rarlo con detalle en este context. Se puede considerar que un andlisis volumétrico es ‘completo cuando involucra los siguientes pasos (algunos de los cuales se han omitido en cl ejemplo de la seccisn precedente con et fin de hacerlo més sencill). (1) Preparaeion de una soluecién estindar de uno de los reactivos. Esto supote (a) pesat ‘un pesasustancias o reeipiente similar que contenga algtin material solido; (b) transfer et material sdlido a un matraz aforado y pesar de nievo el pesasustancias con el fin de obtener por diferencia el peso del sdlido transferido, y (c) Henar el matraz.con agua destilada hasta ef entase (suponiendo que se contempla una titulacién acuosa), (2) Transferir una alicuota del material estindar a un matraz de titulacién con ayuda de ‘una pipeta, Esto supone (a) lena la pipeta hasta el enrase adecuaclo, y (b) vaciar et contenido de una manera espeeitica en el matraz de ttulacisn. {G) Titulacion det liquido en el matraz con una solucién del otro reaetivo afadido de ‘ona bureta Esto implica (a) lenar la bureta y permitir que el liquido contenido en ella escurra hasta que el menisco alcance un nivel constante; (b) aftadir unas cuantas gotas de solucién de indieador al matraz de titulacién; (c)Ieer el voluinen inicial de la bureta; (d) aiiadir poco a poco el liquido de la bureta al matraz de titulacion hasta que se tizgue que se ha alcanzado el punto final, y (e) medi el nivel final del liquid en la bureta ‘Si bien un anilisis elemental de este tipo implica diez pasos diferentes, pot lo general los siete iltimos se repiten, como hemos visto, varias veces. En principio, podriamos ‘examinar eada paso para evalvar los erroresaleatorios y sistematicos que puieran cuttin. En la prctica, es mis sencillo examinar por separado las etapas que utilizan pesadas [pasos 1 (@)y 1 (O)},y las etapas restantes que conllevan cl uso de equipo volumétrico. El lector advertira que la intencién no es proporcionar deseripciones detalladas de las técnicas cexperimentales utilizadas en las diferentes etapas. De igual manera, no se exponen métodos para calibrar pesas, material de vidrio, ete. (Estos temas se tratan con detalie en tos libros citados en la bibliografia al final del capitulo.) Entre las contribuciones para detectar fos ‘errores, son de importancia las tolerancias de las pesas uilizadas en fos pasos gravinnétri- cos, y del material de vidrio volumeétrico, Algunas instituciones tales. como la British Standards Institution (BSI) y la American Society for Testing and Materiats (ASTM) haw publicado especificaciones estindar para estas tolerancias. Algunos valores de tolerancia Uipica se exponen en la tabla 1.3. La toleraneia de uma pesa de. 10 g de alta eatitad puede pequetia como #0.25 mg, aunque para un peso usado en tareas dle rtina la tolerancia podria ser hasta cuatro veces mis grande. De igual manera, Ia toleramncia para um matraz forade de prada Ade 250 miles 40,12 mi; cl material volunétrico de grado B por loregular, presenta tolerancias dos veces mas grandes que el material de videio grado A. Si una pes uma picza dle material de vidrio esta dentro de los limites de tolerancia, pero two posce ‘Tabla 1.3 Ejemplos de tolerancias de pesos y de material de vidrio Ail Tokrancia esos (Clase 1) 2025 mg ode 034mg 1 010mm rong Pesos Chse 3) 210mg iode O10m 1 00300 10g Matra de vidio (Grado A) 025m Probela godin de SD Oia 003 me basins (Datos etenidos de as Espeiticaciones este de ASTM Eb17-78y B694.79; véase abi fia) exactanenteel peso vlunen contest srg un err sisenic. As pes sielmataz son tiene en aida un volumen de 24398 mete enor se eles cnel eats detoeslosexperimentostasaosenel soe dichomatan Larepeiiondslexpeanens no revelr elena, ya queen ca repticonse spent que el amen ede $9000 cuando de hecho es menor que éste. No obstante, si se comparan los resultados de un experinentoenel que se lado este mata on los dees experinen tp shee otros toate) wend con otosutnces, etoees ec de oe ee an ovo yasenenco senor serie rachael dts or fo glo los estinints de peda se ence stetorios my pea pesada cometiclos son sélo tunes pocos ticrogramos, ° reek “ Losers sist en isp de fuentes establecidas, las ct iales incluyen la adsore’ ’ un i site de es una serie de Ta humedad en la superficie del feeb nda; Ios errores provocados al no permitir que fos reeipientes ealentados Se enfricn Ta misina temperatura que la balanza antes de pesa (este exror es my comin Jaret cuando se peso erisoles) Is pesas oxida o comands por el polvo; ¥ elefeeto boyante de la atmésfera, que acta en diferente inedida sobre objetos de distinta 5) se distribuyan normalmente. 2.4 LIMITES DE CONFIANZA DE LA MEDIA Ahora que conocemos la forma de la distribucién muestral de la media, podemos regresar al problema de utilizar una muestra para definir el intervalo dentro del cual podamos suponer de manera razonable que se encuentra el valor verdadero. (Reeuterde que al hacer esto se supone que no existen errores sistematicos.) Este intervalo se conoce como el intervalo de confianza y los valores extremos de dicho intervalo se llaman limites de confianza. El nza” implica que podemos afirmar con.un grado de confianza probabilidad, que el intervalo de confianza sfincluye al valor verdadero. Por supuesto, el tamaito del intervalo de confianza dependera de la certeza que queramos tener de que se incluya el valor verdadero: cuanto ms grande sea la certeza, mds grande seri el intervalo requerido, En Ia figura 2.6 aparece la distribucién muestral de la media para muestras de tamaiio ‘Si suponemos a partir de ahora que La distribucién es normal, entonces el 95% de las ediciones muestrales se encontrarin el el intervalo dado por: | y i o54 wt. 86a//n # Figura 2.6 Distibucidn muestra de Ia media, en fa que se muestra el intervalo denteo del cual se encuentra el 95% dela mediciones inuestrales WI860//n B~ L900) <¥< p+ 1.96(0/VR) 25) (Se utiliza en esta ecuacién el valor exacto de 1.96 en lugar del valor aproximado, 2, que ‘se emplea frecuentemente.) ‘Sin embargo, en la prictica por lo regular disponemos de una muestra, de media conocida, y buscamos un intervalo para uz, el valor verdadero. Puede reordenarse la cecuacién (2.5) y expresarse de la siguiente forma: F- 196 (oi) < p< E+ 1.96(oKKn) 2.6) La ecuacién (2.6) proporciona el intervalo de confianza al 95% de la media, De manera similar, el intervalo de confianza al 99.7% esté dado por: ¥- 297M) < wees 29TH) 27) Otro intervalo de confianza que se utiliza con frecuencia es el intervalo de confianza al 99% que esta dado por: F- 258M) < p< z+ 258(oNH) (2.8) La ecuacién (2.6) se puede utilizar para caleular los limites de confianza al 95% para la ‘eoncentracidn de ion nitrato. Se tiene que 3 ~ 0.500 y n = 50. Lo tinico que se desconoce fen Ia ecuacién es @. Para muestras grandes como ésta, s proporciona una estimacion suficientemente exacta de oy puede sustituirse por ésta, De este modo, el intervalo de ‘confianza al 95% para la concentracién de ion nitrato es: 0,500 - 1.96 « 0.016530" < p< 0.500 + 1.96 « 0.0165/V50~ = 0,5000 + 0.0086 jig/ml medida que el tamano de la muestra se hace més pequenio, la incertidumbre al utilizar 5 para estimar aumenta, A fin de permitir esto, la ecuacién utilizada para caleular los limites de confianza se modifica por la siguiente: HrELUSNT) (2.9) El valor adecuado de ¢ depende tanto de (1 ~ 1), que se conoce como mimero de grados de libertad (cuyo simbolo habitual es v), como del grado de confianza requerido. [El término “aradlos de libertad” se refiere al mimero de desviaciones independiemtes (x, - 3) que se ulilizanal calculars, Eneste caso, dicho mimeroes (1- 1), porque cuando se conocen (n ~ 1) desvi esta se pede decisis liza lett obvio Ss, — 4) =0} En la tabla 2.4 se recogen los valores de t. En dicha tabla puede apreciarse que para muestras de tamaio superior a 50, os valores de t son muy proximos alos valores de 1.96 y de 2.58 tilizados en las ecuaciones (2.6) y (2.8), respectivamente. Esto confirma la validez. de la ipotesis tilizada antesal ealeutar los limites de confianza para la concentracién de nitrato. EL uso de esta tabla puede aclararse con wn ejemplo, Ejemplo, Se determin6 el contenido de ion sodio de una muestra de orina utilizando un, clectrodo selectivo de iones, y se obtuvieron los siguientes valores: 102, 97, 99, 98, 101, 106 m4. ;Cuzles son fos limites de confianza al 95 y 99%, para la eoncentracién de ion sodio? La media y In desviacion estindar de estos valores son 100.5 mM y 3.27 mf, respectivamente. Hay seis mediciones y por lo tanto 5 grados de libertad. El valor de t caleulado usando la tabla 2.4 para determinar los limites de confianza al 95% es de Tabla 24 Valores de # para intervalos de confionza Gros eid “lors de pra nerves de onfanza de - Sios9 ee eo 1 63.66 2 392 5 Ses 3 400 : 237 aos _ 32s at 20 20 2s 0 bow 213 30 aot 208 0 193 bes 2.57 y, de la ccuacisn (2.9), los limites de confianza al 95% estin dados por: = 100.5 £2.57 3.276 = 100.5 + 3.4 mat De igual manera, los limites de confianza al 99% estén dados por: m= 1005 #403 «3.27 = 1005 # 54 mbt Sila muestra procede de ua poblacién de Ta que se sabe que se distribuye log-norm: "tones los valores individuales de deberian transformar tomando sus logarittnos antes de ealeutar fos limites de confianza. Puesto que los valores transformados estaran distri- bbuidos nonnalmente,entonces los limites de confianza de la media se pueden caleular como Se hit explicado con anterioridad, Sin embargo, observe que los valores de la media y la esviacion tipiea de ta muestra se ealeulan utilizando los valores originales no transform dos. Como resultado dle la asimet distribucién log-normal (véase Ia Fig. 2.5), et intervato de confianza de la media, calculado como se ha deserito anteriormente, no es simettico con respecto a la media muestra 2.8 PRESENTACION DE RESULTADOS ‘Como ya lo sefialamos, los resultados experimentales cuantitativos carecen de interés si no van acompatiados de una estimacién de los errores ocurridos en su medida. Una pritica usual en la bibliografia de quimica analitica es citar la media como la estimacién de la cantidad medida y ta desviacién estindar como Ia estimacién de la precisién. Menos, frecuente es citarel error estandar de la muestra en lugar de la desviacién estindar, es decir, dando el resultado en la forina de los limites de confianza al 95% de la media. Ya que no existe un convenio universal, es importante establecer la forma empleada y, suponiendo que el valor de n esté dado, las tres formas se pueden convertir unas en otras wilizando las eeuaciones (2.4) y 2.9) Un aspecto que se relaciona con la presentacién de resultados es el redondeo de la respuesta. El principio importante en este caso es que el niimero de cifras significativas dadas indica la precisién del experimento. Por ejemplo, seria absurdo dar el resultado de un analisis volumétrico como 0.107 846M, pues ningiin analista podria alcanzar la preci- sién implicada de 0.000001 en una cantidad medida de 0.1, es decir, 0.001%. En a practica, se acostuinbra fijar como cifras significativas todos fos digitos que sean seguros, ms el primero incierto, Por ejemplo, la media de los valores 10.09, 10.11, 10.09, 10.10 y 10.12, ¢s 10.102, y su desviacisn estindar es 0.013 04. Por supuesto, existe incertidumbre en la segunda eifra decimal; los resultados son todos 10.1 eon una cifta decimal, pero difieren en la segunda, Mediante el método sugerido, el resultado podria expresarse como: ¥45~ 10104001 (n=5) Sise hubiera constatado que este resultado es un tedondeo inaceptable dela desvincion estindar, entonces se podria dar como: ¥#5= 10,10: £ 0.013 (n= 5) onde el uso de los subindices nos indiea que el digito s6lo se proporciona para evitar la pérdida de informacion. Bl lector podria decidir si fue itil o no. De igual manera, cuando se calculan los limites de confianza {véase Ia Ee. (2.9)}, ne ces necesario dar el resultado dle sf con mis de dos cifras significativas. El valor de ® Aeberia darse, en este caso, con el correspondiente niimero de cttas decimate. El niimero de cifras significativas citado se utiliza a menulo.en lugar de una estimacién especifica para setalar Ia precisién de un resultado. Por ejemplo, se considera que en el ‘nlmero 0.104 64 ls ies primeras cifras decimales son ciertas, pero existen dudas acerca de Ia cuarta, Sin embargo, puesto que existe incertidumbre en la tlima cifra, podria ser cualquiera desde 0,000 05 a 0.000 5; este método proporciona una estimacion pobre de la precision y no es recomendable. A veces se recalca In incertidumbee en Ia itima cifta al utilizar los formatos 0.104(6)M, o ms comiin 0.104eM, pero sigtc siendo preferible dar tuna estimacion especifica de la precisin tal como la desviacion estandar. ‘Un problema que puede surgir es si un 5 deberia redondearse por encima o por debajo. Porejemplo, i 9.65 se reconcen a una sola eifra decimal, zpodeia convertirse en 9.6 69.72 Es evidente que los resultados tenclrin sesgo si un 5 se redondea siempre hacia el valor superior; este sesgo puede evitarse redoncdeando el al nimero par mis préximo, dando, ces este e280, 9.6, De la misma forma 4.75 se redontoa a 4.8 ‘Cuando hay que utilizar varias cantidades para calcular un resultado final (véase la seccidn 2.7), éstas no deben redondearse demasiado porque se produeiri una pérdida de precision innecesaria. Una buena regla es dejar un digito detras de la tiltima cifra signific cativa y dejar ef posterior redondeo hasta que se llegue al resultado final. La misma regla se aplica cuando se usau la media y 1a desviacién estindar en prucbas estadisticas tales como las pruebas F y #(véase capitulo 3): se deberia utilizar en los ealculos los valores no. redondeadas de ¥ ys 2.6 OTROS USOS DE LOS LIMITES DE CONFIANZA Los limites de confianza se pueden utilizar como una prueba para detectar errores sistemé- ticos, como se muestra en el siguiente ejemplo, Ejemplo, Se comprucba In escala de absorbancia de wn espeetrdmetro a wna lon, de onda conereta usando tna solucidn estindar con una absorbanicia de 0.470, Diez ediciones de absorbancia con el espectrémetro dieron F= 0.461 ys ~ 0,003. Encuentre el intervalo de confianza al 95% de la absorbancia media y decida si se encuentra presente un error sistemtico, Los limites de confianza al 95% de las absorbancias medidas por el espectrsmetro son (Ec. (2.9)} HBL) = 0.461 + 2.26 x 0,003/ 10" = 0.461 # 0.002 ‘alot de t se obtuvo a partir de Ia tabla A.1 que se encuentra en los apéndices, la ‘cual es una version mis completa de la tabla 2.4.) jue este intervalo de confianza no incluye la absorbaneia conocida de 0.470, es probable que exista un error sistematico. En el préximo capitulo se tratari otra proximacion al mismo problema, ‘También se pueden usar los limites de contianza cuando se realizan mediciones a eada tuno de una serie de ejemplares. Por ejemplo, si se requiere el peso medio de una pastilla on un gran Tote, se consumiria demasiado tiempo en pesar cada una, De igual manera, si se usa un método analitico destructivo, como la especttometria de absorcion atémica, para analizat el lote y establecer el contenido medio, seria imposible examinar cada tableta. En ‘antbes easos, podria tomarse una muestra del lote (que en tales eireunstancias forma la poblacién) y a partir de la media y la desviacidn estinclar de la muestra se podria encontrar lun intervalo de confianza para el valor medio de la cantiiad medida 2.7 PROPAGACION DE ERRORES ALEATORIOS En el trabajo experimental, se calcula con frecuencia la cantidad que se va a determinar a Hartir de una combinacion de cantidades observables. Ya hemos visto, por ejemplo, que neluso una operacién relativamente simple como un anilisis volumétrico, implica varias tapas, y cada una de ellas se encuentra sujeta a errores (véase el capitulo 1). El céleuto {inal puede conllevar operaciones tales como sumas, restas, multiplicaciones o divisiones, de dos 0 més cantidades, o elevar alguna cantidad a una potencia, Es muy importante sefalar que los procedimientos utilizados para combinar errores aleatorios y errores sistemticos son completamente distintos. Esto se debe a que algunos. errores aleatorios se compensan entre si, mientras que cada error sistemitico ocurre en un, sentido definido y conocido. Por ejemplo, si el resultado final de un experimento, x, esté dado por x ~ a + b; si ay b tienen un error sistematico de +1, es evidente que el error sistemitico de x es de *2, Sin embargo, sia y b tienen un error aleatorio de £1, el certor aleatorio de x no es 2: esto se debe a que habra ocasiones en que el ertor aleatorio en. ‘sera positivo mientras que en otras en b ser negativo (0 viceversa). En esta seccién sélo se considera In propagacién de errores aleatorios (los errores sistemsticos se consideran en la seein 28). Si se conoce la pecisién de cada observaci6n, tentonces se pueden usar reglas matemtaticas sencillas para estimar la del resultado final Estas reglas se resumen a continuacién, (i) Combinaciones tineales En este caso el valor final, y, se calcula a partir de una combinacién lineal de cantidades medidas a, b,c, ete., por: yoktkatkpb+ket (2.10) donde &; ko ky Ky ele., son constantes. La varianza (definida eomo el cuadrado de des- Viacion estindar) tiene Ia propiedad de que la varianza de una suma o diferencia de cantidades independientes es igual a la summa de sus varianzas. Se puede demostrar que Si doy 0 0, te., Som las desvinciones estindar de a, b,c, etc, la desviacion estindat de y, 0, esti dada por: VK OFF hy OF HK OFF (ul) Ejemplo. En una titulacién, la lectura inicial en una bureta es de 3.51 ml y la lectura final es de 15.67 ml, ambas con una desviacidn estindarde 0.02 ml. ;Cusl esl volumen del titulante tilizando y cual es su desviacién estindar? 6, ‘Volumen utitizado ~ 15.67 - 3.51 = 12.16 ml Desviacion estindar = y(0.02)* + (0.02)? = 0.028 mi. Este ejemplo actara el aspecto importante de que la desviacion estindar del resultado final es mayor que la de las lecturas individuales de Ia bureta, incluso aunque el ‘olumen utilizado se calcule a parte de una diferencia, pero es menor que la suma de las desviaciones esténdar. Gi) Expresiones mutiplicarivas Siyse calcula a partir de una expreston del tipo: yo kabjed @.12) (donde a, b, © ¥ d son cantidades medidas independiemtemente y k es una constante) tentonces existe una relacidn entre los cuadrados de las desviaciones estindares relativas: YG) i Ejenplo. El rendimientocusmtico de fluorescencia, 6, se calcula a partirde laexpresién: = [kelly donde los parametros implicados se definen a continuacién, con una estimacidn de sus lesviaciones tipieas entre paréntesis: 1 intensidad de la luz incidente (0.5%) {> intensidad de luz fuorescente (2%) fe absortividad molar (1%) = coneentracisn (0.2%) 1= paso optico (0.2%) kes una constante del instrument. De la ecuacion (2.13), la desviaeion estindar relativa de @ esta dada por: der, VETO FOF +0551) VGF0.0FF 0.084 0.2541) v5.33 =2.3% Puede observarse que la desviacion estindar relativa del resultado final noes mucho ‘mayor que ka mayor de todas las desviaciones estindar relatives usadas para ealeularlo (es decir, 2% para J.) Esto es, fundamentalmente, una consceuencia de elevar at cuadrado las desviaciones estindar relativas y explica una euestién de importan zeneral: cualquier esferzo por mejorar la precision de un experimento debe dirigirse 4 mejorar la precision de los valores menos precisos. Como corolario de esto, no vale la pena esforzarse por inerementar la precision de los valores mas precises, Esto no significa que los errores pequetios no sean importantes: tos, en muchas etapas de wn experimento, tales como las del andlisis volumétrico analizados con detalle et el capitulo 1, producirin un error apreciable en el resultado final Es importante resaltar que cuando una cantidad se eleva a una potencia, p.ej. b°, tentonices no se calcula el error como para una multiplicacién, es decir, b* B x b, debido a «ue las cantidades implicadas no son independientes, Si la relaeién es: yoo" 14) jones tipieas de y y Destin relacionadas por (El simbolo del médulo | significa que la magnitud de la cantidad encerrada en él se toma sin {ener en cuenta el signo, por ejemplo: |-2| = 2.) Git) Otras funciones ‘yes una funcién general de x: yr) 2.16) centonces las desviaeiones estandar de x y y estan relacionadas por: (17) Ejemplo: ta absorbancia, A, de una solucién esta dada por: A= ~log(T) 2.18) donde Tes la ransmitancia. Sil valor medio de Tes 0.501 con una desviacién estindar de 0.001, calcule A y su desviacidn esténdar ‘Tenemos: A ~~ 1og.0.501 = 0.300 Tambien Ua = - loge)/T = -0.434/7 de manera que de ta ecuacién (2.17) on lar (-loge/ = [0.001 x (-0.434/0.501)| ~ 0.0008; Es importante observar que para este método experimental muy utilizado se pueden encontrar las condiciones para que sea minima la desviacion estindar relativa. La desvia- cin estindar relativa de A esti dada por La derivada de esta expresin con respecto a Tmuestra que el coeficiente de variacién de Aes minimo cuando T= Ie = 0,368. Ejemplo: La ecuacion de Nemst, aplicada en el andlisis potenciométrico, es E= B+ (RTinF)Ine donde Eesel potencial de electrodo que se mide; E*esel potencial de electrodoestindar del ion que se determina; Tes In temperatura absoluta; n es el niimero de electrones ae participan en la semicélula correspondiente; ¢ es la concentracién del ion; Res la Constante de Tos ges, Fs la consnte de Faraday. Olena nn, Otten un expres para In desviacion esti slatvn de I concentra, suponiende que Po S08 kya notions err Cale el valor dela desvacin esti latinas = nde be ylade de £ y Press fon dle Nernst y se sus luyen los valores numeéricos de TR 6 expl40u(E ~ E>) Derivando con respecto a E: dcfOE = 40nexpt40n(E ~ E)) de-mnanera que dela eeuacién (2.17) ©. = One, expl40ncE ~ £)) = 40nc 6, Asi, la desviacién estindar telativa de ces LODe.fe = 100 40n01% Cuando n= 1y eres 0.001 V, ew: de © =100 * 0.001 « 40 = 4% En contraste con el ejemplo anterior, la desviacién esti es constant, 2.8 PROPAGACION DE ERRORE: La replas de combin ‘on de erroressistemmiticos pueden dividirse también en tres grupos: (0) Combinaciones lineales Si» sneer decades dies ond sistemiticos de a, b, ¢, : ca ¥ los errores: e- Son1 Aa, AB y Ac, ef, enton se calcula a partir de sel error sistemtico de y, Ay, Ay = ka © AD + hse (2.20) Reenerde que los ertoressistematicos son tanto positives como neg: deben ineluirse en el cilleulo de Ay " oeaee ‘or cjemplo, suponga que se usa tuna y i temiticd de 0.01 g par pessidas utilizachs em I Matava eon err sien ilizacias eu Ta preparacion de Hucion estindar, Puesto que et peso dhe solute milizado se eacula a partir de un diferencia entre dos pesndas, se eliminan los errores sistemiticos, Proceditnientos como 4éste, consideraclos en forma cuidaclosa, pueden minimizar a menudo los ertores sistemiti= ‘eas, como se deseribio en el capitulo 1, Sin embargo, es preciso sehalar que esto se aplica s6lo a una balanza electrénica con una tinica pesa de referencia intema; cuando se uusa una balanza “pasada de moda” con una serie de pesas individuales, éstas deben calibrarse, y hacerse las correcciones correspondientes (jy todavia tendran un error de ca Tibrado aleatorio!). Gi) Expresiones multiplicarivas Siy se calcula a partir de cantidades ediciones utilizando la ecuacién (2.12), entonces se utilizan errores sistemticos relativos: (Byiy) ~ (Bafa) + fAbIb) + (efe) + (dtd) 221) Cuando se eleva una cantidad a alguna potencia,entonces se emplea la ecuacién (2.15), se omite el simbolo del médulo y se sustituyen las desviaciones estindar por errores sistemiticos. Git) Otras funciones La ecuacidn correspondiente es idéntica ala ecuacion (2.17), pero se omite el simbolo det _médulo y se sustituyen las desvinciones estandares por errores sistematicos BIBLIOGRAFIA Davies, 0. L. y Goldsmith, PL. Statistical Methods in Research and Production. Londres, Longmans, 1982. Se rata con mas dealle el tema de este capitulo, Méritz, P, Capitulo 1 en Comprehensive Analytical Chemisiry Vol. XP, Sveblo, G. Ed., Amster, Elsovier, 1981. En este articulo se profundiza en la aplicacisn de la teoria de earores& los meétodas analiticos. Skoog, D. A. y West, D.M., Fundamentals of Analytical Chemistry, 4a ed., Nueva York, Holt Saunders, 1982. Se deseribe el uso de In esiadistica en la evaluaciGn de datos anaiticos. ‘Topping, 1, Ervors of Observation and their Trearment, Londses, Chapman & Hall, 1962. Se tata wis completa la teoria de erroresy se estudi Ia teoria de que los erores se distibuyen, nt. EJERCICIOS 1. Para investgar la reproducibilidad de un método para la determinacisn de selonio en alimentos, se realizaron nueve mediciones sobre unt lote de arroztestado, cam los siguientes resullados Muestras Selenio, wale r 0.07 2 0.07 3 0.08 4 007 Moestras Selenio, wale a (Moreno Dominguez, T, Garcia Moreno, C. y Mariné-Font, A, Analyst, 1983, 108, 505) Caleute la media, la desviacién estindar y ia desviacinestindar relativa de estos resultados, Siete mediciones de pH de una solucién reguladora propotcionaron los siguientes resultados: 5.12, 520, 5.15, 5.17, $.16, 5.19, 5S. Calcule el verdadero pHTal nivel de confianza del (?) 95% y (i) 99%. (Suponga que noexisten errors sistemticos,) Diez anisis dela concentracién de albimina dieron una medida de 20.92 g/,y una desviacisn, estindar de 0.45 g/l. Foote, J. W. y Delves, H. T, Analyst, 1983, 108, 492) Caleule los limites de confianza de la medida al 95%. ‘Se midié la concentracién de plomo en el fluido senguineo para una muestra de $0 nitios de un ran colegio proximo a una calle concurrida, La medida muestral fue 10.12 ng/ml la desviacion estindat fue 0.64 nyjml, Calcul el intervalo de confianaa al 95% para la concentracion media de plomo de tod los niios de la escuela, Qué tamafio deberia tener la muestra pa (0.2 ng/ml (es decir 20.1 ng/ml)? reducir la Tongitud del intervalo de confianza En una investigacién de la exactitud y precisién de un método para Ia determinacion de arprinocida en comestibles preparades, se realizaron seis determinaciones repetidas de una formulacién preparada que contiene 10.2% de arprinocida. Los resultados fueron; 104, 104, 106, 103, 105, 10.58. (Stong, J.D. y Fink, D. W,, Analyst, 1982, 107, 113). Calcule Ia media, la desviacién estandar y los limites de confianza para la media al 95% y 99% {Se encuentra el valor de 10.2% dentro de los limites de eonfianza al nivel del (i) 95% y Gi) del 957 La medida de la concentracién de haptoglobina en suero sanguineo tomada de una muestra al azar de ocho adultos sanos dio los siguientes resultados: 1.82, 3.32, 1.07, 1.27, 0.49, 3:79, 0.15, 1.98 g/l Calcule Ia media y la desviacisn estindar de ests resultados. Suponiendo que la distribucién de la haptoglobina es log-normal en ta poblacién como conjunto, calcul el intervalo de confianza al 95% para la concentracion media de haptoglobina para el conjunto de la poblaeié, Diez mediciones de In relacis hi n entre las reas de dos picos en un experimento de cromatografia ia dieron los siguiente valores: 0.2911, 0.2898, 0.2923, 0.3019, 0.2997, 02961, 0.2986, 0.2902, 0.2882. onvel, Py Anderman, G., Analyst, 1983, 108, 411). CCaleule Ia media, la desviacisn estindar y los limites de confianza de a medi 199%. para valorar 10 mil de una solucién de dleali de O.1M mes de ido: disolucién de 0.LM de Y se registraton los siguientes voli 9.88, 10.18, 10.23, 10.39, 10.25 ml CCaleule los limites de confianza de la media al 95% y uilicelos para decie si existe alguna evidenein de erorsistemitico. .dos en la preparacién de una vn reactive J poblema sconieran ls eos lets ive {tvs etn eprom vlan de 307 dem dln ESM eo ea semen cela pr dfeenci de psa, asin etd de edn psn ve Saar devnein clay a devin etna eatin de pao dl eactvo ores tte ign cst at linen solvent liza fede 008 i Exprese serena una design estat iv, De a clea devin std lta de inl Jetson ep el cco pare snctivo de peso molecular 392 cts de slid el alia de ro es 1.3 10°, ona denn estindar SAPO Sic nts ctr nso cult de lla de i en agua. Pruebas de significacién 3 INTRODUCCION ‘Una de Jas propiedades mis importantes de un método analitico es que se encuentre libre de errores sitemiticos, es decir, el valor dado para la cantidad de analito deberia ser el valor verdadero. Esta propiedad se puede comprobar al aplicar el método a una muestra esténdar que contenga una cantidad conocida de analito (véase el Cap. 1). Sin embargo, como se vio en el capitulo anterior, los crrores aleatorios no permiten que la cantidad medida sea xactamente igual a a eantidad conocida incluso aunque no hubiera ertor sistematico. Para Alocidir si fa diferencia entre la cantidad medida y la cantidad conocida se puede justficar porestoserrores aleatorios, puede aplicarse una prueba estadistica que se denomina prueba de significacién, Como su nombre lo indica, esta aproximacién prueba si son significativas las diferencias entre los dos resultados, 0 si se pueden justificar s6lo por vatiaciones alcatorias, Las pruebas de significacion se han utilizado en forma amplia en la evaluacién de jos resultados experimentales. En este capitulo se eonsideran varias pruebas que son utiles particularmente para los quimicos analiticos, 32 COMPARACION DE UNA MEDIA EXPERIMENTAL CON UN VALOR coNociDo Al realizar una prucba de significacién comprobames Ia veracidad de una hipstesis cnoininada hipOtesis nula. Como observamos en el parrafo anterior, adoptamos como hipotesis ula aquetla mediante la cual un método no se encuentra sujeto a errores sistemmitieos. El término mulo se utiliza para indicar que no hay mis diferencia, entre Io observado y el valor conocido, que 1a que puede atribuirse a la variacién aleatoria. Suponiendo que esta hipétesis nula es verdadera, se puede utilizar la teoria estadis ‘lecular ta probabilidad (es decir, la posibilidad) de que Ia diferencia observada entre la siedia muestral, , y el verdadero valor, se deba solamente a un error aleatorio. Cuando xis pequena sea la probabilidad de que la diferencia observada ocurta por azar, mienos a para probable ser que Ia hipdtesis nula sea verdadera. Por lo regular, a hipstesis mula se rechaza ‘cuando Ta probabilidad de que Ia diferencia observada ocurra por azar es menor que | de cada 20 veces (¢s decir, 0.05 6 5%), yen este caso se dice que la diferenicia es significativa al nivel de 0.03 (0 5%). Si uilizamos este nivel de significacién rechazamos en promedio la hipotesis nula, cwando sea de hecho verdadera, una de cada veinle veces. Para estar mis seguros de que se toma a decision adecnada, se utiliza un nivel de significacién mas pe. ‘queno, por lo regular 0.01 6 0.001 (1% 0 0.1%). El nivel de signilicacién se indica escribiendo, por ejemplo, P (es decir, la probabilidad) = 0.05. Es importante tener en cuenta que si se acepta la hipotesis nula no signifiea que hayamos probado que sea verdadeta, solo que no hemos demostrado que sea falsa. Mis adelante en este capitulo se analizara la probabilidad de aceptar una hipotesis mula cuando sea de hecho falsa. Para decidir si Ia diferencia entre py x es significativa, la ecuacidn (2.9): wars (iil (donde 1 es el famaiio muestra) se escribe de otra forma: f= wm BD) ta ecutacidn, Si y se calcula un valor de r sustituyenddo los resultados experiments iy (es decir, el valor de 1 sin considerar el signo) es mayor que un cierto valor eri centonees se rechaza la hipétesis nula, El valor critico de | para un nivel de significa cién conereto se encuentra en la tabla A.1. Por ejemplo, para un tamaiio de muestra de 10, (cs decir, 9 grados de libertad) y un nivel de signifieacién de 0.01, el valor critico de I 8 3.25. Ejemplo, En un método para determina mercurio por la técnica de absoreién atémica de vapor frio, se obtuvieron los siguientes valores para un material de referencia que 18.9% de mereuio: contie 38.9, 37.4, 37.1% (Hou, P. K., Lau, 0, W. y Wong, M.C., Analyst, 1983, 108, 64.) Hay alguna evidencia de emitica? La media de estos valores es de 37.8% y la desviacién estindar de 0.964%. Si se adopta la hipétesis mula de que no hay error sistemitico, es decir, u = 38.9% y se utiliza 4a ecuaci6n (3.1) resulta = 137.8 - 38.) x /370.964) - 1.98 De la tabla A.1, para 2 grados de libertad, el valor eritico de pes 4.3 (P= 0.05). Ya que el valor observado de ji] es menor que el valor eritieo, no se rechaza la hipstesis mula ico. Hay que seialar nnevamente que esto no no hay evidencia de significa que no existan errores sistematicos, sino que no se ha podiclo constatar su existencia 3.3, COMPARACION DE LAS MEDIAS DE DOS MUESTRAS ira forma por la que los resultados de un método analitico nuevo pueden comprobarse es por comparacién de los obtenidos utilizando un segundo método (quizas un método de referencia). En este caso tenemos dos medias muestrales y 2. Sitomamos como hipétesis ula que los dos métodos dan el mismo resultado, necesitamos comprobar si (%, -%:) difiere cen forma significativa de cero, Si las dos muestras tienen desviaciones estdndar que no sean significativamente diferentes (véase secci6n 3.6,en donde se presenta un método para probar esta suposicidn), se puede calcular una estimacién conjunta de la desviacién cestindar a partir de la dos desviaciones estindar individuales sy s;utilizando la ecuacion: 8° = ((m, ~ 1s} + (ny = 1)sF}M(o + y= 2) (3.2) Se pede demostrar que entonces £ esti dado por: Is (in, ¥ Ung) 3.3) Donde tiene ny + 1-2 grados de libertad, Ejemplo. En una comparacién de dos métodos para la determinacién de boro en Imuestras de plantas se obtuvieren los siguientes resultados (ug/g): 1 método espectrofotométrico: media = 28.0; desvi ‘Zimetodo fuorimétrico: media = 26.25; desvia estindar = 0.3 ni estindar ~ 0.23, Para cada metodo se realizaron diez determinaciones. (Anarez, J, Bonilla, A. y Vidal, J. C., Analyst, 1983, 108, 368.) L La hipctesis nila adoptnda es que las poblaciones de done se tonnan las nests sea normales, y que seat igus las varinzns de las poblaciones. Si ln hipotesis nila es verdadera, entonces la razon de varionzas deberia estar proxiina a 1, Las difere respecto de I se deben a variacionesaleatorias, por si a diferencia es demasiado grande noe pod atria esta ens sil valor enleulado de Fexcede in cierto valor (obtenido de las tablas), ehtonces se reehoza la hipotesis nn, Este valor eritico de F depend del tamaio de las dos muestra, del nivel de signifiacion y del ipo de prucba ralizada. Los valores para P= 0.05 estan dads en as tablas A.2 y A.3 el uso ce fas tablas se aelana en los siguientes ejemplos. Fjenplo. Se compars un método propuesto para ta determinacién de la demanda de oxigeno en aguas residuales con un método estindar (sales de mereurio). Se obtuvieron los siguientes resultados para una muestra de aguas resicuales: Media (mg/l) Desviacién estindar (mgyl) Método estindar n 331 Método propuesto n Ls Para cada método se realizaron 8 determinaciones, (Ballinger, D., Lloyd, A. y Morrish, A., Analyst, 1982, 107, 1047.) iB ha precision del metodo prpestsigniiativament mis grande que a del método ‘Tenemos quie decir sila varianza del método estindar es si que la del método propuesto, F esti dado por la razon de vat icativamente mayor inzas: -331715 48 Se hicieron aco dtemnaciones, por lo tanto, nimero de gad de bead es 7 énenta cs, como tinct por los subies Enea esa hay quae pric de um ol ya qu sso nines sel melo propess eas cic que Tinto stn Ena ebla 2 numero de grado de ead del Sav sa doen to clude Taisen, el ntmero de pads ead el meray, en pte spit El alr tio de een es ean, 3.287 (Pe 0.08) gue ol vlor calla de (48) lo eked a vainza del metodo estindr es Snitivaente mayor dl mtd props a al de pb 58s decine metodo popsioes mis pesos ns ova ot $Brenplo, Fae empl que se encuentra al principio de la seccion 3.3 (determinaciin de boro en plantas), se supuso que las varianzas de los dos métodos no diferian significativamente, Esta hipstesis se puede probar ahora. Las desviaciones estindar eran 0.3 y 0.23 (cada una obtenida de 10 medidas de un ejemplar de una planta _ 2(D,- DY = «ay y la varianza global, o?, debida a todas las fuentes de error, se estima por: plete (42) n= 1) Advierta que cada una de estas ecuaciones incluye un 2 en el denominador. jJustifica porque tanto D como T dan estimaciones de los errores en los dos eonjuntos de resultados, los cuales se restan y suman a D y Trespectivamente. Los resultados de este ensayo se pueden expresar en una tabla como la siguiente: ee ee se ase) een) es A 381 230 238 256 237 210 230 265 214 B 330 232 23 21 236 21 210 286 250 D 21 02 15 15 O1 21 20 09 -36 T @&l 462 461 497 473 441 440 S21 464 itros cdleulos obtenidos a partir de la tercera y cuarta filas de datos muestran que D = 0.244, y T~ 49.33, y de aqui que la estimacién de 09 sea (1.383), y la estimacién de sea (5.296), Por tanto, Fas ~ (5.296]1.383)? ~ 14.67. Bl valor eritico (P = 0.05) es 3.44 (tabla A.2). Bl valor experimental lo supera ampliamente, de manera que se concluye que o* es de hecho mucho mas grande que o:. Esto implica, como hemos visto, que Ia variacién entre laboratorios no puede expliearse s6lo por errores de medicién aleatorios, y que se han producido errores sistematicos entre laborartoris. La componente de a debida a estos errores sistematicos, 0, se calcula a pati de: 2 = Qo +03 (43) ‘Note de nuevo la apariin del 2 en la eeuacién porque se estudian dos muestras. Aqui es facil calcular que la estimacion de 0; es (3.615). Aunque los ensayos de colaboracién de este tipo parecen muy simples tienen también sus problemas. A veces ocurre que un laboratorio no puede tomar las medidas sobre las dos (0 sobre todas las muestras que le mandan, quiziis porque se haya perdido © daiiado una ‘muestra durante el envio, 0 a causa de errores accidentales en el propio Iaboratorio. La desaparicién de datos presenta problemas de interpretacién que se tratan con profundidad en textos mas avanzados. Otro problema avanzado en ensayos de eolaboracién es el de los valores anématos; es decir uno 0 mas laboratories pueden generar resultados que al parecer se encuentran fuera de lugar con respecto al resto. En el segundo ejemplo anterior, resulta obvio que los resultados obtenidos por el laboratorio I son considerablemente més altos que los otros datos, y la aplicacién de la prueba Q (See. 3.7) muestra que estos resultados podrian set rechazados al nivel de probabilidad P ~ 0.05. Si se vuelven a calcular los valores de 03 y & para los lboratoros restantes se demostraria que, aunque cl ltimo valor sigue siendo ‘mayor, la prucha F indica que la diferencia ya no es sigificativa (P= 0.05), Est 5, si se climinaseel laboratorio 1 del ensayo, toda la variacién restante podria deberse sso a etrores de medicion aleatorios. En la prietica, el organismo de arbitraje intentar establecer si existe alguns razon concreta en cuanto a ls resultados de este laboratorio, Si se dispusiera de tl explicacion, podria plantearse la posibilidad de rechazar los datos. ‘Muchos ensayos de colaboracién son bastante mis complejos que los vistos hasta ahora. Por lo regular, se suelen enviar varias muestra a cada uno de los laboratorios participantes (etre 10y 20), cada uno de los cuales tomaria dos omuis mediciones repetidas sobre cada muestra. Al efectuar la evaluacin estadistica de los resultados de tales ensayos se debe tener en cuenta tanto la variaeién entre las mucstras como los ertores de medida aleatoros y as variaciones entre laboraorios. Dichos eélculos se examinan posteriormente encl capitulo 7. 4.9 DIAGRAMAS DE CONTROL, Con mucha frecuencia surge la necesidad de controlar periédicamente la fabricacidn de un producto, quizis para observar si los articulos individuales contienen, en promedio, la cantidad correcta de una sustancia dad, y para asegurar que no existe demasiada variaeisn, ‘Una forma de hacerlo es tomando pequetias muestras a intervalos regulates. Considere la situacién eoncreta en que se controla el peso de las pastillas que salen de una linea de produecién, Idealmente la medida del peso de cada pastlla deberia ajustarse a un valor cxacto, fo, aunque en la préctica habra cierta variaci6n aleatoria de una pastila a otra, Esta variacién se debe en parte al ertor aleatorio al realizar la meclicién y en parte a las diferencias reales en peso entre las pastillas. Suponga que conocemos el tamatio de la ariacién aleatoria global, medida por la desviacién estindar de In poblacién, 0, de experiencias anteriores; si el proceso esta bajo control, es decir que, los pesos de las Pastilas producidas si tienen el peso medio ji ¥ desvincién esténdar g, entonces para ‘muestras de m pastllas, cerca del 95 % de las medisis muestrales se encontraran incluidas en ¢l intervalo uo + 2o/VH y aproximadamente el 99.7% dentro del intervalo joo + 30/n Ivease Cap. 2, Bes. 2.5) y (2.7)}. Un diagrama de control es una erifica en la que se presentan consccutivamente los valores de las medias muestrales de manera que se pueda tomar cualquier accién correctora lo mas ripido posible. En la figura 4.2 se mues- {1a un tipo de diagrama de control, conocido como diagrama de Shewhart, para el pro- ees0 deserito, Se representa el valor de la media muestral, X, en funcién tiempo, y cuando el proceso esti bajo control los valores de ¥ se distribuyen normalmente en torno 4 fy, Hay tambien dos pares de lnneas horizontales en el diagrama: las lineas de alerta en Ho ofa y ls Hineas de aceidn ex su + 3oj'n . Bl objeto de estas linea esta indicado Por sus propios nombres. Puesto que la probabilidad de que tna media eaiga fuera de las Tineas de accion, cuando el proceso esti bajo control, es solamente 0,003 (es decir, 3 de A Line: cién superior a Linea de alerta superior Valor objetivo wea de accién interior Figura 4.2. Un diagrama de Shewhart tipio. ‘cada 1000), en el caso de que esto ocurra lo normal sera detener el proceso e investigar lo sucedido. La probabilidad de que ¥ caiga entre eada par de lneas de accién y de alerta esté proxima a 0.025 (es decir, 1 en 40): un punto que cayera aqui no seria causa de preocupa- Cid, pero si dos puntos consecutivos caen en esta zona habria que detener el proceso. Se puede observar que un diagrama de control muestra una setie de pruebas de sigifica~ cidn, correspondiendo las lineas de aviso y de accidn a los valores criticos para P ~ 0.05 y P= 0,003 respectivamente. En ocasiones el proceso se poxtria detener cuando esté todavia bajo control (un error de Tipo 1, véase la Sec. 3.13), aunque, el riesgo de que esto suceda es bajo. Existen dos razones por las que los puntos podrian empezar a caer fuera de las lineas de accién. La primera, la media de los articulos proclucidos conocida como media del proceso, puede haber derivado hacia fuera del valor objetivo; en segundo lugar puede existir un ineremento en la variacién, de manera que las lineas de aviso y de accion no indiquen las probabilidades correctas, sino que estén demasiado proximas al valor objetivo. Reciprocamente, un descenso en la variacién significa que puede no detectarse un cambio en la media del proceso, debido a que las lineas de aviso y de accion no indican las probabilidades correctas y estin demasiado lejos del valor objetivo. Por estas razones es ‘importante estudiar Ia variaciGn de un proceso asi como su valor medio, Esto se hace con ‘mayor facilidad wtlizando el intervalo, w (es decir, la diferencia entre el valor mis grande ¥¥ el mas pequefio) de cada muestra tomada. El diagrama de Shewhart aclecuado se puede ‘construir con la ayuda de tablas que proporcionan las lineas de aviso y de accion, y el valor objetivo de w para valores diferentes de n y o (véase Ia bibliografia de este capitulo). Los dliagramas de medias e intervalos se utilizan simultineamente, y se toman acciones apropiadas si los puntos eaen fuera de las lineas sobre cualquier diagram. ‘Todavia no hemos considerado con detalle conto establecer un valor para 9; esto es decisivo al construit los diagramas de control para ¥y w;a veces ose denomina eapacidad del proceso, debido a que mide la variacién inherente. Ya que es una desviacién estindar de una poblacién debe estimarse a partir de una muestra muy grande, por ejemplo, de pastllas, Esto podria causar dificultades: necesitamos estar seguros de que cuando se tomen estas medidas no habri derivas en la media del proceso que proporcionarian un valor Linea de accién superior cerréneamente alto de , ;pero no hemos construido tadavia el diagrama para seguir la Linea de alerta superior ‘media! Este problema circular se supera tomando un gran miimero de pequetlas muestras 85+———— durante un periodo. A partirde cada muestra se puede calcular una estimacién de la variantza dentro de muestras que no se ve afectada por las posibles variaciones entre las muestras. ‘a 0 Valor objetivo $$ Estas estimaciones se pueden promediar pata dar un valor de la capacidad det proceso Bop— 25 oe [véase la Sec. 3.9 ()]- En la prctica, por lo general se utilizan los intervalos de las muestras, ° ° is eee ya que esto conduce a calculos mas simples, aunque implica el mismo principio. 2° oo | _ Linea de alerta interi Una consideracisn importante al utilizar un diagrama de Shewhart es larapidez con que se detecta un eambio brusco en la media del proceso. Cuando ésta cambia, el siguiente punto no eaera necesariamente fuera de las lineas de aviso o de accisn; por ejemplo, si cambia en 3of¥H ,entonees existe una probabilidad de 1/2 de que el siguiente punto caiga fuera de las lineas de accion, pero si la media del proceso cambia en Loi, esta probabilidad se reduce a 1/40. EI niimero promedio de puntos que se deben representa antes de que sea detectado un cambio en la media del proceso se deniomina longitud media de racha (LMR). Por supuesto, ello depende del tamaio del cambio en la media del [ieee ee proceso en comparacién con afV7 cuanto mayor sea el cambio, se detectaré con mas 5 10 15 rapidez. Por ejemplo, si la media del proceso cambia en 1o/Vm, entonces fa LMR antes «de que una media muestra caiga fuera de las lineas de accidn es aproximadamente de 50, Si el proceso se detiene cuando dos puntos consecutivos caen fuera de la linea de aleita, Figura 43 Diagrama de Shewhart pata los datos dela tabla 4.3. la LMR queda aproximadamente dividida por dos. Puesto que la LMR depende del cambio en la media del proceso comparada con of , se puede reducir aumentando et tamafio de la muestra: el mayor tamaiio que puede tomarse en la prictica suele esta daclo per considercines de ‘costos y tiempos: por lo regular se toman tamafios de muestra entre eee se Linea de accién inferior Numero de observacién ekjetivo = 80; of (Conocido) = 2.5 Un tipo diferente de diagrama de control, conocido como diagrama de sumas acumu- ‘Niimero de (Media muesteal) ~ Indas (DSA), utiliza todas las medias muestrales previas, en lugar de la tiltima o de las dos Media muestral__(valerobjetivoy SA tiltimas como hace cl diagrama de Shewhart. SA son las siglas del término “suma 82 2 2 acumulada”, es decir, la suma de las desviaciones de las medias muestiales del valor » 4 3 objetivo, acumuladas de atras hacia adelante. Un ejemplo aclarari el caleulo: E 3 " 2 2 1 Ejemplo, fn a tabla 4.3 8 proporciona el valor de la media para una serie de muestras t 0 Se sabe que el valor de o/Vn es 2.5 y la figura 4.3 muestra cl diagrama de Shewhart 80. 0 o para las medias naturales. Se ve que, aunque no quedan puntos fuera de las lineas de 9 “1 a aviso, una serie de valores cae a un lado del valor objetivo. % a En la tabla 4.3 también se muestra cl edleulo de las sumas acumuladas. Es obvio W : que si el proceso esti bajo control, las desviaciones positivas y negativas son igual- is 3 mente probables, por lo que la suma acumulada deberia oscilar alrededor de cero; estos. 16 4 valores se encuentran representados en la figura 4.4. Para ofrecer una buena impresion 76 = visual, el DSA aparece dibujado de tal forms que la distancia correspondiente a 2of1n-sobee el eje vertical es igual a la distancia entre observaciones sueesivas sobre ¢f ee horizontal 35 Se Del DSA se desprende que Ia media del proceso cambie después de tomar la octava ‘muestra, Una ventaja del DSA es que indica en qué punto el proceso se salié de control. 30] 20 SA 10 °° 9 Numero de observacion =10 ° ° -20 ° -30 Figura 4.4 Diagrama de sumas acumuladas (SA) para fos datos de la tabla 4.3 Para probar si una tendencia en un DSA indica que la media del proceso ha cambiado ¥ que esto no se puede atribuir a simples vatiaciones aleatorias, puede utilizarse un ‘dclimitador V. Como se muestra en la figura 4.5 un delimitador en forma de V, de preferencia grabado en plistico claro para poder superponerse (transparencias convenci nales), se sitia en ef DSA con su eje horizontal y su vértice a una distancia d ata derecha de Ia tltima observacién. El semiangulo entre los brazos de la V se denomina @. Se dice ‘que el proceso esta bajo control si todos los valores de la SA caen entre los brazos de la V, como se indica en la figura 4.5. La figura 4.6 ilustra una situacidn en la que el proceso esta fuera de control: dos de los valores de SA se encuentran fuera del brazo superior de la V, To que indica que la media del proceso ha caido por debajo del valor objetivo (véanse las Figs. 4.3 y 4.4). Por supuesto, el rendimiento del detimitador dependera de los valores elegidos para 8y d. Cuanto mayor sea el valor de d (y menor el valor de 6), mais probable sera que un valor dado eaiga fuera de los brazos de la V. Estos valores deben clegirse de ‘manera que aparezcan pocas falsas alarmas cuando el proceso esté bajo control pero que se detecta ripidamente un cambio importante en la media del proceso, Otros detalles acerca de la dependencia de la LMR de @y d para diferentes cambios en la media del proceso se encuentran en tna monografia LC. citada en la bibliografia de este capitulo. En general, Ja LMR pata un DSA es inferior que para un diagrama de Shewhart con el mismo tamaio sie muestra Un DSA también puede utilizarse para estimar el tamaiio del cambio ocurrido en la ‘media del proceso cuando éste se encuentra fuera de control. Si, por ejemplo, la media de! proceso disminuye en A, entonces eada media muestral, en promedio, seri el valor objetivo menos . Como resultado, la SA disminuira en promedio en & para cada punto repre- sentado. Asi pues, {a pendiente promedio de la linea que une tos puntos de la SA roporciona una medida del cambio en la media del proceso y, por consiguiente, la ‘correccion necesara, SA Numero de observacién Figura 4.$ Uso de un delimitador V con el proceso bajo contro. SA Numero de observacién Figura 4.6 Uso de un delimitador V con el proceso fuera de control Los métodos descritos en esta seccién se pueden utilizar tambien para controlar la exactitud y precision de los analisis de rutina en ef laboratorio, A intervalos de tiempo fijos sobre una muestra estandar, se toma un mimero pequefio de muestras repetidas, y la media y el intervalo de tas mediciones repetidas se representan sobre los diagramas de control. El diagrama de control para la media controla la exactitud, y la concentracién conocida de analito en el estindar es el valor objetivo. Para el intervalo, esta consideracién controla la precision, y el valor objetivo es la capacidad del proceso. De nuevo es necesario establecer tun valor para Ia capacidad del proceso con el fin de construir fos diagramas de control. En este caso, la capacidad del proceso estar limitada por el error aleatorio que se produce al tomar las mediclas, en lugar del error que se comete al preparar un estindar. Esto se puede verificar al preparar una serie de estandares y que cada uno contenga el mismo nivel (nominal) de analito, y haciendo una serie de mediciones repetidas sobre cada estindar, Se puede utilizar ANOVA para verificar que la varianza entre estindares no sea significativa comparada con el error aleatorio de las mediciones y también para estimar esto ultimo, Aqui “repetidas” significa una medicién repetida de tal forma que se repiten todas las clapas del anilisis, estimando de esta manera todas las posibles contribueiones al error aleatorio. BIBLIOGRAFIA Davies, O. L. y Goldsmith, P.L., Statistical Methods in Research and Production, Londres, Longmans, 1972, Proporciona ejemplos detalles de c6nto se establece la capacidad de procesos en fs consttucetin de dingramas de contol Kateman, G. y Pijpers, FE, Quality Control in Analytical Chemistry, Nueva York, Wiley, 1981 Proporciona tn tratamiento muy detallad del muestreo, Montgomery, D. C., Introduction to Statistical Quality Control, Nueva York, Wiley, 1985, Da un tratamiento detaliado de todos los aspectos del contol de Ia calidad Neave, H. R,, Elementary Statistics Tables, Londres, Allen & Unwin, 1981. Contiene una tabla con ‘una deseripeion detallada de sus usos para construr dingramas de Shevwhart para ¥y w. Werninont, G., Use of Statistics o Develop and Evaluate Analytical Methods, Spendley, W.(Ed.), Association of Official Analytical Chemists, Virginia, Arlington, 1985, Disefiado como el sucesor sctunlizado de Yuden y Steiner (véase mis abajo) Woodward, R. HL. y Goldsmith, PL, Cunmdative Sum Techniques, Monografia LCI. No. 3, Einburgo,Otiver & Boyd, 1964. Un tratamiento detallado de DSA. ‘Youden, W.J.y Steiner, E. H., Statistical Manual ofthe Association of Oficial Analytical Chemists, Association of Official Analytical Chemists, Virginia, Arlington, 1975, Un manual clisico sencillo y bien eserito sobre los ensayos de eolaboracien Harlley.T. F, Computerized Quality Control: Programs for the Analytical Laboratory. Chichester, Horwood, 1987. Proporcions prograinas de computador para utilizarlos en control de calidad: los programas también se encuentran disponibles en disquetes. EJERCICIOS 1. Se proponen dos esquerias de muestreo para una situacién en la que se sabe, por cexperiencias, que la varianza muestral es 10 y la va anbitraras), eriores waa de-medicion es 4 (en unidades Esquema 1: Tome 5 incrementos de muestra, mézclelos y realice un anilisis por duplicado. Esquema 2: Tome 3 inctementos de muestra y realice un adlisis por duplicado de cada una, Demuestre que la varinza de la medicin es la misma para ambos esquemas. {Qué relacin entre costo de muestreoy costo de anlisis se debe sobrepasar pata que el segundo tsquema sea el mis econémico? Los datos de fa tabla adjunta dan la concentracin de albsimina medida en el suero sanguineo de un adulto. Se toms una muestra de sangre durante cuatro dias consecutivos y se determind Ta concentracién de albiimina en el suero por triplicado. Dis Concentracién de albimina (normalizada, unidades arbitratias) 1 a ol a a 7 36 56 3 50 46 46 4 37 4 9 Demuestre que ls concentracién media para los diferentes dias diet significativamente. Estime la varianza de lavariaciOn dia a dia (es decir, "Ia variacin muestra”) Para estimar las varianaas de medicién y muestrales se determin la concentracion de halofu- ginona en higado de pollo, e tomaron cuatro inerementos de muestra de diferentes partes del higado y se hicieron mediciones por triplado sobre cada una de ellas. Se obtuvieron los siguientes resultados (mg/kg): Muestra Mediciones repetidas A 025 022 023 B 022 020 019 c 019 021020 D 024 022 0 grande que a varianza de medicién Verifique que la varianza muestra es signifietivamente: ‘yestime ambss varianzas. Se proponen dos esquemas disponibles de muestreo: nézelelos y haga mediciones por evadruplicado. en: Tone 6insemetos dems a uno haga mediciones por duplicado. Esquema 2: Tome 3 incrementos de muestra y sobre ea Caleule la varianza total de la media para ead esquema, Para estimar lacapacidad de un proceso, se hicieron mediciones sobre 6 muestras de tamanio 4, ‘como se muestra en la tabla adjunta (ena pctica se necesitaran al menos 25 detales muestras). Estime I eapacidad del proceso, . Sil valor objetivo es 50, calcule las posiciones de las lineas de aviso y de accion de un diagrama de Shewhart para la media muestra Muestras Valores L 488 508513479 2 486 506 «493497 3 482 SLO 493503, 4 48 546 507 53.9 5 496 542483505 6 S48 «HB 523525 5. Enun ensayo de colaboracién, se enviaron dos muestras muy similar Iaboratories, cada uno de los euales realiza una determinacion del n de aceite (A y B) a 15 el de cadmio en cada ‘muestra utilizando la téenica de emisién de plasma por acoplamiento inductive. Se obtuvieron los siguientes resultados: Laboratorio Dibuje el diagrama de estas dos muestras pata estos Niveles de Cadmio (ppm) B 100 47 21 3 y comente la principal fuente de error en el ensayo de colaboraciGn. Estime la vatianza global, a varianza de medieion, y el ‘componente de error sistematico de la varianza de ls resultados: Errores en analisis instrumental; regresion y correlacion 5.1 ANALISIS INSTRUMENTAL Las técnicas de analisiselisico 0 “quimica himeda” como volumetrias y gravimetrias se utilizan todavia en muchos laboratorios y también se enseiian ampliamente en cursos de Quimica Analitca. Dichas técnicas suministran excelentes introducciones a la manipula- ign y otras pricticas requeridas en el trabajo analitico; son ideales para andlisis de alta precisin, especialmente cuando se utiliza un pequefio niimero de muestras, y son necesa- rias para el andlisis de materiales estindar. Sin embargo, en este momento no hay duda de que muchos andlisis se efectian por métodos instrumentales. Las técnicas que utilizan espectrometria de absorcidn y emisién a varias longitudes de onda, diferentes métodos clectroquimicos, espectrometria de masas, cromatografia gascosa y liquida, y métodos ra- dioquimicos y térmicos, probablemente suponen el 90% de todo el trabajo analitico actual, © incluso mas. Hay varias razones para est. (1) Los métodos instrumentales pueden realizar andlisis que son dificiles o imposibles por los métodos clisicos. Mientras que éstos pueden detectar slo rara vez. especies uimicas a niveles de submicrogramos, muchos métodos instrumentales son sorprenden temente sensibles. Por ejemplo, los métodos luminiscentes han detectado moléculas ‘orginicas a nivel de 10""M. Por lo general, solo es posible determinar un analito ala vez por métodos de “quimica himeda”, si bien la espectrometria de plasma puede determinar diez 0 més elementos simulténeamente (y a muy bajas concentraciones), mientras que los ‘métodos que combinan HPLC (cromatografialiquida de alta resolucisn, high-performance liquid chromatography) con deteccién espectrosedpica pueden identificar y determinar ‘muchos componentes de mezclas ongénicas complejas en pocos minutos. Atin mas, el intervalo de concentracién de un método conereto de anilisis clisico esta normalmente limitado por consideraciones tesrico-practicas. Asi, titulaciones con AEDT (EDTA, en inglés) pueden realizarse con éxito con concentracién de reactivo del orden de 10M, aunque se establece un limite superior (~0.3M ) por Ia solubilidad del AEDT en agua. El intervalo de concentracién ttl en métodos clisicos es generalmente de 2 a3 érdenes de rmagnitud (es decir, potencias de 10). Por el contrario, algunos métodos instrumentales pueden determinar concentraciones de anaito en el intervalo de seis o més érdenes de rmagnitud: esta caractristca tiene importantes repercusiones para el tratamiento estadisti- 0 de los resultados, como veremos en la proxima section (2) Para una gran variedad de muestras, el anlisis instrumental suele ser més ripido y 1 menudo ms barato que los métodos manuales que requieren de mucha mano de obra En aniliss elinieos, por ejemplo, se presenta con frecuencia Ia necesidad de realizar el mismo anilisis en una veintena o incluso en cientos de muestras de sangre © suero sanguineo o plasma cada dia; a pesar del alto costo inicial del equipo, esto, se realiza, por Jo general, usando sistemas completamente automdticos. La automatizacién ha llegado a set un aspecto tan importante en quimica analitica, que la facilidad eon la cual puede automatizarse una técnica conereta a menudo determina si se utiliza © no. Un métod automiticotipicooftece la posibilidad de procesar muestras a razon de cien por hora o ms: el equipo tomaré un volumen medido de muestra, la diluird adecuadamente, provocara una 0 mas reacciones, y determinara y registrard la concentracion del analito 0 un derivado producido en las reacciones. Evidentementeen el anlisis automatico surgiran problemas especiales de estimaciones de error los errors sistematicos, por ejemplo, deben, ser identificados y corregidos tan rapido como sea posible. (G) Los instrumentos analiticos modemos pueden ponerse fécilmente en interfaz con computadores. La tendencia actual consiste en utilizar microcomputadores de 8 bits 0 16 bits con dispositivos de almacenamiento de informacicn de disco duro o blando, Tales sistemas pueden traer consigo un grado de perfeccionamiento razonable en el control del instrumento y manejo de datos. Por ejemplo, el computador puede controlar tiempos de ‘muestreo o aparatos de inyeccidn mediante activacion eléctria con conmutadores. Una ve2 que se han obtenido los resultados analiticos, el computador puede procesar los datos, realizando operaciones tales como la generacin de derivadas de espectrosotransformadas de Fourier. También puede evalua ls resultados estadisticos —el tema recurtente de este libro—, y comparar los resultados analiticos con datos almacenados en su memoria, asi como comparar especttos y otros datos. Todos estas recursos se consiguen eon compu- tadores de bajo costo que funcionan a velocidades aceptables. Otra posibilidad importante es el desarrollo de instrumentes “inteligentes” que realizan, por ejemplo, procesos de cptimizacién automaticos (véase el Cap. 7). No hay duda de que con los recursos de los computadores y su répida incorporacién a Ia gran mayoria de los instrumentos analiticos, tos aumentarin su potencialidad y eficencia 5.2. GRAFICAS DE CALIBRACION EN ANALISIS INSTRUMENTAL La capacidad de las téenicas de andlisis instrumental para manejar un intervalo amplio de coneentraciones de analito significa que se calculan los resultados, y se evahian los errores aleatorios de una manera concreta, que difiere de la que se utiliza cuando se repite una sola ‘medicin varias veces. El procedimiento habitual es como sigue. El analista toma una se de muestras (normalmente tres 0 cuatro, y posiblemente alguna mis) en las que se conoce Ja concentracién de analito, Estas calibraciones estandar se miden en el instrumento Analitico en las mismas condiciones que las usadas para las muestras problema (es decir, las “desconocidas”), Una vez que se ha establecido la grifica de calibracisn, se puede Sefial Numero de observacin Figura $.1. Procedimiento de calibracién en anslsis instrumental: © puntos de elibracions © rnucstra problema ‘obtener la concentracicn de analito en cualquier muestra problema por interpolacién, como se indica en la figura 5.1. Este procedimiento general plantea varias preguntas estadisticas importantes. (1) gBs lineal la grafic de calibracién? Si es una curva, gqué forma tiene? 2) Teniendo en cuenta que cada uno de los puntos de Ia linea de calibracién esta sujeto a errores, {cul es la mejor linea recta (0 curva) que pasa por esos puntos? 3) Suponiendo que la calibracién es realmente lineal, ;cudles son los errores estimados y los limites de confianza para la pendiente y la ordenada en el origen de Ia recta? (4) Cuando la grifica de calibracién se usa para el andlisis de una muestra problema, {cuales son los errores y los limites de confianza para la concentracién determinada? (5) {ual esel limite de deteccidn del método? Esto es, cual es la menor concentracién de analito que se puede detectar con un nivel de confianza predeterminado? Antes de abordar estas preguntas detalladamente, debemos considerar una serie de aspectos sobre el trazo de grficas de calibracién. Primero, por lo regular, es eseneial que Jos estindares de calibracién cubran el intervalo completo de concentraciones requerido en Jos analisis subsiguientes. Con la importante excepcidn del “método de las adiciones estindar”, que se tratard en una seecién posterior, la coneentracion de muestras problema se determina normalmente por interpolacién y no por extrapolacion. En segundo lugar, es ‘muy importante inctuir el valor de una muestra “en blanco” en la curva de calibracién. La muestra en blanco no contiene ningtin analito agregado deliberadamente, pero contiene los mismos disolventes, reactives, etc., que las otras muestras problema, y esti sujeta exactamente a la misma secuencia del procedimiento analitico. La sefial del instrumento dada por la muestra en blanco no ser a menudo cero. Desde luego, esta sujeta a errores, como los otros puntos de la calibracién, y no tiene sentido, en prineipio, sustraer el valor del blanco de los otros valores estindar antes de dibujar la grfica de eaibracién, Finalmente, se debe subrayar que la curva de calibracién se representa siempre con la respuesta del instrumento en el eje vertical (y) y la concentracisn estindar sobre el eje horizontal (x). Esto se debe a que muchos de los procedimientos que se deseriben en las secciones siguientes suponen que todos los errores se presentan en los valores de y y que las concentraciones estindares (valores de x) se encuentran libres de error. Este supuesto se analiza posteriormente El lector deberia considerar que los métodos descritos ahora siguen generando contro- versia lo cual es patente en muchas reuniones cientificas y trabajos originales acerca de Ia calibracidn. Muchas de estas controversias derivan del hecho de que los métodos uilizados generalmente se apoyan en dos supuestos. El primero es el que mencionamos en el pirrafo anterior, 0 sea, que los errores en Ia ealibraeién s6lo ocurren en los valores dey. En muchos anilisis instrumentales de rutina, este supuesto puede estar bien justficado. Los estindares pueden prepararse con un error de ca, 0.1% o inferior (véase el Cap. 1), ‘njentras que las mediciones instrumentales podeian tener un coeficiente de variacidn del 1.412% omayor, No obstante, con la aparicién en los tltimos aftos de algunos instrumentos automticos de alta precision nuevamente se han cuestionado estos supuestos, lo que ha levado a algunos usuarios a preparar sus disoluciones estandar por peso en lugar de usar 1a combinacién de peso y Volumen, que es menos exacta El segundo suptesto es que la magnitud de los errores en y sea independiente de la coneentracién de analito, El sentido comin indica que es improbable que esto sea verdad: si, por ejemplo, los errores relatives en la medicién son constantes, los errores absolutos ‘aumentaran a medida que aumenta la concentracién de analito. Como veremos, es posible Imodificar el procedimiento estadistico teniendo en cuenta tales factores; sin embargo, en 1a prictica los procedimientos modificados (y bastante mas complejos) parece que no se adoptan en muchos de los casos donde deberian utilizars. 5.3. EL COEFICIENTE DE CORRELACION MOMENTO-PRODUCTO Aqui se analiza el primer problema planteado en la seccién anterior: ges lineal la repre sentacién grifica de la calibracién? Supongamos que la representacién de una linea recta toma la expresién algebraica: yrbrta 6.) donde b es la pendiente de la recta y a su ordenada en el origen (punto donde corta al eje 2): Los puntos individuales sobre la linea se denotaran por (,y1) (normalmente la lectura del “blanco”), (42,93), (oy 32)---Gt, alt Ya €S decir, hay n puntos. La media de los valores de-x, por lo general, se denomina ¥y la media de los valores de y, la posicion (, 5) se eonoce come el “centro de gravedad” de todos los puntos. Para estimar si los puntos expetimentales se ajustan bien 0 no a una linea recta, calculamos el coeficiente de correlacién momento-producto, r. Para simplificar, deno- minaremos a este dato estadistico como “coeficiente de correlacién” debido a que en las ciencias cuantitativas es el més usado; sin embargo, encontraremos otros coeficientes de correlacién en el capitulo 6, El valor de r esti dado por: (5.2) ‘Un minucioso estudio de esta ecuacién muestra que r puede tomar valores en el intervalo de -1£r& +1. Comoe indica en la figura 5.2, un valor de r de ~1 describe una correlacién negativa perfecta, es decir, todos los puntos experimentales estén en la linea recta de pendiente negativa. En forma similar, cuando r~ +1, tenemos una correlacién positiva perfecta, ya que todos los puntos estén exactamente en una linea recta de pendiente rent oO . ° 5 10 oO ° Figura S:2 El coeficiente de correlacién momento-producto, r positiva. Cuando no existe correlacién entre x y y, el valor de r es cero. En la prictica analitica, las grficas de calibracién proporcionan frecuentemente valores numéricos de r mayores que 0.995 los valores de r menores que 0.90 son relativamente poco comunes. Un ‘ejemplo tipico de un ealeulo de r ilustra una serie de aspectos importantes. Ejemplo. Se ha examinado una serie de soluciones estindar de fluoresceina en un fluorimetro, y condujo a las siguientes intensidades de fluorescencia (en unidades arbitrarias): Intensided de fluorescencia: 2.1. «5.090 126.—«:173.«21.0 24.7 Concentracign, pel: o 2 4 6 8 wb 2 Determine el coeficiente de correlaci En la préctica, estos célculos seguramente se realizaran en una caleuladora progra- able o en un microcomputador, pero es importante, ¢ instructive, examinar un resul- tado calculado manualmente, Los datos se presentan en una tabla, como la que sigue. ys “3 24 6 50 “4 9.0 2 126 0 173 2 210 4 316 247 636 N6 13456696 917 ° m2 0 418282162 Fo 42/7 = 6; F=91IT= 13. Los niimeros que se encuentran por debajo de la linea, al pie de las columnas, son en cada caso las sumas de los nimeros de la abla (Note que E(x, - 3) y Z0% ~ y) ambos son cero.] Usando estos totales y la ecuacién (5.2), tenemos. 7 = 216.2/(112 » 418.28)! = 216.2/216.44 0.9989 Dos observaciones se siguen de este ejemplo. Como se muestra en la figura 5.3, aunque varios de los puntos se desvian notablemente de la “mejor” linea reeta(calculada utilizando los principios de la seccién siguiente), el valor de r es muy cereano a 1. La experiencia muestra que aun con grificas de calibracién bastante pobres a la vista, los valores coreespondientes de r son altos. En tales casos, el numerador y el denominador en la ecuacién (5.2) son aproximadamente iguales. Entonces es muy importante realizar el caleulo con tn mimero adecuado de cifras significativas. En el ejemplo dado, despreciar las cifras después del punto decimal daria un valor incorreeto de r de exactamente 1, ¥ utilizar s6lo una cifra decimal supondria un valor incorrecto der de 0.9991, Este aspecto £5 especialmente importante cuando se usa una caleuladora o microcomputador para determina r; tales herramientas no siempre proporeionan suficientes cffas. Fluorescencia Pendiente = 1.93, Ordena en el origen o 2 4 5 8 © Concentracién, pg/ml Figura 3 Grifica de calibracion de los datos dE LA PAg. 92. ‘Aunque los cocficientes de correlacién son sencillos de caleular, también son mal interpretados con facilidad, Debe tenerse en cuenta que el uso de la ecuacién (5.2) generaré un valor de r aun cuando los datos sean claramente de caricter no lineal. En la figura 5.4 se muestran dos ejemplos en los que un céleulo de r llevaria a conclusiones cerréneas. En la figura $.4(a) los puntos de la grifica de calibracién pertenecen a una curva; esta curva es suficientemente suave, aunque se obtiene un alto coeficiente de correlacién ‘cuando se aplica la ecuacién (5.2). De este ejemplo deducimos que siempre hay que representar fisicamente la curva de calibracién (en papel milimetrado en monitor de computador): si no es asi, del céleulo de r se puede deducir erréneamente una relacién de cardcter lineal. La figura 5.4(b) es na advertencia de que un coeficiente de correla- cién cero no significa exactamente que y y x no estén relacionados, sino que no estan linealmente relacionados. igura 5.4 Interpretaciones erréneas del coeficiente de correlacién,r. ‘Como hemos visto, los valores de r obtenidos en anilisis instrumental son generalmente ‘may altos, de manera que un valor calculado, junto con la propia grifica de calibracién, sucle ser suficiente para asegurar al analista que de hecho ha obtenido una relacién lineal Util, Sin embargo, en algunas circunstancias, se obtiene valores de r mucho més bajos; una de estas situaciones se analizaré posteriormente en la seccidn 5.9. En estos casos sera necesario utilizar una prucbs estadistica adecuada para ver siel coeficiente de correlacién es realmente significativo, considerando el mimero de pares de valores usados en su céleulo. El método més simple es calcular un valor (véase el capitulo 3 para un estudio mais completo de la prueba 1), usando la ecuacién [Ve va-P) 63) El valorcalculado de rse compara con el tabullado al nivel de significacion deseado, usando ‘una prueba rde dos colas y (n - 2) grados de libertad, La hipétesis nula en este caso es que hho existe correlacin entre x y y. Si el valor calculado de # es mayor que el tabulado, la hipdtesis mula se rechaza; esto es, se concluye que existe una correlacién significativa. 5.4 LARECTA DE REGRESION DE y SOBRE x En esta seceidn, suponemos que existe una relacién lineal entre la seal analitica () y la concentracién (2), ¥ mostramos e6mo calcular la “mejor” linea recta a través de los puntos de la grifica de calibracién, cada uno de los cuales esti sujeto a un error experimental Hasta aqui hemos supuesto que todos los errores se encuentran en y (véase la Sec. 5.2), ahora trataremos de busear Ia recta que minimice las desviaciones en la direccion y entre los puntos experimentales y la linea calculada. Ya que algunas de esas desviaciones ((éenicamente conocidas como los residuos de y) seran positivas y otras negativas, es rezonable intentar minimizar la suma de los cuadrados de los residuos. Esto explica el uso frecuente del término “método de los minimos cuadrados” para este procedimiento, La linea recta buscada se calcula basindose en este principio: la linea debe pasar por el “centro de gravedad” de los puntos, (Z,5). Puede demostrarse que Ea) 0-9) L(y iP Ce) = bi 63) La linea calculada de esta forma se conoce como la recta de regresin de y sobre x, es decir, la recta indica cémo varia y euando x se ajusta a los valores elegidos. Es muy importante notar que la recta de regresién de x sobre y no es la misma recta (excepto en el caso muy improbable donde todos los puntos caigan sobre una linea recta, exactamente cuando r~ 1. La recta de regresion de-x sobre y (que tambien pasa por el centro de gravedad de todos los puntos) supone que todos los errores ocurten en la direccién x. Si se mantiene rigurosamente el convenio de que la seftal analitica se representa sicmpre sobre el eje y y la coneentracién sobre el eje x, debemos usar siempre la recta de regresidn de y sobre.xen los experimentos de calibracién. Ejemplo, Calcule la pendiente y ordenada en el origen de la recta de regresién para los datos expuestos en el ejemplo anterior (See. 5.3). En la seceisn 5.3 caleulamos que, para esta curva de calibracién: ¥ = ¥) (1-H) = 216.25 Fx HP + 112; = 6 Y= 13.1. Usando la ecuaciones (5.4) y (5.5) caleulamos que b= 216.12/112 = 1.93, a= 13.1 ~ (1.93 6)= 13.1 ~ 11.58 = 1.52 La ecuacién para la recta de regresion es y ~ 1.93x + 1.52. Es obvio que los términos utilizados para calcular rson necesarios también enel caleulo de ay b: esto se facilita con una calculadora o un programa de computador sencillo. Las resultados de los calculos de la pendiente y ordenada en el origen se representa en. Ia figura 5.3. De nuevo es importante recalcar que la ecuaciones (5.4) y (5.5) no deben emplearse mal porque sélo darn resultados itiles cuando un estudio previo (eileulo de r ¥ una inspeccién visual de los puntos) indique que una linea recta es coherente con el experimento que se trata. Para calcular rectas de regresién pueden usarse también métodos ro paramétricos (es decir, métodos que no hacen supasiciones acerca de la naturaleza de la distribucién del error): este tema se trata en el proximo capitulo, 5.5 ERRORES EN LA PENDIENTE Y ORDENADA EN EL ORIGEN DE LA RECTA DE REGRESION La recta de regresién calculada en la accién anterior se utilizari en la prictica para cstimar Ia concentracién de las muestras problema por interpolacién, y quizas también para estimar el limite de deteecién del procedimiento analitico, Los errores aleatorios en. los valores de la pendiente y de ta ordenada en el origen son importantes, por lo que consideramos ahora las ecuaciones utilizadas para calcularlos. Primero debemos calcular el dato estadistico sy, , que esta dado por: EO; rfp os ‘Se comprueba que esta ecuacién utiliza los residuos de y, y; ji, donde los valores 3 son los puntos sobre la recta de regresin calculada, correspondientes a los valores individuales exes decir, los valores de y “ajustados” (Fig 5.5) El valor dey para un valor de x dado se calcula ripidamente a partir de la ecuacién de regresién. La forma de Ia ecuacién (5.6) es similar a Ia de la ecuacién de la desviacién estindar de una serie de mediciones repetidas (Ec. (2.2)}; pero difiere en que las desviaciones (), ~ 5), son sustituidas por los residuos, (};~ 3), y el denominador contiene el término (1 - 2) en ver de (n - 1). En un céleulo de regresidn lineal el nimero de grados de libertad (véase la See. 2.4) es (n - 2) Esto refleja el hecho obvio de que para representar una linea recta sélo se necesitan dos puntos. Después de obtener un valor de sya, podemos calcular sy y sy, las desviaciones estindar para la pendiente (b) y la ordenada en el origen (a). Estas estén dadas por: an 5.7) ; Los valores de ss y ss se pueden utilizar de la manera usual (véase el Cap. 2) para estimar limites de confianza para la pendiente y la ordenada en el origen. Asi, los limites de confianza para la pendiente estin dados por b + 1s,, donde el valor de tse obtiene para un hivel de confianza deseado y (n - 2) grados de libertad. De manera similar, los limites de confianza para la ordenada en el origen estin dados por a ts. x Figura 5.5. Los residuos de y de una regresién lineal Ejemplo, Calcule la desviacién estandar y los limites de confianza para la pendiente y la ordenada en el origen de la recta de regresin calculada en la seccién 5.4 Es posible que no realicemos este tipo de edleulo directamente en una calculadora programable, aunque se han desarrollado programas de computador titles (véase la bibliografia del capitulo 1). Aqui se efectia el caleulo manualmente, utilizando una tabla estructurada como antes. 0 058 0.3364 4 038 onass 6 024 0.0576 x6 050 0.2500 6 034 0.1136 100 ons ose M44 002 0.0004 Tad = 364 Lor JP = 09368 A partir de la tabla, y utilizando la ecuacién (5.6) se obtiene Sy. + VO936RS ~ VOTETSE = 0.4329, De la seccién 5.3 sabemos que E(x; ~ 3)? ~ 112, y la ecuacién (5.7) puede utiizarse para mostrar que 8 ~ 0.4329/V TIE ~ 0.4329/10.58 = 0.0409, El valor de t pata (1 - 2) = 5 y el nivel de confianza del 95% es 2.7 (tabla A.1), Entonces los limites de confianza al 95% para b son b= 1.93 £2.57 x 0.0409 = 1,93 £0.11 La ecuacién (5.8) requiere conocer E17, calculado de la tabla como 364. Asi, podemos escribir 5S, = 0.432 36VIBA - 0.2950 cde manera que los limites de confianza son a= 1.52 £2.57 «0.2950 = 1.52 £0.76 En este ejemplo, ef nimero necesario de ciftas significativas no es grande, pero es anvenient uilizarsiempre el mimeo mixin disponible draneel eslelo,redondeando 5.6 CALCULO DE UNA CONCENTRACION Una vez determinadas la pendiente y la ordenada en el origen de la reeta de regresion es facil caleula un valor de comespondiente a cualquier valor de ymedido, Pero surge un problema més complejo cuando necesitamos estimar el error en tna concentracién cafe Jada titizando una reeta de regresin. El cdleulo de un valor de x para un valor de y dado conlleva elusode la pendiente (b)y la ordenada en el origen (a) y,como vimos en laseccién anteris, ambos vores estn sets a error, Como res, la determinacion del eror en el valor de x es extremadatnente compleja y muchos profesionales utilizan la siguiente formula aproximad: me — aa (or Fiesta eeuacién yes el valor experimental de ya partir del cual se determina el valor 9 de la concentracién; sw es la desviacién estindar de xs, y los otros sinibolos tienen sty significado usual. En algunos casos, un analista puede realizar varias lecturas para obtener «l valor de yu; si se dispone de m lecturas, entonces la ecuacion para sa se convierte en Como se esperaba, la ecuacién (5.10) se reduce a la (5.9) si m ~ 1, Como siempre, los limites de confianza pueden calcularse como x9 + ts, con (1 ~ 2) grados de libertad. Como mencionamos antes, un programa de computador simple realizar todos estos calculos, ‘aunque muchas calculadoras preprogramables no sersin del todo adecuadas. Ejemplo. Usando los datos del ejemplo de la seccién 5.3, determine los valores de 2 y soy ls limites de confianza de xo para soluciones con intensidades de fluorescencia de 2.9, 13.5 y 23.0 unidades. Tos valores de 20 se calculan fécilmente utilizando la ecuacion de regresion determinada en la seecién 5.4, y= 1.93x + 1.52. Sustituyendo los valores de yo2.9, 13.5 y 23, obtenemos los valores de xp de 0.72, 6.21 y 11.3 pg/ml respectivamente Para obtener los valores de suo correspondientes a los valores de 2 utilizamos ta ecuacién (5.9), recordando de las secciones precedentes que n = 7, B= 1.93, sy: = 0.4329, 5 = 13.1, y E(x ~ H? = 112. Los valores de yw 2.9, 13.5 y 23.0 proporcionan unos valores de sin de 0.26, 0.24 y 0.26, respectivamente. Los limites de confiaza cortespondientes al nivel del 95% (1 = 2.57) son 0.72 + 0.68, 6.21 + 0.62,y 11.3 0.68 pa/ml respectivamente. Este ejemplo aclara un aspecto de cierta importancia. Es obvio que los limites de ‘confianza son bastante mas pequetios (es decir mejores) para el resultado de yy = 13.5 que ‘para los otros dos valores de y. El estudio de la ecuacién (5.9) confirma que mientras que yo se aproxima a F, el tercer termino dentro del paréntesis se aproxima a cero, y yu al valor rminimo. La forma general de los limites de confianza para una concentracién calculada se muestra en la figura 5.6. Ademas, en un andlisis prictico un experimento de calibracién de este tipo proporcionari los resultados mas precisos cuando la sefal del instrumento medida ‘corresponda a un punto préximo al centro de gravedad de la recta de regresion, Si deseamos mejorar (es decir reducir) os limites de confianza en este experimento de calibracién, las ecuaciones (5.9) y (S.10) muestran que se puede considerar al menos dos aproximaciones. Podemos aumentar n, el mimero de puntos de la calibracién de la recta de regresién, y podemos hacer mas de una medicién de yo, y utilizar el valor medio de dichas m mediciones en el célculo de 2. Los resultados de tales procedimientos pueden establecerse considerando los tres términos dentro de los paréntesis, en las dos ecuaciones. En el ejemplo anterior, el término predominante en los tres célculos es el primero, o sea la unidad. Se sigue que en este caso (y en muchos otros) puede llevarse a cabo una mejoria en la precision midiendo yo varias veces y usando la ecuacién (5.10) en lugar de la ecuacién (5.9). Si, por ejemplo, se ha calculado el valor de yo de 13.5 como la media de cuatro determinaciones, entonces el valor de sa y ls limites de confianza serian 0.14 y 6.21 # 0.36 sespectivamente; ambos resultados indican que se ha mejorado sustan- cialmente la precisién. Por supuesto, si sc hacen muchas mediciones repetidas (suponiendo {que se dispone de suficiente muestra) se genera mucho mis trabajo y se obtiene sélo un beneficio adicional pequeio: el lector puede verificar que 8 mediciones de y produciran tun valor de syo de 0.12 y unos limites de confianza de 6.21 + 0.30 Bl efecto de nel nimero de puntos de calibracién, sobre los limites de confianza en la 38 Gu) La signifieacion de esta ultima definieion se aclara con mayor detalfeen fa figura 5.7 ‘Un analista que estudia coneentraciones traza se enfrenta a dos problemas: por un lado ne desea dar un informe de la presencia de analito cuando esté realmente ausente, pero pot otro, tampoco pretence informar que el analito esta ausente cuando de hecho esta presente. idad de que ocurra cada uno de estos errores debe minimizarse bajo una defini de un limite de deteceién. En la figura, la curva A representa la distribucién normal de valores medidos de la sefal del blanco. Seria posible identificar un punto y ~ Py hacia el borde superior de esta distribucién, y pretender que seria improbable que una sefal imi grande que ésta se debiese al blanco (Fig. 5.7), mientras que se supondria que una seiial menor que P indica una muestra en blanco. Sin embargo, para que una muestra dé tuna seial promedio P, el 50% de las sefales observadas seri’ menor que ésta, ya que tendra una distribucién normal (de la misma forma que para el blanco, véase mas aclelante) ‘que se prolonga por debajo de P (curva B). La probabilidad de concluir que esta muestra no difiere de la del blanco cuando de hecho lo hace es por lo tanto del 50%. El punto P, Limitede Limite de Ye decision deteccién de decision y (b) el Kimite de det. Figura $.7Definiciones de (a ll Hamado el limite de decisién, es insatisfactorio como un limite de deteccisn, ya que soluciona el primero de las problemas mencionados antes, pero no el segundo. Un punto mas adecuado esta en y = Q (véase la Fig, 5.7), de manera que Q esta situado al doble de Ta distancia que existe entre yp y P. Se puede demostrar que si ys - Q es 3.28 veces la desviacién estandar del blanco, ss, entonces la probabilidad de que cada uno de los dos tipos de error ocurra (indicados por las dreas sombreadas de la figura 5.7) es sélo del 5% Si, como se sugiere en Ia ecuiacion (5.11), la distancia yp ~ Q es sélo 3s, la probabilidad de cada error es aproximadamente del 7%; muchos analistas deberian considerar que esta definicion del limite de detecci6n es razonable. Es preciso insistir de nuevo en que esta definicién es completamente arbitraria, y esta abierta para que cualquier analista proponga una alternativa ante un propésito conereto. Por ejemplo, existen ocasiones en que un analista esta ansioso de evitar a toda costa la posibilidad de informar sobre ta auseneia de analito cuando de hecho esta presente, pero 1o contrario no es relativamente preocupante. Esta claro que cuando se cite un limite de deteccién en un trabajo 0 informe, debe proporcionarse la definicién utilizada para obtenerlo. Se han realizado algunos intentos para definir otro limite, el “limite de euanti- ficacién” (0 “limite de determinacion”), considerado como el limite mis bajo para medi- cones cuantitativamente precisas, en oposicidn a la deteccién cualitativa, Se ha sugerido un valor de y+ 10sy para este limite, aunque en a prictica no se ha utilizado ann A continuacién analizaremos cémo se obtienen en la prictica los términos yw ¥ sw cuando se utiliza una recta de regresion convencional para la calibracidn, tal como se deseribio ett las secciones precedentes. Un supuesto fundamental del método de los ‘minimos cuadrados sin ponderar que ya hemos estudiado en este eapitulo es que eada punto en a representacion grifiea (incluido el que representa al blanco o ruido de fondo) tiene luna variacién distribuida normalmente (s6lo en la direecién de y) con una desviacién estandar estimada por sys [Véase la Be. (5.6)]. Esta es la justificacion para representar las ccurvas de distribucién normal con la misma amplitud que refleja la figura 5.7; por lo tanto ¢ apropindo utilizar sy, en lugar de sy en la estimacién del limite de deteccién. Por supuesto, se puede realizar el experimento con el blanco varias veces y obtener un valor independiente para sp, pero es un procedimiento que leva tiempo, y en la prictica el uso de sys es bastante adecuado. EI valor de a, la ordenada en el origen caleulada, puede Utiizarse como una estimacién de yy, la propia sefal del blanco; deberia ser una estimacién Ins exacta de yp, que el solo valor de la medieién del blanco, yy Ejenplo. Estinve el limite de deteceién para determinar la fluoresceina estudiada en las Se utiliza la ecuacion (5.11) con los valores de yy (= a) y su (~ sys) caleulados previamente. El valor de y en e! limite de deteccién esta dado por 1.52 + 3 * 0.4329, es decir, 2.82. Et uso de Ia ecuacién de regresién conduce a un limite de deteccién de 0.67 pg/ml. La figura 5.8 resume todos los eailculos realizados a partir de los datos para determinar la fluoreseeina, Es muy importante evitar la confusion entre el limite de deteceién de una téenica con Su sensibilidad. Esta confusion surge, probablemente, porque no existe una palabra que Signifique “tener un limite de deteccién bajo”; la palabra “sensible” se utiliza generalmente con este propasito, lo que da lugara demasiada ambigiiedad. La sensibilidad de una téenica se define correctamente como la pendiente de una linea de calibracién y, siempre que la 25 ae yy= 15: 1932004 zo” | |+- 0.0089 \ Jia eter 0499 | LDD =0.67pg/m| qst|s, 0-25, Fluorescencia (oye sera betes Ont ORe 12 Coneentracién, pg/ml Figura 58 Resumen de los céeulos usando los datos de la pig. 92 oto de els ore conti, representa ea inl, puede ser media en csr panto ‘ a ecion de uk mclodo ecleula con ay de a zon de lo represetcion cercana al origen, y utiliza tanto la pendiente como la ordenada al origen. $8 ELMETODO DE LAS ADICIONES ESTANDAR amos qv un aaa desea determina la concetacin de plata en muestas de area tctitne por eepectortia de sbsorcon atomic. Si wliz los métodes se iy efeeuar na eabcion ene expectfotometo con cease es tee una st de lta pray wlzat grafic de calibracion resutane sa rreinolon de pat es ucts problema, Sin bare, ese modo s60 es Cine stanecluion asosa pura de ata da misma seal de sbsorcdn que una mocsta desechos de las secciones anter fotogrifica de desecho que contenga la misma concentracién de plata, En otras palabras, ‘cuando se usan soluciones puras para establecer Ia grfica de calibracién se supone que no hay “efectos de matriz”, es decir, disminucién o aumento en la sefial de absorbancia de plata debido a Ia presencia de otros componentes en la muestra. Frecuentemente, tal suposicin no es valida en muchas éreas del anilisis. Los efectos de matriz ocurten incluso con métodos tales como Ia espectrometria de plasma que tienen la ventaja de estar relativamente libres de interferencias. La primera solucién posible a este problema es tomar una muestra de desechos fotogrificos que sea similar a la muestra problema pero libre de plata, y fiadirle eantidades: conocidas de una sal de plata para formar soluciones estindar. Entonces, la grafica de calibracién se establecera utilizando una matriz aparentemente adecuada; sin embargo, en ‘muchos casos esta aproximacin es impracticable. No se eliminaran efectos de matriz que difieran en magnitud de una muestra a otra, y quiza no sea posible obtener tna muestra de Ja matriz. que no contenga analito, por ejemplo, es improbable que se consiga tna muestra de residuos fotograficos sin plata, De esto se desprende que tocias las mediciones analiticas, incluyendo la grifica de calibracion, de alguna manera deben realizarse con la propia uesira. Esto se logra en la prictica usando el método de adiciones estandar, el cual se utiliza mucho en la espeetromettia de absorcién atémica y emisién y también se aplica en el anilisis electroquimico y en otras areas, Se toman voliimenes iguales de solucién problema, pero todas salvo tna son “tratadas” por separado con cantidades conocidas y diferentes del analito, y todas se diluyen al mismo volumen, Después se determinan las sefiales instrumentales para todas estas Soluciones y los resultados se representan como se ‘muestra en la figura 5.9. Como de costumbre, la sefal se representa en el eje y; mientras, que en el eje x la escala se expresa en términos de las cantidades de analito ailadidas (ya sea como peso absoluto o como concentracién). La recta de regresidn (no ponderada) se calcula de la manera usual, si bien el espacio ocupado por ella se extrapolara al punto sobre el eje x donde y = 0. Esta claro que esta interseccidn negativa sobre el eje x corresponde a la cantidad de analito en la muestra del problema. El analisis dela figura muestra que este valor esta dado por a/b, la razon de la ordenada en el origen y la pendiente de la recta de regresion. Ya quea y b estin sujetas a ertor (véase la Sec. 5.5), el valor caleulado también estaré obviamente sijeto a error. Sin embargo, eneste caso la cantidad no se predice a partit dde un tinico valor medido de y, de manera que la frmula de la desviacién estindar s,., del valor extrapolado de x (1) no es la misma que en la ecuacién (5.9), En su lugar, se utiliza 1 ' (mal 6.12) Al aumentar nuevamiente el valor de n, se mejora la precisin de la cantidad estimada: en general, deberian usarse al menos seis puntos en un experiment de adiciones estindar. demas, la precision se miejora mnaximizand 5 (x, ~ 8), asi las soluefones de ealibracion cubririan, si fuera posible, un intervato considerable. Los limites de confianza para xy se determinan, como siempre, como x 15 Ejemplo, La concentracion de plata en una muestra de desechos fotogrificos se determiné por espectrometria de absorcién atémica con el método de las adiciones estindar. Se obtuvieron los siguientes resultados. Sofa! Cantidad afiadida ———> Cantidad de analito en la muestra del problema Figura $9 El método de las adiciones estindar. Plata adicionada, wg por ml de solueion de muestra orginal Absorbancia| 032 o 5 0 1 2% 25 3 041 052 060 0.70 077 089 Determine la concentracién de plata en la muestra, y obtenga los limites de confianza al 95% para esta concentracién. ae seca Las ecuaciones (5.4) y (5.5) conduce a a~ y b= 0.0186. La razén entre estas, cifras proporciona la concentracién de plata en la muestra problema de 17.3 ug/ml. Los limites de confianza para este resultado se pueden determinar con la ayuda de la ecuacién (5.12), Aqui sy.es 0.010 94, 9-0.601 4, y E (xi- 3)* = 700. BI valor de ‘5 €8 entonces 0.749 y los limites de confianza son 17.3 4 2.57 x 0.749, es decir 17.3 £19 pg/ml ‘comparamos : ten los limites de confianza. Como hemos visto, los limites de confianza para un punto sobre una recta de regresidn varian con el valor de y; y aleanzan un minim cuando y ~ ¥ (véase la Sec, 5.6). En la prictica, como se muestra en este ejemplo y en el de la seccién 5.6, esta variacion en Ios limites de confianza con el cambio en y probablemente no es muy grande, cde manera que los limites de confianza no son significativamente malos incluso para un resultado derivado de una extrapolacién sustancial 5.9 EL USO DE RECTAS DE REGRESION PARA COMPARAR METODOS ANALITICOS Siun quimico analitico desarrolia un método nuevo para determinar un analito conereto, desea validario (entre otras ténicas) aplicandolo a un conjunto de muestra ya estudiadas mediante otro procedimiento estindar o de prestigio. AI realizar tal comparacign, el principal interés seri la identiicacin de errares sistematicos (proporciona el nuevo todo resultados significativamente mas altos 0 mas bajos que el procedimicnto estable- ido). En los casos donde un andlisis se repite varias veces sobre un intervalo de concentracién muy limitado, tal comparacion puede hacerse usando las pruebas estadisti- cas descritas en un capitulo anterior (véanse las Seces, 3.2 y 3.3). Dichos procedimientos no serin adecuados en andlisis instrumental, los euales a menudo se ulilizan sobre intervalos de concentracién grandes. Cuando se comparan dos métodos a diferentes concentraciones de analito, se adopta nnormalimente el procedimiento que ilusta la figura 5.10. Uno de los ejes de la grafica de regresi6n se utiliza para los resultados obtenidas por el nuevo métodeo, y el otto para los «que se obtienen aplicando et de comparacion o referencia a las mismnas muestras. (La importancia de asignar un ejea cada método se analiza postertormente.) Asi cada punto de ta gefica representa una nica muestra analizada por dos métodos separados. Los métodos de ls sceciones precedentes se han aplicado para caleular la pendiente (b), la ordenada en el origen (a) y el coeficiente de correlaci6n (7) de la recta de regresién. Queda elaro que si cada muestra conduce a un resultado idéntico eon ambos métodos analiticos, la recta de regresin tendrd una ordenada en el origen de cero, y una pendiente y un coeficiente de correlacion de 1 (véase la Fig. 5.10a). En Ia prctica, por supuesto, esto nunca ocurre incluso cuando los errores sistemsticos estin completamente ausentes, los aleatorios aseguran que los dos procedimientos analiticos no darin resultados que concuerden ‘exactamnente en todas la muestra. Pueden ocurrr desviaciones de la situacin “ideal” (a = 0, b= r= 1) en una serie de citcunstancias diferentes, En primer lugar, es posible que la recta de regresion tenga una Pendiente de 1, pero no una ordenada en el origen de cero; 0 sea que un método de anilisis puede producir un resitado mis alto o mas bajo que el otto en una canidad fj Tat ertor podria ocurrr si se calcul erroneamente la seal de fondo de uno de los métodos (véase la Fig. 5.10b). Una segunda posiblidad es que la pendlente de la recta de regresién sea > Lo < 1, lo que indica que puede darse un error sistematico en la pendiente de una de Ins graticas de calibracion individuales (Fig. 5.10e). Desde luego, estos dos errores pueden ocurtir simutténeamente (Fig. 5.10d). Otros tipos posibles de error sistemitico se ‘manifiestan sila representacién grafiea es una curva (Fig. $.10e). Problema de especiacién trveden proporeionar resultados sorprendentes (Fig. 5.101) Este tipode representacién gra- fica podria surgit si un analito se encuentra en dos formas quimieas distinta, en propor. igura $10 Eso de wa set de ees a compari dos ros anaitn:() meta eran cr nese prt ue de) «(sao ese ‘esd vu os deere seats (as exo 4) podria detectar slo una forma del analito, mientras que el segundo detectaria ambas formas, En la practica, el analista con frecuencia desea realizar una prueba para contrastar una ordenada en el origen significativamente diferente de cero, y una pendiente significativa- ‘mente diferente de 1. Tales pruebas se realizan determinando los limites de confianza para 95% de nivel de significacién. De este modo, el caleulo es muy ay b, generalmente al lo utilizando un programa de similar al descrito en la seccién 5.5, y es mas util realizarl computador sencillo, enmpo-Enve plone de ier muestes eu de lad tein por un evo ar le teciometico de eslutn tripping) (SPR) emplendo wn rete ate decabon seedy stead fron compres con ls See raiser decpecvrcndstertn atic tans EAA) $eSturonesigintes cate Ges redo en ee o Muestra 1 2 3 4 5 6 205 215 240 350 ResulladosEAA 35 75 75 80125 205 2 Resultados APR 3570-80-80 '120 200 220 200 250330 Manno, S.. Analst, 1982, 107, 1466) Estos resultados se representan en una linea de regresion (véase la Fi “sin (véase Ia Fig. 5.11), con los obtenidos por EAA en el eje xy los que resultaron por APR en el eje y. Usando los étodos de las secciones precedentes puede observarse fécilmente que. a ~ 3.87, b = 0,968; r = 0.9945 Cilculos adicionales mue: fan que Sy ~ 10:56; 5, ~ 6.64; sy = 0.0357 usando valores de 1 adecuados para 8 grados de libertad (1 ~ 2.31) dan los si a dan los siguientes limites de confianza al 95% para In pendiente y ordenada en elorigen: 4 ~ 3.874 15.34 y b= 0.963 + 0.083 De estos resultados se desprende que la pendiente y ordenada en el iente y ordenada en el origen calculadas no difieren en forina significativa de los valores “ideales” de 1 0 respectivamnente, y Por lo tanto no existen diferencias sistematicas entre las dos series de resultados. Enrelacion conse ejemplo pueden mencionrse ote do la eisin dea biiograta de quimic anatca muesraque los anore se preeo o frecuencia de ls valores del cofiiente de coreacion en eetwing coon embargo, en este ejemplo no juga un papel dite al evatlecersteganey cnn 350 © 50 100 150 200 250 300 350 Resultados EAA 1g. Figura 5.11 Comparacién de dos métodes analiticos: la representacin muestra los datos de la pig. 93, sistemiticos. Incluso si las reetas de regresion son ligeramente curvadas, el coeficiente de cortelacién podria haber sido I (véase Ia See. 5.3). Es evidente, por lo tanto, que el edleulo de r tiene menor importancia en el presente contexto que el establecimiento de limites de confianza para la pendiente y ordenada en el origen. En algunos casos puede encontrarse que el valor de r no es muy préximo a 1, aun cuando la pendiente y ordenada en el origen no sean significativamente diferentes de I y 0 respectivamente, Tal resultado sugeriria una precisién muy pobre para uno © ambos de los métodos bajo estudio. Por supuesto la precision de los dos métodos puede deterininarse y compararse por los métodos de los capitulos 2 y 3. En la prictica es preferible que esto se haga antes de representar la recta de regresidn que compara los dos métodos, la razén de esto se explica posteriormente, El segundo aspecto es que, si bien es claramente deseable comparar los métodos en un intervalo de concentraciones tan amplio como sea posible, en la prictica quiza no sea factible obtener muestras reales con concentraciones de analito igualmente espaciadas en el intervalo. En el ejemplo dado, los jugos de fruta examinados tienden a agruparse con contenidos en plomo claramente similares, de manera que las muestras que contengan plomo entre ca, 130 y 200 p/l y entre 260 y 320 jig/l no se podsian estudiar. También veremos esto més adelante. Este método, aunque a nivel intemacional se ha adoptado pricticamente en estudios comparativos de inétodos instrumentales, esti abierto a serias objeciones tedricas por varias razones. En primer lugar, se ha recalcado a través de todo este capitulo, que la recta de regresién de y sobre x se calcula bajo el supuesto de que hay errores despreciables en los valores de x y se supone que todos los errores ocurren en la diteccién y. Mientras que esto es generalmente vilido en la generacién de una grifica de calibracién para un tinico étodo analitico, no puede justificarse cuando la recta de regresién se usa con propésitos. cde comparacisn, En tal caso se puede tomar como cierto que los errores aleatorios existirin cen ambos métodos analiticos, es decir, en ambas direceiones de x y y. Esto sugeriria qu las ecuaciones ulilizadas en el edleulo de la propia recta de regresin pudieran no ser vlidas. Sin embargo, ensayos pricticos y simulaciones muestran que la presente aproxi- macién conduce @ resultados sorprendentemente fiables, siempre que se cumplan tres condiciones. 1, Elmétodo mis preciso se representa en el eje x: Por eso se realizan investigaciones preliminares sobre las precisiones de los dos métodos (véase lo expuesto anteriormente). 2. Un mimero razonable de puntos (al menos 10, como en el ejemplo anterior) se representan en Ja comparacién, Ya que los limites de confianza se basan en 1 ~ 2 grados de libertad, es importante evitar Valores pequeiios de 3. Los puntos experimentales deberian cubrir el intervalo de concentracién de interés de una manera aproximadamente uniforme: como hemos visto, puede ser dificil que se ‘cumpla este requisito en estudios comparatives sobre muestras reales. Existe una segunda objecin teérica al utilizar la recta de regresién de y sobre x como se calculé en las secciones 5.4 y 5.5, en la comparacién de dos métodos analiticos. Esta recta de regresién no s6lo supone que los errores en la direccién x son cero, sino también {que los errores en los valores de y son constantes, es decir que no varian con la concentra cidn, y por Jo tanto todas los puntos tienen igual ponderacién cuando se calculan la pendiente y In ordenada en el origen, Este supuesto probablemente carezea de validez e1 Ja praetica. En muchos analisis, Ia desviacién estindar relativa (coeficiente de variacién) es aproximadamente constante en un intervalo de concentraciones: el error absoluto aumenta de este modo con la concentracién del analito, en vez de tenet el mismo valor en todas las concentraciones. Por consiguiente las rectas de regresién “no ponderadas” tienen también una validez muy cuestionable en otras situaciones, es decir, cuando se aplican a grificas de calibracién para un tinico procedimiento analitico. En principio, se deberian utilizar en su lugar rectas de regresidn ponderadas. Este concepto se desarrolla en a siguiente seccidn. Mientras tanto, puede reafirmarse que, a pesar de las objeciones tedricas, las rectas de regresién no ponderadas proporcionan informacién ttl en estudios compara- tivos si se cumplen los requerimientos enunciados anteriormente, 5.10 RECTAS DE REGRESION PONDERADAS: Los comentarios hechos en las sececiones anteriores sobre célculos de regresién conven- cionales 0 no ponderados indiean que los ponderados quizés deberian adoptarse mis frecuentemente. Los caleulos que conllevan la utilizacién de los métodos de regresicn ponerados son slo un poco mas complicados que los de as secciones anteriores, y pueden realizarse ficilmente en un microcomputador, pero requieren informacién adicional de los errores que surgen en los diferentes niveles de concentracidn,o al menos la formulacién de supuestos adicionales acerca de ales errores. Esto explica quizis por que los eeulos de regresién no ponderada se usan con menos frecuencia. En esta seccién se esbozan las aplicaciones de los métodos de regresién ponderada. Se supone que la recta de regresion ponderada se utiliza para la determinacién de un tinico analito y no para comparar dos rmétodos separados. Consideremos con més detalle Ia simple situacién que surge cuando el error en el caleulo de una regresién es aproximadamente proporcional a la concentracion del anaito. Cuando los errores en los diferentes puntos de la grafica de calibracién se expresan por “barra de error” (véase la Fig. 5.12), estas se alargan a medida que aumenta la concentra- ign. En este caso es evidente que debe calcularse la recta de regresidn para dar una pon- deracién adicional a aquellos puntos donde las barras de error son més cortas: es mis importante que la recta calculada pase cerca de tales puntos que de los que representan con- centraciones mas altas con los errores més grandes. Este resultado se logra cuando se da a cada punto una ponderacién inversamente proporcional ala vatianza correspondiente, s% este procedimiento légico es de aplicacién general Asi, si los puntos individuales se de- notan con (1, J), (as 2), et, como es habitual, y las orrespondlientes desviaciones es tndarson ssi, ete.,entonces las ponderaciones individuales, w,, wi, etc.,estén dadas por: w= SUE im (5.13) Como se vera las ponderaciones se han puesto en una escala de tal manera que su suma sea igual al niimero de puntos sobre la representacin grifica: esto simplifica los subsi- guientes cilculos. La pendiente y la ordenada en el origen de la recta de regresién estén dadas por: E wy — nS (S14) Sefal Concentracién -a 8.12 La ponderaciin de erores en un cdleulo de regresion a= 55 BR 6.15) Bn la ecuacién (515), Ke y Bx fepesetan las eoordenadas del cenro de grovedad ponderado (3) pore! que debe pasar la recta de repesién ponderada, Estas coordeniadas estan dadas por: By ~ E witli y Ju = E woe cs jerada y no ponderada para los siguientes Ejemplo. Calcule las rectas de regresién ponderada y no por P datos de calibracién. Calcule también para cada recta la concentracién de las muestras problema con absorbancias de 0.100 y 0.600. 6 8 10 Concentracién, ug/ml o 2 4 Absorbancia 0.009 0.158 0301 0472-0577 0739 Desviacin estindar 0.001 0004 0.010 0013 0017-0022 pleat ds ecuacinos (54) y (6.5) mes els port orden c Fees Tater de eprenon no poneradasonrespetivamente 0.0725 y 00133, cain 0100) 060 son 1209 809 cl origen de la Las concentraciones correspondientes a la aj respectivamente. La recta de regresién ponderada es un poco mis tediosa en ewanto a su cai ausencia de un programa de computador es habitual establecer unia tabla como la que sigue. 0° 0.009 fate 0ilse 0.0587 0.1003 4 301 0.0166 0.0662 6 oan 00156 0.0935 8 OST 0110 9.0877 10 0739 ou! 0.0813 01558 0.4340) De estos niimeros queda claro que Sw = 0.1558/6 ~ 0.0260 y Za = 1.3726 = 0.22 . 1260 y Fe 9, Mediante Ia ecuacién (5.14), bse calcula a partir de (1.438 ~ (6 X 0.229 x 0.026) 5.768 [6% (0.22977] = 0.0738, de manera que a esti dado por 0.0260 - (0,073 * 0.229) - 0.0091. Estos valores para a y b pueden utilizarse pata mostrar que los valores de absor- bbaneia de 0.100 y 0.600 corresponden a concentraciones de 1.23 y 8.01 ygftl respec- tivamente, 1a uldadosa comparacin de los resilados de fos cleus de regresin ponderad to poneran es muy insretva, Los efectos del proceso de pondeacion sie cares a centro de gravedad ponderado (iy, 5.) esti mucho mis cerca del origen de a prea que €! no ponerado (3), y ln ponderacin dada a os patos mus proximos al erigen y en particular a primer punio (0, 0.009) que tcneel menor de todos lo ertoresaxopina ela recta de regresion ponderada tiene una ordenada en el orien muy proxiina a este punt {La pendiente y la ordenada en el origen dela recta porderaa son notabemente silaree a las dela recta no ponerada, aunque los resultados de los dos tac proporeonen Valores muy parecis para las concentracones de muesies qe enen abworbencin de 0.100 0,600. Nodebe suponerse que esos valores semrjantessrgen simplemente bids a que en este ejemplo fos puntos expermentales se ajstan muy bien aun linen teeta, En la practic, tas tetas de regresiom ponderada y no ponerada derivadas den sete de datos experimentates, tienen pendientes y ordonadas en el origen similares incluso si es Felevante la dispersion de los puntos respect ala recta, Asi, podriamos pensar que los eieulos de regresion ponderada son paco recomen Abies; reqiezen mis informacion (en Informa de las esinaciones de Tn desvncion éstindaren varios puntos sobre la represetacion grifia),y son mis complejondeeeeatan Pero apatentemente proporcionan datos miy similares aos obtenids «pat del cod mucho is simple, de regresién no ponderada. Dichas consideraciones de hecho pueden iustiticar que en a prictca se desprecien los cieulos de regres ponderadn, Pers un 4uimico aaltico que wiliza métodos insiramentales no emp eéleuos de reprecion simplemente para dterminar Ia pendientey la ordenada en el orgen de la grafica de calibraciony las concentraciones de mucstras problema, Tambin quiere oben estinoe, clones de los errs o limites de confianza de esas conceiraciones y en este content ‘método de regresién ponderada proporciona resultados mucho mis reales. En la seccién 55.6 utilizamos la ecuacién (5.9) para estimar la desviacién estindar (s9) y por lo tanto los intervatos de confianza de una coneentracién caleulada usando un solo valor de y y una recta de regresién no ponderada. Al aplicar esta ecuacién a los datos de ejemplo anterior ‘vemos que los limites de canfianza no ponderados para las soluciones con absorbancias de 10.100 y 0,600 son 1.20 + 0.65 y 8.09 # 0.63 pg/ml respectivamente. Como en el ejemplo de la seccisn 5.6, estos intervalos de confisnza son muy similares. Sin embargo, en el ejemplo presente ta resultado noes completamente real os datos experimentales muestran que los errores de Tos valores y observados, auinentan a medida que aumentan los propios valores de y; es a situacién esperada para un método que tenga una desviacicn estindat relativa aproximadamente constante, Podriamos esperar que este ineremento en s, con el de y también se reflejara en los limites de confianza de las eoncentraciones determinadas: Jos limites de confianza para la solucién con una absorbancia de 0.600 serian mucho mis srandes (es decir, peores) que los de la solucién con una absorbancia de 0.100, En los edleulos de regresién ponderados, la desviacion estandar (,) de una concen- tracion prevista estd dada por: sate {2 (5.16) 460, sye esta dada por (Sw Squaye = (5.17) ¥y wes tna ponderacién adecuada para el valor de yo, La ecuacién (5.16) es claramente Similar en su forma a la (5.9). Ello confirma que los puntos cercanos al origen, donde las ponderaciones son mésaltas, y os eercanosal centro de gravedad, donde yo~ wes pequeiio, tendran los limites de confianza mis pequefios (véase la Fig. 5.13). La principal diferencia entre las dos ectiaciones es el termino I/wy en la ecuacién (5.16). Ya que» disminuye bruscamente a medida que aumenta y, este término asegura que los limites de confianza aumentan cuando aumenta yo, como espersbamos. La aplicacién de la ecuacidn (5.16) a los datos del ejemplo anterior muestra que Tas soluciones problema con absorbaneias de 0.100 y 0.600 poseen intervalos de confianza ppara las concentraciones calculadas (1.23 y 801 ug/ml) de + 0.12 y + 0.72 ye/ml, respectivamente. Vemos que estos intervalos de conianza son proporcionales a las absor- bancias de las dos soluciones. Adem, el intervalo de confianiza para la muestra menos cconcentrada de las dos es mis pequeio que en los caculos de regresion no pondera- ddos, mientras que para la muestra mas concentrada ocurre lo contrario. Todos estos resultados concuerdan mucho mis con el experisnento de calibracién real que con los re- sultados de los eaitculos de regresién no ponderada, Entonees podemos concluir que, si bien los cailculos de regresion ponderados son mis ‘complicados que sus homélogos no ponderados, dan resultados mucho mis reales para los limites de confianza de concentraciones previstas en andlisis instrumental convencional. Sefial Concentracién Figura S.13_ Forma general de los limites de confianza para una concentracién determinada tiie ‘zando una recta de regresién ponderada, Adem, los métodos de regresion ponderados pueden se esenciles cuando se obengn ua recta por transformaciones algebras de una represenacnininccnmene crea (ese mi alt, Se. $1), Ea natalie open a is computadores personales, que eliza los ileus devegresionponderdes, for loose deberia fomentar més el uso de este método. . ca 5.11 REGRESION CURVILINEA Hasta aqui, nuestro estudio de los métodos de calibracién se ha centrado en experimentos «de donde suponemos que la respuesta del instrumento es proporcional ala concentracion de analito, Esto es usualmente vilido, ya que los quimicos analiticos utilizan tales métodos siempre que pueden, y toman precatciones experimentales para asegurar que la linealidad de a respuesa se conserve en lo posible, en un ampli interval de concetrciones Tales precauciones incluyen el contro! dela anchura de hinea deemisin de una limpara de citodo 'ninimizar los efectos del filtro interno en la espectrofluorimetria molecular. Sin embargo, & pesar de tales esfuerzos, muchos métosos analiticos proporcionan grificas de ealibracion courvas en una parte del intervalo de concentracién de interés. En concreto es muy sual la situacién en donde la grifica de calibracion es lineal (0 aproximadamente lineal) a bajas concentraciones de analito y sin embargo se vuelve curva aaltas concentraciones. En otros casos, por ejemplo en inmunoensayos y en la respuesta de algunos electrodos selectivos de iones, la grifica de calibracién es obviamente curva en todas las concentraciones, y en este caso ain necesitamos respuestas a la lista de preguntas de Ia seecion 5.2, si bien plantearén problemas estadistcos mucho més complicados que en el caso de experimentos de calibracidnlineales. La solucién completa a estos problemas est fuera de! alcance de este libro, aunque merece la pena darle ciertaatencién preliminar. El leetor puede consultar la bibliografia para tratamientos més completos. La primera pregunta es: emo detectamos la curvatura en una grifica de calibracin? Esto es, josmo distinguimos entre una grafica que se ajuista mejor por una linea recta, y tna que se ajusta mejor por una curva poco pronunciada? Puesto que el grado de curvatura puede ser pequeno, yo suceder sdloen parte de la grfica, esto no es una pregunta trivial ‘Ademas, a pesar desu amplio uso para probar la bondad del ajuste de grficaslineaes, el coeficiente de eorrelacién momento-prodicto(r) es de poco valor al probar la curvatura hhemos visto (Sec. 5.3) que las Kineas con una curvatura obvia todavia pueden dar valores der muy elevados. Naturalmente, un analista esperaria que alguna prueba de curvatura se pudiera aplicar eon bastante facilidad en trabajos de rutina sin calculos extensos; algunas de estas pruebas estin disponibles, y se basan en la utilizacion de los residuos de y en las igrificas de calibracién, . Como hemos visto (See. 5:5) un residuo de y,y, ~ J, representa la diferencia entre un valor experimental dey y el valor caleuladoj de la recta de regresin para el mismo valor de x. Si es apropiada una grifica de calibracién lineal, y si los errores aleatorios en los valotes de y estan distribuidos normalmente, los residuos en si mismos deberian estar distribuidos normalmente en tomo al valor ceto. Si esto no ocurre en la prictica, entonces (despreciando la posibilidad de que los propioserrores experimentales noestén distribuidos normalmente) debemos sospechar que la recta de regresinajustada no es la correcta. En el desarrollo del ejemplo dado en la seceién 5.5, los residues y obtenidos fueron +0.58, -0,38, -0.24, -0.50, +0.34, +0.18 y +0.02; estd claro que estos valores suman cero (teniendo en cuenta los posibles errores de redondeo, esto debe ser siempre verdadero), y aproximadamente estin distribuidos en forma siméitica en tomo a cero. Aunque es imposible tenet la certeza —especialmente con un nimero pequento de puntos— de que estos residuos estén normalmente distibuidos, tampoco existe evidencia en contra en este caso, es decir, no hay evideneia para justifiear una grifica de calibracién no lineal Se sugiere una segunda prueba sobre la inspeccién de los signos de los residuos anteriormente expuestos. Sinos trasladamos alo largo dela grafica de calibracién, es decir, cuando aumenta x, supondremos que existen residuos positivos y negativos en orden aleatorio si los datos estin bien ajustados a una linea recta Si, al contrario, intentamos ajustar una linea recta a una serie de puntos que caen realmente sobre una curva suave, entonces los signos de los rsiduos no tendran un orden aleatorio mis amplio, sino que se produtcinin secuencias de valores positivos y negativos. Examinando de nuevo los residues expuestos anteriormente encontramos que el orden de los signos es + - ~~ - + + +. Para probar si estas secuencias se residuos * y ~ indican la necesidad de una linea de regresin ‘no lineal, ecesitamos conocer Ia probebilidad de que tal ordenacién pudiera ocurtir por azar; tales cileulos se describen en el proximo capitulo. Desafortunadamente debido al pequenio niimero de puntos es muy probable que éstas y otras secuencias pucieran realmente ocurrir por azar, de manera que cualquier conclusion que se extraiga debe tratarse con gran precaucién. Probablemente la eleccién cntre métodos de regresién lineales y curvilinea sea mis efectiva si se utilizan las te de curvas esbozades posteriormente. En la situacion donde una grafica de calibracién sea lineal sobre parte de su intervalo, y curva en otta,es de gran importaneia para el quimico analitico establecer el intervalo so- breel que se supone linealidad. Enel siguiente ejemplo se esbozan aproximaciones posibles ‘este problema. Ejemplo, Analice el intervalo de calibracién lineal del siguiente experimento de Auorescencia, sensidad de fuorescencia O1 80 157 242 31S 330 oncentracion, ug/ml 0-8-7 0 ou de los datos muestra que la parte de la grifica proxima al origen se adapta bastante bien a una linea recta con una ordenada en el origen proxima a cero y tina pensdiente cercana a 4. La fluorescencia de la solucién estindar de 10 ug/ml es claramente inferior a la esperada si se tiene en cuenta estas bases, y existe alguna posibilidad de que Ta desviaci6n de la Tinealidad afecte tambien a ia fluorescencia estindar de 8 pail. En primer lugar, se aplican edleulos de regresion lineal (no ponderada) a todos los datos; dela aplicacién de los métodos de las secciones 5.3 y 5.4 se obtienen resultados a= 1.357, b= 3.479 y r = 0.9878, De nuevo tenga en cuenta que s, ¥ en muchos de ellos sélo se deseribirin las operaciones de 1m desarrollo tedrico detallade, pruebas sin entrar 62 LAMEDIANA Enos capitulos anteriores sha ullizado la medi aritmetica promedio com la “medida de tendencia central” de un conjunto de resultados. Esto es bastante lgico cuando se supone la distbucion (Simeétriea) normal, aunque en esladistin no paraméirica se liza Tabitualments en st logat la mediana. Para calcular la mediana de » observacioes, se disponen en orden creciente (en el e2s0 improbable de que n sca muy grande, ese proceio de ordenacén puede realzarse rpidamente con programas sencilos que se Encuentan disponibles parla mayora de los microcomputadores) Entonces, la mediana se define como el valor de la observacion que ocupa el lugar Kn + 1) si es impar y el promedi de las observaciones que ocipan los lugares tn y (i + 1) sin es par La Acterminacién dela mediana de na serie de resullados expevinentales generalmente no requiee muchos edleulos, Adem, en muchos esos puede ser una medida de tendencia central mds realist que la media atta Ejemplo. Determine la media y la mediana para los cuatro valores siguientes de una titulacién, 25.01 25.04 25.06 25.21 ml Es ficil calcular que la media de de estas cuatro observaciones es de 25.08 ml y que la mediana es de 25.05 ml —en este caso es el promedio del segundo y tercer valores, ya que las medidas estn ordenadas numéricamente. La media es mayor que cualquiera de los tres valores més préximos entre si (25.01, 25.04 y 25.06 ml) y de este modo puede ser una medida de tendencia central menos realista que la mediana, En lugar de caleular la mediana podriamos utilizar los métodos del capitulo 3 para probar el valor 25.21 como un posible resultado anémalo, y determinar la media de acuerdo con ct resultado obtenido, pero esta aproximacién implica caleulos extras y supone que los datos proceden de una distribucién normal. Este simple ejemplo ilustra una propiedad valiosa de la mediana: ésta nose ve afectada por los resultados extremos 0 andmalos. Los limites de confianza (véase el Cap. 2) para la mediana se pueden estimar con la ayuda de la distribucién binomial. Este célculo puede realizarse aun cuando el nimero de mediciones sea pequeio, pero no es habitualmente necesario en quimica analitica donde la mediana se utiliza por lo general s6lo como una estimacion rapida de un promedio. El lector puede consultar la bibliografia para mayor informacion. En estadistica no paramétrica la medida habitual de dispersion (que sustituye a la desviacién estindar) es el recorrido intercuartilieo. Como ya hemos visto, la mediana divide la muestra de mediciones en dos mitades iguales; si cada una de éstas se divide posteriormente en otras dos mitades, los puntos de division se denominan cuartiles inferior y superior. Al hacer este cdleulo se utilizan varios convenios diferentes; de nuevo, el lector interesado puede consultar la bibliografia. El recorrido intercuartilico no es muy usado en el trabajo analitico, pero varias pruebas estadisticas se pueden ejecutar con él 6.3 LA PRUEBA DE SIGNOS La prueba de signos es uno de los métodos no paramétricos mais simples y se empezs a estudiar por primera vez a principios del siglo xv. Se puede utilizar de diferentes formas, Ja mis simple se ilustra con el siguiente ejemplo. Ejemplo. Un preparado farmacéutico exige tener un contenido mediano del 8% de un constituyente conereto. En la prictica se encontraron lotes que contenian 7.3, 7.1, 7.9, 9.1, 8.0, 7.1, 6.8 y 7.3% del constituyente, Al nivel de significacidn del 5%, indica esto que la mediatia exigida es ineorrecta? Bn el capitulo 3 (véase la Sec. 3.2) se demostré que tales problemas podrian abordarse Utilizando la prueba r después de calcular la media y la desviacién estandar de los datos experimentales. La prueba f supone que los datos se distribuyen normalimente. La prueba de signos prescinde de tal hipétesis y es mucho mas facil de realizar. A cada valor experimental se le resta a su vez, la mediana postulada, y se considera el signo de cada resultado, Seignoran por completo aquellos valores que son iguales a la mediana postulada. En este caso, por tanto, disponemos efectivamente de siete valores experimentales, seis de ellos inferiores a la mediana y a los que individualmente se les da el signo menos, y unio ‘mais grande que Ia mediana al que se le da el signo més, Para contrastar si esta preponde- rancia de signos menos es significativa utilizamos la ley binomial, Esta ley establece que Ja probabilidad de que aparezcan r signos menos entre n signos esti dada por: PO) "Copy? (6) donde "C; indica el nimero de combinaciones de r elementos de un total de n elementos, Pees la probabilidad de que aparezca un signo menos en uno de los resultados y q es Ia probabilidad de que no aparezca un sigho menos en uno de los resultados, es decir, q = 1 ~ p. Ya que la mediana se define de manera que la mitad de los resultados experimentales se sitia por encima de ella y la otra mitad por debajo, queda claro que sila mediana es 8.0 en este caso, entonces p y q deberian ser 3. Utilizando la ecuacién (6.1) encontramos que P(O) = 'Co(9 x; = 728, De manera similar podemos calcular que la probabilidad de obtener siete signos menos, P(7), es 1/128. Por lo tanto, en general 1a probabilidad de obtener seis 0 mas signos negatives en nuestro experimeto es 8/128. La cuestion solo consisteen saber silos datos dficren significativamente de la mediana postulada, Por con- siguiente, debemos realizar una prueba de dos colas (véase el Cap. 3), es decir, debemos caleular la probabilidad de obtener 6 0 mas signos idénticos (0 sea, > 6 signos mas 0 2 6 siznos menos), cuando se toman al azar siete resultados. Esto es claramente 16/128 ~ 0.125, Luego comparamos esta cifra con 0.05, cs decir, realizamos la prueba al nivel de signifi. cacién del 5%. Puesto que el valor experimental es mayor que 0.05, nuestra hipotesis nula (es decir, que los datos proceden de tina poblacién de mediana 8.0) no se puede rechazar. gual que en el capitulo 3, es importante observar que no se ha probado que los datos proceden de tal poblacién; sélo se ha probado que tal hipdtesis no se puede rechazar, Queda claro. partir de este ejemplo que la prucba de signos conllevara al uso frecuente de la distribueion binomial con p ~ q ~ 3, Esta aproximacion es tan comin en Ia estadistica no parametrica que la mayoria de as tablas estadisticas incluyen los datos necesarios, 1o
    Vi) .y al nivel P= 0.01 si Q > Va) , donde nes el numero de mediciones ineluyendo aquella que es aparentemente anémal. Esta prueba sirve para recordar que las métodos de recorridos presentan a gran desventaja de verse muy afectados por uno o més resultados anomalos. En contraposicion, los métodos verdaderamente no paraméiticos son por lo general inmunes a tales resulta- dos, Las pruebas de recorrido poseen otra desventaja: tienen menos potencia estalistica {que los métodos correspondientes decritos en el capitulo 3. Debido a que las pruebas de recorrido no utilizan todos los datos disponibles, habra casos en Tos que una prueba F, por ‘ejemplo, indique que la hip6tesis nula apropiada pueda ser rechazada, pero st altemativa ris simpie, el sustituto de la prueba F, indique que la hipdtesis nuta deberia ser aceptada La popularidad de las pruebas de recorrido indica que Ia simplieidad en los ealeulos es una compensacién mas que suficiente a todos estos problemas. 6.6 LA PRUEBA DE RANGOS Y SIGNOS DE WILCOXON La seceién 6.3 describia el uso de la prueba de signos. Su importancia reside en los ‘supuestos minimos que se hacen sobre los datos experimentales. No se supone que la poblacién de la cual se toma la muestra sea normal, ni incluso que sea simétriea —Ia nica informacién a priori necesaria es el valor de la mediana. Una cierta desventaja de la prueba de signos es que no utiliza toda la informacion disponible. Solo es necesario saber si una medicién individual es mas grande o mas pequefa que la mediana— la magnitud de esta desviacién no se utiliza en absoluto, En muchos casos un analista tendra suficientes razones para creer que sus mediciones. se distribuyen simezricamente pero no desea suponer que siguen distribucion normal. Este supuesto de datos simétricos, y Ia consecuencia de que la media y mediana de la poblacién sean iguales, permite desarrollar pruebas de significacién mas potentes. Wilcoxon contri- bbuy6 con importantes avaneces a este respecto, y su prueba de rangos y signos tiene varias aplicaciones. Su mecanismo se ilustra mucho mejor con un ejemplo, Ejemplo. Se encontré que los niveles de plomo en sangre (en pg/ml) de siete nifios eran 104, 79, 98, 150, 87, 136 y 101. ;Podrian proceder estos datos ce una pablaci6n que ‘se supone simétriea, con mediana (media) de 95 pg/ml? Los datos comparados con el valor de referencia (95) toman los valores 9, -16, 3, 55, -8, 41,6 En primer lugar y prescindiendo del signo se ordenan estos valores de menor a mayor, resultando) 3,6,8,9, 16, 41, 55 A continiaci6n se incorporan sus signos (en Ia prictica estos dos pasos se harian de una vez) 3,6, -8,9, 16,41, 55 Los niimeros entonces se jerarquizan; en este proceso mantienen sus signos pero se Jes asignan nimeros que indican su orden (o rango), asi: 1,2, 4, -5,6,7, Los rangos postivos suman 20 y los negativos 8. La menor de estas dos ciftas (8) se toma como el estadistico de Ia prueba. El teorema binominal dard la probabilidad de ue aporezca este minieto. Silos datos proceden de una poblacién con una mediana de 95, se espenarin que ls suas de ls rangos postivos y negaivos fuesen aproxima- dlamente iguales; sila mediana de la poblacion fuese muy diferente de 95, la suma de los sangos positivos y negativos sera diferente, La probabilidad de que aparezca una uma conereta en la practica esta dada por una serie de tables (véase la tabla A.12). En esta prueba se rechaza Ia hipotesis nula si el valor tabulado es menor o igual que el valor experimental es decir, la situacion opuesta de Ia observada en la mayoria de las pruebas de signifiencién. En este ejemplo, el examen dea abla A, 12 muestea que, para 17, elestaistico de la prueba debe ser menor o igual que 2 para que la hipotesis nila —aue los datos proceden de una poblacién con una medina (media) de 95— se puede rechazat a un nivel de significacion de P = 0.05, En este ejemplo, la hipdtesisnula se debe aceptar claramente. Como de costurbre, se utiliza tuna prueba de dos colas, sunque quizis haya ocasiones en los que una prucba de una cola sea mis adecuada ‘Una ventaja importante de la prueba de rangos y signos es que tambien se puede utilizar para datos por parejas, ya que se pueden transformar en el tipo de datas dados en el ejemplo anterior. De esta forma se puede wilizar el métod de rangos y signos como una altenativa no parametric ala prueba ¢ por parejas (véase la Sec. 3.4). Ejemplo. La siguiente tabla proporeions el porcentaje de concentracin de zine deter- Iminado por dos métodos diferentes, para cacla una de las ocho muestras de alimentos. Mucstra Titulacion con AEDT. Especttometri 1 72 16 2 61 68. 3 52 46 4 39 57 5 9.0 97 6 85 87 7 66 790 8 44 47 {lay alguna diferencia sistemitica entre los resultados de los dos métodos? La aproximacién a este tipo de problemas es muy simple. Si no hay diferencia sistematica entre los dos métoxtos, entonees se esperaria quc Ins diferencias entre los resultados para cada muestra, es decir, (resultado volumétrico) - (tesultado espectro- métrico)) se distribuiran simétricamente en torno a cere, ks facil obtener las diferen- ccias sefaladas 0.4. -0.7, 06,02, 0.2, -0.4, {in tener en cuenta el signo, tenemos: Colocande estos valores en orden numérico 02,02, -0.3, -0.4, -0.4, 06, -0.7, -0.7 Queda claro que Ia asignacién de rangos a estos resultados presenta una dificultad, kx de las posiciones empatadas, Hay dos resultados con el valor numerico 0.2, dos con un valor numérico 0.4, y dos con un valor numérico de 0.7, gedme se caleulan las posiciones? Este problema, en la prictica el Unico que uno se encuentra en fos métodos. de jerarquizacién, se resuelve asignando posiciones promiedio a los valores empatados, ‘con signos adecuados: por Io tanto, los rangos resullantes para estos datos son “15,15, -3,-45, 4.5, -75,-75 En estos easos, merece la pena verificarsi se ha hecho correetamente Ia ordenacién calculando la stima de todos los valores, sin tener en cuenta el signo. La suma para los rnameros anteriores es 36, Ia misma que la suma de los ocho primeros ntimeros naturales, y por tanto la ordenacién es correcta. La suma de los valores positivos es 7.5, ¥ la de los valores negatives es 28.5. Bl estadistico de fa prueba es entonces 7.5. Al ‘mirar la tabla A.12 se observa que, para = 8, el estadistico de la prucba tiene que sor menoro igual que 3 para quese pueda rechazar la hipotesis mula al nivel designificacion P ~ 0.05, En este caso, la hipotesis nula tiene que ser aceptada —no hay evidencia de Ia mediana (media) de la diferencia sea distinta de cero, y por tanto no hay ninguna evidencia sobre de una diferencia sistertica entre los dos métodos analiticos. De estos ejemplos se desprende que la prueba de rangos y signos es un método simple y valioso, Su limitacién principal radiea en que no se puede aplicar a conjuntos de datos ‘muy pequefios: para una prueba de dos colas al nivel de significacién P = 0.05, n tiene que seral menos 6. 6.7 LAPRUEBA DE SUMA DE RANGOS DE WILCOXON Y METODOS RELACIONADOS La prueba de rangos y signos que se describe en la seccién anterior es vali estudio de conjuntos individuales de mediciones y para conjuntos de datos por parejas que se puedan reducir con facilidad a conjuntos individuales. Sin embargo, en muchos casos 3 necesario comparar dos muestras independientes que no se pueda reducir a tun conjunto tinico de datos. Dichas muestras pueden contener diferentes mimeros de ediciones, Para abordr estos problemas se ian propuesto varias prucbas no paramétricas. La inés sencilla de comprender (aunque quizis no sea Ta muis sencilla de realizar) es La prucha de suma de rangos de Wileoxon. La ejecucién de esta prueba se entiende mejor con tun ejemplo, Ejemplo, Se analiz6 una muestra de material fotogrifico de desecho mediante espee- trometra de absorciénatémica para conocer el nivel de plata, proporcionando para cin- co determinaciones sucesivas os siguientes valores: 9.8, 102, 10.7,9.8 y 10.5 pelml. Después de recibir un tratamiento quimico se volviefon a analiza por et mismo procedimiento, Los resultados obtenidos para las cinco determinaciones sucesivas fueron fos siguientes: 7.7, 9.7, 8.0, 9.9 y 9.0 ug/ml. Hay alguna evidencia de que el tratamiento produjo una reduccién significativa en los niveles de plata? El primer paso es ordenar todos los datos (es decir, de ambos conjuntos de ‘mediciones). Para distinguir los resultados obtenidos después del tratamiento, éstos aparecen subrayados: Las posiciones —de nuevo subrayadas las que corresponden a las mediciones de la smuestra tratada— son: 1,2,3,4,5, 6,7, 8,9, 10 ‘Queda claro que, incluso si aparecen posiciones empatadas y se tratan de la misma forma en la seceisn anterior, la suma de todas las posiciones tiene que ser n(n + 1)/2, eneste caso 55. Si las mediciones de los dos conjuntos de resultados fueranindistinguibles,espe- rariamos que tanto las posiciones subrayadas como las otras estuvieran mezcladas mas ‘omenos al azar en la lista, Esto es la uma de las posiciones subrayadas y la de las otras posiciones deberia ser similar (si el mimero de medicfones fuese e1 mismo en los dos Conjuntos de resultados). En el presente caso la suma de las posiciones subrayadas (muestras tratadas) es 37, Estas sumas de posiciones se convierten ahora en los estadisticos 7, y T; utilzando las ecuaciones: Tr Sy=mim + 2 6S) Tee Sy - mlm + Y/2 (66) donde S, s la suma de las posiciones subrayadas y $; es la otra suma (18 y 37 en este ejemplo) y n, yn son los correspondientes mimeros de abservaciones, En este caso n= m~ 5, con lo cual n(n, 12 = 15,y Ty T2son 3 y 22 respectivamente. El menor de estos dos valoces (3) se compara con el valor apropiado de fa tabla A.13. Es especialmente importante observar que en este ejemplo podemos aplicar de forma ortodoxa una prueba de wna cola porque el método de tratamiento esti diseiado especificamente para reducir el nivel de plata del tesiduo fotogrifico; jesto se podra 0 no hacer con éxito, pero no hay ninguna pasibilidad realista de que erezca realmente el nivel de plata! La tabla muestra que, para P = 0.05 y m= nz = 5, el mentor valor de Tro tiene que exceder desi se vaa rechazar la hipotesis nul Ast, es posible rechazar Ja hipotesis mula —que las dos muestras proceden de la misma poblacion— y concluir due el tratamiento quimico se ha mostrado efectivo en el momento de rechici el nivel de plata en el residuo fotogritic, El funcionamiento de la prueba de suma de rangos se complica debido al caleulo de los valores de Ta partir de las sumias de posiciones, Sin embargo, este paso adicional es ‘esencial ya que Ia prucba es también valida cuando m, y n: son distintos. En dichos casos no es razonable esperar que las sumas de los dos conjuntos de posiciones sean iguales, ‘aunque se hayan mezelado mais o menos al azar en la ordenacisn global, y las ecuaciones (6.5) y (6.6) tongan en cuenta este efecto. Debido a este céleulo adicional se han establecido dos pruebas altemativas, y probablemente mas simples, para comparar dos eonjuntos de datos que tienen diferente nimero de elementos. La primera, la prueba U de Mann-Whitney, es un método mas facil e igualmente vilido para caleular el menor valor de T'definido antes. Ejemplo, Aplique la prueba U de Mann-Whitney a fos datos del ejemplo anterior. En este procedimiento hay que encontrar el niimero de resultados en una muestra que supera cada uno de los valores en la otra muestra. En este ejemplo tenemos Ia impresion de que la concentracién de plata de la solucidn tratada deberia ser, en todo caso, menior que la solucién no tratads. De esta forma esperamos encontrar que et _nimero de casos en los que una muestra tratada tiene un valor mas alto que una muestra no tratada deberia ser pequefio, A continuacién se hace tna lista con cada uno de los valores de la muestra no tratada, y se anota el nimero de casos en que los valores para Ja muestra tratada son mayores. Valores nis grandes Numero de valores Mucstra no tratada en la muestra tratada mis grandes 98 99 1 102 - 0 107 = ° 98 97.99 2 los = 0 La suma total de Ia tercera columna es 3, el mismo valor de Tobtenido en Ia prueba de uma de ranigos, Se ptiede demostrar que Tos dos métodos siempre producen el miso resultado, con lo cual la tabla A.13 se utiliza tanto para la prueba U de Mann-Whitney ‘como para la de suma de rangos. Es obvio que el método de la prucba U es una forma mticho mas sencilla de Hegat al valor de 7. En realidad, cuando los mimeros de _mediciones son pequeios, el cfleulo se puede hacer mentalmente, lo cual es una gran vventaja, Sise presentan empates (valores idénticos) en la prueba U, acada uno seasigna tun valor de 0.5 en el ealeulo de T Otro método conveniente que tiene alguiias caracteristicas interesantes en la prucba ripida de Tukey. Parece apropiado que se ilustre su uso con el mismo ejemplo. Ejemplo. Aplique la prueba rapida de Tukey a los dates del ejemplo anterior. ‘Se puede considerar que la prueba esta formada por dos pasos, aun cuando sélo se isponga de pocos resultados; esos dos pasos se agrupan sin Ingar a duda en un solo céleulo mental rapido, En el primera, se cuenta el niimero de resultados del segundo conjunto de datos que son inferiores a todos los valores del primer conjunto. $i no existe ningin valor con esa condicidn la prueba se da por terminada, y se acepta la hipotesis nula de medianas iguales. En el ejemplo que se esta analizando, hay tres de ces0s valores, las lecturas 7.7, 8.0 y 9.0, son inferiores al menor valor del primer conjunto (9.5), En el segundo paso, se cuentan todos los valores del primer conjunto, de datos que son mds grancdes que 1odos los valores en el segundo conjunto, De nuevo, si no existen esos valores la prucba finaliza y se acepta Ia hipstesis mula, Aqui hay también tes valores, 10.2, 10.5 y 10.7, que superan el mayor valor del segundo conjunto de datos 9.7) (Esta aproximacién se puede contastar con lade la prieba U de Mann-Whitney, que identifica los valores grandes en la muestra que se espera tenga Ja mecliana nis pequeiia.) Globalmente, por tanto, hay seis valores que no estin dentro Gel intervalo donde se solapan las dos muestras. Este total (a menudo designado por T pero que no se debe confundir con el estadistco Ten la prueba de sua de ranges) e¢ el estaistico de la prueba, El aspecto mis interesante y destacado dela prueba rida de Tukey es que normalmente no se necesitantablas estadistcas para interpretar este resultado. Si suponemos que el nimero de lecturas de cada muestra no excede de 20, que los dos tamafios muestrales no dificren mucho (condiciones que probablemente serian validas en muchos experimentos analiticos reatizados en Inboratorios), tos valores de referencia de 7 pata un nivel de signficacién eonereto serin independientes del tamario nuesiral, Para una prucba de una cola se puede rechazar la hipotesis mula si T2 6 (para P = 0.05), 2 7 (P = 0.025) >, 10 (P = 0.005) y > 14 (P = 0.0008). (Para tuna prueba de dos colas los valores criticas de T'a unos niveles de significacion P 0.05, 0.025, 0.005 y 0.0005 son 7, 8, 11 y 15, respeetivamente). En el ejemplo que estainos analizando, por tanto, el valor de Tes suficientemente grande para set significativo a un P ~ 0,05 en una prueba de una cola. Podemos por lo tanto rechazar la hipotesis nula y coneluir que el tratamiento reduce significativamente el conte! 4e plata en el material fotogrifico de desecho, lo que concuetda con la prucba U de Mann-Whitney. Se prodiicen empates en la prueba ripida de Tukey (es decir si uno de estos vatores n la muestra hipoteticamente ms grande es igual al mayor valor de la otra nuestra, 0 tuno de Jos valores en la muestra “ms pequena” es igual al menor de la muestra "mas sande”) entonces cada empate se cuenta como 0. en el caleulo del valor de T ‘Adem desu aplicacin habitual para comparar medianas, a prucba de uma de rangos de Wilcoxon ha sido moditieada por Siegel y Tukey para comparar Ia dispersin de dos conjuntos de resultados, y asi ofrecer una altemativa verdaderamente no paramétrica ala prueba F (véase la See. 3.5). En esta version de la prucba de suma de rangos, se juntan los {alos y se disponen por orden creciente del valor numérico, como antes, subrayando une Ge los conjuntos de resultados para diferenciarlo del otra. Luego se ordenan de una forma diferente: a la medici6n mas pequeia se le asigna la posicin 1, a fa ms grande se asigna !a posicidn 2, la medicién inmediatamente anterior a‘ mis grande lleva la posicion 3, la inmediatamente posterior a la miis pequena leva la posicion 4, la medicion posterior a las dos mis pequeiias lleva la posicidn 5 y asi sucesivamente. (Si el nimero total de wediciones ¢ impar se jgnora la medida central.) Esta “ordenacisn altera por pares" produce una sittacion en la que se asignan posiciones bajasa los resultados bajos y altos, y los resultados centrale reciben posiciones alta. Si un conjunto de datos tiene una dispersion significa. tivamente mayor que el otro, la stmia de sus posiciones deberia ser mucho menor, mientras cue si la dispersion es similar en los dos eonjuntos de resultados, las stmas de. sus Posieiones tambien seran similares. La aplicaeién de este método en el ejemplo utilizade 4 prineipio de esta seccion proporciota las posicfones siguientes: 92, 98, 99, 102, 105, 107 Datos 12, 80, eo o (0 ree age alee Posiciones: “4 Ja tabla A.13). La hipotesis mula, en este caso que la dispersion de Tos reultdoses sina proporciona al 68 PRUEBAS NO PARAMETRICAS SOBRE MAS DE DOS MUESTRAS. En a seceisn anterior vimos pruebas que comparan dos nluestras esladisticas entze si. Sin cag, los métads no parametrces no estinfinitados dos eonjotos de datos: hay varios métodes disponibles que compara es ois rests, Anes de de a idea several sobre dos de estas prchas, es importante mevelonr un psig gus se debe ear cn tas las comparaciones de muchas mista. examina ies cnnios de meiiones (0or ejemplo, para comprobar si sus medias sn ono sinilares, existe Ia tention de comprar ieamente fs dos muss ue fn ts medias myer y menor. Esa aproxinacin simplista puede condi # restos engosos. Cuando se tomar var muestras de la misma poblacién, hay casos en que Ins medianas menor y mayor, eonside- radas en fortna aislada, resultan ser significativamente diferentes. Esto se debe a que, a ined que crse el imero de metas a fern ent as edie menor mayor tender a erect La aproximacion cmeca es realizar upc ge considers fdas las Imtestras juntas si se demuesra que tas pian proceder de la nisin poblacn, entonces se pueden realizar pruebas separa paint entfcar dnd se proton las diferencias significativas. Aqui describimos, en términos generales, los prineipios d dos pruebas no paramétricas para tres o mis conjuntos de datos; el lector que desee mis informacién puede consultat los libros mencionados en Ia bibliografia La pricba de Kruskal-Wallis se puede considera coino una extension del proc mento de suma de ranges ce Wileoxon para comparar las medias de tres os miestras entre fs que nose pda consider nnn io de emparejaicno, (Ua geetalizacion {elanlisis ce plata escrito la seceion anterior con tres mestras ce material otogrstio de desecho, una sin tratamiento y fas otras dos tratadas por metodo diferentes, proporcio- ria un ejemplo donde serail a prcba,) Los resultados de fs tes (o nis) testasse junta ys isponen por orden de menor mayor Se tenn cl otal de posiciones pra tos datos de las diferentes musias: se promedia las posieiones con el wisn valor come cn el inétodo de Wileoxon, aunque hay un procedimiento de cosreccion especial si se encuentran numerosos Valores iguales. Es ficil apreciar quc, si cada nuestra tiene el mismo ero cle mediciones (ésta no es una condicién de la prueba), y si las muestras tienen edianas similares, entonces seria similar Ia suma total de posiciones en cada muestra, de Inanera que la suma de sus cuadrados seria minima, De este modo, si tenemos tres muestras cada una con cinco medidas— las posiciones iran de la 1a la 15 y la suntia de todas ellas seri 120. Supongamos que las tres medianas son muy similares, y que la suma de las posiciones para cada muestra son por tanto iguales a 40. La suma de los cuadrados de estos totales sera 40* + 40? + 40° ~ 4800. Si las medianas son significativamente diferentes, entonces los totales de Jos rangos serin también diferentes unos de otros —digamos 20, 40 60. La suma de los euadrados de dichos totales seri siempre més grande «que 4800 (20° + 40° + 60? ~ 5600), Se puede determminar la probabilidad de obtener cualquier suma de cuadrados utilizando clestadistico ehi cuadrada (véase ef Cap. 3). Si uno se refiere a las muestras por A, B, C, te, (& rmuestras en total), con un niimero de medidas 4, ma, ne, ete, y Ia suma de las posiciones por Rs, Ra, Re, etc,, entonces el valor de y? esti dado por )-30+1 (67 donde N= 14 + my + ne ete, Este valor 7° se compara con tos valores usuales cuando el iimero total de medi no obstante se utilizan tablas especiales para mi- Inewos de mediciones mis pequcios. El mimero de grados de libertad es &~ 1. Los valores cexperimentales de 7° que superan los valores tabuladas permiten rechazar la hipétesis mula {que las medianas de las muestzas no son signiicativamente diferentes). Como ya se ha bservado, en esta iltima situacién se pueden realizar otras pruebas sobre pares individua- les de nuestras; de nuevo, el lector que desee mayor informacién puede eonsultat la bibliografa Ya hemos visto (Sees. 3.4 y 6.3) que cuando se comparan resultados por parejas, se bucden utilizar prucbas estadisticas especiales. Estas prucbas se basan en el siguiente Principio: cuando dos métodos experimentales que no difieren signficativamente se apli- can a las mismas muestras quimicas, las diferencias entre los pares de resultados empare~ Jados deberian estar cerca de cero, Esto puede extenderse a tres 0 més conjuntos de resultados emparejados utilizando una prueba no paramética ideada en 1937 porel famoso «conomtista amerieano, Milton Friedman. En quimica analitia, la principal aplicacign de la Drucha de Friedman es a comparacion de tes (o mas) métodos experimtentales aplicados # bas misinas rnuestras quimiicas. La prueba utiliza de nuevo el estadistico 72, en este caso Para caleular las diferencias que apatecen entre Jos valores de la sum total de posiciones, or distintos métodos. EI siguiente ejempto aclara la simplifia ién de la aproximacion: emplo. Se determinaron los niveles de un pesticida en cuatro extractos de plantas por (A) cromatografia liquida de alta resolucisn, (B) cromatogratia de gas-liquido, y (C) radioinmunoensayo, Se obtuvicron los siguientes resultados (todos en ng/ml) Must Método A B c 1 47 58 S7 2 1 7 as 3 90 99 98 4 23 20 29 @Proporcionan los tres métodos valores para los niveles ule pesticida que difieren te poten se esuelve simplemente sting os sus rao, Poa ccs mesa se asia la sca 1 al ito ge da lesa esultados de la tabla por Moestea Méiodo A B c L 1 3 2 2 1s Us 3 3 L 3 2 4 2 1 3 5 necesario el uso de un valor promedio en el caso de posiciones empatadas en ka Imus 2 (See 66), Ls de posses rao ne mito AB C,son 5.5, 8.5 10, respectivamente. Estas sumas totaizarian nk(k + 1/2, donde k es Tver de midtodos (aqut tres) y a el nimuero de muestras (aqui cunt). Se elevan al ‘undrado Ins sumas de los rangas, lo que da 30.25, 72.25 y 100, respectivamente, y estos cuadrados se suman para dar el estadistico R, que en este caso es 202.5. El valor experimental de 7° se calcula entonees » partir de 5 ae 3 (68) nk(k +1) ake) {que resulta en este caso 2.625, Al ive! de signifieacisn P= 0.05 y con k= 3, los valores criticos de 7? son 6.0, 6.5, 6:4, 7.0, 7.1 y 62 para n = 3,4, 5, 6,7 y 8, respectivamente (Muchos conjuntos de tablas estaisticas proporcionan mas dates, y cuando k > 7, se puede utilizar las tablas usuales de 72 eon k ~ 1 grados de libertad.) En este e280, ef valor experimental de 7 es muclio menor que el valor eritco, y se debe aceptar la hipdtesisnula: los tres metodos dan resultados que no differen significativamente. Fs importante mencionar que Ja prueba de Friedman podria wilizarse alternativa- tncnte en forma inversa: suponiendo que los tes métocos aaliticos dan resultados inistinguibles, se podia utilizar el mismo procedinviento para contrastar diferencias centre los cuatro extractos de plantas. En este caso ky 1 son 4 y 3 respectivaniente; el lector puede verficar eon cuidado que R es 270 y que el valor resuitante de 7° es 9.0. Tte es mayor que el valor eritico para P = 0.05, n = 3,k4, que es 7.4. Asi, en esta segunda aplicacin de I prucha se puede rechazar la hipstesis nula, y afirmar que las cairo muestrasdfieren en sus niveles de pesticida, Se encuentran disponibles otras es de muesteas seleceionados. pruebas que permiten comparaciones entre pa Evidentemente es mucho mis simple realizar Ia prueba de Friedman en fa prictica que elmctoclo ANOVA (veanse Ins Sees, 3.8, 3.10), aunque no tiene la capacidad de est de estudiar los efcetos de interaccion (vease el Cap. 7) 69 CORRELACION ORDINAL Los métodos de jerarquizacion se pueden aplicar tambien a los problemas de corn El método de coeficiente de correlacién ordinal de Spearman, que se decribira en esta se ibtt Cans re nmi nti open anh no se expresa con facilidad en términos cuantitativos, pero Para un panel de catadores. de enol. Un pe de eperos oes sep sx peeencis site vines de mesa eres mers asi asco I lag ny stern oo de iid de aac de cas vin (en pes por milan) se deg tne ais po inecin en fijo con dca clot, Uc lo silts siguientes para deerminr i hay reac ste cleed vino y ¢l contenido de didxic 7 eta Vino A Bo cp ose clot 1 2 5 8 SS GS oid 50, ey yg i) EI primer paso en los cileulos es convertir las concentraciones de SOs de valores absolutos a valores de ran; i orang (i aparcenpsiionesempatadce ese ene seciones aero) nese Pomedoncomose Vino ; A Bo cp F tose te TM ps te ‘tendo de SOs 1302 4 6 $ G Entonces, se calcula ls diferencias, se caleulan las diferencias, dente las dos ordenaciones Claamente -1, 1,0, -1, 1, 0. El coeficiente de correlacién, p, esti dado entonees por: 8 62d? p= 1-— n(n? = 1) (6.9) es slemplo, es 1 - (24/330), es decir, 0.929. La teoria demuestra que, como 1 Seeficiente de corcacién momento-preducto, puede varia entie=1y +1. Cuando de orcas a superar 0.780 si se va a rechazar la hiptesisnula de ausecia tos rac al nivel de signifencin P = 0.05 (véase I abla A.14). Agu, pode re, ometulr que hay una coretacicn ene el contenido de SO: de los vines y su lad percibida, Teniendo en enenta la forma en que se definen las posiciones, una fuerte evidencia de que niveles de SO; mas altos prouicen vinos menos aceptables al paladar! Otro método de correlacién ordinal, debido a Kendall, se introdujo em 1938; éste pre~ tende tener algunas ventajas tedricas sobre el método de Sparman, pero cs mis complicado «de calcular (especialmente cuando aparecen posiciones empatadas) y no se emplea con tanta frecuencia 6.10 METODOS DE REGRESION NO PARAMETRICOS Al analizardotalladamente tos métodos de regresion linealesen el eapitulo anterior, se hizo hineapie en la hipdtesis de cistribucién normal para los eroresen a diteccion del ee ys ¥ ued clara In complejidad de alguno de los métodos de eéleulo; sta se supera en gran parte al utilizar calculadoras © computadores, y existen también algunos métodes de proximacién ripidos para ajustar Kineas rectas a datos experimentales (¥éase la bilio- afin), Se mantiene, por lo tanto, un cierto interés en las aproximaciones no paremétricas 1 problema de ajustar una linea reta a un conjunto de puntos: de los métoios disponibles, {quizis el mas simple es el método incompleto dle Theil, denominado de esta forma para distinguirlo de otto procedimiento mis complejo desarrollado por el mismo autor (el método “completo") I método de Theil supone que un conjunto de puntos (31, 1) (8s 33), ele aa ser ajustado por una recta de Ia forma y = bx + a. El primer paso en los ealenlos consiste en disponer los puntos en orden de x reciente. Si el mimero de puntes, x, es impar, et punto medio, es decir, el valor median de x se bora el eleulo siempre exige un nlimeto pa de puntos, Para cualquier par de puntos (3, (83) donde x, > x, la pendiente, by dela linea {que une los puntos se puede calewar a pati de: G8) (6.10) by 0 tes by para el par de puntos (8, )1) y el inmediatamente posterior al valor mediano de lax, para (1,2) y el segundo punto despues del valor mediano de la 4, y asi sucesivamente hasta que se calcule la pendiente para fa Kinea que une el punto, inmediatamente anterior a la mediana de x eon el tltimo punto, De esta forma, silos datos originales contenian II puntos, se estimarian 5 pendientes (el punto mediano se ha ‘omitido}; 8 puntos originales proporcionarian 4 estimaciones de Ia pendiente, y asi sucesivamente, Estas estimaciones de In pendiente, a su vez se disponen en orden ascen- dente y su valor mediano, caleulado como se deseribi6 en In seccién 6.2, es la pendien- {westinada de la linea recta. Con este valor de b, los valores a de fa ordenadla en el origen se estiman para cada punto con la ayuda de la ecuacién y ~ bx + a, De nuevo, las estimaciones de a se ordenan de forma ascendente y el valor mediano se elige como la Je la ordenada en el origen de la recta. Fl método se aclara mediante el Se caleulan las pend mejor estimacis siguiente ejemplo. Ejemplo. Se han obtenido Jos resultados siguientes en un experimento de calibracién para la determinacién absorciométrica de un complejo metalico tipo quelato: Concentracién, we/tnk Ot) ) 9 0) om ay Absorbanein 004 023 039 059 08s O86 124 142 Uitilice el método de ‘Theil para estimar la pendiente y la ordenada en el origen de la recta que mejor se ajuste a esos puntos, En este caso el cilcuto se simplifica al tener un mimero par de observaciones, y por 4que los valores de x (es decir, las concentraciones) aparecen a intervalos regulares y estan ya ordenadas. Por tanto se calculan las estimaciones de la pendiente de los cuatro pares dle puntos: bys = (0.84-0.04)/40 ~ 0.0200 ye = (0.86-0.23)40 = 0.0158 ry» (1.24-0,39)140 ~ 0.0212 b= (142-0.59)/40 = 0.0208 Ahora se ordenan estas estimaciones de la pendiente, resultando 0.0158. 0.0200, 0.0208, 0.0212. La estimacion mediana de la pendiente es, por lo tanto, el promedio entre 0.0200 y 0.0208, es decir, 0.0204. Se utiliza este valor de b para estimar Ia ondenada en el origen, a; los ocho valores a, individuales son: 1a; = 0004 ~ (0.0208 « 0) ~ +0.040 a: “0.23 ~ 0.0204 « 10) = +0.026 ‘a5 = 0.39 - (0.0204 20) = -0.018 ay = 0.59 ~ (0.0204 x 30) ~ -0,022 ‘as = 0.84 » (0.0204 » 40) = +0024 15 = 0.86 ~ (0.0204 50) ~ -0.160 7 ~ 1.24 ~ (0.0204 60) = +0.016 a = 1.42 ~ (0.0204 « 70) ~ +0.008, Ordenando estas estimaciones de la ordenada en el origen, tenemos -0.160, -0.022, -0.018, -0.008, +0.016, +0.024, +0.026, +0.040. La estimacién mediana es, por lo tanto, 0,004. De este modo coneluimos que Ia mejor hi esti dada por y= 0.0204 + 0.004. Es fell mostrar que la reeta de “minimos cuadiados”, caleulada por los métoclos del capitulo 5, es y = 0.0195x + 0.019. La figura 6.1 muestra que ambas, Fectas son similares cuando se representan grificamente. Sin embargo, el método de ‘Theil tiene tres ventajas distintas: no suponte que todos los etrores estin en fa direccion, de ys no supone que los errores en la direceién de.x 0 de y se distribuyan normalmente,, {Y¥ no se ve efectado por la presencia de resultados anémalos. Este tiltimo aspecto queda laramente ilustrado por el punto (50, 0.86) de este ejemplo; tiene tox la aparieneia de scr un resultado anémalo, pero su valor no afecta, en absoluto, el edleulo de Theil, Ya que ni bse ni ae afectan directamente las estimaciones medianas de la pendiente y ordenada en cl origen, respectivamente. En el caleulo de minimos cuadrados, sin embargo, este resultado anémalo tiene tanto peso como los otros; esto se reflefa en los resultados calculados: Ia linea de minimos cuadrados pasa mis cerca det resultado anémalo que Ia tinea no paramétrica, Se dice que los métodos estadisticos que no se ven muy afectados por los resultados anématos son metodos “robustos”: st importancia ln éste y ottos casos esti ela. Adifereneia de la mayoria de Los métodos no paramétricos,¢1 método de Theil coulleva silculos tediosos, y seria de gran utilidad un programa de computador. Tenga en cuenta 14 12 1.0 08 0.6 04 02 ow 208640508070 ~8O ‘ ype i ric dee ta decline port mtad de Tell) Fewen 6 On ode mininos ciara del eaplo 5), que también existen métodos no paramnétricos disponibles para ajustar curvas, si bien éstos escapan a los objetivos de este libro, 6.11 LA PRUEBA DE BONDAD DEL AJUSTE DE KOLMOGOROV Jlema estadistico frecuente de la “bor ad de ast Este eae ceando ne neces prob la provedeeia de una muesta . suit conc eomo pds sen acon noma La prs dei caada cry ain ee foe cond ss reson camo ster + atc liza ormalment pra menos de 0 observasines, ye ee jnuos. En esta seccién se describe el método de Kolmogorov, aves nario proba dlaitecon dat coined. Este eto reetCexenersreompaco de don mestas, nen desi con tle ree hte modeaes taro scien eh rier ig porShimov,¥ co seShapacbarse es ence,» ero, com el metdodeKologorv-Simow iyi deo ponacon de Kolmogooy espe Cons nur teats cde dts qe se osc ev deen (Sdn dinelnproptt como coset de eva defen Sac sca pectin on eco pel prt na aa c irvas experimental e hipotética, el estadistico tet apt 3 Cuando se han tao sc 5p mn rear > ne enconando la maxima cieencia veal entre abs, y come Enel capitulo 3 se estudio el probi usatla con datos con rando este vator, de la fortna habitual, con el conjunto de valores tabuilados. Si tos datos experimentales se apartan sustancialmente de la distribucion esperada, se esperard que las dos curvas se encuentren separadas en parte del diagrama de frecuencias acumuladas; sin ‘embargo, silos dates estén en gran consonancia con la distribueién esperada, las dos curvas. nunca se separaran mucho una de otra. En la practica, el método de Kolmogorov tiene dos aplicaciones frecuentes ~prucba de aleatoriedad, y prueba de normalidad de una distribu- ion; el funeionamiento del procedimiento se ilustrard con ejemplos simples, Bjemplo, Se analizaron las lecturas de bureta obtenidas por un laboratorio durante un periodo dilatado, En 50 lecturas se ha encontrado que los iltimos digitos registrados sont los que aparecen en Ia siguiente tabla: Digito: Oo 123 4 5 6 7 8 9 Frecuenteia: ees {Son estas lecturas congruentes eon un uso aleatori «latos de este ejemplo son idénticos a los del ejercicio 5 al final det eapitulo 3.) En este ejemplo la distribucion hipotética es inmediata: se presupone que todos los digites del 0 af 9 tienen la misma probabilidad de aparecet, y no son posibles otros resultados. La curva hipotética de frecuencias acumuladas es, por lo tanto, una fun- cidn regular escalonada como se muestra en la figura 6.2. Las frecuencias acumula- ‘Gas en Ia préctica son claramente: 0.02, 0.14, 0.22, 0.32, 0.38, 0.60, 0.64, 0.80, 0.86, 1.00 en x = 0, 1, 2, ...9, respectivamente. Las dos curvas muestran una diferencia ‘nvixima de 0.12 en x = 4. (En ejemplos simples de este tipo es innecesario representar en Ta prictica las frecuencias acumuladas; la diferencia méxima se puede obtener ‘examinando los datos.) La tabla A.15, que es adecuada para unia prueba de dos colas (eleaso usual), muestra que al nivel de significacion P~ 0,05 para n = 50 el valor citico cs 0.188, de manera que no se puede rechazar la hipotesis nula de que los digitos se distribuyan ateatoriamente. de los digites 0.9? (Note que los. Elector observara que este resultado es el mismo que el obtenido utiizand el método ‘i euadrada (vase el Cap. 3, ¢. 5). Una inspeccién minuciosa de las dos pruebss muestra que, en el caleulo de chi euadrada, os valores experimental y tabulado son casi los mismos, ss decir, los digitos de titulacién no se desvian significativamente de una distribucién ‘lestori. En Ia prueba de Kolmogorov, sin embargo, los resultados sugieren que las datos se desvian ostensiblemente de la aleatoriedad. Esta reflexion surge del hecho de que los ‘alotes de Ia tabla A.1S estin basados en la hipétesis de que la distribuetén probada es cout, Cuando los datos son disereto, ls resultados de a prueba son conservadores, > decir, tienden a dar muy pocos resultados significativos. No obstante hay algunas Yettajasen Ia prueba de Kolmogorov. En los ejemplos del tipo que se acaba de analizas, ests sencillo de utilizar, es nas lable cuando nes pequeii. (El ejemplo anterior utiliza inecisamente el conjunto de datos mis pequefios que generalinente se puede estudiar por | iétodo chi euadrada: 50 observaciones y una frecuencia esperacla de 5 para cada ‘nimero,) El método de Kolmogorov también proporciona limites de confianza no paran ‘"ieos para la funcién de dstribucion acumulada verdadera uilizando los datos de la tabla ‘15, Este tema se trata con mayor profundidad en pruebas detalladas sobre métodos no paramétricos (véase la bibliografia). TT Sr FAP oat | ost 7 4 oak 4 | oz 8 Digit apa Inleatriodad ds digitos 0-9. La nl de mtd de Kotnege Fes acura eis (8) J eRe By se musta con a ches (>. iguas2_ El ental cite repreceat Senacion pei ana disrbacknes noma unos ti el nso de Komozaos aa ror un dion nol vo eect que hor ss tsa os os ens, ai psn one oer ara a tea desvicion etna, nT ar Esto se hace utilizando la ecuacion: 1) zn (ewe ' sformacién ritual. Se sueleconsideraresta ran 7 estdndar. La teoria demuestra que 2, 1 su funcin de distribucion esté dada eee ated nes de tablas estadisticas. La ecuacion (6.11) Seer ae pares ae necesario probar la procedencia de un conj os Gee ae iba de Kolmogorov. Con mas: frecuencia, sera necesario cont aie eee de los datos de cualquier distribucion normal, En este on FE ee Fh i do ‘se transforman por la ecuacién (6.11); y por ultimo se aplica el met todo Kolmogorov, Estos dos tipos de pruebas se analizan en el ejemplo siguiente. ernst Ejenplo.S ealiarn cc titlaciones con : Se 250, 2457. 25 11) 2809 ml Dehra parang te os pobissen nore contedi 28.00mlpdeninclonccansr oo eo) otra poblacion normal? 7 “alawicr wa Etese 28 inept es tansfoeariosalosxen valores ic la relacion z = (x ~ 25.00)/0.05 obtenida de la ecuacion (6.11). Los och sul on wansformatos en 26, 04,22. 14,06, 06,28 y 18 Taos ler renee Iori cant como fain de bck con ode OES di er cada paso, (Otserve que steno sl mismo cleo ie se lien a sein 312) Lacongrc fiona pcin casla pe)
      : 5 El método por el cual se estiman los efectos de los factores y sus interacciones se ilustra mediante el ejemplo siguiente. Ejemplo. En un experiment de cromatografia liquida de alta resolucién, se investige {2 dependencia del parimetro de retencién, €, sobre tres Factores, Los factores fueron pH (factor P), la coneentracién de un contraién (factor T) y la coneentracién de un disolvente orgdnico en la fase movil (factor C), Se utilizaron dos niveles para cada factor y se realizaron dos mediciones, una réplica de la otra, para cada eombinacién, Las mediciones se aleatorizaron. La tabla que se expone a continuacién da el valor medio para cada par de réplicas, Comibinaeién de niveles de factor & 47 99 70 27 150 53 32 60 BaReo-se (a) Efecto de los factores individuales. El efecto de cambiar los niveles de P se puede hallar de la diferencia media en respuesta cuando P cambia el nivel alto bajo y los niveles de C y Tse mantienen fijos. Hay cuatro pares de respuestas que proporcionan una estimacién del efecto del nivel P, como se muestra en la tabla siguiente. Nivel de P Nivel de C Nivel deT + = Diferencia : - 99 47 52 ; : 53 27 26 - + 150 0 30 * + 60 32 28 Total = 186 Efecto promedio de alterar el nivel de P ~ 18.6/4 = 4.65 ‘De manera similar se puede obtener ¢l efecto promedio de alterar los niveles dey C. Se deja como ejercicio para el lector demostrar que ellos son: = 4.85 efecto promedio de alterar el nivel de C 245 efecto promedio de alterar el nivel de (b) Interaceién entre dos factores. Consideremios aliora los dos factores P y T. Si no hubiera interacctén entre ellos, entonces el cambio de resptiesta entre los dos niveles de P deberia ser indepen- ente de! nivel'T. Las primeras dos cifras en fa ultima columna de la tabla anterior dan ‘el cambio en respuesta ensando P cambia del nivel alto al bajo con Ten el nivel bajo. Su promedio es (3.2 + 2.6/2 ~ 39. Las dos slimas cifras en la misma columna proporcionan el efecto de eambiar P cuando T esté en el nivel alto, Su promedio es (8.0 + 2.8)/2 ~ 5.4, Si no hubiera interaccidn ni error aleatorio (véase la Sec 7.7) estas cstimaciones del efecto del cambio del nivel Pdeberian ser iguales. El convenioseguido ces tomar la mitad de su diferencia como una medida de la interaccis efecto de interaccién PT ~ (5.4 - 3.9/2 ~ 0.75. Es importante darse cuenta de que esta cantidad estima el grado en que los efectos de Py Tno son aditivos, Igualmente, se podria haber calculado considerando queé tanto el ‘cambio en respuesta para los dos niveles de T es independiente del nivel de P. Las otras interacciones se calculan de manera similar, De nuevo el lector puede verificar que: ‘efecto de interaccién CP =~ 1.95 efecto de interaccién CT ~ - 1.55 (©) Interaceisn entre tres factores. La interaccidn PT calculada anteriormente se alnivel de C. Con C en el nivel bajo, a estin rede dividit en dos partes con relacién icin de la interaccion seria (8.0 ~ 5.2)/2 = 14 y con C en el nivel alto seria (2.8 - 2.6)/2 ~ 0.1. Si no hubiera interaccién entre Ios tres factores ni error aleatoro, estas estimaciones de la interaccion PT debe- rian seriguales. La interaccién de los tres factors se estima por a mitad de su [+ @.1-1.4)72 ~ - 0.65}; y mide hasta que punto el efceto dela interacci efecio de C no son aditivos: igualmente se podria ealcular considerando la diferencia entre las estimaciones de la interaccién PC para los niveles bajo y alto de T, o la los efectos de orden mis grande son normalmente mucho mas pequchos que los efectos principales y los efectos de interaccién entre dos factores. Si las interacciones de orden, superior se pueden suponer insignificantes, una fraccién adecuada de todas las posibles ‘combinaciones de los niveles del factor es suficiente para proporcionar una estimacion de los efectos principal y de interaccidn de dos factores. Como se mencions en Ia seccién 4.7, dicho disefio experimental se llama disefio factorial fraccional o incompleto, Al utilizar un disenio factorial para determinar qué factores tienen un efecto signitica- tivo sobre la respuesta se observa que, para factores que son variables continuas, el efecto depend de los niveles alto y bajo utilizados; si éstos estan excesivamente cerca no del otro, se puede obtener que el efecto del factor correspondiente sea no significativo, a pesar de que sobre cl intervalo posible completo de los niveles del factor el efecto de ese factor no sea despreciable, Por otra parte, silos niveles se alejsn bastante pueden caer a ambos lados de un maximo, y aun asi dar lugar a una diferencia en la respuesta que no sea signific 7.40 INCAPACIDAD DEL METODO DE UN FACTOR CADA VEZ PARA. LOGRAR EL OPTIMO. En la secci6n 7.8 se demostr6 la superioridad de un disefio factorial sobre un experimento, de un factor eada vez en el momento de estimar si un Factor ejercia un efecto significative. Elmétodo de un factor cada vez.es también poco adecuado para lograr condiciones éptimas sila respuesta depende de dos 0 mas factores que interaccionan (véase la Sec. 1.6). Esto se puede comprobar grificamente cuando la respuesta lepende de dos factores que son variables continuas. En este caso, la relacién entre la respuesta y los niveles de los dos Respuesta Figura 7.4. Una superficie de respuesta para dos factores, factores se puede representar por una superficie tridimensional como se muestra en la figura 74. Esta superficie se Hama superficie de respuesta. Se comprende mejor su utili- dad consideranclo un diagrama de curvas de nivel (véase la Fig 7.5),en el que la respuesta sobre cada curva de nivel es constante. La forma de las curvas de nivel es, desde luego, esconovida por el investigador, quien desea determinar los niveles éptimos, ey Ye para Jos factores Xy ¥, respectivamente. Adoptando elenfoque de un factoreada ver con el nivel incial de X fijoen.x,, por ejemplo, y variando el nivel de ¥,resultaria una respuesta maxima encel punto A, cuando et nivel de ¥ fuese y A continuacién, manteniend el nivel de Yen ‘i, ¥ Variando el nivel de X resultaria un inaximo en B. Obviamente, éste noes el maximo real y la posicién alcanzada depence del nivel inicialelegido para xy. El proceso se podria repetirvariando los niveles de X y Yalternativamente, pero éste es un método no eficiente de aproximacién a (xs, 34). Adentis, en algunos easos no conduciia al maximo real, como se pone de manifiesto en la figura 7.6 donde, aunque C no es el maximo real, el valor de respuesta dismimye hacia cada lado de las direcciones X'y ¥ Con el método de un factor cada vez, al legar a este punto se concluria, por tanto, que representaba Ia respuesta inaixima. Razonamientos similares se aplican en la optimizacion de mas de dos factores, aunque nose pueda visualizar fécilment la superficie de respuesta en estos casos. Por esta raz6n, el anilisis de los métodos de optimizacisn se centraré en gran parte en el caso de dos factores, aunque los métodos se puiedan generalizar a cualquier nlimero de Factores. 7.41 METODO DE LA MAXIMA PENDIENTE O DEL GRADIENTE El proceso de optimizacion se puede visualizar como um hombre en una colina co espesa y que pretend Ilepr a fa cima. En estas cireunstancias una aproximacion obvia es 3 1 2 iz vg] wane = a5 Nivel de x Figura 78 Un disefio factorial 2 2 para determinar la maxima pendiente, que esta indicada por Ia linea de trazo discontinu. Los efectos de X y de ¥ indican que en la figura 7.8 se buscaria la mixima respuesta a la detecha y por encima de la regién original. Ya que la variacién en la direccién de X ces mayor que en la direccién de Y, el incrementro a dar en la direccién de la X tendria que ser mayor. Para set més exactos, los inerementos en las direcciones de X y ¥ tendrian ‘que estar en razén de 5 a 4 respectivamente, es decir, en la diteccién indicada por la de trazo discontinuo de la figura 7.9. El paso siguiente en la optimizacién es realizar otros experimentos en la direecion indicada por la linea discontinua en Ia figura 7.9, digamos que en los puntos euya numeracién es 5, 6 y 7. Esto indicaria que el punto 6 es una posicién aproximada para el maximo en esta direcci6n, Entonces se leva a cabo otro experimento factorial en la region del punto 6 para determinar la nueva direccion de la méxima pendiente. Este método proporciona una forma satisfactoria de progresar en direccin al maximo, con tal que sobre Ia region del diseno factorial, las curvas de nivel sean aproximadamente rectas. Esto es equivalente a que la superficie de respuesta sea plana, lo que se puede describir matemiticamente por una combinacién lineal de términos en xy y. Al estar mas cerca de la cumbre son también necesarios érminos en xy, x" y°, El término xy representa la interaccidn entre X y Y y se puede estimar utilizando la replicacién como se deseribis en la seccién 7.9. Los términos cuadrados, que representan la curvatura de la superficie, se pueden estimar comparando la respuesta en el centro del disefo factorial con el promed de las respuestas en las esquinas. Cuando los efectos de curvaturae interaecién se hacen ‘mis apreciables en comparacién con el error experimental (que se estima mediante replicacién) se emplea un diseno factorial mas elaborado que permite determinar la forma dela superficie curva y, por lo tanto, la posicidn aproximada del maximo. Es evidente que el diseno factorial y el método det gradiente seri muy complicados cuando existan varios factores implieados. La siguiente seccidn describe un método de optimizacion que es conceptualmente mucho més simple. 40 Temperatura, © 6.6 6.8 7.0 7.2 7.4 7.6 7.8 8.0 pH Figura 7.9 Diggrama de curvas de nivel: a dteceida iniial de la maxima pendiente es la corres: ponudiente ala linea de trazo discontinuo, En loa puntos 5,6 y 7 se realizan mievos experimentos, 7.12 OPTIMIZACION POR EL METODO SIMPLEX La optimizacion simplex se aplica cuando todos los factores son variables continuas. (Se advierte al lector que ta eleccién del nombre es poco afortunada ya que el método es iferente det método simplex que se utiliza en programacién lineal.) Un simplex es una Figura geomeétrica que tiene m + 1 vértices cuando se trata de optimizar una respuesta respectoa n factores. Porejemplo, pata dos factores, el simplex sera un triangulo, El método de optimizacisn se ilustra mediante la figura 7.10. El simplex inicial esta definido por los puntos con numeracién 1,2 y 3, En el primer experimento se mide la respuesta en cada luna de las combinaciones de los niveles del factor dadas por los véttices del simplex. En este caso, la peor respuesta se encontraria en el punto 3 y seria Idgico conehuit que se cobiendria una respuesta mejor en et punto simétrico del 3 respecto a la linea qu une 1 y 2.8 decir, en 4, Con los puntos 1,2 y 4 se forma un nuevo simplex y se mide la respuesta vara la combinacion de los niveles del factor dacla por 4, Si ahora se comparan las respuestas alcanzadas en los puntos 1,2 y 4se observara que 1 da la peor respuesta, El proceditiento anterior, basado en la reflexion sobre una recta, se repite de nuevo, con lo cual e! simplex resulta definido por los puntos 2, 4 y 5. La figura 7.10 muestra la continuacién de este Droceso, Se puede ver que no es posible progresar mas alls del paso dado, ya que los puntos 6 ¥ 8 dan peor respuesta que 5 y 7. Para mejorar la ejecucidn del mnétodo simplex se han propuesto (y se siguen proponien- 440) varias modificaciones. El avance hacia el maximo se puede acelerar utilizando un simplex que puede variar en tamaiio sein comio se compare la respuesta en el nuevo vértice 1 un simplex con los otros vértices. Inicialmente, el simplex es grande para avanzar eon Nivel de Y Nivel de x Figura 7.10 Optinizacién porel metodo simplex. ~ (ii) ~ (ii), y las coordenadas cel nuevo vet lice 7, por (v) = (i) + Gv). ec tanto, 1 ir el métoxlo del simplex es la eleccién del simplex figura regular en n dimensiones, entonces las Ios valores mayor y menor factibles de ca distancia, La elecei6n del tamuano del simplex cial se Tabla 7.8 Optimizacidn por el método simplex E Respuesta Vertice | 50 1 Vertice 2 60 8 Vertice 3 60 10 Vertice 4 (rechazado) 2543 3569 60 6 Vertice $ 25° 43959760 n Venice 6 re) 9 (i) Suma (vértice 4 exeluido) 1450 2740 4000 3640 32.60 (iy Suma fu (sérice exeluido) «2:90 5.48800 7.28652 (ii) Vertice rechazado (es decir, 4) 2.50 430-350 6906.00 (iv) Desplazamientos =(i)=(i)—— «O40 LAB 4500.38 OS? (9) Vertice 7 = 330 666 1250 7.66 7.08 Deming (véase la bibliografia), que demuestran que el tamatio del simplex inicial no es in ctitico si se puede expandir 0 contraer segiin se procede con el método, Yarbro y Deming citan un algoritmo que se puede utilizar para calcular las posiciones iniciales de los vertices; un vértice normalmente se coloca en los niveles de los factores aceptados actualmente Se puede ver que, al contrario de tn disetio factorial, el mlimero de experimentos xigidos en el método simplex no erece répidamente con el niimero de factores. Por esta raz6n todos los factores que se piense que pueden tener relacién con la respuesta deberi ser ineluidos en Ia optimizacién, Ya que al hacerlo asi no se inerementari el ntimero de ‘experimentos necesarior para definir el 6ptimo. Una vez. que se ha encontrado un dptimo, el efecto sobre la respuesta cuando se varia tun factor mientras los ottos se mantienen a sus niveles dptimos, se puede analizar cada vez para cada Factor. Este procedimiento se puede utilizar para’ verificar la optimizacién. ‘Tambien indica la importancia de las desviaciones del nivel 6ptimo para cada factor; cuanto ins acusado es el pico de respuesta en la regi6n del éptimo, mis eritica es la variacién en el nivel del factor La optimizacién por simplex se ha utilizado con éxito en muchas dteas de quimica analitica, por ejemplo, espectrometria de absorcién atémica, cromatografia de gases, inétodos de analisis colorimétricos, espectrometria de plasma y analizadores centrifugos en quimica clinica. Cuando un instrumento st conecta con microcomputador, se pueden utilizar Jos resultados de la optimizacién del simplex para ini mejoras en la variables instrumentales Para superficies de respuesta con mas de un pico, como la expuesta en la figura 7.11., los dos tipos de optimizacién descritos pueden encontrar un éptimo local tal como A en |jgar del 6ptimo verdadero B. Una forma de verificar este punto es empezar en una regién, diferente y ver si se obtiencn las mismas condiciones de éptimo. Los métodos de optimi- zaci6n proporcionan informacicn solo sobre algunas partes de la superticie de respuesta, ‘yagque su objeto es maximizar la respuesta con el minimo esfuerzo. Sise requiere un cuadro completa de la superficie de respuesta, son necesarios experimentos mis elaborados que ccubran todo el intervato de kas variables. Nivel de ¥ Nivel dex Figura 7.11 Diagrama de lineas mostrando dos miiximos loealizads, 7.13. RECONOCIMIENTO DE PAUTAS. Havancen laautomaizacén a echo posible a cleci pda de grandes cata {se dato, el eared fos miroconptaores ha hecho pile proesretos Ciorcon myer prfecconomiento Eltesnino qimometea seh esa para describe Tec nnctede estan y mtemtiesdsenaos para extarinfomacon qui ii tantra oe dato quinicos La optinizacion esa campo ebieo pel papi de ‘rtontriy tecsel cmpo del enone dept, qe aor pos ade cre. Th consecvenci def auomatizacon es ese pueden te tester sa mtn, ore, gn ie comet wean fut conret,wiando las neste fo as Mecteis de os nos ‘tines eltenosenlespecto de faorscencis onraoj de ich musa. Otro Arora clasifencion, por ejemplo, dives fasts estacionarias liad en eomato- fala putiqido dent de pos eon propiedades sine, uizando as popiedades A etncn de una tread de sles con propisdes qu thon ns nto de eonocinent de pas fiz fds disponibles sia tentcea lugar de scent El conju dedi que ac za pacar Tinea dns pt Casto nnds peo pia i mst Fantase pasts preset pafcamente porn pt conse mst nT figura 7-2, Guy Parémetro ¥ Parémetro X a 7.12 Una pauta representada en el espacio de pautas; x y y, om los valores de los par metros X y Y;r,e5 el veetor de pautas. donde fs cordenadas pt son los vale tonados po os dos parities. B punto se puede dein ambien por un vet, dibjado desde el oigeny conte cone tnvectordedatnode aus Iecmncovrdemtoscconse soccpsto de gaat La base desis mtd econo de ane losses ae parvesto sine sean con mucha posinidadenslesaciode fests tetas tongmeraes Bs doe densi ete conglomerda se pase ee oe ide poreloohunao. Sin enbarocundose mien msde dovfraos ssseeret Inteesenaio uf se hiden nants cada mies se seme er pao en spc dines y sence todos macs fos dee covslomersos, Uno de dics mito conto como nan de comyonenlce ei cae, ese rset verve de passe tm pan et ene eee fan pos infomacon coo saps La Migs 113 snl po dd aedocy Istuacisen icy so dosnt El dgrana murstsdeeorestiericede de vetoes de ony doshas poses soba r= pon ener scene deetenodoclnineredenenonenie2a t Lapeer eins ‘Amant ots een como ise pone ene los Sor anes eae precio sobre ses B ossecta i rece En ee ase ees has tna proycson soles A. Leica Ay B epee combines a ie vars org Dems si las ce eomponenteedelenae bose la fren cat sven de puta, Det, losses newest use rea poco ent conblnacanes nese dclas ek naen "nhs ase slo lat dea ales eile Ieuan spsonton en cas connie an, de ee tds Se een enon as svat ten constituyen mas a Ia variacién entre los vectores de pautas. Las variables restantes, que Hevan poca informacién extra, se pueden rechazar, De hecho, si se utilizan demasiadas variables, puede resultar una separacién en clases aleatoria y sin sentido quimico, 0 el “ruido” de los parimetros superfluos puede oscurecer la existencia de clases, Eseneialmente hay dos procedimientos diferentes para el reconocimiento de pautas, Clase2 °/ Clase 1 & o/ e EL o/ ee off 6 0 o/ © /* ParmeroX iminimos euadrados. Este método minimiza una suma de cuadados que estima los errores, cn la clasificacién, Determinar la posicién del plano de decisién se puede tambien tratar como un problema de optimizacisn, resoluble por el metodo de simplex: el plano de decision se puede defini por un vector ortogonal al y las componentes de este vector son Jos factotes que se vatiarn de nivel. La respuesta que se maximiza es la proporcidn de pautas del conjunto de orientacién que se encuentran clasificadas correctamente. Cuando fa posicién del plano de decisién se ha fijado, la efectividad del plano de decision para separar las dos clases se puede probar ulilizando el resto del conjunto de datos, es decir, el conjunto de prediecién: cada muestra se clasifica por su pauta, y el porcentaje clasificado correctamente proporciona una estimacisn objetiva dela eficiencia el clasitieador. En la prictica, antes de aplicar el procedimiento de reconocimiento de pautas, se 1.54, 1,60, 1.18, 1.60, Hay 7 grados de libertad y el valor critico es 2.36 (P = 0.05, pricha de dos colas). Ninguna de las medias difiote significativamente del valor certificado, Las medias son 55.875 y 50.25 mg/kg y las desviaciones estindar son 0.8345 y 8.828 mgykg, (a) Fy = 112, Valor eritico = 3.79 (P ~ 0.05, prueba de una cola). Variabilidad significativamente més grande para tiempos de ebullicién mas largos. (b) Una estimacién conjunta de la varianza no es adecuada cuando las varianzas dlfieten significativamente; r= 1.8. El niimero de grados de libertad, calculado de la cecutacion (3.5) es 7. Valor crtico = 2.36 (P ~ 0.05, dos colas). La medias no difieren signitie te. (a) Frecuencias esperadas = 15.25 y 45.75, suponiendo que el imero de rotuas esté 1 proporeién al mimero de trbajndores en cada grupo, mientras que ls frecuencias reales son 24 y 3751 grado de libertad 72 = 5.95 (Se aplica la correccin de Yates). £84 (P ~ 0.05). El primer trabajador dificre signifiativamente de los otros tres, (b) Para los iiltimos tres trabajadores las frecwencias esperadas = 12.33, 12.33, 12.33 (es decir, 37/3); 7° ~ 2.815 2 grados de libertad. Valor eritico ~ 5.99 (P ~ 0.05), ‘Los tltimos tres trabajadores no dificren significativamente tnos de otros. ier lugar debemos probar si las varianzas difieren significativamente: Fog 1.22 —no significativo (P = 0.05, dos colas). Entonees se puede ealcular una estima- cién conjunta de la varianza que es igual a 0.16855 r= 0.54. Valor eritica ~ 2.78 (P = (0.05, dos colas). Los resultados medios no difieren significativamente, 1, Bresson asc por fected seonanbos iso ede tena, pose qe a eens ent pres elimina el efeto de cualgie ae gna ns muss as fren son 0.051, 003, -0.030 mln. Estos Tiesncis nen una media 0.017 mlm desviacin extindr = 082mg Hay orate dibenndy 07, Valoreica~ 43 (P= O08, dos cles) Ls estas po fieren sinfcatvament. 11. Hombres: media ~ 0.0 fl, desviacionestndar ~ 2.78 af Mujeres: media = 43.258/ desvicionestndar = 3.06 g/. En pine lugar debemos probar sas varanzas fie ren significtivamente: Fy = 121. El valor eritico es 4995 (P= 0.05 ds eos) nmanera que ls varianeas no ire sigificaivamente. La estimation conunta de desviacién estindar es 2.92; ¢ = 2.2. Valor critico = 2.14 (P = 0.05, dos colas). Las medias difieren significativamente. ; ta desvacion estar de Is 12. Un prcha 1 por pres es adecunda. La media y : tiferencias son 1.18 y 0.84 respectivamente; ¢ ~ 3.4. Valor critico = 2, 57 (P = 0.05, do col) La esulindosdfren sigiieativamente CAPITULO 4 1. Esquema 1: 0° = (4/2) + (10/5) = 4 Esquema 2: o° ~ (4/2 3) + (10/3) = 4 SiS ~ costo de muestreo y A ~ costo del anilisis, entonces: costo del esquema 1: costo del esquema 2 = (58 + 2A) : (35 + 64), Esta razén es mayor que 1 si S:A es mayor que 2:1 2. Los eaileulos del ANOVA se restimen a continuactén: Fuente de variacién Suma de cuadrados el cuadrado medio Entre dias 332.92 mt Dentro de dias 26.00 8 3.25 Total 358.92 n niraciones medias Fa 34, Valor eritico = 4.066 (P = 0.05) demostrando que las concent Sm dificren significativamente, Estimacién de la varianza muestral = (ILI ~3.25)/3 ~35.9. 3. Los ealeulos del ANOVA se resumen a continuacién: Fuente de variacion Suma de cuadrados eu cuadrado eae Entre muestras 10,0024916667, eae Dentro de muestras 0.0014 8 0.0001 Total 00038916667 u Fa = 4.746. El valor eritico (P = 0.05) es 4.066, demostrando que el cuadrado medio ete ments dessa ane pra se exe or varie t es El eundrado medio dentro de muestra, 0.000175, roprsins una ta variance de as mediciones, 6 repo nsetieeien ce Esti a varies milo = 06008306 - 0000175) 0.000219 ariaza dela mea para lesquena 1 =0,000175/ »0.000219)6~0.00008025 Varianza de la media para el esquetna 2 ~ aE 0,0001022. squemna 2 = [0.000175/ (2 x 3)] + 0,000219/3 4. Se realign una estimacion de ode cada muestra, d di ode cada muestra, dando: 2.607, 0.847, 3.017, 3.6% 6.417, 1.927. El promedio de estos valores es 3.077. Entonees la estimacién de 0 = 4071927 estimacion de o bs fines de alerts se encuentran en 50 2 1.753//4 , es decir, en 48.25 y 51.75 aslineas de accién se encuentranen 502 3 17534/Fesdecin en 47379 52.63, 5. Cileulos simples muestan qu las concen fan que las concntraiones medias de Cd en ls muestas Ay Bu termina pork Sartor son 09 7.25ppnecectenene Can serosa cin ct dss el pio 2.78, 70, spn ates deel na herent y veri, low into ena genera conten (yen del sentido bs gs del lj adel uae +), 1,791 pin Aes gras aris son dein findamentalmente x artes sistemiticos. Hay que hacer constar que s6lo cuatro laborat. ygenera esl cuatro labortorios 7,9, 12y 15) gencran sto ue tn as eet i edie este est, memo qu Jos Inboratorios 3 y 10 poscen para ambas mest grandes sespes positives» nepativos, respectvamente. Las distancas en perpendicular desde los puntos exper, nals ie 4h en por (75, 701 mide es cee sles de bs laboratorios participantes, y queda claro que los laboratorios 4 y es srandeserroresaleatorios ch ss tesiltadon Ceeete nena Para calcula los componentes de a varacion, se expone a tabla sig “aon a 8 > + 4 88 100 “12 ie 3 aa a ~09 85 4 a m1 “20 222 5 ea 10 -30 190 3 50 47 03 ae 7 ea om 12 n6 8 7 84 “20 isa 9 3 ae -03 189 10 ee 15 “06 Maa " a ae oa 60 RB oat aa 07 20.1 B ing 83 1 155 4 oF ss 03 B3 1s ea i 25 69 50 60 “10 na De las columnas D y T de la tabla, es ficil ealcular que la estimacion de 0 = 0.793, ¥ Que ta eatinmcion de of ~ 11.027, El valor experimental de Fy e5 11.027/0.793 = Teo95: este ex mucho mayor que el valor tabulado (ca. 2.8, obtenido de la tabla A.2 por interpolacin), mostrando que ls erroressistematicos son de hecho significative. Se pueden estimar dela ecuacin (4.3), siendo el resultado de of ~ §.117 CAPITULO 5 1. Laaplicacién de la ecuacién (5.2) los datos proporciona un coeficiente de correlacién producto-momento, , de -0.8569. Este valor sugiere una eorrelacién negativa consi erable entre el nivel de mercury I distancia al polardgrafo. Su significacién puede ser probada utilizando la ecuacién (5.3), que proporciona un valor de t de 3.33. La comparacién de este valor con el valor tabtlado de un nivel de confianza del 95% y n~ 2 (~ 4) grados de libertad (¢ ~ 2.78) muestra que la relacién es de hecho significativa a este nivel de confianza. Sin embargo, hay dos advertencias, (1) este ‘método prueba sélo una correlacién lineal, mientras que en el laboratorio podriamos esperar que el nivel de mercurio decreceria con el incremento de ta distancia al polardgrafo de forma inversamente proporcional al euadrado de la misma; (2) corre- Tacién noes lo mismo que causa, Los eélculos muestran que existe una relacién entre la distancia al polardgrafo y la concentracién de mercurio —no prueban que ¢l polaré- grafo sea la fuente de la contaminacién de mercurio. La contaminacién podria surgir, por ejemplo del fregadero o de otra pieza del equipo proxima al polardgrafo. 2. Eneste caso la ecuacién (5.2) muestra que r = 0.99982. Esto es sintomatico de una co- rrelacién lineal, aunque inspeccionando los datos se muestra claremente que tina curva es en més adecuada en este caso. Cada valor de y (absorbancia) es mas grande que su predecesor, pero con un ineremento que decrece lentamente euando x aumenta, La ccurvatura también puede demostrarse estudiando los residuos (vedse el ejercicio 9) En este caso, los errores causados al tratar los datos como en una grafica de calibrcién Tineal serian muy pequefios. 3. Aplicando lasecuaciones (5.4 y (5.5) resultan unos valores de b= 0,0252,ya~ 0.0021 respectivamente, Otros resultados importantes incluyen: X = 15; 9 = 0.380; Eat = 2275; y Los ~ ¥)° = 700, Los residuosindividuales( ~ js) de y enconrados son +0.0009,.-0,0009, -0.0028, +0.0104, -0.0074, -0.0062, +0.0060. Estos residues suman cero (como era de esperar), y la suma de sus cuadrados es 0.000247. Aplicando ta ecuacién (5.6) se obtiene que Sys = 0.00703. Entonces la ecuacién (8.7) da sy = 0.000266, y el uso de 1 (5 grads de libertad; nivel de confianza del 95%) ~ 2.57 proporciona un limite de confianza para b de 0.0252 £ 0.0007. Similarmente, la teuacién (5.8) proporciona tn valor des, = 0.00479, con limites de confianza para a 60,0021 + 0.0123 4. (a) Es facil demostrar, usando los valores de a y b calculados en el ejercicio 3, que un valor de y de 0.456 comesponde a un valor de x de 18.04 ng/ml, y que Oo - YF = 0,00578. La aplicacién de la ecuacién (5.9) proporciona entonees un valor de sie = 0.300, y los correspondientes limites de confianza estan dados por 18.04 + (2.57 * 0,300) = 18.04 + 0.77 ng/ml (b) En este caso, es claramente necesario ver si el valor de absorb un valor aomalo. El valor de Q caleulado de la ecuecion (38) e6 (0347 O.tsyt0.47 0.38) = 0846 Panel confines 08ers es mayor quel valor de Q tabula de 829, de manera que el alr O87 pe rechazar Delo tes teslados qu quedan se oben ua aborbaela mend 0.31, corespndene a una concentraion de 12.28 nn En xe eas el valor de sect isin 1 (43:04 ~~ 008}seno0 1D nes ic confanza son, pont, 1228+ (2.57% 0195)» 1228 030 na |, calculado de la pendiente y ordenada en el origen de la recta de regresi t + ¥ Sse dado por la ecuacién (5.12) es 0.9179. Los limites de confianza pa la concentracion son 48.03 + (2.45 x 0.9179) = 48.0 + 2.2 ng/ml i 7. Los datos disponibles permiten un céleulo de regi {ede ips pei de regresién ponderado, siendo los valores x 0 10 2 30 4 50 y 40 212 446 618 780 1052 s 07 08 08 16 2.2. 30) dientes a intensidades de peer see Nequese cae einen que E(x ~2) e 1750585247, los valores de pata irda inane ge oy tae —notese que la suma de estos nimeros es 5.999, es decit 6, si don i ree errores. Esta es una importante ver Uniizando esta pondereton « *Bresion ponderada son 1.964 y 3,483 respectivamente. De esta recta, las conce 5.87 y 44.1 ng/ml respectivamente. Note que estos valores, y os de Ia pendiente y ordenada en cl ofigen, son todos similares a los caleulados en a regresién no ponderada, a pesar de la considerable dispersién de los puntos experimentales. La Fiferencia esencial entre el uso de los métoclos de regresin ponderada y no ponderada solo es patente cuando Ia ecuacisn (5.16) se utiliza para estimar Ia desviaci6n estandar ie las concentraciones estimadas. Para estimar esta ecuacién, es necesario, en primer Tagar, estimar los valores wo para lo dos valores Yo bajo estudio. La inspeeciéon de los datos sugiere que pesos de 1.8 y 0.18 respectivamente son apropiados para los valores de yode 15 y 90. El uso de estos pesos da valores de Si, de 0.906 y 2.716 respectiva- ficacion por el valor de f de 2.78 proporciona limites de confianza para las dos concentraciones de 5.9 + 2.5 y 44,0 + 7.6 nghint respectivament. . Aqui, el método “nuevo” es claramente el ESI, representado, por lo tanto, en el eje ¥: {a tecnica pravimétrica es la referencia o procedimiento estandar y se representa en el je x La recta de regresion calculada de esta manera tiene una pendiente de 0.963, y tina ordenada en cl origen de 448, siendo el coeficiente de cortelacion de 0.970. Este titimo valor es sumamente significativo [f= 11.29 ~ Ee. (5.3), pero los limites de confianza de la pendiente y la ordenada en el origen deben calcularse también. Los talculos usvales (Fes. (5.6)-(S.8)] yun Valor tabulado de 1~ 2.31 (8 grados de libertad; 4 un nivel de confianza del 95%) muestran que los limites de eonfianza para ta pendiente y la ordenada en el origen son respectivamente 0.96 + 0.200 y 4.5 # 20.1 Ya que estos intervalos de confianza al 95% incluyen claramente a | y 0 respectiva- nente, debemos concur que esta recta de regresién indica una buena concordancia ttre los dos métodos anaiticos. No obstante, hay una sensacién residual de intran- Gqilidad sobre los datos. Ls eleulos mestran qe 7 de Ios residues y son negativos incluyendo 6 en una secueneia simple) y solo 3 son positivos. Se sugiere tambien que ta concordaneia enre los dos métodos es muy grande para fa mayoria de las muestras, pero muy pobre para una pocas; esto podria ser causado por problemas de especiacién. Un buen analista podria concluir que se necesitan mas datos (en el trabajo citado se ssuministran mas datos). Si se representan grificamente estos datos (recuerde que deberia hacerse siempre), texisten ciertos indicios de que la calibracién sea lineal hasta 0.7 - 0.8 unidades de absorbancia, y curva posteriormente. Céleulos de regresién lineal no ponderada utilizando los seis puntos proporcionan un coeficiente de correlacién de 0.9936, y los residuos y (en orden creciente de x) de 0.07, -0.02, +0.02, +0.06, +0.07 y -0.07 (fedondeando a dos cifras decimales). La tendencia en estos valores es obvia y confirma que se trata de una curva, La suma de los cuadrados de los residuos es 0.0191. La confirmacién de que el ultimo punto deberia ser omitido del intervalo lineal, se obtiene repitiendo el célculo de regresién sélo con tos cinco puntos. El covficiente de correlacion entonces auumenta a 0.9972 y los residuos y son -0.04, 0, “70.02, +0.04 y -0.02 respectivamente (summa de cuadrados 0,0040). Los residuos y pata el sexto punto con respecto a esta segunda linea recta es comparativamente muy grande: -0.22. Este proceso puede repetirse para el quinto punto, es decir, se calcula la linea reeta ajustada solo con los cuatro primeros puntos, De nuevo se mejora, en este caso, el coeficiente de correlacién (a 0.9980), se reducen los valores de los residuos y (-0.02, +0.01, +0.01 y -0.01), y existe un gran residuo para el quinto punto bajo estudio (b) En la prucha de rangos y signos, se desprecia de nuevo el valor cero, Los datos io 14). Puede concluirse, por Io tanto, que el quinto punto puede excluirse también restantes compatados con la mediana proporcionan las siguientes diferencias ordena- le] intervato lineal del método. Pruebas similares aplicadas al cuarto punto indican, he 20.01, 0.01, 0.01, -0.02, 0.02, 0.02, 0.04, 0.07, Las posiciones con sus sistas, al compararlos, que probablemente deberian formar parte del intervalo lineal, y un teniendo en cuenta los empates, son por tanto -2, 2, 2, ~5, 5, 5, 7, 8. El total de analista podria usar métodos de regresion lineal en el intervalo de absorbancia 0 ~0.6 posiciones nezativas (-) es 7 pero, P ~ 0.05, el valor eitco para n= Bes solamente a le 3. Por lo tanto, se mantiene de nuevo la hipétesis mula, {© Para utilizar una prueba de rangos, caleulamos la media (®), que es 0.1156 y 10. Este ejemplo también recalea la importancia del trazado de una curva de calibracién cl recorido (Ww), 0,09. Entonees Test dado por Ff ~ V1 /w = 0.173. El valor eriteo Fa en vex de realizar un simple eélculo de regresin lineal El ultimo eéleulo produce un tate caso es 0.255, de modo que por tercera vez se mantiene Ja hipétesis mula. En coeficiente de correlacién de 0.9952, aunque la inspeccién de la grifica miuestre ‘contra de las apariencias observadas a simple vista no se puede decir, quizas, que la ‘obviamente que es curva La egresion lineal muestra que los residuos y tienen signos nuestra de combustible no cumpla la especificacién (en orden ereciente de 2) de ~ = - + +++ + +; la suma de los euadrados de los residuos es 9.50. Es claramente mis improbable que el orden de los signos sea 5. Fst problema se puede resolver también ilizando la prucha de signos,y el de rangos aleatorio. Cuando la curva y ~ 4x ~ 0.12 se ajusta a los datos, el orden de los signos signos. Sie testan los valores e.id, de los valores id.t, los signos de las diferencias de los residuoses: +--+ +0 y signos. Sie restan los ~ +> *,yla suma de los cuadrados es sélo 1.29. Existe, con t+ + +++ +0 +, En efecto, 9 resultados, con 8 signos + y un signo -. La entonces, evidencia de que los puntos se ajustan mejor por la curva que por la linea robabilidad de que haya 8 signos + en 9 resultados es solamente de 0.04, por tanto al 483 851 midadesespecivamente, mie qe ncaa pede eoncaeacos ae ee Ripwzi de rnge signe lalor sci is cies crs pod afar pntor eins aE, a man no estan, qv eed eb sugiere aqui: ef andlisis con computador muestra que “el mejor” ajuste cuadritico es rueba de rangos y signos deberian interpretarse con precaucién si hay muchas 70.86 + 3.97x - 0.098%, art idritico es prueba de rangos y sig vricionesempaadas, como octre en este ejerceioy encl anterior. ciemplo también muestra que, en tos casos donde existe un razonablenimero de puntos de calibracién, y donde los errores aleatorios no son muy grandes, e nuevo método proporciona una media de 64.7 mg/100 ml y un intervalo de aproximado atractivo. Sse dibujan diez segmentos lineales, es decir, se uilizan todos 0.9 mg/100 mi, De estas cifras, se ve laramente que Tes 0.773, mayor que el valor Jos puntos del calibrado, las concentraciones caleuladas por interpolacién lineal para crite de 0.61, de manera que las medias difieren significativamente, La razén de sentales de 5, 16 y 27 unidades son 1.36, 4.50 y 8.65 unidades respectivamente. Incluso. posiciones Fx es 2.33, comparada con el valor critica de 3.2, de manera que las si sdlo se dibujan cinco segmentos, es decir, sdlo se usan los puntos x ~ 0, 2,4, etc, los rétodos no son significativamente diferentes. (La prueba F da el las concentraciones predichas son 1.32, 4.37 y 8.51 unidades. En vista de la facilidad de cileulo y los derivados de ta curva ajustada, los atractivos de este método son precisiones de | mismo resultado.) evidentes. '5, Silos valores se disponen en orden ascendente, se obtiene que la mediana es 23.5. Los Valores individuates, para el uso de las barras de grafito, tienen por lo tanto los signos +t ‘+, De este modo existen tres rachas. Pero para N= M ~ 5 el valor ee ritico es 3, con lo cual se podria decir que la sucesién dada se ha obtenido al azar. ‘Ta media es 9.96 mi, y Ia mediana (el promedio de las mediciones que ocupan ta ste problema se resuelve facilmente mediante la prueba U. Sise espera que los valores studs ytexcer ihe) 8990 ml La Pcs Qtr al oe Tea oe yee sales deeriera mi” dbo Jest se puede rechazar a P = 0.05. Si fuera techazada, la media cambiaria a 9.88 ml y la pequeiio el nimero de valores de cerveza rubia que son mayores que los de cerveza ‘mediana a 9.89 ml; la mediana es insensible a la presencia de valores andmalos. tstandar, Es realmente 4.5, contando 0.5 para el empate que aparece. El valor critico 2 tenuna prueba de una cola es 5, con fo cual podemos rechazar la hipétesis nulaal nivel 2 (@) Se usa la prueba de fos signos: comparadas con la mediana proporcionan, en los Ge P= 00 y afimar que yuna cerveza rubia en particular produce niveles de alcoho! valores experimentales, os signos - + 0 + ~ + + + +. En efecto, de este modo tenemos tn sangre inferiores a los de una cerveza estindar en conereto! Sin embargo, el ¥ lecturas, 6 con signo +. La probablidad de 6 signos en 8 lecturas es 0.29, mucho ‘eeutadoen ia prucha deejecucidn répida de Tukey, 7 5.5,no llega aaleanzarcl valor mayor que 0.05. Por Jo tanto se mantiene la hipstesis nula de procedencia de los datos critico de 6 (una cola, P ~ 0.05). Por tanto, se deben tratar Jos resultados con de una poblaciin simétrica con eontenido mediano de azufre de 0.10% Siegel-Tukey para la variabilidad precaucién. Se necesitan ms datos. La prueba de proporciona un estadistico de la prucba de 10, muy por encima del valor eritico de 2, Por tanto, la hipotesis nula de vatiablidades similares se debe aceptat. 7. Las posiciones se muestran a continuacién: TInstrumento, A BC D E F G Ordenacion delestudiante 3 1 S$ 4 7 6 2 Ordenacién del personal académico Oe a: 202 1 2 3 4 1 é: ee aoa Asi pues, es 1 - (6% 24)/(7* 48) 0.571, Este se encuentra por debajo de valor eritieo 0.786 (P 0.05 y n ~ 7), con To cual no parece que los estudiantes y el personal académico estan de acuerdo —Ia correlacion no es sinificativa 8. Silos valores x son las distancias, y los valores y los niveles de mercutio, entonces el método de Theil da a = 2.575, y b = 0.125. Estos valores estin sorprendentemente proximos a los niveles (parametricos) de “minimos euadrados” de 2.573 y -0.122. 9. Para probar = 1.0y @= 0.2, escribimos z = (x~ 1.0/0.2, y obtenemos 1.5, 2.5, -1.5, -05, 0,05, -10, 40, 3.0 1.3, Si dibujamos dichos valores frente a la funeién de distribucion normal estindar, esulta que dan luger a un trazo que casi es simétrico, Pero mucho mas ancho que la curva estindar,indicando que la media supuesta no se aleja demasiado de la verdadera, pero la desviacién estandarestimada es demasiado equena. La maxima diferencia es +0.335 en2z~ 1.5. Este valores mucho mis alto que el titico de 0.262, lo que confirma que se debe rechazar la hipétesisnula, y que los valotes nose ajustan a esta dstibucién normal concreta, Para probar otra distribucin ‘normal, calculamos las estimaciones de la media y la desviacion estindar que son respectivamente 1.08y 0.4. Esto proporeiona los valores zde.0.54, 1.02, -0.93, 0.44, ©.20, 0.05, -0.68, 1.76, -1.66 y 0.54, La maxima diferencia, en este caso, es Solo de ©2.0.11 enz~ 0.54, por tanto se acepta la hipdtess nua; los datos se ajustan muy bien 8 esta distribucion normal 10. Este problema se resuelve sustituyendo las concentraciones de niquel reales con valores de posicién, con los resultados siguientes: Muestra Valores de posicién 1 1 8 5 1s 4 6 2 2 7 ws 13 3 7 3 14 18 9 105 12 16 Observe que se da un empate y, por tanto, se tratara de la manera habitual, Las sumas de los tres con juntos de posiciones son: R, = 39, R: = 52.5, R;~ 79.5, Estos tres mimeros Suman 171, igual a 3N(N + 1)/2, donde N 18, es el mimero total de mediciones, El valor del estadistico chi-cuadrada, esta dado por oss028) suse = 497 Bute val auc el etc par 2° de $99 (P = 0.05, 2 gados de bead ste valor es menor que el crt 2 gran de Ht an A), orto, debesos mantener I hipstesis nls, y coer que no hy Uiferenciasignificaiva entre los niveles de nique! en las tres muestra CAPITULO 7 1. Unejemplo de ANOVA de dos factores con replicacién Cuadrado medio Fuentedevatckin Sumo cindedos a eae ls Sacre > 2 Ene cols aware 2 woo Ineracin on0es2 i ais Resid 0.36500 3 Tia S728 n for que el cusdrado medio de la interaccisn, por eso El cuadrado medio residual es may wean pore nuestra-laboratorio. Para proba no existe interaccién significativa muest Fara port hay irene significativa entre los laboratorios se compara el cuadrado medio ents el cuadrado medio residual, dando: Fag ~ 0.0939/0.0406 ~ 2.31 El valor critico de Fi» (P = 0.05) es 4.2556, con lo cual ei valor calculado no es significative. 2. El vértice 1 deberia ser rechazado al formar el nuevo simplex Vatice 3 25 115 95 69 60 10 eae 25 43° 95 9.7 60 vy ee 25 43 95 69 96 9 Sim 168 31.1 505 381 346 sua 34 62 101 76 69 iatceechazado(sdec, 1) -40«30-20«GO 50 ages e ip ao; a1) Desplazamiento w4 32 Bt Le Vertice 8 (Todos los valores de la tabla anterior se expresan con uns eifta decimal.) 3. Un ejemplo de ANOVA de dos Factores sin repli valor. icion. Primero se resta 16 de cada Fuente de variacion Suma de cuadrades gl. Cuadrado medio Entre filas 0.011092 3 0.00370 Entre columnas 0.012014 2 0.00601 Residual 0.028186 6 0.00870 Total 0.051292, u (a) EI cuadrado medio entre soluciones (es decir, filas) es mis pequeto que el ‘cuadrado medio residual, de manera que no es significativo, (b) Comparando los cuadrados medios entre métodos (es decir, columnas) y residuales proporciona Fs» = 1.28, que no es significative (P = 0.05). 4. Un ejemplo de ANOVA de dos factores con replicacién. Fuente de vatiacién Suma de cuadrados gl. Cuadrado medio Entre filas 208768749 3 6.959 Entre columnas 0.14062595 1 o.141 Interaccion 0.11187458, 3 0.037 Residual 992499971 8 1241 Total 310543752 1s No existe interaccion significativa o diferencia entre los métodos ya casos el correspondiente cuadraclo medio es menor ue en ambos ie el cuadrado medio residual 5. Utilizando ta si tiente notacién: G gas de purga (Ar—bajo, Ar + O;—alto) T © tiempo de purga (20 segundes—bajo, 60 segundos —allo) Q = temperatura de ta célda de silice (900C—bajo, 1000°C—alto) los efectos ealeutados son: Un factor Efecto G 18.25 T -12.25 Q 55.25 Dos factores or 13.75 TQ -5.25 cq 0.75 ‘Tres factores GTQ 375 Efecto Una factor in 0.0215 c 0.0005 T -0.0265 Dos factores ‘AC -0.0005 cr 0.0025 AT 0.0065 ‘Tres factores ‘ACT -0.0005 Utilizando la siguiente notacién: N = concentracién de icido nitrico (0.1M = bajo, 1.0 M ~ alto) L. = concentracién de lantano (OM - bajo, 0.1 ~ alto) Jos efectos ealculados son: Un factor Efecto Suma de cuadrados gl N 95 1805 1 L 225 10125 1 Interaccion NL 35255 1 Para probar si es significativa la interaccién se compara el cuadrado medio de fa interaceién con el cuadrado medio de los tesiduos, dando Fs ~ 24.5/4 = 6.125. Ef valor eritico de Fiz es 7.709 (P ~ 0.05), de manera que no existe interaccion significativa (1) Pruebas sobre promedios [Nombre de la prueba Prueba de signos n Te L (Prueba de reeortidos de Lond) Prueba de rangos y signos se Wileonon roca de suma de rangos de Wileoxon Prucha U de Mann-WI Prueba ripida de Tukey Prucba de Kruskal-Wallis Praca de Fried ‘o1aNoUo> ew3}go. japnce seyqer seis Ie ap ue unsax seq 59} uosayen ‘se | We eurSed vy veo sega 'souotoeayide sns Uo opi: Peso eqatud e| ap uorDaa[9 ed 304091 [e ae1odso ap sq -soqteiap somo aseajucouo uapand anb e, ’pe uo salfeiap sosasq X souequaLoD uoD + ‘seganid sv ‘03qH] asa ua seLosap seohstpeise lun exed epenoope et Ulizado para probar si {) una media muestral difiere de un valor estindar (@) las medias de dos muestrasdifieren (@) las medias de dos muestras differen (@) una mediana muestra difiere de un valor estindar () la miuestras por parejos difieren (@) las medianas de dos muesteasdiferen medianas de dos muestrasdifieren estas differen (9) fas medtianas de tes 0 ms (@) las muestras emparejadas dfieren 143 144 145 146 148 148 150 Seon sIpeysa seqanad ap uauinsay | ao1puydy Comentarios Supone que las pobaciones son noma No paraméitico Supone que la poblacién es normal; mis ripido {gue la pricba F Supone que las poblae nis rapide que la prueba t ‘Supone que las poblaciones son normals; nis rapido que la prucha t [No paramérica, pero supone que la poblacién cs smetriea; requiere m > 5 para pruchas de ‘una cola y 2 6 para dos eolas [No parameétrica; tamatios de muestra minimos: prueba de una cola m:n = 3; prueba de dos clas, m=3,m=5 ‘Versin mai simple de Ia prucha de suma de rangos de Wileoxon Altemativa muy simple a las prucbas de summa de rangos y U—no necesita tablasestadisticas stodo 22 en forma mosl- No paramétrica utiliza el fieada [No paramétrica; método 2 en forma modifica Comentarios Referencia en pigina Ullizado para probar si: prucba (2) Pruchas sobre variabilidad Nombre dela prucba o esadistico de la ai} | = a i 2] Jel fe E g2 <<) [a ja 4 23 | fal | if 3 a 2 Bg a] /F dE a ag 5 z ge al tg i; js @ ge} ia] [2 gE 23 a| |2 a & a a (2 a] fieg id 3] | 8 23 2 wae g E sae pas ae Bae 2b & Apéndice 2 Tablas estadisticas $3 Eee | jae Bu li 2) | a gage, [ai |e {ea of Se presentan para la conveniencia del lector las siguientes tablas,y para su uso en este libro BaSs) |e] | & a2 a3 ‘en pruebas estadisticas simples, ejemplos y ejercicios, Estin presentadas en un formato eee" |g) |3 a3 iy compatible con las necesidades de quimicos analiticos el nivel de signficacién P = 0.05 aod hha sido utilizado en muchos casos, y se ha supuesto que el niimero de mediciones disponible Sef | fs] js a] je xs 8 stificientemente pequeito. Excepto donde no se establezca lo contrario, estas tablas ~ 3 abreviadas han sido obtenidas, con autorizacién de Elementary Statistics Tables de Henry R. Neave, publicadas por George Allen & Unwin Lid. (Tablas A.1-A.3, AS-A.Ty A.I2- g }/@ 2] A.16). Se remite a estas fuentes a los lectores que requieran niimeros de mediciones no gig | 2 Ey | recogidos en las tabla, gsi | | fal i i Tabla Ad Ladistbucién aah $478, | Volr de pam ninevalode onfiana de 90% 95% 98K 99m gee ey laa Valor eritcn de para valores de Pde 010 005 002 001 es g 2 3 g 4 [Niimero de grados de libertad 433 | # £| |ge id 1 631 1271 3182 68.66 ead} ]a 2 2b] jaa aa 2 a ‘230 “e96 “oo2 ag ai | 4 s a2 Zé 3 235° «318 454 S84 233 5 i g3 bs 4 213278 375 460 ge gs} jg 2 | | 82 eg) 5 202257336403 gas # |3 3) (i392 ‘ 196245318371 238 gs 78 8 a3 Ba 1 189 236 300 350 We ee 43 83 8 186 231 290 3.36 | a} 9 183 226 282 325 3 a | 10 181223276317 gig {gi | R 178 218 268 305 f qi. i./3/ “ Ihe tle 262 298 e 4] | les ¢ 3 3 16 175 212 258 292 Zlaslgibe FRG. 2 8 1 310 235288 # de aga a 20 12 209253285 @ fglgigizi salgig 0 170 208346 2.75 3 jajgidige gslaje 8 30 Vos 201 240 3.68 £/2(s/z/22 23/22 2 | o 16l 196-233-258 late felled dglajz 2 | Ce ee ee eee ! fa de clin pr dor eset led Pee, por ena pra a rst de na cl, P= 0, entice lee del cob (0:10 es igual a 202. S prados de bere el val had 3 @ 8 6 1 &® 8 wD som ee neat eo eee i ‘3 1043 9552 9277 9117 901} B94] BHR7 BASS KHI2 8.786 H 74S A703 8.660, 7 4 7.709 6944 6591 6388 6256 6163 6.094 041 $999 5.964 S912 SASK 5.803 8 0524 5S 6.608 $786 $409 $192 5050 4.950 4876 4418 4.772 4735 467K $619 4.558 o 0.492 ie) ie eae ‘7 SSO) 4.737 4.347 4120 1.972 3866 3.787 3726 3.677 3637 3575 3511 3.445, ‘Tomados de King, E. P, J. Am. Statist. Assoc., 1958, 48,531, ite 11 4844 3.982 3.587 3.357 3.204 3.095 3.012 2.948 2896 2.856 2788 2719 2.646 Numero de grados de libertad 12 4.747 2.885 3.490 3.259 3.106 2.996 2.913 2.849 2.796 2.753 2.687 2617 2.544 ‘ 13 4.667 3.806 3411 3.179 3.025 2918 2832 2.767 2.714 267] 2.604 2533 2459 2 S458 3a ato ; es 20 4351 3495 5098 2866 2711 2899 2514 2447 2490 Da¥h 227A 2908 2128 BQ ie 1+ erode grads de libertad del nomeacos y= nimene de rads de iba del derominadr. ‘Tabla A.6 Niimeros aleatorios 41915 02944 a 3) 31788 A587) 63289 99886 20648 41853 TalaA.3- Valores critica de F para una prcha de dos eoas (P= 0.05) GBI RES) 23s Gazer 95093 o73e2 T4354 13071 77901, 3088 teaser) 2 A7436 63266 TOS? 79781 09184 8390977232 $7571 25413 ——— Sf 7 8 8 wo es (Mush $6030 23781 G1BRO 40119 88098 75956 85250 05015 99184 1 647.8 199.5 864.2 8996 9218 937.1 948.2 9567 9633 96K. 9767 993.8 nyt) GIA}? 46847 79352 42478 71784 65864 84904 48901 17115 2 3851 3900 3917 3925 1930 3953 39n6 1937 3939 3940 JOET BES 3945 eee - = } 1744 1604 15.44 1510 1488 1673 1462 1454 ]4.47 1642 1434 1425 1417 GoalT G36 88491 73259 21086 $1932 32304 45021 61697 73953 $1222 1065 9979 9605 9.364 9.197 9074 8980 8905 Abed AISI 86S) 8560 42293 I97SS M119 62128 33717 20284 $5606 33308 $1007 68272 5 1001 84347764 7388 7146 697 6H3 6757 6681 GEId 6525 428 6399 Size ssrid anya) $3ng2 99174 30596 67769 59343 $3193 19203 ~ — —- — = — pated © 2 1 SS! 0 $5523 15849 32402 © 8413 7.260 6399 6227 S968 $820 $695 S600 5523 S461 S260 5269 Y7ovs 34959 49721 69341 4087S $5998 8751 5 8013 6582 S90 S521 Sans Sti a9gs sooo e423 S361 feee e368 ser Ses2) 75808 cold 14300 $2782 29356 35382, $2387 2919421591. 8 S71 6.059 5416 S083 4817 4.652 4529 4439 4.957 4298 4200 S10r 3999 a = 5 1209 S113 Sone a7ia 4484 $320 4g? 4102 sane S964 Sans StK9 S87 Siesi <207 Aioss 9109) GosTS 748s SATIS 45293 So4se TeDLE 10 6957 $456 4826 4465 4236 4.072 4950 3455 3979 A717 AAD 3522 3419 13798 99632 3295R 49802 40261 35555 76229 00486 64236 7478; reereeee Javed 66460 87303 13788 04806 31140 75253 79692 47618 20024 11 6724 5.256 4.630 4275 4084 3881 3759 3664 3588 3526 3430 3.330 3.226 10385 28822 51891 04097 98009 $8042 67833 23839 37668 16324 12 6854 $056 4474 4121 3891 3728 3607 S12 3436 S374 3277 3177 3079 3882 49576 9182263807 99480 1824070002 78386 26035 21459 5 eae Mashed a ‘3767 3.604 3.483 3388 3.312 3.250 3.153 3.053 2948 a —_—_- — 86 4 34663 3501 3380 3285 2309 J147 1050 2949 dae oe sal 15 620 t7es ish Sam 35% 30s 3258 1H GI SAS 280 08 2s BRS BRE SG GANGS SSENS Sou tens gota dntse 2060 oe ——— ectaucntt Wcueaottsoen 10399 16 6.115 4687 4077 3.729 3502 3341 3125 3049 2986 2889 2788 2 92986 09401 58892 $9686 10899 89780 $7080 82799 70178 A og $619 $011 3.455 3408 3277 3156 jam Daas 3ana 2ans 2701 Fete Biss OWTLy $7956 H5672 49036 24993. 69827 67637 09472 63386 We S978 £560 3958 3608 3382 3221 3100 3005 2929 Da66 2769 2657 2559, S901 21152 0025 1645 48500 73237 95420 98974 36036 21781 19 $922 SoH 3903 3589 3333 3172 40s1 2956 2480 DAIT 2720 2617 2508 a 20 S871 4.461 3.859 3.515 3.289 3128 3.007 2913 2837 2778 2676 2573 2464 220m4 03117 99937 86176 80102 48211 61149 71246 19993 79708 = ——— SEES 28000 44301 40028 88132 07083 $0818 09104 92449 27860 90196 ">i de gas de ira dl maneradr y= miero de pido de era el noid. Steer 202%) 32856 91565 64917 18709 79884 44742 1R010 11599 91384 iesal 51399 62654 00857 21068 94121 39197 2775267308 feed QUST RAST 42334 06695 26306 16832 63140 13762 15598 ‘Tabla 7 La pricha de signos La abla uiliza Ia distribucidn binominal eon P= 0.5 para proporcionor las probabilidades de réxitos ‘© menos para n= 13 Wo 15 RE, Ann Math Stans, 950,21, 122.con autorizacin el stitute of Mathematical Statistics, ‘Tabla A.12 La prucba de rangos y signos de Wileoxon ‘Tabla 14 El cocficiente de correlacién ordinal de Spearman Valores criticos para el estadistico a P = 0.05 ‘Valores criticos de P ~ 0.05 n Prueba de una cola Prueba de dos colas n Prueba de una cola Prueba de dos colas 5 9 NA 5 0.900 1,000 : : ; ; ose oan a 13 10 i ose ost 12 17 3 0 Osos ost 1B an 17 B oats 036 4 25 a a oust ose 1s 30 25 5 ase oa e. i oat aaa . 0.401 0472 » 0391 0460 2» 0380 0447 ‘Tabla AIS La prucba de bondad del ajuste de Kolmogorov aloes s Los valores critios para Ia prueba de una y dos colas a P 0.05. Los valores adecuados se comparan Valores citicos de Uo el menor entre Ts y Toa P= 0.05: con la diferencia maxima entre las curvas de frecuencia acumlada experimental y teria, tal y como se describe en el texto, ‘Tabla A.13 La prusba de suma de rangos de Wileoxon; la prueba U de Mann-Withney m 1m Prba dea cola Prueba de do ols 5 ; ° NA . Prueba de wa cola Prucba de dos colas ; : 4 NA i oa fea 3 6 o 2 0.776 0.842 4 4 a 1 3 0.636 0.708 4 4 ; ° 4 0565 0.624 4 6 a 1 s 0.509 0.563 4 7 3 2 6 0.468 0519 3 i i 3 7 0436 oases s A M 2 8 0410 0454 5 7 : a 9 0388 0.430 6 6 s BI 10 0369 0.409 é ; 7 3 t os. toe 7 7 fi eI 2 0338 0375 tah 8 B 0.326 0.361 {ahr nda deren Vl ae Taipei d Nain ia 914 0349 i 0235 oaz7 p 0386 oais 2 oz 0309 » oan 0301 20 0.265, 0294 ‘Tabla A.16 La prueba de Kolmogorov para probar la normalidad Los valores eriticos para pruebas de se describe en el texto, ¥ dos colas a P ~ 0.05. Los valores adecuados se comparan con la diferencia maxima entre las curvas de frecuencia acumulada experimental terica, aly como Prueba de una cola 0307 0345 0319 0297 0.280 0265 0252 0241 0231 0.222 0215 0208, 0201 o.19s 0.190 0.185 0.181 0.176, Prueba de dos colas 0376 0375 0343 0323, 0.304 0.288 0274 0202 0251 0232 0234 0226 0219 0213, 0207 0.202 0.197 0.192 Indice de materias bsorbancia, 12, 32, 35 ajuste de eutvas, 115, 118, 119, 126, 141 albiimina en suero, determinacién de, 1,13, 25 aleatoriedad, prucba para a, 142, 143 alestorizacién, 148, 149, 160 ‘American Society for Testing and Materials (ASTM), 7,17 anilisisautomstico, 88, 9, 169, 170 aniliss linieos, 188 anilisisevalitativo, 1 analisis cuantitativo, 1-3 andlisis de componentes principales, 172, 174, 119 anilsis de la varianza (ANOVA), 52-56, 67-10, 75, 76, 84, 137, 147-149, 179 aritmética de cilevlos, 56, $7 ceuadrado medio residual en, 150-152, 157 ceuadrados medis en, 3-56, 150-152, 15, 162, 163 de un factor, $2-S6, 75, 150, 153 diferencias siguifieativas en, 5-56 de dos factores, 149-158, 162 ‘minima diferencia significaiva en, 82, 83 para comparar varias medias, 52-56 suma de evadeados en, $5, 56, 150, 151, 157, 158, 162, 163 variacion dentro de muestras en, 53-56, 69, 70, 76,79 variacion entze bloques en, 149, 151 Variacién entre muestras en, 53-56, 69, 70, 75, 76, 78 variacion entzetratamientos en, 149, 153, variacién total en, $5, 56 aniliss de tamaiios de particulas, 2 anilisis enzimatico, 14, 15, 165, 166 isis gravimétrico, 87 isis potenciométrio, 35, 36 isis volumeético, 7-10, 33, 35, 87, 122 snaliandores centrifigos 170-171 aprendizaje no supervisado, métodos de recono: ‘imiento de pautas, 172-173, 176-180 aprendizaje supervisado, metodos de recono- cimiento de pauias, 172, 175, 176 ARTHUR, método dereconocimiento de pavtas, 179 astigmatismo, 11 barras de error, 111 blanco, 10, 89, 9, 101-102, 108 bloque(s), 148, 149, 152 bondad del ajuste, 141-145, 198, 205 British Standards Institution (BSD), 7, 17 bureta, 7-9 boisqueda de variable alterativa, 164 caleuladors, 15,21, 92, 96, 9, 139 capacidad de procesos, 79, 80, 84 centro de gravedad ponderado, 111-114 centro de gravedad, de puntos en grificas de calibracisn, 90,95, 100, 106, 111-113, ciftassignificativas, 23, 31, 92,98, 151 clasificacin binaria, 172-173 clasificador, 172-173 censura de valores en ensayis de eolaboracisn, 16 coeficiente de correlacién momento-producto, 160, 90-95, 106-107, 109, 115, 116, 198 ‘covfieiente de correlacién ordinal de Spearman, 138, 139, 198, 205 coeficiente de correlaeién, 60, 90-95, 107, 109, 115, 116 coeficiente de variaeién (CV), 21, 36, 110, (ase tambisn desvizeion estindar relative)

      You might also like