You are on page 1of 14
CAPITULO 4 EL CASO DE UNA MUESTRA que requiere solamente muestra particular proviene sen de las de dos mues- -omparar dos muestras, . Estas pruebas conocidas y que, la probabilidad de que provengan ajuste, En el caso tipico, con una muestra tomada al azar, probamos la de que su extraccién viene de una poblacién con una distribu- ién especificada. En tal caso, la prueba de una muestra puede contestar a ¢Hay una diferencia significativa de ubicacién tre la muestra y la poblacién? ¢Hay una diferencia, entre las frecuencias observadas y las frecuencias supuestas in de forma o aspecto especificado GEs razonable creer que esta mues- tra es una muestra al azar de alguna po el caso de una muestra, una téen observaciones puntajes de la muestra pro poblacién distribuida normalmente, La prueba ¢ también requiere que las observaciones sean medidas por lo menos en una escala de westigador puede encontrar que a) Jos supuestos y 1 tos de la prueba # no concuerdan con sus datos; b) es preferible evitar hacer los supuestos de la prueba f y, asi, ganar una mayor gene- 6 1A PRUEBA BINOMIAL 7 ralidad en las conclusiones; ¢) tes a los rangos y, en estas condiciones, no son analizables por la prueba 45 d) los datos. pueden ser simplemente clasificatorios o enumerativos y tampoco son analizables por la prueba t, 0 ¢) no est interesado sola~ mente diferencias de colocacién sino més bien desea descubrir cualquier clase de diferencia. En tales casos el investigador puede escoger tuna de las pruebas estadisticas no paramétricas de una muestra presen- tro pruebas para el caso de una muestra. El ca- ‘a comparaci6n y contraste de estas pruebas, que puede ayudar ‘gador a seleccionar la més adecuada para su hipétesis de investigacién y sus datos. 1A PRUEBA BINOMIAL Funcién y fundamento Hay poblaciones que se conciben formadas solamente por dos eases, ino, letrado ¢ iletrado, miembro y no y ambulante. En tales casos, todas las observ blacién caerdn en una u otra de las dos cl En cualquier poblacién de dos clases, al tonces la proporcién en Ia otra clase seré el simbolo Q para 1 — P. ‘Aunque el valor de P puede variar de poblacién a poblacién, es én particular. Sin embargo, aun si conocemos (0 de P en alguna poblacién, no podemos esperar que fa aleatoria de observaciones de esa poblacién contenga exac- proporcién P de casos en una clase y la proporcién Q de casos en la otra, Los efectos aleatorios del muestreo suelen impedir que a muestra reproduzca exactamente los valores de la poblacién P y Q. Por ejemplo, se sabe por regstros oficiales que los votos en cierta po- fididos igualmente entre dos partidos politicos, Pero una muestra aleatoria de los votos registrados en ese lugar podria contener 47% de un partido y 53% del otro, 0 atin 56% del primero y 449% del segundo. Tales diferencias entre los valores observados y los de la pobla~ cién son resultado del azar. Por supuesto, son mas probables las dife- rencias 0 desviaciones pequefias que las grandes. La distribucién binomial es Ia distribucién muestral de las propor- ciones observadas en muestras tomadas al azar de una poblacién de das clases. Esto es, da los diferentes valores que pueden presentarse bajo so BL CASO DE UNA MUESTRA 1a un valor de la poblacién P, Por < de una investigacion estén en dos es del tipo de la bondad del ajuste. Nos dice qué tan razonable es que Jas proporciones (0 frecuencias) que observamos en nuestra muestra se hhayan sacado de una poblacién con un valor especifico de P. Método La probabilidad de obtener x objetos en una categoria y N— x objetos en la otra es dada por: on =) ror (4) donde P = proporcién de casos esperados en una de las categorias, Q = 1— P= propecin de canon esperados en a otra categoria 1). Supongamos que un dado “egal” es lanzado cinco veces, ¢Cual es la probabilidad de que salga el seis en dos tiradas exactamente? En este caso, N (némero de P (propor- idad de que salga seis en dos de cinco tiradas es dada por la f6rmula (4. (4.1) obtener exactamente dos veces seis al tirar un dado perfecto cinco veces es p = 0.16. Ahora bien, en la investi bilidad de obtener én no solemos ocupamos de la proba- valores que fueron observados, Antes idad hay de obtener los valores obser- SME os W fact ae 8 del ap alors hasta de 20. La tabla T del apéndice contiene lov coeficents binomials ( 1A FRUEBA BINOMIAL so vados 0 valores atin més extremos?” Para contestar este tipo de pre- -guntas la distribucién muestral del binomial es: En otras palabras, sumamos la probabilidad del valor observado con las, probabilidades de valores més extremos atin, Supongamos ahora que queremos conocer la probabilidad de obtener dos © menos veces el seis cuando tirames cinco veces un dado perfecto. ‘Aqui otra vez N= 5, x= 2, P=}, y Q= §, Ahora la probabilidad de obtener dos o menos veces el seis es p(x <2). La probabilidad de obtener cero veces el seis es (0). La probabilidad de obtener una vez 1 seis es p(1). La probabilidad de obtener dos veces el seis es (2). ‘Sabemos por la férmula (4.2) que P(x S 2) = p(0) + p(1) + p(2). Esto ¢s, la probabilidad de obtener dos o menos veces el seis es la summa i usamos la {érmula lades, tenemos: b(# S 2) = p(0) + PU) + A(2) = 040 + 0.40 + 0.16 = 0.96 lad, de acuerdo con He de obtener dos o menos veces seis cuando se tira un dado cinco veces es p = 0.96. Muestras pequefias. En el caso de una muestra, cuando se usa una clase con dos categori ituacién comin ocurre al ser P igual a4. La tabla D del apé asociadas con x conforme a la hipétesis nulidad de que P= Q = 4. Al consultar Ja tabla D, supongamos que x ¢s igual a la menor de las frecuencias observadas. Esta tabla es titil cuando N es 25 0 menor que 25. Su uso hrace innecesaria la f6rmula (4.2). Cuando PQ, se debe usar la férmula (4.2). La tabla D contiene las probabilidades asociadas con Ta ocurrencia de varios valores tan pequefics como x para diferentes NV oo [1 CASO DE UNA MUESTRA (de 5 a 25). Por ejemplo, supongamos que 7 casos en observacién caen en una categoria y otros tres caen en otra. Aqui N = 10 y x = 3. La tabla D muestra que la probabilidad de una cola de Ja ocurrencia conforme a Hy de x = 3, 0 menos, cuando N = 10, es p = 0.172, (No- se han omitido los puntes decimales de p en el cuerpo de la Las p, de la tabla D, son de una cola, Se usa una prucba de una cola cuando hemos predicho cual de las categorias contendra el menor niéimero de casos. Cuando se predice simplemente que las dos frecuencias difie- ren, se usa una prueba de dos colas. Para una prueba de das colas s¢ 1a la p dada por la tabla D, Asi para N = 10 y x = 3, Ia proba- bilidad de dos colas asociadas con Ja ocurrencia conforme a He de valor extremo de x ¢s p = 2(0.172) = 0.344. jemplo que sigue ‘1 uso de la prueba binomial en una investigacién donde P = Q = 4. Ejemplo En un estudio de los efectos de Ta tensién,* un experimentador ensefié a 18 estudiantes de preparatoria dos métodos diferentes para hhacer un mudo, La mitad de los sujetos (seleccionados al azar de ‘un grupo de 18) aprendié antes el método A y la otra mitad, antes el método B. Mis tarde —a medianoche, después de un examen final de cuatro horas— se pidié a cada sujeto que hiciera de nuevo el rediccién era que la tensién induciria regresién, es decir, retrocederian al método aprendido antes, Cada su- icado de acuerdo a que usara el método aprendido aprendido después, al pedirsele atar el nudo estando 2 fi = ps =}. Esto es, no hay di- i¢ usar bajo tensién el método apren- 1d que podria esperarse en una muestra de la poblacién de los resultados posibles conforme a Ho. Hi: = pr Se elige la prucba binomial porque los orias y el disefio es de una muestra, Puesto ‘que los métodos 4 y B fueron asignados al azar para ser aprendidos antes y después, no hay razén para pensar que cl método apren- P,, y Ku, Nani D. ~schologist, 10, “Specific regresion under a noneelated (Abstract) UA PRUEDA BINOMIAL “ icacién, Sea a= 0.01. N, el néimero de ca- 1. Distribucién muestral. La distribucién muestral esti dada por la f6rmula (4.2). Sin embargo, cuando N es 25 0 menos y P= Q = $5 la tabla D da las probabilidades asociadas con la ocurrencia ‘conforme Ho de valores observados tan pequeiios como x, y hace asi innecesaria Ia distributiOn muestral al aplicar esta prueba, vy. Regién de rechazo. La regién de rechazo consiste en todos Jos valores de x (cuando x es miimero de sujetos que usaron bajo tensién el segundo método aprendido) tan pequefios que la proba- bilidad asociada con su ocurrencia conforme a Ho es igual a 0 me- nor que «= 0,01. Puesto que la direccién de la diferencia fue predicha, Ia regién de rechazo es de una sola cola, ‘vt. Decisién, En el experimento, todos excepto dos de Ios su- jetes usaron el método aprendido antes cuando se les pidié atar el rudo bajo tensién (avanzada la noche después de un largo examen final). Estos datos aparecen en la tabla 4.1. ‘Tabla 4.1, Método para atar el nudo escogido bajo tensién En este caso, N es el ndimero de observaciones independientes, 18, x ¢5 1a frecuencia menor: 2, La tabla D muestra que para N= 18, la probabilidad asociada con x <2 es p = 0.001. En vista de que p es menor que « = 0.01, se rechaza He y se acepta Hs. Con cluimos que p: > ps, esto es, que las personas bajo tensién regresan al primero de los dos métodos aprendidos. Muesteas grandes. La tabla D no puede usarse cuando N es mayor aque 25. Sin embargo, se puede demestrar que, a medida que NV se in- ‘crementa, la distribucién binomial tiende hacia la distribucién normal. Esta tendencia es répida cuando el valor de P es cercano a 3 y lenta cuando el valor de P esti préximo a 0 0 a 1. Esto cs, a medida que es mayor la disparidad entre P y Q, mayor debe ser N para que la aproximacién sea buena, Cuando el valor de P es cercano a 4, la apro~ ximacién puede usarse para una prueba estadistica si N > 25, Cuando cl valor de P se acerca a 0 0 a 1, el sentido comin sefiala que NPQ debe a FL CASO DE UNA MUESTRA igual a 9 para ser aplicable a la prueba estadis- tica basada en la aproximacién normal, Dentro de estas limitaciones, fa distribucién muestral de x es aproximadamente normal, con m = NP y desviacién estindar = VNPQ, y por consiguiente Ho puede ser probada por: fobs £—NP NPG (43) donde z esti aproximadamente distribuida en forma normal con media de cero y varianza de uno. ‘La aproximacién es excelente si se hace una correccién por medio de la continuidad. La correccién es necesaria debido a que la distribu- CG6n normal es para una variable continua, mientras la varial distribucin binomial es discreta. Para corregir por medio de nuidad, consideramos Ia frecuencia observada x de la form ite infer medi por debajo de la frecuen media unidad arriba de Ia frecuencia diel nuidad consiste en reducir en 0.5 la diferenc de x y el valor esperado, re = NP. Por consiguiente, cuando * < ie afiadimos 0.5 a x, y cuando x > Hs, sustracmos 0.5 de x. Ast, Ia dife- rencia observada se reduce en 0.5. Por tanto z viene a ser (22:05) — NP YVNPQ. donde x + 0.5 se usa al ser x < NP; x — 0.5 se usa cuando # > NP. de 2 obtenido al aplicar la férmula (4.4) puede considerarse ‘media de cero y varianza de uno, Por puede determinarse por medio tabla A da la probabilidad, de la con forme a He de valores tan ex: tremos como la z observada, (Si se requiere una prueba de dos colas, la p obtenida en la tabla A deberd ser doblada.) Para mostrar cudn buena es una aproximacién cuando P = 4, adn para N < 25, podemes aplicaria a los datos del nudo recién estudiado. En ese caso, N = 18, x = 2, y P= Q = 4, Para estos datos, x < NP, esto es, 2<9, y por la formula (4/ aces ze (44) = -3.07 La tabla A indica que una z tan extrema como —3.07 tiene una proba- bilidad de una cola asociada con su ocurrencia conforme a Ho de p = 1A PRUEBA BINOMIAL 6 0.0011, Es esencialmente la misma probabilidad que encontrames por cl otro anilisis, que emplea una tabla de probabilidades exactas, Resumen del procedimiento. Brevemente, estos son los pasos para el uso de la prueba binomial: 1. Se determina N, el niimero total de casos observados. 2 Se determinan las frecuencias de ocurrencia observadas en cada una de las dos categorfas. '3. Se escoge el método para encontrar la probabilidad de ocurrencia conforme a He de los valores observados, o valores ain mas extremos, suientes: cs 25 0 menos y si P = Q = 4, la tabla D sefiala las pro- abilidades de una cola conforme a Ho de valores diferentes tan pequefios como una x observada, Una prucba de una cola se emplea cuando el investigador ha predicho qué categoria tendré Ja menor frecuencia, Para una prueba de dos colas, dupliquese 1a p sefialada en la tabla D. b) Si PQ, habré que determinar la prol del valor observado de x, 0 de un valor aun més syendo los valores observados en la férmula (4.2). i para este célculo: da los coeficientes bino- Ta tabla T es (8), ara. < 20. wrayor que 25 y P cereana a 4, He se prueba usando Ta formula (4-4), La tabla A enlista las probabilidades asociadas de la ocurrencia conforme a Hy de valores tan grandes como una J chservada, proporcionada por esa férmula, En la tabla A se ‘valores de p de una cola; para una prueba de dos valor obtenido, Si la p asociada con el valor observado de x, 0 de un valor atin més extremo, ¢s igual o menor que @ hay que rechazar Ho, Potencia-eficiencia En vista de que no hay técnica paramétrica aplicable a datos me- didos en una escala nominal, carece de sentido inquirir 1a potencia- cficiencia de la prueba bi ‘cuando se emplea con datos nominales. ‘Al ser dicotomizado un continuo si con Jos datos result plea la prucba binomial, puede actuar disipadofamente, En tales casos, la prueba binomial tiene una potencia-efi (en el sentido de- finido en el capitulo 3) del 95% con una N de 6, dismainuyendo a una eficencia eventual (asintética) de 2 = 6395 (Mood, 1954). Sin em “ FL CASO DE UNA MUESTRA bargo, si los datos se prestan bisicamente a Ia dicotomia, aunque la variable tenga en la base una distribucién continua, la prueba bino- mial puede no tener alternativas més poderosas. Bibliografia Para revisiones adicionales de la prueba consultar las obras de Clopper y Pearson (19: tulos, 3-4), McNemar (1955, pags. 42-49 58). 4 lector puede 949, capi- (1950, pags. 54 UA PRUEBA y* DE UNA MUESTRA Funelén Frecuentemente, al emprender el investigador su tarea, se interesa fen el nimero de sujetos, objetos o respuestas que se clasifican en dife- entes categorias. Por ejemplo, un grupo de pacientes puede clasificarse de acuerdo con el tipo preponderante de sus respuestas al Rorschach y el investigador puede predecir la predominancia de ciertos tipos sobre otros. © los nifios pueden clasficarse de acuerdo con los modos més frecuentes de sus juegos, para ias en las respuestas. La prueba x* ¢s adecuada para analizar datos como estos. El néimero de categorias puede ser de dos 0 més, La técnica es del tipo de la bon- dad yue puede usarse para probar la existencia de una dife- renci iva entre un mimero observado de objetos 0 respuestas de cada categoria y un méimero esperado, basado en [a hipétesis de nulidad. Método Con el fin de comparar un grupo de frecuencias observado con uno esperado, debemos, por supuesto, ser capaces de indicar qué frecuencias, son esperadas. La hipétesis de nulidad establece la proporcién de objetos que caen en cada una de las categorias de la poblacién presumida. Esto 3, a partir de la hipétesis de nulidad podemos deducir cuales son las frecuencias esperadas, La técnica x* prueba si las frecuencias observa- das estin suficientemente préximas a las esperadas que podrian ocurrir conforme a Ho. 1 PRUEBA 7 DE UNA MUESTRA, os La hipétesis de nulidad puede probarse mediante la {6rmula 2 $(Oi- By)? ree donde O1 es el ntimero observado de casos clasificados en la categoria dei. donde Ey es el mimero esperado de casos en la categoria de i confor- me a Ho, (45) 2 sefiala Ia necesidad de sumar en todas las categorias (£). Asi, la {6rmula (4.5) nos indica sumar en las k categorias los cua~ drados de las diferencias de cada frecuencia observada y cada frecuencia esperada dividida por la frecuencia esperada correspondiente. Si el acuerdo entre las frecuencias observada y esperada es grande, la diferencia (Os — Ei) seré pequefia y, consecuentemente, x? serd también pequefia, Sin embargo, si la divergencia es grande, el valor de x* calculado con Ia férmula (4.5), también ser grande. A grandes rasgos, podemos decir que para valores mayores de x, aumentardn las probabilidades de que las frecuenci poblacién en la que se bas6 la Puede mostrarse que la calculada con la form con gl =k — 1. los grados de libertad, que ser més adelante.) La tabla C del apéndice fue tomada de la distri miucstral de chi cuadrada y con ella se obticnen ciertos valores crticos. En la parte superior de cada columna de la tabla C encontramos las probabilidades de ocurrencia asociadas (de dos colas) conforme a Hs. ‘Les valores de cualquier colurmna son valores de chi cuadrada con pro- babilidad de ocurrencia asociada conforme a He, dada en la parte superior de la colurina correspondiente, Hay un valor diferente de chi cuadrada para cada gl Hay diferentes distribuciones muestrales para chi cuadrada, una para cada valor de gl. El tamafio de gl refleja el niimero de observa- ciones susceptibles de variar después de que ciertas restricciones se han hecho en los datos. Estas restricciones no son arbitrarias sino inherentes sanizaci6n de los datos. Por ejemplo, si los datos de 50 casos estin clasificados en dos categorias, tan pronto como sepamos que 35. casos pertenecen a una categoria, inferiremos que 15 deben estar en la otra. En este ejemplo, gl = 1, porque con dos categorias y cualquier valor ry HL CASO DE UNA MUESTRA fijo de N, tan pronto como se conoce el niimero de goria, queda determinado el néimero de casos de la En general, en casos de una muestra, cuando Ho ion. dde una hipétesis en casos de una muestra, ada una del niimero k de celdillas, El ni- k—1, donde k representa el niéimero de categorias de Para usar x* en se pone cada obse mero total de tales ot , wna observacion debe ser i Esto produciré una “N inflada” frecuencia esperada también debe ypone que Ia proporcién de casos en cada categoria es 1a misma, ces Ei = N/k. Conociendo los diferentes valores de Ei y Os, se puede computar el valor de x* mediante la {érmula (4.5). La signifi- cacién de este valor obtenido de x* puede determinarse recurriendo ala tabla C, Si la probabilidad asociada con Ia ocurrencia, conforme a Hy, de la x obtenida para gl = k — 1 ¢s igual o menor que el valor de @ determinado previamente, H» puede ser rechazada. Si no es asi, Hy seri aceptada. Ejemplo [Los aficionados a las carreras de caballos a menudo afirman que tna carrera alrededor de una pista circular da lugar a ventajas sig- iciones de posta. de arranque, En una ca cercana a la barandilla int en el lado exterior, es Ia més alejada de la barandilla, Podemos pro- bar el efecto de Ia posicién de posta analizando los resultados de la carrera, dados de acuerdo con dicha posicién, durante el_ primer mes de carreras en la temporada de 1955 en una pista circular.” 1. Hipétesis de mulidad, Ho: no hay diferencia en el niimero esperado de ganadores que partieron de cada una de las posiciones de posta y las diferencias observadas son meramente variaciones i sn una muestra al azar de la pot rectan- no son todas iguales. 1m. Prueba estadistica. Ya que estamos comparando les datos de una muestra con alguna presunta poblacién, es apropiada una 1 Datos del New York Post, agosto 30, 1955, phe. 42. UA PRUEBA x* DE UNA MUESTRA o prucba de una muestra. Se escoge la x‘ porque a la hipétesis bajo prueba le concieme una comparacién de frecuencias observadas sgorias discretas. (Las categorias son las ocho po- seré rechazada si el srobabilidad asociada con su oct aH para gl igual o menor que « = 0.01. ‘vi. Decisign. La muestra de 144 ganadores produjo los datos aque aparecen en la tabla 4.2. Las frecuencias observadas de triunfos TABLA 4.2. Triunfos logrados en una pista circular de carreras de caballos ‘desde ocho poriciones de posta Prin de poe | | et Her leis oman al eat lhe tones hla cstin al centro de cada celdilla; Ias frecuencias esperadas estin en ‘nimeros cursivos en la esquina de cada celdilla. Por ejemplo, los caballos en la posicién 1 lograron 29 triunfos; conforme a Ho se hhabian esperado 18 solamente, Por otra parte, los caballos en la po- sicién 8 solamente obtuvieron 11 triunfos, mientras que, conforme a Ho se habrian esperado 18. En seguida, calculamos x* a =3 (04: (45) La prueba x2 puede no ser la mis apropiada para estos dator, ya que parece hay algunas etiones de orden implicadas, y la prucba x es insensble al to del orden, Se presenta el ejemplo porque ilustra el uso y computacién de I ‘prucba, Mas adelante en ete capitulo presentaremos prucbas de una muestra que fon més apropiadas para tales datos oo HL CASO DE UNA MUESTRA La tabla G muestra que x* > 16.3 para gl = 7, tiene probabilidad de ocurrencia entre p = 0.05 y p = 0.02. Esto En via de qu probabilidad es mayor que el nivel de significa- jado anteriormente, « = 0.01, no podemos rechazar He en el de significacién, Nétese que la hipétesis de nulidad pudo haber sido rechazada en « = 0.05. Parece que se necesitan més datos antes de hacer cualquier conclusién definitiva acerca de Hs. Frecuencias esperadas pequefias. Cuando gl = 1, esto es, cuando k= 2, cada frecuencia esperada deber4 ser por lo menos de 5. Cuan- do gl > 1, esto es, cuando > 2, la prueba x* para casos de una mues- tra no debe usarse si més del veinte por ciento de las frecuencias espera~ das son menores que 5 0 cuando cualquier frecuencia esperada es menor que 1 (Cochran, 1954). Las frecuencias esperadas algunas veces pue- den incrementarse combinando categorias adyacentes. Esto es deseable solamente si pueden hacerse combinaciones que tengan sentido (y, desde uego, si hay més de dos categorias para empezar). Por ejemplo, una muestra de personas puede clasificarse de acuerdo ‘con su respuesta a una declaracién de opinién como sostenida firme- ‘mente, sostenida, indiferente, opuesta o firmemente opuesta, Para in- deben combinarse categorias adyacentes, y las personas clasificadas como de acuerdo, indiferentes u opuestas 0 posiblemente como de acuerdo, indiferentes, opuestas y firmemente opuestas. Si se empieza solamente con dos categorias y se tiene una frecuencia csperada menor que 5, 0 si después de combinar las categorias adya- centes se termina solamente con dos categorias y atin se tiene una frecuencia esperada menor que 5, entonces ¢ indicado el uso de Ia prueba binomial (paginas 57 a 64) en lugar de la prueba x? para determinar la probabitidad asociada con la ocurrencia de las frecuencias observadas conforme a He. Resumen del procedimiento. En este estudio del método para usar la prueba x en casos de una muestra, hemos visto que el procedimiento para emplearla involucra ls siguientes pasos: 1, Se clasifican las frecuencias observadas en un niimero k de ca- tegorias. La suma de las frecuencias debe ser N, es decir, el néimero de observaciones independientes. 2. A partir de He, se determinan las frecuencias esperadas (las Es) para cada una de las & celdillas. Cuando k > 2, si mAs del veinte por ciento de las Ei son menores que 5, habré que combinar las categorias adyacentes cuando sea razonable hacerlo, reduciendo de ee modo ¢l valor de k ¢ incrementando los valores de algunas de las £1. Cuando k = 2, la prueba x* para el caso de una muestra no puede usarse apro- 1A PRUEBA DE UNA MUESTRA DE KOLMOGOROV.SMIRNOV. o piadamente a menos que cada frecuencia esperada sea 5 0 més, 3. Con la férmula (4.5), se calcula el valor de x*. ocurrencia conforme a He de un valor tan gran: vado de x* para el valor observado de gl. Si p 5 igual o menor que «, se rechaza Ho. Potencia La bibliografia no contiene mucha informacién acerca de la funcién de potencia de la prueba x’. En vista de que esta prueba suele ser usada cuando no s¢ dispone de otra altemnativa clara, usualmente no estamos en posicién de calcular su potencia exacta. Cuando se usa la medicién nominal 0 cuando los datos estin con- formados por categorias inherentemente discretas, la nocién de potencia- ficiencia de la prueba x* no tiene importancia; en tales casos, no hay prueba paramétrica adecuada, Si los datos permiten que pueda dis- ponerse de tuna prueba paramétrica, la prueba x* puede ser disipadora de la informacién. Deberd notarse que cuando gl > 1, las pruebas x* son .nsensibles a los efectos de orden, y, asf, cuando una hipétesis tiene en cuenta el orden, Ia prueba x* puede no ser la mejor. Para métodos que forta- Tezcan las pruebas comunes de x* cuando se prueba Ho frente a alter- nativas especificas, véase Cochran (1954). Bibliografia Utiles estudios de la prueba x* estn contenidos en Cochran (19525 51, cap. 13), Lewis y Burke ( 1A PRUEBA DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV Funcién y fundamento La prucba de una muestra de Kolmogorov-Smirnov es una prueba ic. Esto es, se interesa en el grado de acuerdo de un conjunto de valores de la muestra (puntajes observados) y alguna distribucién teérica especifica, Determina si razo- nablemente puede pensarse que los puntajes en la muestra provengan de una poblacién que tenga exa distribucién te6rica. 7 1 CASO DE UNA MUESTRA Brevemente, la prueba lleva consigo la especificacién de la distri- Ducién de frecuencia acumulativa que ocurriria bajo la distribuci te6rica y su comparacién con la distribucién de frecuencia acumulativa observada. La distribucién tedrica representa lo esperado conforme a Ho, Se determina el punto en el que estas dos distribuciones, la tedrica y Ia observada, muestran la mayor divergencia. La referencia a la dis- tribucién muestra indica si hay probabilidad de divergencia tan grande con base en el azar, Esto es, la distribucién muestral indica que una divergencia de la magnitud observada probablemente ocurriria si Jas observaciones fueran realmente una muestra aleatoria de la distribuciéa teérica. Método Sea Fo(X) una funcién de distribucién de frecuencia acumulativa completamente especificada, Esto es, para cualquier valor de X, el valor de Fo(X) es la proporcién de casos esperados que tienen puntajes iguales o menores que X. Y sea Ss(X) la distribucién de frecuencia acumulativa observada de una muestra tomada al azar de N observaciones. Si X es cualquier puntaje posible, tenemos Sx(X) = k/N, donde & es el mimero de observaciones igual a o menor que X. ‘Ahora bien, conforme a la hipétesis de nulidad que supone una muestra obtenida de una distribucién tebrica especifica, se espera que ¢s, conforme a Hs esperamos qu pequefia y esté dentro de los limi més grande de Fo(X) — Ss(X) se lama la méxima des designa D: D = maxima [Fe(X) ~ Sx(X)] La distribucién muestral de D conforme a He se conoce. del apéndice proporciona ci tral, Notese que la si depende de N. Por ejemplo, supongamos que con Ia férmula (4.6) se tiene que D = 0325 cuando N = 15. La tabla E muestra que D > 0.325 tiene una probabilidad asociada de ocurrencia (de dos colas) entre p = 0-10 y p = 005. sobrepasa 35, se determinan los valores criticos de D mediante Jas divisiones indicadas en la tabla E. Por ejemplo, supongamos que tun investigador tiene como N 43 casos y como a el valor 0.05. La tabla acién de un valor cualquiera atribuido a D 1A PRUERA DE UNA MUESTRA DE KOLMOGOROV-SMIRNOV n E muestra que cualquier D igual o mayor que 13° seré significativa. Esto es, cualquier D, definida por la férmula que sea igual o ativa al nivel 0.05 (prueba de Los valores criticos para pruebas de una cola atin no han sido tabulados adecuadamente, Un método para encontrar las probabili- dades asociadas en las pruebas de una cola, puede consultarse en Birnbaum y Tingey (1951) y Goodman (1954, pig. 166). Ejemplo Supongamos que un investigador esté interesado en confirmar, por medios experimentales, la observacién sociolégica de que los negros americanos parecen tener una jerarquia de preferencias entre dlistintos matices de piel Para probar cun sistemiticas dad; asi, las cinco copias pueden ordenarse segiin el color de piel, de la més oscura a la mis clara. La fotografia que presenta el color de piel més oscuro recibe el rango 1, la siguiente en oscuridad el 2, y asi sucesivamente hasta la més clara, que recibe el rango 5. Después se le pide a cada sujeto que escoja, de entre las cinco im- presiones, su propia fotografia. Si el matiz de la piel no es impor- jetos, las fotografias de cada rango a menudo serdn escogidas igualmente, exceptuando las diferencias aleatorias, matiz de la piel es importante, como se ha supuesto, entonces los sujetos consistentemente mostrarén preferencia a uno de los rangos extremos, 1. Hipétesis de nulidad. Hs: no hay diferencia entre el niimero esperado de clecciones para cada uno de los cinco rangos y las dife- encias observadas son meramente variaciones casuales esperadas gn uma mena alestora pro laci6n rectangular donde fs = fe = +++ = fs. Ha: las frecuencias fs, fs, ...,fs no son todas iguales. 1. Prueba estadistica, La prueba de una muestra de Kolmo- mimov se escoge porque el investigador desea comparar una A. 1941, Color and human nature, FL CASO DE UNA MUESTRA distribucién de puntajes observados en una escala ordinal con ‘una distribucin teérica. jetos negros que sirvie wv. Distribucién muestral, vy. Regién de rechazo. La regién de rechazo consiste en todos Jos valores de D [computados por la férmula (4.6)] que son tan grandes que la probabilidad asociada con su ocurrencia conforme ‘escogen la impresién 5 tabla 4.3 muestra estos datos y los presenta en forma aproj para aplicarios a la prueba de una muestra de Kolmogorov-Smimov. TABLA 4.3, Preferencias hipotiticas del color de In piel ‘de 10 sujetos negroe Rango de le foto eo aad i roa Nétese que Fo(X) es la distribucién acumul le Hy supone que cada una ta parte de las elecciones, del valor real de la muestra con respecto a su valor esperado toma- do comparativamente. Asi la primera desviacién absoluta es de fp obtenida sustrayendo 0 de 3 UA PRUEBA DE UNA MUESTRA DE KOLMOGOROV.SMIRNOV a La inspeccién del renglén de la tabla 4.3 sefiala que Ia D para estos datos ¢s sea 0.500. La tabla E muestra que para N = 10, D > 0: .¢ una probabilidad asociada conforme a Ho de p < 0.01. En vista de que la p asociada con el valor obser- vado de D es menor que « = 0.01, nuestra decisi6n en este estudio fs rechazar Ho en favor de Hs. Concluimos que nuestros sujetos muestran preferencias significativas entre los colores de piel. Resumen del procedimiento. En el cilculo de la prueba de Kol- ‘mogorov-Smimov se siguen estos pasos: fica la funcién acumulativa te6rica, es decir, la distribu- cién acumulativa esperada conforme a Ha. 2 Se disponen los puntajes observados en una distribucién acumu- lativa, comparando cada intervalo de Sx(X) con el intervalo corres- pondiente de Fo(X). ldafio de las distribuciones acumulativas, se sustrae Sx(X) de Fa(X). 4. Usando la férmula (4.6), se encuentra D. 5. En la tabla E, se encuentra la probabilidad (de dos colas) aso- ciada con la ocurrencia conforme a He de valores tan grandes como el valor observado de D. Si esa f tiene un valor igual o menor que @, se rechaza Ho. Potencia La prueba de una muestra de Kolmogorov-Smimov trata las obser- vaciones individuales separadamente y, asf, a diferencia de la prueba x* para una muestra, no pierde necesariamente informaci6n al combi- nar categorias. Cuando las muestras son pequefias y, por consiguiente, las categorias adyacentes deben combinarse antes de que x* pueda calcu- ‘muestras muy pequefias, _sin embargo, Ia de de Kolmogorov-Smirnov puede en todos los casos ser més poderosa que su alternativa, la prueba x*. ‘Un nuevo andlisis mediante Ia prucba x* de los datos del ejemplo anterior destaca la potencia superior de la prucba de Kolmogorov- ‘Smimoy. En la forma en que los dates estin presentadas en la tabla 43, x* no puede calcularse, porque las frecuencias esperadas son sola- mente 2 cuando N = 10 yk = 5. Tenemos que combinar las categorias adyacentes para incrementar la frecuencia esperada por celdilla, lo que nos lleva al andlisis de dos categorfas que aparece en la tabla 4.4. Cual- ” HL CASO DE UNA MUESTRA aquier eleccién de un sujeto es simplemente clasificada como inclinacién ‘al tono de piel claro u oscuro; las gradaciones més finas serén ignoradas. TABLA 44, Preferencias hipotéticas por colores de piel de 10 sujetos negros Color de pial de Ia fotografia escogide Cara (rangor 3,4, 5) Oscura (rangos 1,2) ‘Frecvencia de eleccién Para estos datos, x* (no corregida por continuidad) = 3.75. La tabla C muestra que la probabilidad asociada con la ocurrencia con- forme a He de ese valor, cuando gl = k— 1 = 1, esth entre 0.10 y Este valor de no nos permite recha- cién, Nétese q ‘ada con la prueba Kolmogoroy-Smimov ¢s ‘menor que 0.01, mientras la de la prueba x? es mayor que 0.05. Esta diferencia nos da alguna indicacién de la potencia superior de la prueba de Kelmogorov-Smimoy. Bibliogratia El lector puede hallar otros anilisis de la prucba de Kolmogorov- ‘Smimov en Bimbaum (1952; 1953), Bimbaum y Tingey (1951), Goodman (1954) y Massey (19512). LA PRUEBA DE RACHAS DE UNA MUESTRA Funcién y fundamento Si un experimentador desea legar a una conclusién acerca de una poblacién usando la informacién contenida en una muestra de ella, su nuestra debe ser aleatoria. En afios recientes, se han desarrollado varias ‘tgcnicas que nos permiten probar que una muestra es aleatoria, Estas téc- nicas se basan en cl orden o secuencia en que los puntajes u observa- ciones del individuo fueron obtenidos originalmente. ‘La técnica que presentaremos aqui se basa en el némero de rachas que la muestra exhibe, Se define una racha como una sucesién de simbolos idénticos que pueden estar o no estar separados por otras sim- bolos. {UA PRUERA DE RAGHAS DE UNA MUESTRA cay Por ejemplo, supongames una serie de simbolos de més y mens oct rrida en este orden: $eoo tooo otto Esta muestra de puntajes empieza con una racha de dos més, la sigue otra racha de tres menos, a continuacién otra de un més, en seguida Cuatro menos, dos més, etc. Podemos agruparlas en rachas, contando las series de simbolos idénticos: $4 o25 +2 o5o tt 2 Bnew’ A cndom Bb of Observamos que 7, el nsimero de rachas, es de 7. TEI nimero total de las rachas de una muestra de cualquier tamafio ‘nos sefala si la muestra es 0 no es aleatoria, La escasez de rachas puede Ueberse a tendencias temporales o a cierta falta de independencia, Por ftra parte, al ocurrir rachas abundantes, las fluetuaciones ciclcas sste- tnaticas de corto periodo pueden causar esta influencia en los puntajes. Por ejemplo, supongamos que lanzamos al aire 20 veces una moneda y observamos la siguiente secuencia de caras (HT) y eruces (7'): HHHHHHHHHHTTTTTTTTTT. ob 7 En 20 lanzamientos, ocurrieron sol poco si se trata de una moneda “legal! sugiere que hay falta de independencia ‘supongamos que ocurrié la siguiente secuencia: HTHTHTHTHTHTHTHTHTHT. ‘Aqui se observan demasiadas rachas. En este caso, siendo r= 20 cuando N = 20, es otra vez razonable rechazar Ja hipétesis de que la ‘NNinguna de las frecuencias anteriores parecen ser series al az Tr. ‘Notese que el andlisis basado en el orden de los eventos nos da una informacién que no proviene de la frecuencia de los mismos, En ambes ‘cases, ocurtieron 10 cruces y 10 caras. Si se analizaran los puntajes Ge acuerdo a sus frecuencias, por ejemplo, usando la prueba x‘ o la prueba binomial, no tendriamos razén para sospechar que la moneda “legal”, La prueba de rachas solamente no atiende sino al ‘ventes, descubriendo en él una fuerte falta de aleatoriedad dde los puntajes y asi, la posible “legalidad” de la moneda. ‘La distribucién muestral de los valores de r que podemos esperar de repetidas rmuestras al azar ¢5 conocida. Usando esta distribucién ucstral, podemos saber cundo una muestra observada tiene més 0 % 1 CASO DE UNA MUESTRA menos rachas de las que probablemente ocurritian en una muestra al azar. Método Sea m: el niimero de elementos de una clase, y nz el nimero de elementos de la otra; n: podria ser el mtimero de caras y ns el de cruces; © m podria ser el mimero de signos de més y ns el de signos de menos. Sea N el miimero total de eventos observados = ms ++ ms. ‘Al usar la prueba de rachas de una muestra, se observan en primer lugar los eventos mt: y n: en el orden que han ocurrido y se determina 1 valor de r. Muestras pequefias. Si tanto m como ft son iguales © menores que 20, encontraremos en la tabla F del apéndice los valores criticos de r conforme a Ho considerando « = 0.05. Son valores criticos de su dis- tribucién muestral: Si el valor observado de r esti entre los valores criticos, se acepta H. valor observado de r es igual o més extremo que uno de los valores criticas, se rechaza Ho. Son dos las tablas, Fr y Fu. La tabla Fi contiene valores de r tan pequefios, que la probabilidad asociada con su ocurrencia conforme a Hy es p = 0.025. La tabla Fn contiene valores de r tan grandes, que 1a probabilidad asociada con su ocurrencia conforme Hs es = 0.025. ‘Cualquier valor observado de r igual a 0 menor que el de Ja tabla F,, 0 igual a o mayor que cl de la tabla Fr, queda en la region de rechazo considerando a = 0.05. Por ejemplo, en la primera serie de Ianzamientos de Ia moneda observames dos rachas: una de 10 caras seguida por otra de 10 eruces. Aqui, nm: = 10, ns = 10, yr = 2. La tabla F muestra que a estos valo- res de ny ms, corresponde una muestra aleatoria de mas de 6 rachas y menos de 16, Cualquier r observada de 6 (o menos) 0 de 16 (o més) est en la regién de 05. La r observada de 2 es menor que 6; por tanto, cién de 0.05 se rechaza la hipé- tesis de ulidad que supone series aleatorias de caras y cruces producidas por esta moneda. Al considerar adecuada una prueba de una cola, es decir, al ser pre~ determinada la direccién de desviacién de Ia aleatoriedad, solamente se necesita examinar una de las dos tablas, Si se predice una observacién de muy pocas rachas, Ia tabla Fr abarca los valores criticos de 7. Si la + observada bajo la prueba de una cola es igual a o menor que Ia de la tabla Fi, Ho puede rechazarse en « = 0.025. Si se predice una obser- de demasiadas rachas, Ia tabla Fu abarca los valores criticos de 1 significatives al nivel 0.025. 1A PRUEBA DE RACHAS DE UNA MUESTRA n ‘Veamos ahora el caso de Ia segunda secuencia de lanzamientos de Ja moneda, Supongames sc ha hecho la prediccién de que con esta seonoia ne producrin demasiadas rachas. Como r = 20, y m = 10 y = 10, y puesto que el valor observado de r es igual o mayor que el Imostrado ela tabla Fx, podemos rechazar Hen a = 0.025, y concluir que la moneda es “legal” en la direcci6n predicha. Ejemplo de muestras pequetias En un estudio de la dinémica de la agresién en nifios menores, Ja experimentadora observé varias parejas de nifios en una situa- ci6n de juego controlada* La mayoria de los 24 sujetos infantiles del estudio provenfa de la misma guarderia y por tanto jugaban juntos diariamente. En vista de que la experimentadora fue obser- vando solamente dos nifios cada dia, investigé qué propensiones reflejaria el estudio debido a las discusiones entre aquellos nifios que servido como sujetos y aquellos que no lo habian hecho efectos sobre el nivel de agresion durante las sesiones de juego, las consecuencias podrian sefialar en ¢l orden de los puntajes de agresién una carencia de aleatoriedad. Al finalizar el estudio, fue probada la aleatoriedad de la sucesion de puntajes convirtiendo el puntaje de agresién de cada nifio en un més o un menos, de acuerdo con que quedara por encima o por debajo de la mediana del grupo y aplicando la prueba de rachas de una muestra a la sucesién observada. 1. Hipétesis de nulidad, Hy: los signos de més y menos ocurren al azar, Hs: Ia sucesién de los signos de més 0 menos no ocurre al 1. Prueba estadistica. En vista de que la hipétesis concieme a la aleatoriedad de una sola serie de observaciones, se escoge la prueba de rachas de una muestra. im. Nivel de significacién. Sea a= 0.05. N, el ndmero de su- jetos, 24. Como los puntajes serdn caracterizados de més o mencs ‘de acuerdo con su posicién respecto al puntaje intermedio del grupo, = iy m= 12, ucién muestral. La tabla F tiene los valores criticos vy fesse de rechazo. Puesto que H. no predice la direccién de Ja desvincién que supone, se usa un test de dos colas. Hy seré re- “The effect of filmmediated fantary aggression on re in young children”. Unpublished doctors distertetion, nm EL CASO DE UNA MUESTRA chazada a nivel de significacién 0.05 si r ¢s igual 0 menor que un valor apropiado de la tabla Fr 0 es igual a o mayor que un valor apro- piado de la tabla Fur. Para mi = 12 y m= 12, la tabla F muestra que a regién de rechazo consiste en los valores de r de 7 0 menores y los valores de r de 19 0 mayores: vi. Decisién. La tabla 4.5 muestra los puntajes de agresion de cada nifio en el orden en que ocurrieron. La mediana de este con- junto de puntajes ¢s 24.5, Todos los puntajes por debajo de Ia mediana se designan como menos en la tabla 4.5; y todos los que quedan por encima de la mediana se designan como més. En la ‘columna que muestra Ia serie de + y — el lector puede répida- mente observar que ocurrieron 10 rachas en esta serie por tanto, r=10. La referencia a la tabla F nos revela que r= 10 para mi = 12 y ny = 12 no cae en la regién de rechazo. Por tanto, se puede decidir {que ¢s aceptable Ia hipétesis de nulidad que supone una muestra de puntajes ocurrida al azar. TABLA 4.5. Puntajes de agresign en orden de ocurrencia Ldbb i beth Hitieeti iets ‘Muestras grandes. Sim 0 m2 ¢s mayor que 20, la tabla F no puede ‘usarse, Para muestras tan grandes, una buena aproximacién. a la distri bucién muestral de res la distribucién normal, con ia = pe = 2 Media = wr == +1 Bm y Dewan etindar = 0 = qe m= 1) 1A PRUEBA DE RACHAS DE UNA MUESTRA n Por tanto, cuando n 0 ms es mayor que 20, He puede probarse asi: (47) Los valores de z que son dados por la férmula (4.7) son, conforme a ‘Hy aproximadamente distribuides en forma normal con media de cero y varianza de uno; por tanto Ia significacién de cualquier valor obser- vado de z calculado con esta férmula puede determinarse por medio de Ta tabla de curva normal, tabla A del apéndice. Esto es, en la tabla A se encuentran las probabilidades de una cola asociadas con la ocurren- ‘ia conforme aH» de valores tan extremos como el de cierta z observada. El siguiente ejemplo trata Ja aproximacién de la curva a la distri- bucién muestral de r con una muestra grande, Ejemplo de muestras grandes El autor se interes6 en descubrir el cardcter ordenado o azaroso de la colocacién de hombres y mujeres en la cola frente a la taqui- Ia de un cine, Los datos se obtuvieron simplemente anotando el sexo de 50 personas en el momento de acercarse a la taquilla. 1. Hipétesis de nulidad. Ho: Ia serie de hombres y mujeres en la fa setie de hombres y mujeres no es al azar. ‘La prueba de rachas de tuna muestra se ¢sco- ‘oncicme a la aleatoriedad de un solo grupo ‘m. Nivel de significacién. Sean « = 0.05 y N, (nimero de per- sonas observadas) 50. Los valores de m y mz se determinarin una ‘vez reunidos los datos. 1. Distribucién muestral, Para muestras grandes, los valores de z que se calculan con la férmula (4.7), conforme a Hs estén nor- malmente distribuidos. En la tabla A encontramos las probabilidades de una cola asociadas con la ocurrencia conforme a He de valores tan extremos como el de cierta z observada. vy. Regién de rechazo. H, no predice la direccién de la desviacién respecto al azar, en consccuencia, se usa una regién de rechazo de dos colas que abarca todos los valores de z calculados con la férmula (4:7), tan extremos que la probabilidad asociada con su ocurrencia conforme a He es igual o menor que « = 0.05. La regi6n de rechazo, por tanto, incluye todos los valores de z.iguales a 0 més extremos aque = 1.96. 0 FL CASO DE UNA MUESTRA vt. Decisién. Los hombres (M) y las mujeres (F) se formaron frente a la taquilla en el orden indicado en la tabla 4.6. TABLA 4.6 Orden de 30 hombres (M) y 20 mujeres (F) formados frente a In taquilla del cine (Se indican las rachas con lot subrayados) La muestra fue de 30 hombres y 20 mujeres. El examen de los datos de la tabla 46, determina que r = 35 es el nero de rachas. Para determinar si r > 35 podria haber ocurrido féciimente con- forme a Ho, se calcula el valor de 2 definido por la férmula (4.7). Sea ms, el nimero de varones, 30 y ns, el niimero de mujeres, 20. 2nsne Qnins(2nins — ta — Ma) Non + m)"(m + m= 1) — (2(30)(20), endundit 8, (ork poi, (GO) (20) [2(30(20) — 50 = 20} (80+ 20)*(80 + 20 = 1) = 298 La tabla A muestra que la probabilidad de ocurrencia conforme a He de z > 2.98 es p = 2(0.0014) = 0.0028. (La probabilidad es dos veces la p dada en la tabla porque se necesita una prueba de dos colas.) Puesto que In probabilidad asociada con la ocurrencia observada, = 0.0028 es menor que el nivel de signifiacién, « = 0.05, se rechaza la hipétesis de nulidad yy se favorece a la. hipé- tesis alterna. Concluimos que la fila frente al cine no contenfa. un orden de hombres y mujeres aleatorio. (47) Resumen del procedimiento. Estos son los pasos para el uso de Ja prueba de rachas de una muestra: 1, Se colocan las observaciones ms y m: en su orden de ocurrencia, 2. Se cuenta el mimero de rachas, 7. 8. Se determina la probabilidad conforme a Ho asociada con un valor tan extremo como el valor observado de r. Si esa probabilidad es ANAUSIS o igual o menor que @, se rechaza He, La técnica para determinar el valor de p depende del tamafio de los grupos m y ma: a) Si my nm: tienen un valor de 20 0 menor, la Fr abarca valores de r tan pequefios, que su probabilidad asociada conforme a Hee p= la tabla Fur abarca valores de r tan grandes {que su probabilidad asociada conforme a Hy es p = 0.025. Para tuna prueba de dos colas, Ia regién de rechazo en « = 0.05 con- siste en los dos valores tabulados de r y de todos los valores més fextremos, Para una prueba de una cola, la regién de rechazo ‘en « = 0.025 consiste en el valor tabulado de r en la direccién supuesta (demasiado pequefio o demasiado grande) y de todos Jos valores mAs extremos. b) Si mom: es mayor que 20, se determina el valor de z caleulado con Ia férmula (4.7). La tabla A muestra la probabilidad de tuna cola asociada con Ia ocurrencia conforme a Ho de valores tan extremos como el de cierta z observada, Para una prueba de dos colas, se duplica la p encontrada en esa tabla, Si la p asociada con el valor observado de 7 es igual o menor que a, se rechaza Ho. Potencio-eficiencia Debido a que no hay pruebas paramétricas para Ia aleatoriedad de laserie de eventos de una muestra, el concepto de potencia-eficiencia no ¢s significativo para prueba de rachas de una muestra, Bibliografia Otros estudios de esta prucba se encuentran en Freund (1952, ca- pitulo 11), Moore y Wallis (1943) y Swed y Eisenhart (1943). ANALISIS. ‘Hemos presentado cuatro pruebas estadisticas no paramétricas para ‘usarse en el disefio de una muestra, Tres de estas pruebas son del tipo de la bondad del ajuste y la cuarta es de la aleatoriedad de la serie de eventos en una muestra, Este estudio, que compara y contrasta estas prucbas, puede ayudar a escoger la prueba mejor para los datos de una investigacién. ‘Al probar una hipétesis acerca de si el origen de una muestra ¢s ‘una poblacién con distribucién especifica el investigador puede usar una ” EL CASO DE UNA Mut de las tres pruebas de la bondad una muestra o la de Kolmogorov-Smimov de una niimero de catego- .) el tamafio de la muestra, yd) La prueb: de Ia prueba estadistica. puede usarse cuando hay solamente dos catego- cuando el tamafio de la Cuando k = 2, cada E: deberd ser de 5 0 mayor. ‘més del veinte por ciento de las Bi deberd ser menor que 5 y ninguna de cllas debers ser menor que 1. Tanto la prueba binomial como la x* pueden usarse con mediciones cn escalas nominales 1 ordinales Las pruebas x son insensibles a les efectos del orden cuando gl > 1, y entonces x* puede no ser la mejor prueba al tomar en cuenta una hip6- tesis el orden, La prucba de Kolmogorov-Smimoy deberé usarse cuando se puede suponer que la variable bajo consideracién tiene una distribucién con- tinua, Sin embargo, sise usa al ser la distribucién de la poblacién Fo( X) discontinua, el error de la aseveracién resultante de probabilidad se dirige ala “seguridad” (Goodman, 1954). Es decir, si se usan las tablas que suponen que Fs() es continua para probar una hipbtesis acerca de una variable discontinua la prueba es conservadora: al rechazar Ho con esta prueba podemos confiar plenamente en esa decis Ya se ha mencionado que la prucba de Kolmogorov-Smimoy trata observaciones individuales separadamente y, asi, no pierde informacién a causa de agrupa variable conti muestra es pequefia y, por ti adyacentes, Ia prueba x* es def la de Kolmogorov-Smimov. Parece que en todos los casos donde es aplicable, i 1¢ que hemos visto ‘ibucién de D no se conoce en el caso de ciertos pardmetros de poblacién cuya estimacién se hace a partir de la muestra. Sin em- bargo, Massey (19514, pag. 73) ha comprobado que si en tales casos se aplica la prueba de Kolm imov (por ejemplo para probar Ia bondad del ajuste a una distribucién normal con media y desviacién estindar estimadas a partir de la mues 0 de la tabla E condue ciria a una prueba conservadora. Esto es, si el valor critico de D que aparece en Ja tabla E es excedido por el valor observado en estas cit aNAusts 8 ‘cunstancias, confiadamente podemes rechazar H» (que supone, por ejem- plo, una poblacién normal) y concluir con toda seguridad que hay una diferencia significativa. En los casos donde deban estimarse los paré- ‘metros de la muestra, puede modificarse facilmente la prueba x* redu- ciendo el niimero de grados de libertad. La prueba Kolmogorov-Smirov no tiene modificaciones conocidas seme} La prueba de rachas de una muestra se ‘ocurrencia temporal o sucesi principio general acerca de basado en las rachas ¢s significativo; en este caso la cuestion de cia tiene significado solamente en el contexto de un problema especifco,

You might also like