You are on page 1of 48
eee 144, 14.2, 14.3. 14.4, Introduccion a la estadistica no paramétrica Exes Contrastes de la bondad del juste: probabilidades especificadas Aproximacién normal del contraste Contrastes de la bondad del ajuste: ‘de Wilcoxon Parametros poblacionales desconocidos: Contraste de signos de una mediana Un contraste de la distribucién de Poisson poblacional Un contraste de la distribucién normal 14.5. Contrastes no paramétricos de muestras Tablas de contingencia aleatorias-independientes Contrastes no paramétricos de muestras Contraste U de Mann-Whitney pareadas o enlazadas Contraste de la suma de puestos Contraste de signos de muestras pareadas de Wilcoxon, © enlazadas 14.6. Correlacién de orden de Spearman Contraste de Wilcoxon basado en la 14.7, Un contraste no paramétrico de aleatoriedad ‘ordenacién de las diferencias en el caso Contraste de rachas: pequefias muestras de muestras pareadas 0 enlazadas Contraste de rachas: grandes muestras Introduccién cTienen los clientes una preferencia por una bebida refrescante, por un sabor de helado, por un ingrediente para hacer una pizza o incluso por un navegador por Internet o por una red social? {Se basan las preterencias de la gente por un determinado candidato politico en alguna caracteristica, como la edad, el sexo o el lugar de residencia? ¢Prefieren los estudiantes de una universidad a alguno de los tres profesores que ensefian la asignatura de introducci6n a la contabilidad? Basan- dose en una encuesta realizada a personas recién tituladas en la universidad, Les el sueldo media- no de partida signiticativamente diferente (o mayor que o menor que) de un determinado valor? iTiene un grupo de catadores una tendencia general a preferir una nueva salsa de pizza trente a la salsa de pizza original? Estos no son més que algunos de los tipos de cuestiones que abordamos en este capitulo. Introducimos los contrastes no paramétricos, que suelen ser el método adecuado para extraer conclusiones estadisticas sobre datos cualitativos (nominales u ordinales) o sobre datos numéricos cuando no se puede postular el supuesto de la normalidad de la distribucién de probabilidad de la poblacién. Este tipo de datos procede a menudo de numerosas fuentes, entre las que se encuen- tran los estudios de mercado, las encuestas a empresas y los cuestionarios. __ Aproximacién normal del contraste da signos 642 Estadistica para administracion y economia En primer lugar, analizamos algunos contrastes que se basan en la distribucién j-cuadrado, co- ‘mo un contraste de la hipdtesis de que los datos son generados por una distribucion de probabilidad otalmente especificada. Los analistas de mercado utlizan a menudo esta técnica para averiguar si os productos son preferidos por igual por los posibies clientes 0 para averiguar si las cuotas de mercado de diversas marcas de un producto han cambiado en un determinado periodo de tiempo. ‘A continuacién, contrastamos Ia hip6tesis de que los datos son generados por alguna distribu- ci6n, como la binomial, la distribucién de Poisson o la normal, sin suponer que se conocen los paré- metros de esa distribucion. En estas circunstancias, se pueden utilizar los datos de los que se dis pone para estimar los pardmetros poblacionales desconocidos. Cuando se estiman parametros poblacionales, se utliza un contraste de la bondad del ajuste. El contraste de la ji-cuadrado puede ‘extenderse para abordar un problema en el que se toma una muestra de la poblacién y cada uno de ‘sus miembros puede ciasificarse de manera inequivoca de acuerdo con un par de caracteristicas, La hipétesis que se contrasta es que no existe ninguna relacién en la poblacién entre las posesio- nes de estas caracteristicas. Los profesionales del marketing utiizan este método frecuentemente Para las tablas de contingencia mayores, es comodo utilizar un programa informatico para calcular @l estadistico del contraste y el p-valor. A continuacion, analizamos altemativas no paramétricas a algunos métodos introducidos antes en el libro. No es nuestra intencién aqui intentar describir toda la amplia variedad de métodos no Paramétricos que existen. Nuestro objetivo es mas modesto: que el lector conozca algunos méto- dos no paramétricos, entre los que se encuentran el contraste de signos, el contraste de Wilcoxon basado en la ordenacion de las diferencias, el contraste U de Mann-Whitney, el contraste de la su- ma de puestos de Wilcoxon y el contraste de correlacién de orden de Spearman. Concluimos esta introduccién a la estadistica no paramétrica con un andlisis del contraste de rachas aplicado a datos de series temporales con una muestra de pequefio tamafio y a datos de series temporales con una muestra de gran tamafio. 141. Contrastes de la bondad del ajuste: probabilidades especificadas Tustramos el contraste mas sencillo de este tipo con un estudio en el que se observé una muestra aleatoria de 300 sujetos que compraban una bebida refrescante. De estos sujetos, 75 seleccionaron la marca A, 110 seleccionaron la marca B y el resto selecciond la marca C. Esta informacién se muestra en la Tabla 14.1 Tabla 14.1. Seleccién de una marca, Categoria (marca) A B Cc Total Niimero de sujetos 75 1101S 300 En términos mas generales, consideremos una muestra aleatoria de n observaciones que pueden clasif- arse en K categorias. Si el niimero de observaciones que hay en cada categoria es O,, 03, ... Ox, la clasi s la que muestra la Tabla 14.2 Tabla 14.2. Clasificacién de n observaciones en K categortas. Categoria 1 2 - K ‘Total Numero de observaciones Of ee On on Los datos muestrales se utilizan para contrastar una hipdtesis nula que especifica las probabilidades de que una observacidin pertenezca a cada una de las categorfas. En el ejemplo de los 300 sujetos que compran Introduccion a la estadisitca no paramétrica_ 643. una bebida refrescante, la hipétesis nula (Hg) podrfa ser que un sujeto clegido aleatoriamente tiene las mis- ‘mas probabilidades de scleccionar cualquiera de las tres variedades. Esta hipétesis nula especifica, pues, {que la probabilidad de que una observacién muestral pertenezca a una de las tres categorias es de un tercio. Para contrastar esta hipdtesis, es légico comparar el ntimero muestral observado con el que se esperaria si la hipdtesis nula fuera verdadera, Dado un total de 300 observaciones muestrales, el niimero esperado de sujetos en cada categoria si se cumple la hipdtesis nula seria (300)(1/3) = 100, La Tabla 14.3 resume esta informacién, Tabla 14.3, Numero observado y esperaio de compras de tres marcas de bebidas refrescantes, Categoria (marca) ABC ‘Total ‘Niimero observado de sujetos 95 (aHAtO Hitt INS 11111900 Probabilidad (segtin Ho) 1 18) 8 1 Niimero esperado de sujetos (segiin Ho) 100 100-100-300 En el caso general en el que hay K categorias, supongamos que la hipstesis nula especifica las probabi- lidades P,P, .. , Py de que una observacién pertenezca a las categorfas. Supongamos que estas posibilida- des son mutuamente excluyentes y colectivamente exhaustivas, es decir, cada observacién muestral debe pertenecer a una de las categorfas y no puede pertenecer a més de una. En este caso, las probabilidades supuestas dehen sumar 1; es decir, Pit Pte + Pp = Entonces, si hay m observaciones muestrales, el mimero esperado en cada categoria, si se cumple la hipstesis nula, es nP, parai = 1, 2.4K ‘como se muestra en la Tabla 14.4. Tabla 14.4, Niimero observado y esperado en el caso de observaciones y K categorias. Categoria 1 2 K Total ‘Numero observado Probabilidad (segtin Ho) Numero esperado de sujetos (segdin Hy) Pe La hipstesis nula sobre la poblacién especifica las probabilidades de que una observacién muestral per tenezea a cada categoria. Las observaciones muestrales se utilizan para contrastar esta hipstesis. Si la hip6- tesis nula fuera verdadera, pensarfamos que los valores de os datos observados en cada categoria son muy parecidos a los esperados. En esas circunstancias, los datos constituyen un buen ajuste de la distribucién de probabilidad que hemos supuesto que sigue la poblacién. Los contrastes de 1a hipstesis nula se basan en tuna valoracién del grado de ajuste y generalmente se conocen con el nombre de contrastes de la bondad del ajuste. Ahora bien, para contrastar la hipdtesis nula, es légico examinar las magnitudes de las discrepancias entre lo que se observa y lo que se espera, Cuanto mayores son estas discrepancias en valor absoluto, mas sospechamos de la hipdtesis nula. La variable aleatoria de la Ecuacién 14.2 se conoce con el nombre de Variable aleatoria ji-cuadrado. 644 —_Estadistica para administracion y economia Variable aleatoria jl-cuadrado ‘Se selecciona una muestra aleatoria de n observaciones, cada una de las cuales puede clasificarse_ exactamente en una de K categorias. Supongamos que ei numero observado en cada categoria es 0). yy» Ox. Si una hipstesis nula (Hg) especitfica las probabilidades P,, ?,, .... Px de que una observacion Periibain a cada una do setae céhagoria, ls nimoros ebperadie en iss calepories, teat) = yy la variable aleatoria 7%, sigue una distribucién j-cuadrado con K — 1 grados de libertad. Para ilustrar este contraste, consideremos de nuevo los datos de la Tabla 14.3 sobre la selecciéin de una marca. La hiptesis nula es que las probabilidades de las tres categorfas son las mismas. El contraste de esta hipotesis se basa en (75 — 100)", (110 = 100)" | (115 ~ 100) 100 100 100 Hay tres categorfas (K = 3), por lo que los grados de libertad de la distribucién ji-cuadrado son K ~ 1 En la Tabla 7 del apéndice vemos que oo: = 9.210 Por tanto, segiin nuestra regla de decisién, 1a hipstesis nula se rechaza al nivel de significacién del | %. Estos datos contienen una prucba contundente en contra de la hipstesis de que un sujeto elegido aleatoria- mente tiene las mismas probabilidades de seleccionar cualquiera de las tres marcas de bebidas refrescantes. Introduccion a la estadistica no paramétrica 648 aTienen los clientes preferencia por alguna de las cuatro chocolatinas Hershey? (ji-cuadrado) ‘Supongamos que la Hershey Company quiere averiguar si los clientes tienen preferencia por alguna de las cuatro chocolatinas siguientes: A, Mr. Goodbar; B, Hershey's Milk Chocolate; C, Hershey's Special Dark Mildly Sweet Chocolate; 0 D, Krackel. En una muestra aleatoria de 200 personas, se ‘observ6 que 43 preferfan Mr. Goodbar; 53 preferfan Hershey's Milk Chocolate; 60 preferfan Hers- hey’s Special Dark Mildly Sweet Chocolate y el resto preferfa Krackel. Contraste la hipétesis nula de que los clientes no tienen preferencia por ninguna de las cuatro chocolatinas frente a la hipstesis altemativa de que tienen preferencia al menos por una de ellas. Solucién. La hipétesis nula establece que los clientes no tienen preferencia por ninguna de las cuatro chocolatinas (A, B, C y D). Es decir, se prefieren las cuatro por igual: Hg: Py = Py = Po = Py = 0,25 Dado que la hipstesis nula establece que cada chocolatina es preferida por el 25 % de los clientes, se deduce que cada uno de los valores esperados seri 50: E, = nP, = 200(0,25) = 50 En la Tabla 14.5, se calcula el estadfstico de contraste ji-cuadrado. Tabla 14.5, ;Tienen los clientes preferencia por alguna de las cuatro chocolatinas Hershey? Tipo de chocolatina oF O,- EY 0, BYE, ‘A. Mr. Goodbar 4350 7 49 49/50 = 0,98 B. Hershey's Milk Chocolate 5350 3 9 9/50 C. Hershey's Special Dark 60 50 10 100 100/50 = 2,00 D. Krackel 4450 -6 36 36/50 = 0,72 El estadistico de contraste ji-cuadrado es 7? = E{(O, ~ £,°/E)] = 3,88. Vemos en la Tabla 7 det apéndice con gl = K ~ 1 = 3 que el estadistico de contraste se encuentra entre 0,584 y 6,251; por tanto, 0,10 < p-valor < 0,90. No rechazamos 1a hipétesis nula y concluimos que los datos no son cestadisticamente significativos para extraer la conclusién de que ios clientes tienen preferencia al me- 1nos por una de estas chocolatinas. Debemos tener cuidado de no concluir que tienen ta misma prefe- rencia por las cuatro chocolatinas; solo podemos decir que los datos no apoyan una preferencia. tra cuestién de marketing que Hershey podria abordar es si han cambiado las preferencias de los clien- tes con respecto a las preferencias histéricamente conocidas. Han cambiado las preferencias de los clientes? (ji-cuadrado) La Hershey Company sabe, por los datos hist6ricos, como los registros de ventas, que el 30 % de sus clientes prefiere Mr. Goodbar, e! 50 % prefiere Hershey's Milk Chocolate, el 15 % prefiere Hershey's Special Dark Mildly Sweet Chocolate y ¢l resto prefiere Krackel. Suponga que los analistas de mar- keting seleccionan una muestra de 200 personas y observan que 50 prefieren Mr. Goodbar, 93 prefie- 646 —_Estadistica para administracion y economia ren Hershey's Milk Chocolate, 45 prefieren Hershey's Special Dark Mildly Sweet Chocolate y el resto prefiere Krackel, ; an cambiado las preferencias actuales por estos productos con respecto a las preferencias conocidas? Solucién. La hipstesis nula es que las preferencias actuales de los clientes siguen la misma pauta. Es decir, no son diferentes de las que conocfa la Hershey Company: Ho: P, = 0,30; Py = El miimero esperado de clientes que prefieren Mr. Goodbar es: E, = nP, = 200(0,30) = 60 El ndmero esperado de clientes que prefieren cada una de las dems chocolatinas se calcula de mane- +a parecida y el estadstico de contraste (Tabla 14.6) es: er) 50; Pe = 0,15; Py = 0,05 < (0.- E) _ Ti ‘A. Mr. Goodbar 3060 10 100100160 = 1,67 B. Hershey's Milk Chocolate 93100 -7 49 49/100 = 0,49 C. Hershey's Special Dark 45 30 Is 225 225/30 = 7,50 D. Krackel 2 10 2 4 4/10 = 0,40 x2 = 10.06 ‘Vemos en la Tabla 7 del apéndice con gl = K — 1 = 3 que el estadistico de contraste se encuen- {ra entre 9,348 y 11.345; por tanto, 0,01 < p-valor < 0,025, Rechazamos la hipdtesis nula y concluimos que los datos aportan considerables pruebas que su- gieren que las preferencias actuales de los clientes son diferentes de la pauta dada de preferencias. ‘Los analistas de mercado ahora podrfan analizar las diferencias especificas y recomendar unas estra- tegias de marketing adecuadas. ‘Compahia de gas (ji-cuadrado) Una compaiia de gas, basdindose en la experiencia, ha llegado a la conclusién de que al final det invierno ha cobrado fntegramente el 80 % de sus facturas, cobrard el 10 % un mes més tarde, el 6 % dos meses més tarde y el 4 % més de dos meses més tarde. Al final de este invierno, la compaiifa ha comprobado una muestra aleatoria de 400 facturas y ha observado que ha cobrado 287 integramente, {que cobraré 49 dentro de un mes, 30 dentro de dos meses y 34 dentro de més de dos meses. ,Sugicren estos datos que este invierno no est siguiéndose la pauta de afios anteriores? Solucién. Seguin la hipdtesis nula de que las proporciones del presente invierno siguen la pauta histérica, las respectivas probabilidades de las cuatro categorias son 0,80, 0,10, 0,06 y 0,04, Seguin la |hipstesis, los ntimeros esperados de factyras de cada categoria, en una muestra aleatoria de 400 factu- ras, serfan -400(0,80) = 320; 400(0,10) = 40; -400(0,06) = 24; 400(0,04) = 16 Introduccion a la estadistica no parametriea Los nuimeros observado y esperado son ‘Niimero de meses 0 1 2 ‘Mis de 2 Total Niimero observado 28749 30 34 400 Probabilidad (segiin Hg) 080 0,10 0.06 0,04 1 Niimero esperado (segtin Ho) 320-40 24 16 400 El contraste de 1a hiptesis nula (H,) se basa en & (O,— EP _ (287 - 3207 | (49-40)? G0 - 24)? | G4 - 16)? eS Ee » G De i Bi eke 320 40 4 16 3 grados de libertad, En la Tabla 7 del apéndi = 27,178 Aqut hay K = 4 categorfas, por lo que hay K ~ vemos que Boro = 16,266 Dado que 27,178 es mucho mayor que 16,266, la hipétesis nula se rechaza claramente, incluso al nivel de significacién del 0,1 %. Estos datos constituyen, desde luego, una prucha considerable para sospechar que la pauta de cobro de las facturas del gas de este afio es diferente de la histérica. El ‘examen de los ntimeros de la tabla muestra que este aio hay més facturas que se cobrarén més tarde ‘que en afios anteriores, Conviene hacer una advertencia. Los valores utilizados para calcular el estadistico del contraste en la Ecuacién 14.2 deben ser el niimero observado y el ntimero esperado en cada categorfa. No es correcto, por ejemplo, utilizar los porcentajes de miembros muestrales que hay en cada categoria. Ejercicios Ejercicios aplicados Ma. . En 2008, se Se pidié a una muestra aleatoria de 150 residentes de ‘una comunidad que indicaran su primera preferencia por tna de las tres cadenas de televisin que dan las noticias de la noche. Los resultados oblenidos se muestran en la tabla adjunta. Contraste la hipStesis nula de que las pri- rmeras preferencias de esta poblacién estén distribuidas por igual entre las tes cadenas. Cadena AB Namero de primeras diferencias 474261 76 una encuesta para averiguar cusles eran los deportes acudticos favoritos en Australia y se lbservs que e 45 % de los encuestados vots por el sur- fing, e! 40 % votS por el submarinismo y el resto vots por otros deportes acusticos. En 2001, se realiz6 una en- ccuesta parecida; de una muestra de 200 encuestados, 102 ddeclararon que preferian e! surfing; 82 eligieron el sub- rmarinismo y los 16 restantes seleecionaron otros depor- 143. tes acusticos. {Es posible concluir al nivel del 5% que ‘en 2011 estas preferencias segufan siendo las mismas’ En una encuesta en linea realizada por un periédico de Hong Kong, e1 45 % de Ia gente declaré que va al gim- nasio una ver a la semana, el 25 % declaré que va dos veces, el 10 % declaré que va tres veces y el resto decla- 16 que no va, Se recogieron datos por medio de entrevis- tas telef6nicas a 650 personas; 230 respondieron que no ‘van al gimnasio, 150 respondieron que van una vez a la ‘semana, 200 respondieron que van dos veces a la sema- na y el resto respondié que va tres veces a la semana, fa. {Se puede considerar que es un experimento multino- ‘mial? {Qué caracterfsticas debe tener para que se cconsidere como tal? > {Utilizarfa un contraste de bondad del ajuste? ;Por qué? €. (Qué conclusiones extraerfa? ;Coinciden los resulta- dos de la encuesta en linea con las entrevistas telefS- 4. En caso contrario, ;podefa sugerir alguna razén por la que son diferentes? eas 144, 145. 146, 147. Estadistica para administracion y economia Los datos de produccién indican que en la actividad normal, el 93 % de los componentes electrénicos que se producen no tiene ningiin defecto, el 5 % tiene un defecto y el 2 % tiene ms de un defecto. En una mues- tra aleatoria de 500 de los componentes producidos en ‘una semana, se observ6 que 458 no tenfan ningtin de fecto, 30 tenfan un defecto y 12 tenfan més de un de- fecto, Contraste al nivel del 5 % Ia hipétesis nula de que ta calidad de la produccién de esta semana es con- forme a la pauta habitual Una institucién benéfica solicita donaciones por teléfo- no, Se ha observado que el 60 % de todas las personas ccontactadas por teléfono se niega a hacer una donacisn: 1 30 % pide mas informacién por correo con la prome- ‘sade que considerar4 al menos la posibilidad de donar; y el 10 % hace inmediatamemte una donacién por me- io de una tarjeta de crédito. En una muestra aleatoria de 100 llamadas realizadas esta semana, 65 personas se nnegaron a donar, 31 solicitaron més informacién por correo y cuatro hicieron inmediatamente una donacién por medio de una tarjeta de crédito. Contraste al nivel ‘del 10% la ipdtesis nula de que la pauta de resultados de esta semana es similar ala pauta habitual El gerente de una universidad ha observado que el (60 % de todos Jos estudiantes considera que los cursos son muy utiles, el 20 % considera que son algo tiles y el 20 % considera que son indties. En una muestra aleatoria de 100 estudiantes que asisten a los cursos de ‘administracién de empresas, 68 piensan que el curso en ‘cuestign es muy atl, 18 piensan que es algo Gtil y 14) {que es indtil. Contraste la hip6tesis mula de que la dis- tribucién poblacional de los cursos de administracién de empresas es igual que la de todos los cursos, En un supermercado se venden varios tipos de yogur. El duefio del supermercado sabe, por un estudio ante- rior sobre los sabores elegidos por los clientes, que el 20 % pidid el sabor A. el 35 % pidi6 el sabor B, el 18 % pidi el sabor C, cl 12 % pidié el sabor D y cl resto pidié el sabor E. Ahora el dueiio, que piensa que 148, 149. 14.10, las preferencias de los clientes han cambiado, toma una ‘muestra aleatoria de 80 clientes y observa que 12 pre fieren el A, 16 prefieren el B, 30 prefieren el C, 7 pre- fleren el E y el resto prefiere el D. Averigie si las pre- ferencias de los clientes han cambiado desde el estudio anterior, En una encuesta de mercado reciente, se dieron a pro bar cinco bebidas refrescantes para averiguar si ls Clientes preferian alguna de ellas. Se pidic cada per- sona que indicara cusl era su bebida favorita. Los resul- tados fueron los siguientes: bebida A, 20; bebida B, 25; bebida C, 28; bebida D, 15; y bebida E, 27. ;Existe una preferencia por alguna de estas bebidas refrescantes? Un equipo de estudiantes de marketing debia averiguar qué pizza gustaba més a los estudiantes matriculados fen su universidad. Hace dos aflos, se hizo un estudio parecido y se abscrvs que el 40 % de todos los estu- diantes de esta universidad preferfa la pizza de Bellini, cel 25 % preferta la pizza de Anthony, el 20 % preferfa la pizza de Ferrara y el resto la pizza de Marie. Para ver si han cambiado las preferencias, se seleccionaron alea- toriamente 180 estudiantes y se les pidié que indicaran sus preferencias respecto a las pizzas. Los resultados fueron los siguientes: 40 seleccionaron la pizza de Fe- ‘ara, 32 seleccionaron la de Marie, 80 seleccionaron la de Bellini y el resto seleccions la de Anthony. ;Indican los datos que las preferencias han cambiado desde el estudio anterior? ‘Se ha pedido a una muestra aleatoria de profesores de estadistica que contesten a una encuesta que contiene preguntas sobre el contenido del plan de estudios, la in- {egracién del uso de ordenadores y las preferencias por los programas informéticos. De tas 250 respuestas, 100 profesores han indicado que prefieren el paquete esta- distico M y 80 el programa informético E, mientras que cl resto estd repartido por igual entre el programa infor- tico $ y el P. ;Indican los datos que los profesores Prefieren alguno de estos programas informticos? 14.2. Contrastes de la bondad del ajuste: parametros poblacionales desconocidos En el Apartado 14.1, la hip6tesis se referia a datos generados por una distribucién de probabilidad rotal- ‘mente especificada. En este contraste, la hipétesis nula especifica la probabilidad de que una observacién muestral pertenezca a cualquiera de las categorfas. Sin embargo, a menudo hay que contrastar la hipstesis de que los datos son generados por alguna distribucién, como la binomial, la distribucién de Poisson o la normal, sin suponer que se conocen los pardmetros de esa distribuciGn. En estas circunstancias, no puede aplicarse el Apartado 14.1, pero pueden utilizarse los datos de los que se dispone para estimar los pardme- {ros poblacionales desconocidos. A continuacién, formulamos el contraste de la bondad del ajuste que se utiliza cuando se estiman pardmetros poblacionales. Introduccion a la estadistica no paramétrica 649. Contrastes de la bondad del ajuste cuando se estiman parémetros poblacional ‘Supongamos que una hipdtesis nula especifica as probabilidades de diferentes categorias que depen- den de la estimacion (a partir de los datos) de m parémetros poblacionales desconocidos. El contraste do la bondad det ajuste cuando se estiman parémetros poblacionales es precisamente el del Apartado 14.1, Con la salvaded de que el ndmero de grados de lbertad dela variable aleatoaj-cua- rado es ‘grados de libertad = (K ~ m ~ 1) 43) ‘donde X es el niimero de Categorias y m es el nimero de pardmetros poblacionales desconocidos. Un contraste de Ia distribucion de Poisson Consideremos un contraste para averiguar si los datos son gencrados por la distribucién de Poisson. Un método para intentar resolver las cuestiones relacionadas con los conflictos sobre la autorfa de un texto es contar el ntimero de veces que aparecen determinadas palabras en distintos pérrafos del texto y compararlo ccon los resultados de pasajes cuyo autor se conoce; a menudo esta comparacién se puede realizar suponien- do que el niimero de veces que aparecen determinadas palabras sigue una distribucién de Poisson. Un ejemplo de este tipo de investigacién es el estudio de The Federalist Papers (Mosteller y Wallace, 1964) GEGEN Federalist Papers (ji-cuadrado) En una muestra de 262 parrafos (cada uno de los cuales tenfa alrededor de 200 palabras) de The Federalist Papers (Mosteller y Wallace, 1964), el némero medio de veces que aparecfa la palabra ‘may era de 0,66. La Tabla 14.7 muestra el numero de veces que aparece esta palabra en los 262 prrafos de la muestra. Contraste la hipétesis nula de que la distribucién poblacional de las veces que aparece es una distribucién de Poisson, sin suponer que se conoce previamente la media de esta dis- tribucién Tabla 14,7. Numero de veces que aparece la palabra «may» en 262 pérrafos de The Federalist Papers. I Sel cs es Se ei Niimero de apariciones 0 1 2 30 miés| Frecuencia observada, 156632914 Soluci6n. Recuérdese que si la distribuci6n de Poisson es adecuada, Ia probabilidad de x aparicio- nes es ere Pay = x donde A es el ntimero medio de apariciones. Aunque esta media poblacional es desconocida, se puede estimar por medio de la media muestral de 0,66. En ese caso, sustituyendo 4 por 0,66, es posible estimar la probabilidad de cualquier niimero de apariciones si se cumple la hip6tesis nula de que 1a distribucién poblacional es de Poisson. Por ejemplo, la probabilidad de dos apariciones es €9(0,66)? _ (0.5169)(0,66)" a 2 11126 PQ) 650 —_Estadistica para administracion y economia ‘También pueden hallarse las probabilidades de que la palabra no aparezca nunca y de que aparezea tuna ver, por lo que la probabilidad de que aparezca tres veces © més es ‘ P(X > 3) = 1 — PO) = PQ) ~ PR) Estas probabilidades se muestran en la segunda fila de la Tabla 14. Tabla 14.8. Frecuencia observada y esperada en The Federalist Papers. ‘Nimero de apariciones 0 1 2 3omés Total Frecuencias observadas 156 63 29 14 262 Probabilidades 0,5169 0.3411 0,126 00294 Frecuencias esperadas segin Hp 135.4 89.4 29.57.7262 Las frecuencias esperadas si se cumple hipétesis mula se obtienen entonces, exactamente igual ‘que antes, de la siguiente manera: Ey=nP, parai=1,2,..K ‘Asf, por ejemplo, la frecuencia esperada de dos apariciones de la palabra may en 262 pérrafos del texto es (262) (0,1126) = 29,5. Aunque la propia variable es un nimero entero, es mejor no redon- dear estos valores esperados a valores enteros. La fla inferior de la Tabla 14.8 muestra estas frecuen- cias esperadas. El estadistico del contraste es eae Mae Oh ws aT Dado que hay cuatro categorfas y se ha estimado un pardmeto, el némero aproximado de grados de libertad del contraste es 2. En la Tabla 7 del apéndice, vemos que 7.ooo1 = 13,816 Por tanto, la hip6tesis nula de que la distribucién poblacional es de Poisson puede rechazarse al nivel de significacién del 0,1 %. Los datos son una prueba tealmente contundente en contra de la hipétesis. Un contraste de la distribucién normal La distribuci6n normal desempefa un importante papel en estadistica y tanto la validez. como algunas pro- piedades de optimatidad de muchos métodos pricticos dependen del supuesto de que los datos muestrales siguen una distribucién normal. En el Capitulo 5, analizamos representaciones gréficas de probabilidades normales para buscar pruebas de la ausencia de normalidad. En el Capitulo 7 (Figuras 7.2 y 7.9), buscamos visualmente prucbas de la ausencia de normalidad averiguando si los puntos de los grificos de probabili- dad normal estaban «cerca» de la linea recta. A continuaciGn, examinamos un contraste del supuesto de la normalidad adaptando el método ji-cuadrado. Este contraste es {cil de realizar y es probablemente més poderoso, El contraste de normalidad de Jarque-Bera, que es una adaptaciGn del método ji-cuadrado, se basa en dos medidas descriptivas, e! sesgo (Ecuaci6n 14.5) y la curtosis (Ecuaci6n 14.6). Analizamos el sesgo tanto en el Capitulo 1 como en el apéndice del Capitulo 2. Se sabe que el sesgo, que es una medida de la simetria, es 0 en el caso de una distribucién normal. La curtosis es una medida del peso de las colas de Introduccion a la estadistica no paramétrica 651. una funcién de densidad. Se sabe que en el caso de la distribucién normal la curtosis poblacional es 3. Por tanto, el contraste Jarque-Bera de una distribucién normal se basa en la cercanfa del sesgo muestral a Oy en la cercanfa de Ia curtosis muestral a 3. El estadistico de contraste de Jarque-Bera se indica en la Eeuacién 14.4. Contraste de normalidad de Jarque-Bera ‘Supongamos que tenemos una muestra aleatoria x, x2, .. %» de n observaciones de una poblacién. E! ‘estadistico de contraste del contraste de normalidad de Jarque-Bera es. pf Seago), (urtosis ~ 3)° ieee ous donde utilizando informacién muestral, el sesgo de una poblacién se estima de la forma siguiente: La-a sesgo = Serra (4s) Ia curtosis se estima del modo siguiente: Lu a cunosis = 046) ‘So sabe qua cuando ol ntimero de observaciones muestrales es muy grande, este estadistico tiene, si '8@ cumple la hipdtesis nula de que la distribucién poblacional es normal, una distribucién jL-ouadrado con 2 grados de libertad. La hipétesis nula se rechaza, por supuesto, cuando los valores del estadistico, de contraste son altos. Desgraciadamente, la ji-cuadrado como aproximacién de la distribucién del estadistico del contraste de Jarque-Bera, JB, solo es buena cuando la muestra es de gran tamafo. La Tabla 14.9 (Bera y Jarque, 1981) muestra las diferentes relaciones entre los tamafios muestrales y los niveles de significacién del 5 y el 10 %. El método recomendado es calcular el estadistico, JB, en la Eeuaci6n 14.4 y rechazar la hipdtesis nula de ta normalidad si el estadistico es superior al valor correspondiente de la Tabla 14.9. Tabla 14.9, Puntos de significacién del estadistico de Jarque-Bera (Bera y Jarque, 1981). Tamaiio muestral Significacién Significacién Tamafio muestral_ Significacién Significacién n del 10% del 5 % a del 10% del % 20 213 3,26 200 3.48 443 30 2.49 371 250 3.54 431 40 2,70 3,99 300 3,68 4,60 50 2.90 4.26 400 76 474 8 3,09 427 500 4,82 100 34 429 800 5,46 125 331 434 w 5,99 150 3.43 4,39 Estadistica para administracion y economia Tasas diarias de rendimiento de las acciones (contraste de la distribucién normal) El fichero de datos Closing Stock Prices contiene los precios diarios de cierre de las acciones de una determinada empresa el aflo pasado, La muestra tiene n = 251 sesiones bursatiles. Calcule las tasas diarias de rendimiento y contraste la hipstesis nula de que la verdadera distribucién de estas tasas de rendimiento es normal. Soluci6n. Basindonos en el fichero de datos Closing Stock Prices, primero calculamos las tasas diarias de rendimiento, r,, de cada una de las n = 251 sesiones bursétiles de la manera siguiente: PrPaitd PB donde p, es el precio de cierre en la sesiGn i y d, es el dividendo pagado en la sesién i. El aflo pasado, no se pagé ningiin dividendo, Una vez calculadas las tasas diarias de rendimiento, se realizan los siguientes célculos intermedios: ri n (14.7) Pa © (n ~ 7 = 0,0835496 20, Y (i - FY = -0,002158324 Y (n — F)* = 0,000329593 Aplicando la Ecuacién 14.5, se calcula el sesgo: ae 0902158324 a ne 251(0,00000610951) ~~ '* y aplicando la Ecuaci6n 14.6, se obtiene la curtosis: sie I ae = 1000329593 sg oe a 251(0,000000111688) ~ "” A continuaci6n, obtenemos el estadistico de contraste de Jarque-Bera, JB: (=141? 8.76") _ a + SO | a ane La comparacién de este resultado con los puntos de significacién de la Tabla 14.9 da, desde lue- {80, razones para pensar que la distribucién poblacional no es normal ‘A menudo cuando se trabaja con datos reales, surgen algunas cuestiones sobre los puntos de datos inusuales, como el caso atfpico que se observa en el grafico de probabilidad normal de la Figura 14.1 ‘Qué podemos decir sobre ese punto? {Ocurri6 realmente o se debié a un error de registro? A excep- Ccidn de este caso atfpico, las demas tasas de rendimiento fluctian entre ~0,05 y +0,05. Sino hubie- ra ningiin error de registro, los analistas buscarfan circunstancias atenuantes circunstancias muy. excepcionales que pudieran llevar a esta tasa de rendimiento excepcionalmente baja. mzasi[ Introducet6n a la estadisttea no parametrica Dally Rates of Return "Normal Probabitty Pit 0 Percent od Beeggse se 8 on Mean 0,00007846 Sev 0.01828 N 25 AD 1.785, P-value «0,005, 0.18 010-005 0.00 0.05 Figura 14.1. Tasas diarias de rendimiento (grétfico de probabilidades). El sesgo y la curtosis se incluyen en la salida esténdar de la mayorfa de los paquetes estadisticos; sin embargo, es posible que se pueda utilizar una formula altemativa para calcular estas medidas descripti- vas, Hay otros contrastes no paramétricos de la normalidad, como el de Kolmogorov-Smirnov, el de An- derson-Darling, el de Ryan-Joiner, el de Shapiro-Wilk y el de Lilliefors que quedan fuera del alcance de este libro. Ejercicios Ejercicios aplicados 1411. Durante un petiodo de 100 semanas, se observ6 el ni- -mero semanal de averfas de una méquina y se anots en Iatabla adjunta, Se observé que el némero semanal me- dio de averfas fue de 2,1 en este periodo. Contraste la hipétesis nula de que la distribuciGn poblacional de las averias es de Poisson, Nimero de averias 0 1 2 3 4 Somés Niimero de semanas 10 24 32 23 6 5 14.12. En un periodo de 100 minutos, pass por el puesto de peaje de una autopista un total de 190 vehiculos, Lat ta- bla adjunta muestra la frecuencia de Hegadas por minu- tw en este petiodo, Contraste la hipdtesis nula de que la distribucin poblacional es de Poisson, ‘Niimero de Negadas fen minutos. o 12 2% 35 2S 3 domés Frecuencia observada 10) 14.13. 14nd. 14.16, En un estudio, se pidié a una muestra aleatoria de 50 estudiantes que estimaran Ia cantidad de dinero que ¢gastaban en libros de texto en un afi. Se observ que el sesgo muestral de estas cantidades era 0,83 y la curtosis| ‘muestra era 3,98, Contraste al nivel del 10 % la hipéte- sis nula de que la distribucién poblacional de las canti- dades gastadas es normal Se tomé una muestra aleatoria de 100 mediciones de la resistencia de los componentes electrnicos producidos cen una semana. El sesgo muestra era 0,63 y la curtosis ‘muesteal era 3,85. Contraste la hipdtesis nula de que la distribucién poblacional es normal . Seleccione acciones de una empresa como Apple, Dell © Microsoft y utilice ef contraste de Jarque-Bera para averiguar si las tasas diarias anuales de rendimiento de un determinado ato siguen una distribuci6n normal ‘Una muestra aleatoria de 125 saldos de titulares de una tarjeta de crédito indica que el sesgo muestral es 0,55 y la curtosis muestral es 2,77, Contraste la hipdtesis nula de que Ia distribucién poblacional es normal. 654 —Estadistica para administracion y economia 14.3. Tablas de contingencia Supongamos que se toma una muestra de una poblacién, cuyos miembros pueden clasificarse de forma inequivoca de acuerdo con un par de caracterfsticas, A y B. Debe contrastarse la hipstesis de que no existe ninguna asociacién o dependencia en la poblacién entre la posesidn de la caracterfstica A y la de la caracie~ ristica B. Por ejemplo, una agencia de viajes puede querer saber si hay alguna relacién entre el sexo de los clientes y el método empleado para hacer una reserva de avin. Una empresa de auditoria puede querer ‘examinar la relacidn entre la edad de las personas y cl tipo de declaracién de la renta que hacen. O en un estudio médico, una compaffa farmacéutica puede querer saber si cl éxito de un medicamento utilizado para controlar el colesterol depende de! peso de la persona. Una empresa de estudios de mercado puede averiguar si la eleccién de los cereales por parte de un cliente depende de alguna manera del color de la caja de cereales. Quiz4 existe una asociacién entre la afiliaciGn politica y el apoyo a una enmienda que se vva_a someter a votacidn en las préximas elecciones, Supongamos que hay r categorfas en A y c categorfas en B, por lo que es posible hacer un total de re ccruces de categorias. El niimero de observaciones muestrales que pertenecen tanto a la i-6sima categorfa de A como a la j-ésima categorfa de B se representa por medio de O,, donde i = 1, 2, a FJ = 1s 2s am & La Tabla 14.10 se llama tabla de contingencia r x c. Por comodidad, hemos afadido en la Tabla 14.10 Jos totales de las filas y de las columnas y los representamos, respectivamente, por medio de Ry, Ray. Ry VO, Cy oe Ce Tabla 14.10. Clasificacién cruzada de n observaciones en una tabla de contingencia rx c. Caracteristica B Caracteristica A. 1 2 c Total ! Oy On OR 2 On On 0, Re r Or On OR, Total GG Gin Para contrastar la hipétesis nula de que no existe ninguna asociacién entre las caracterfsticas A y B, Preguntamos cudntas observaciones esperariamos encontrar en cada cruce de categorias si esa hipstesis fuera verdadera, Esta pregunta tiene sentido cuando los totales de las filas y de las columnas son fijos. Consideremos a clasificaci6n conjumta correspondiente a la i-ésima fila y la j-6sima columna de la tabla. Hay un total de C; observaciones en la j-ésima columna y, suponiendo que no existe ninguna asociacién, seria de esperar que cada uno de estos totales de las columnas estuviera distribuido entre las filas en propor- cién al nimero total de observaciones de cada i-¢sima fila. Por tanto, seria de esperar que una proporcién R,/de estas C; observaciones estuviera en la i-ésima fila. Por consiguiente, el nlimero esperado estimado jones en cada una de las categorias del cruce es AG 4 para i= 1,2, f= 162s donde R, y C, son los totales de las filas y de las columnas Nuestro contraste de la hipotesis nula de que no existe ninguna asociacién se basa en las magnitudes de las diferencias entre los niimeros observados y los que serfan de esperar si esa hipstesis fuera verdadera. La variable aleatoria de la Ecuacién 14.8 es una versién generalizada de la que hemos introducido en el Apar- tado 14.1 Introduccion a la estadistica no paramétrica 688. Variable aleatoria ji-cuadrado en el caso de tablas de contingencia Puede demostrarse que si se cumple la hipdtesis nula, la variable aleatoria relacionada con (ass) se aproxima bastante a una distribucién ji-cuadrado con (r ~ 1)(c = 1) grados de libertad. La aproxima- ‘ci6n funciona bien si no mas del 20 % de los nimeros esperados estimados £, es de menos de 5. ‘A veces puleden agregarse clases contiguas para satisfacer este supuesto. El doble sumatorio de 1a EcuaciGn 14.8 implica que el sumatorio abarea todas las re casillas de la tabla. Es evidente que la hipétesis nula de la ausencia de una asociaci6n se rechazard en el caso de que las diferencias absolutas entre los ntimeros observados y los esperados sean grandes, es decir, en el caso de que los valores del estadfstico de in 14.8 sean altos, A continuacién, se resume el método de contraste, Un contraste de asociacién en las tablas de contingencia ‘Supongamos que se clasifica una muestra de n observaciones segiin dos caracteristicas en una tabla de contingencia r x c. Sea 0, el nimero de observaciones que hay en la casilla que est en la i-ésima fila y la j-ésima columna. Si la hipétesis nula es H,: No existe ninguna asociacién entre las dos caracte- isticas en la poblacién, el numero esperado estimado de observaciones en cada casilla, si se cumple Ho, es a8 aus donde R, y C, son los totales de las filas y de las columnas. Un contraste de asociacién a un nivel de ‘significacién x se basa en la siguiente regia de decision: Lae ae as yee > tiem mne D2 mim &, Diferenciacion de mercado (contraste de asociacién) ‘Cuando los vendedores colocan productos 0 establecen nuevas marcas, aspiran a diferenciar su pro- ducto de la competencia. Para investigar la percepciGn del consumidor, a menudo se utilizan asocia- ciones esponténeas. Eso significa que se expone a los consumidores a diferentes productos y se les Pregunta en qué piensan cuando ven su producto u oyen hablar de él. Supongamos, por ejemplo, que se realiz6 un estudio para averiguar si cuando ven un determinado tipo de automévil —BMW, Mer- codes 0 Lexus— u oyen hablar de é1 piensan en «seguridad» 0 en «deportivor. Las asociaciones y los productos se pueden organizar en una tabla de clasificaci6n cruzada, como la Tabla 14.11. El némero de una casilla es, pues, igual a la frecuencia con que aparece una determinada combinacién (por ejemplo, 256 personas asociaron BMW con deportivo). Utilice un contraste ji-cuadrado para averi- ‘guar si los productos mencionados son diferentes en lo que se refiere a sus asociaciones y, por tanto, se consideran distintos (que es lo mas probable que desee el vendedor). Estadistica para administracion y economia Tabla 14.11. Automéviles segtin la percepcién de los consumidores. ‘Automévil| Deportivo Seguridad Total BMW 256 4 330 Mereedes 4 42 83 Lexus 66 34 100 Total 363 150 S13 Soluci6n. La hipstesis mula que hay que contrastar implica que en 1a poblacién los tres tipos de automéviles se consideran similares; es decir, no hay ninguna asociacién entre el tipo de automévil y la impresién que tienen los clientes de que el automévil se conoce por ser un deportivo 0 por su seguridad. Para contrastar la hipStesis nula de que no hay ninguna asociacién, preguntamos de nuevo ‘cudntas observaciones esperariamos encontrar en cada clasificacién cruzada si esa hipdtesis fuera verdadera. Por ejemplo, si no hubiera ninguna asociacién entre estas caracteristicas, ¢! ntimero esperado de clientes que ven en un BMW un deportivo serfa cl siguiente: - 330)(363) _ ee eae Los otros niimeros esperados se calculan de la misma manera y se muestran en la Tabla 14.12, junto ‘con los mimetos observados correspondientes. 23,5 Tabla 14.12, Numero observado (y esperado) de clientes en cada clasificaci6n cruzada. ‘Automévil Deportivo Seguridad Total BMW 256 (233,5) 74(965) 330 Mercedes 41 (58,7) 42(24,3) 83 Lexus 66 (70,8) 3429.2) 100 El contraste de la hipstesis nula de que no existe ninguna asociacién se basa en las magnitudes de las discrepancias entre los niimeros observados y los que serfan de esperar si esa hipstesis fuera ver- dadera. Extendiendo la Ecuacién 14.2 para incluir cada una de las seis clasificaciones cruzadas se ‘obtiene el siguiente valor del estadistico de contraste ji-cuadrado: a 2 = 96,5) = 58,72 42-243)? = 256 = 233.5)" 14 = 96,5)", 1 — 58,7)? | 42 ~ 24,3) re 2355 965 38,7 243 (66 = 70,87 | 34 = 29.27 _ 708 29.2 oe Los grados de libertad son (7 ~ 1 ~ 1). Aquf hay r = 3 filas yc = 2 columnas en la tabla, por lo que el niimero adecuado de grados de libertad es: (= Ne 1) =B=NA-N +2 Introduccion a la estadistica no paramétrica 687 Vemox en la Tabla 7 del apéndice que 13,816 2 Boo Por tanto, se rechaza muy claramente la hip6tesis nula de que no existe ninguna asociacién, ni siquie- ra al nivel del 0,1 %. Las pruebas en contra de esta hipstesis son abrumadoras. Debe seftalarse, al igual que en el caso de los contrastes de la bondad del ajuste de los apartados anterio- res, que las cifras utilizadas para calcular el estadistico deben ser los niimeros efectivos observados y no, por ejemplo, porcentajes del total, Ley Sarbanes-Oxley de 2002 (contraste de asociacién) Los organismos reguladores y el Congreso de Estados Unidos estén reconociendo tanto los valores como las nuevas cuestiones que plantea a las pequeflas empresas la aplicacién de la ley Sarbanes- Oxley de 2002 (SOX). E1 23 de abril de 2006, el Advisory Committee on Smaller Public Companies entreg6 un informe final a 1a Security and Exchange Commission en el que evaluaba el efecto produ- ‘cido por Ia ley Sarbanes-Oxley de 2002 en las empresas mis pequefias que cotizan en bolsa (Final Report of the Advisory Committee on Smaller Public Companies to the U.S. Securities and Exchange Commission, 23 de abril de 2006). En el Ejercicio 1.54, presentamos un estudio que se realizé con tuna muestra aleatoria de directores generales, directores de finanzas y consejeros de empresas desde Ja aplicacién de la ley Sarbanes-Oxley de 2002 (Michelson, Stryker y Thorne, 2009), Basindose en los datos que contiene la Tabla 14.13, {hay una asociacién entre la opinién de la empresa sobre el efecto total de la aplicacién de la ley Sarbanes-Oxley y el tamafio de la empresa? Tabla 14.13. Efecto total de la aplicacién de la ley Sarbanes-Oxley y tamaiio de la empresa. Pequefias Medianas Grandes pee empresas empesas empresas Efecto pequefio 0 nulo 17 3 6 Efecto entre moderado y muy grande 13 4 2 Solucién, En este estudio, e! tamafio de la empresa se midi6 por medio de los ingresos anuales, no por medio del nimero de empleados 0 de algtin otro factor. Las pequeflas empresas son aquellas Ccuyos ingresos anuales no superan los 250 millones de d6lares; las grandes empresas son aquellas ‘cuyos ingresos anuales superan los 750 millones de détares. Calculamos cada uno del niimero espera- do de empresas de cada casilla de 1a forma siguiente: 16130) 12 Eu= = 9,64 ¥ aplicamos la Ecuacién 14.8 para obtener un estadfstico de contraste de 11,358. Con 2 grados de libertad y 72,00: = 9,210 (Tabla 7 del apéndice), concluimos que el p-valor < 0,01 y que los datos, son estadisticamente significativos para creer que hay una asociacidn entre la opiniGn sobre el efecto total de Ia ley Sarbanes-Oxley de 2002 y el tamafio de la empresa, Vemos en la Figura 14.2 (obtenida utilizando SPSS) la misma conclusién con un p-valor = 0,003. 658 Estadistica para administracion y economia amano Total Efecto total de SOX Pequefia | Mediana | Grande Efecto pequenoonulo —-Recuento 7 13 6 Frecuencia esperads | 9.6 14 9.0 360 Efecto grande ——-Recuento 13 a 2 78 Frecuencia esporada | 20.4 366 190 760 Total Recuento 30 28 54 12 Contrastes j-cuadrado Sig. asintotes Valor gt | (later Jrevadrads de Pearson | 44,358) | 2 0,003 Razin de verosimiitud | 10,900 2 0.008 ‘Asociacion Inga! 7.907 1 0,005 Per lineal Ne casos vidos 412 {2.0 casi (0,0 %) tienen une frecuencia esperada de mens de 5. Le frecuencia esperada minima 6s 9,00. Figura 14.2. Efecto total de la ley Sarbanes-Oxley de 2002 segun el tamafio de la empresa (SPSS). ‘Aunque el uso del contraste ji-cuadrado de asociacién indique que existe una relaci6n entre dos vari bles, este método no indica el sentido o el grado de relacién. Ejercicios Enue en www.mymathlab.com/global on ww-pearsonglobaleditions.com/newbold para seceder 10s Ficheros de datos. Ejerciclos basicos 14.07. El Center for Nutrition Policy and Promotion (CNPP) del U.S. Departament of Agriculture (USDA) utiliza el Healthy Eating Index para controlar la calidad de la dieta de la poblacién estadounidense, sobre todo el grado en que se ajusta a las orientaciones dietéticas. EI HEI-2005 mide el grado en que la pobl ‘cién sigue las recomendaciones de las Dietary Guideli- nes for Americans de 2005 (Guenther et al., 3007). Los datos recogidos de una muestra aleatoria de individuos 4que participaron en dos extensas entrevistas y exhausti- ‘vos reconocimientos médicos se encuentran en el fiche- 10 de datos HEI Cost Data Variable Subset, en el que la primera entrevista es idéntica con el cédigo 1 de la variable daycode y los datos de la segunda con el cdi {g0 2 de dicha variable. Una de las variables del estudio 5 el nivel de actividad del participante, que se codifica de la siguiente manera: 1 = sedentario, 2 = activo y 3 = muy activo, En el Capstulo 1, construimos grificos 1418, de barras del nivel de actividad de los participantes por sexo con los datos recogidos en la primera entrevista. Averigie si existe una asociacién entre el nivel de acti- Vidad y el sexo. I de actividad Hombres Mujeres ‘Sedentario 957 1226 Activo 340, 47 May activo 842 678, Las autoridades universtarias han recogido la siguiente informacisn sobre la calificaci6n media de los alumnos y la carrera que han estudiado, Averigie si existe alguna asociacion entre la califi- caciGn media y los estudios realizados, Calificacién Estudios realizados Humanidades Empresariales Masica 14.19, Un creciente nimero de distrtos escolares publicos es- 14 utilizando el iPad como instrumento didctico. Por ejemplo, un centro de ensefianza secundaria de Long Island distribuy6 recientemente 47 iPads entre los ‘lumnos y los maestros de dos clases de humanidades y tiene la esperanza de que con el tiempo los 1.100 alum nos tengan un iPad (Hu, 2011). Los educadores discre- pan sobre los heneficios académicos del iPad. Es nece- ssario realizar muchas investigaciones para saber si el ‘Pad mejora el aprendizaje o es simplemente otra moda tecnoldgica. Suponga que se encuestara a una muestra aleatoria de maestros de ensefianza secundaria (de ma- tematicas, historia, ciencias y lengua) y se les pregunta ra si ereen que el iPad mejora el aprendizaje. Averigle si existe una asociacién entre la materia ensefiada y la respuesta a esta pregunta, {iMejora el iPad el aprendizaje? Materia St No Matematicas 68 2 Historia 70 30 Ciencias 60 50 Lengua 50 40 ). {Como se enteran los clientes de la existencia de un huevo producto? Se ha encuestado una muestra alea- toria de 200 usuarios de un nuevo producto para averi- ‘guarlo, También se han recogido otros datos demogri- Introduccion a la estadistica no paramétrica 1421, 659 ficos como Ia edad. Los encuestados eran $0 personas de menos de 21 afos y 90 de entre 21 y 35; el resto tenfa mds de 35 aftos. El 60 % de las personas de me- rnos de 21 aftos habfa ofdo hablar del producto a un amigo y el resto habia visto un anuncio en la prensa lo cal. Un tercio de las personas del grupo de edad 21-35 habfa visto el anuncio en la prensa local, Los otros dos tercios habfan ofdo hablar del producto a un amigo, So- lo el 30 % de las personas de mas de 35 aflos habta ‘fdo hablar del producto a un amigo, mientras que el resto habfa visto el anuncio en la prensa local. Elabore una tabla de contingencia para las variables edad y fo ma de enterarse de la existencia del producto, ;Existe luna asociacién entre la edad del consumidor y el méto- do por el que se enters de Ia existencia del nuevo pro- ducto? Tras un debate electoral entre dos candidatos, se pre Bumt6 a la gente por el sentido de su voto en las si- fBuientes clecciones. ;Existe alguna asociacién entre el sexo del encuestado y la eleccién del candidato presi- dencial? Sexo referencia por un candidato Hombre Mujer Candidate A 150 130 Candidato B 100 120 14.4. Contrastes no paramétricos de muestras pareadas o enlazadas El contraste no paramétrico més sencillo de realizar es el contraste de signos. Se utiliza principalmente para contrastar hip6tesis en el anslisis de datos procedentes de muestras pareadas o enlazadas. El contraste de signos se emplea en los estudios de mercado para averiguar si los consumidores prefieren uno de dos productos. Dado que los encuestados manifiestan simplemente su preferencia, los datos son nominales y se prestan a métodos no paramétricos. El contraste de signos también es itil para contrastar la mediana de una poblacién. Contraste de signos de muestras pareadas 0 enlazadas Supongamos que se toman muestras pareadas 0 enlazadas de una poblacién y se descartan las diferencias iguales @ 0, por lo que quedan 7 obscrvaciones. El contraste de signos puede utilizarse para contrastar la hip6tesis nula de que la mediana poblacional de las diferencias es 0 (lo que serfa cierto, por ejemplo, si las diferencias procedieran de una poblacién cuya distribucién fuera simétrica en tomo a una media de 0). Sea + una diferencia positiva y — una diferencia negativa. Si la hipstesis nula fuera verdadera, se podria cconsiderar que nuestra secuencia de diferencias + y ~ es una muestra aleatoria extrafda de una poblacién cen [a que las probabilidades de + y ~ fueran cada una de 0,5. En ese caso, las observaciones consttuirfan tuna muestra aleatoria extrafda de una poblacién binomial en la que ta probabilidad de + serfa de 0.5. Por 660 Estadistica para administracion y economia tanto, si P representa la verdadera proporcién de signos + que hay en la poblacién (es decir, la verdadera proporcidn de diferencias positivas), la hiptesis nula es simplemente Hy: P = 05 El contraste de signos se basa entonces en el hecho de que el niimero de observaciones positivas. S, que hay cen la muestra sigue una distribucién binominal (donde P = 0,5 seguin la hipotesis nula). Contraste de signos | ‘Supongamos que se toman muestras aleatorias pareadas 0 enlazadas de una poblacién y que se des- ‘aartan las diferencias iguales a 0, por lo que quedan n observaciones. Calculamos la diferencia para | ‘cada par de observaciones y anotamos el signo de esta diferencia. El contraste de signos se utliza para contrastar Hy:P = 05 donde P @s la proporcién de observaciones no nulas en la poblacién que son positivas. El estadistico del contraste s para el contraste de signos de muestras pareadas es simplemente ‘5 = ivimero de pares que tienen una diferencia positiva ‘donde 5 sigue una distribucion binomial, con P= 0,5 yn = numero de diferencias no nulas. Tras contrastar Ia hipotesis nula y la hip6tesis alternativa y hallar un estadistico del contraste, el paso siguiente es calcular el p-valor y extraer conclusiones basadas en una regla de decisién. CAleulo del p-valor de un contraste de signos El p~valor de un contraste de signos se halla utilizando la distribucién binomial con n = numero de die rencias no nulas, $ = nimero de diferencias positivas y P= 0.5. . En.un contraste de la cola superior Hy:P>05° p-valot = Pe > 5) 4.10) b. En.un contraste de la cola interior HyP < 05 prvalor = Por <9) a4. ¢. Enun contraste de dos colas, sea S = max(S.,, 5), donde 5, es el numero de diferencias posi- tivas y $_ es el numero de diferencias negativas. Entonces, | HyiP 405 p-valor = 270 > 5) 42) FEGEEIEREEY referencia por un producto (contraste de signos) ‘Un restaurante italiano cercano a un campus universitario esta considerando ta posibilidad de utilizar ‘una nueva receta para hacer la salsa que echa a las pizzas. Se elige una muestra aleatoria de ocho estudiantes y se le pide a cada uno que valore en una escala de I a 10 la salsa original y la salsa propuesta. La Tabla 14.14 muestra las valoraciones obtenidas en la comparaci6n; los ntimeros més, altos indican que el producto gusta mas. {Ulndican tos datos que hay una tendencia general a preferir la nueva salsa a Ia original? Introduccion a la estadistica no paramétrica 661 Soluci6n. La Tabla 14.14 también muestra las diferencias de valoracién de todos los estudiantes y Jos signos de estas diferencias. Asf, se asigna el signo + si se prefiere la salsa original, el signo — si se prefiere la nueva y 0 si se valoran los dos productos por igual. En este experimento, dos estudian- tes prefieren la salsa original, cinco prefieren la nueva y uno las valora por igual. La hipétesis nula de interés es que en la poblacién en general no hay una tendencia general a preferir un producto al otro. Para evaluar esta hipstesis, comparamos los némeros que expresan una preferencia por cada producto, descartando Tos que valoran los productos por igual. En este ejemplo, los valores del estudiante G se omiten en el andlisis, por lo que el tamafio efectivo de la muestra se reduce an = 7. La Sinica informacién muestral en la que se basa nuestro contraste es que dos de los siete estudiantes prefieren el producto original. Por tanto, el estad{stico del contraste es § = 2. ‘Tabla 14.14. Valoracidn de 1a salsa de pizza por parte de los estudiantes. Valoracién anne pone Pee egal ae) de ier a 6 8 —2 = B 4 9 5 = c 5 4 1 + D 8 7 1 + E 3 9 6 - F 6 9 3 - G 7 7 0 0 4 5 9 4 - La hipotesis nula puede concebirse como la hip6tesis de que la mediana poblacional de las dife- rencias es 0. Si la hipétesis nula fuera verdadera, se podria considerar que nuestra secuencia de dife- rencias + y — es una muestra aleatoria extrafda de una poblacién en la que las probabilidades de + y — Son 0,5 cada una. En ese caso, las observaciones constituirfan una muestra aleatoria extratda de una poblacién binomial en la que la probabilidad de + es 0,5. Por tanto, si P representa la verdadera proporcién de signos + que hay en la poblacién (es decir, la verdadera proporcién de la poblacién que prefiere Ia salsa original), la hipGtesis nula es simplemente Ho:P = 0,5 No hay una tendencia general a preferir uno de los productos al otro Se utiliza un contraste de una cola para averiguar si existe una tendencia general a preferir la nueva salsa a la original. La alternativa de interés es que la mayoria de la poblacién prefiere e! nuevo pro- ducto, Esta alternativa se expresa de la forma siguiente: H,:P.<0,5 Menos del 50 % prefiere el producto original A continuacién, hallamos la probabilidad de observar en 1a muestra un resultado tan extremo 0 ‘més que el que se obtendrfa si la hipstesis nula fuera, en realidad, verdadera. Este valor es el p-valor del contraste. Si representamos por medio de P(x) la probabilidad de observar x «éxitos» (+) en ‘n= 7 pruebas binomiales, cada una con una probabilidad de éxito de 0,5, entonces la probabilidad 662 —_Estadistica para administracion y economia binomial acumulada de observar dos o menos signos + puede obtenerse en la Tabla 3 del apéndice. Por tanto, el p-valor es prvalor = P(x <2) = 0,227 ‘Con un p-valor tan grande, no podemos rechazar la hipstesis nula, por lo que concluimos que los datos no son suficientes para sugerir que los estudiantes prefieren 1a nucva salsa. Asimismo, podria- mos haber dicho que si adoptamos la regla de decisin «rechazar Hy si hay dos 0 menos signos + en la muestra», entonces la probabilidad de que la hip6tesis nula se rechace cuando en realidad es verda- era es 0,227, Por tanto, ese contraste tiene un p-valor de 22,7 %. Dado que el p-valor es el nivel de significacién més bajo al que se puede rechazar la hipGtesis nula, en este ejemplo la hipétesis nula se puede rechazar al 22,7 % o mas. Es improbable que alguien estuviera dispuesto a aceplar un nivel de significacén tan alto. Una vex mas, coneluimos que los datos no son estadfsticamente significativos para recomendar un cambio de salsa. Quiza nuestra decisién se debe a que tenemos un néimero muy pequefio de observaciones muestrales. Contraste de Wilcoxon basado en la ordenacion de las diferencias en el caso de muestras pareadas 0 enlazadas Uno de los inconvenientes del contraste de signos es que solo tiene en cuenta una cantidad muy pequefia de informacién, a saber, los signos de las diferencias. Por ejemplo, en la Tabla 14.14 el contraste de signos indica simplemente qué producto se prefiere y no tiene en cuenta el grado de preferencia. Cuando el tama- fio de la muestra es pequefto, cabria sospechar que el contraste no es muy potente. El contraste de Wilco- xon basado en la ordenacién de las diferencias es un método para incorporar informacién sobre la magnitud de las diferencias entre pares enlazados. Sigue siendo un contraste que no depende de la distribucién. Al igual que muchos contrastes no paramétricos, se basa en las ordenaciones El contraste de Wilcoxon basado en Ia ord las diferencias en el na otteniegiin de lea enel caso de muestras blab lips inoue aisha ely ohne acta. pp ogebreked dispone de una muestra aleatoria cates ese eserecnes, ‘Supongamos que la distribu: _ Sh alana oo ert fe ‘es simétrica y que queremos contrastar la hipdtesis nula de que esta distribucién esta 0. Descartando los pares entre los que la diferencia es 0, ordenamos las n diferencias absolutas restantes en sentido ascendente; en caso de ‘empate, a pubes Sawin 04 eee que ocupan en la ordenacién. Se calculan las | ‘sumas do los puestos correspondientes a las diferencias positivas y nogativas y la menor de estas ‘sumas es el estadistico de Wilcoxon, 7, es decir, iJ T= min. 7) (a4.13) donde TT, = uma de los puestos correspondientes a diferencias positivas -_ = suma de los puestos correspondientes a diferencias negativas ‘n= ndmero de diferencias no nulas ‘Se rechaza la hipétesis nula si T es menor o igual que ol valor de la Tabla 10 del apéndice. Introducctén a la estadistica no paramétrica 663 Preferencia por un producto (contraste de Wilcoxon) Considere de nuevo el Ejemplo 14,8, la valoracién que hacen los estudiantes de una salsa para pizza. Utilice el contraste de Wilcoxon para averiguar si los datos indican una tendencia general a preferir la nueva salsa a la original, Solucién. —Prescindimos, al igual que en el contraste de signos, de cualquier diferencia de 0, por lo que eliminamos e! estudiante G del estudio y el tamafio de la muestra se reduce an = 7. A continua- cidn, ordenamos en sentido ascendente las diferencias absolutas no nulas. Es decir, asignamos un 1 al valor absoluto més bajo. Si dos 0 més valores son iguales, se les asigna Ia media de los siguientes puestos correspondientes. En nuestro ejemplo, las dos diferencias absolutas mas pequefias son igua- les, Por tanto, el puesto que les asignamos es la media de los puestos 1 y 2, es decir, 1,5. Asignamos 13 al siguiente valor absoluto, y asf sucesivamente. Ordenamos todas las diferencias y obtenemos la Tabla 14.15. Los puestos de las diferencias positivas y negativas se suman por separado. La menor de estas sumas es el estadistico T de Wilcoxon, En este ejemplo, 7 = 3. Supongamos ahora que la distribucién poblacional de las diferencias pareadas es simétrica. La hip6tesis nula que vamos a contrastar es que el centro de esta distribuciGn es 0. En nuestro ejemplo, suponemos, pues, que las diferencias de valoracién de los dos productos siguen una distribucién si- métrica y queremos contrastar si esa distribucién esté centrada en 0, es decir, si no hay ninguna dife- rencia entre las valoraciones. Sospecharfamos de la hipdtesis nula si la suma de los puestos corres- pondientes a diferencias positivas fuera muy diferente de la suma de los puestos correspondientes a encias negativas. Por tanto, se rechazard la hipdtesis nula en el caso de los valores bajos de! estadistico 7. Tabla 14.15. Célculo del estadfstico de contraste de Wilcoxon para los datos sobre las preferencias. Estudiante __Diferencia Puesto (+) ‘Suma de los puestos 3 Estadistico T de Wileoxon = minimo (3, 25) = 3 Los puntos de corte de la distribucién de esta variable aleatoria se encuentran en la Tabla 10 del apéndice y se refieren a los contrastes de que la distribucién poblacional de las diferencias pareadas est centrada en algtin nimero mayor que 0 0 en algiin ndmero menor que 0 frente a una hipdtesis alternativa unilateral, Cuando el tamaiio de la muestra es n, la Tabla 10 muestra para distintas proba- bilidades a, el némero 7, tal que P(T y (14.15) 'b. Enun contraste de la cola superior See 5-05 (14.16) ¢, nun contraste de la cola inferior SH=5+05 aay) EI helado (contraste de signos: aproximacién normal) Se ha pedido a una muestra aleatoria de 100 nifios que comparen dos nuevos sabores de helado: man- tequilla de cacahuete y goma de mascar. Cincuenta y seis miembros de Ia muestra prefieren el helado de mantequilla de cacahuete, 40 el de goma de mascar y cuatro no manifiestan ninguna preferencia. Usiice aes ‘aproximacién normal para averiquar si existe una preferencia general por cualquiera de los sabores. Solucién. Para contrastar si existe en esta poblacién una preferencia general por uno de los dos sabores, las hipétesis son Ho: 0.5 Los nitios no tienen ninguna preferencia por ninguno de los dos sabores H,;P 40,5 Los nifios tienen preferencia por uno de los dos sabores Introducelén a la estadistica no paramétrica 665 Sea P la proporcién de la poblacién que prefiere el helado de goma de mascar, por lo que $ = 40 (P también podria haber sido la proporcién de la poblacién que prefiere el helado de mantequilla de cacahuete; en ese caso $ = 56), Utilizando las Ecuaciones 14.14 y 14.15, = np = 0,5n = 0,5(96) = 48 7 = 0,5,/96 = 4,899 Stan 405 = 48 7 4899 z = =1,53 dado que 40 < 48, S* = 40,5 De la distribucién normal esténdar se deduce que el p-valor aproximado = 2(0,0630) = 0,126. Por tanto, puede rechazarse la hip6tesis nula a todos los niveles de significaciGn superiores a 12,6 %. Si de continuidad, el valor Z se convierte en Z = ~ 1,633, lo que da un p-valor algo menor: 0,1024. Aproximacion normal del contraste de Wilcoxon ‘Cuando el niimero n de diferencias no nulas en la muestra es grande (n> 20), la distribucién normal cons- tituye una buena aproximacién de la distribucién del estadfstico de Wileoxon T en el caso de la hipotesis nula de que las diferencias poblacionales estén centradas en 0. Cuando esta hipétesis es verdadera, la media Han por medio de las Ecuaciones 14.18 y 14.19. y la varianza de esta distribucién se Contraste de Wilcoxon: aproximacién normal (grandes muestras) En la hipétesis nula de que las diferencias poblacionales estén centradas en 0, el contraste de Wilco- xon tiene una media y una varianza que vienen dadas por BM) = pr = OED (14.18) nin + H2n +1) r 2 Var(T) = 4a) Entonces, cuando n es grande, la distribucién de la variable aleatoria, Z, es aproximadamente normal esténdar donde (14.20) Si el niimero, n, de diferencias no iguales a cero es grande y T es el valor observado del estadistico de ‘Wilcoxon, los siguientes contrastes tienen un nivel de signficacién a. 1. Sila hipétesis alternativa es unilateral, se rechaza la hipdtesis nula Tor 2. Sila hipétesis alternativa es bilateral, se rechaza la hipétesis nula si <-4 r- 666 Estadistica para administracion y economia Métodos de postauditoria (contraste de Wilcoxon) En un estudio, se compararon empresas que tenfan sofisticados métodos de postauditorfa y empresas ‘que no tenfan métodos de ese tipo. Se examiné una muestra aleatoria de 31 pares enlazados de em- presas. Se calculé el cociente entre 1a valoracién de mercado y los costes de reposicién de los activos de cada una y se utiliz6 como medida de los resultados de las empresas. En cada uno de los 31 pares, una de las empresas utilizaba un sofisticado método de postauditorfa y la otra no. Se calcularon las 31 diferencias entre los cocientes y se ordenaron las diferencias absolutas. La menor de las sumas de los puestos, 189, correspondié a los pares en los que el cociente era mayor en el caso de la empresa que ccareefa de sofisticados métodos de postauditorfa, Contraste 1a hip6tesis nula de que la distribucién de Jas diferencias entre los cocientes esté centrada en 0 frente a la hipstesis alternativa de que el cocien- te tiende a ser menor en las empresas que carecen de sofisticados métodos de postauditoria, Solucién. Dada una muestra de n hipétesis mula, Ia media 1 pares enlazados, el estadistico de Wileoxon tiene, segin la nin + 1) BNG2 Oa een y la varianza \ Vert = op— M+ pon) GOGH), por lo que la desviacida tipica es y= 51,03 El valor observado del estadistico es T= 189. Se deduce de las Ecuaciones 14.18-14.20 que se re- chaza la hip6tesis nula frente a la hipstesis alternativa unilateral si 189 - 248-39 or 31,03 Para x = 0.05 2 =~ 1,645 El resultado del contraste no es suficiente para rechazar la hip6tesis nula. Utilizando a distribucién ‘normal esténdar, la hip6tesis nula solo se podria rechazar a todos los niveles de significacién de 12,3 % ‘0 mas. Ese elevado p-valor indica que los datos no son estadisticamente significativos para indicar que el cociente entre 1a valoracién de mercado y el coste de reposicién de los activos tiende a ser menor en las empresas que carecen de sofisticados métodos de postauditorta Introduccion a la estadistica no paramétrica 687 Contraste de signos de una mediana poblacional El contraste de signos también puede utilizarse para contrastar hipGtesis sobre la posicién central (mediana) de una distribucién poblacional, esos La Tabla 14.16 contiene los sueldos iniciales de una muestra aleatoria de 23 personas recién titu- ladas: de personas recién tituladas (contraste de signos) Tabla 14.1 29.250 29.900 28.070 31.400 31.100 29.000 33.000 50,000 28.500 31.000 34.800 42.100 33.200 36.000 65.800 34.000 29.900 32.000 31.500 29.900 32.890 36,000 35.000 ‘Sueldos iniciales. Undican los datos que la mediana de los ingresos iniciales es diferente de 35.000 $? Los datos para resolver este problema se encuentran en el fichero de datos Income. Soluci6n, Dado que la distribucién de los ingresos a menudo esté sesgada, se utilizard el contraste de signos. La hipétesis nula y la hipétesis alternativa son, ‘Ho: mediana = 35.000 $ Hy :mediana # 35.000 § Agu{ contrastamos Ia hipétesis nula utilizando una distribuci6n binomial con P = 0,50. Primero ‘obtenemos una respuesta aproximada utilizando las Ecuaciones 14.14 y 14.15. Obsérvese que hay 17 estudiantes que indicaron que tenfan unos ingresos iniciales de menos de 35.000 $, cinco que tenfan ‘unos ingresos iniciales de mas de 35.000 $ y uno que tenia unos ingresos iniciales de 35.000 $. El tamafo de la muestra se reduce a n = 22 y S = 5. Se observa que la media y la desviaci6n tipica son Dado que S= 5 <= 2,35 Utilizando a tabla de la distribucién normal esténdar, el p-valor aproximado es 2(0,0094) = 0,0188. Por tanto, se rechaza la hipétesis nula al 1,88 % 0 més. 668 Estadistica para administracion y economia Ejercicios ere Ejerciclos aplicados 14.24, Se pregunta a una muestra de 11 encargados de super rmetcados que tienen una caja rida si sus clientes te- 14.22. Se pide a una muestra aleatoria de 12 analistas finan- fen na actitod poritva hacta Is caja répida, Siete com- ‘ieros que predigan cuinto subirén en términos porcen- estan «si» y Cuatro contestan «no». Contraste la tuales los precios de ls acciones ordinarias de dos em- hipotesis nvla de que, en la poblacién de encargnlos, presas el préximo ao. La tabla muestra los resultados Re cccs 00 eprom poole cate 7 ‘Obtenidos. Utilice el contraste de signos para contrastar Sigs «tm hicotisaberoatpa bleh la hipétesis nula de que en la poblacién de analistas no hay una preferencia general por lasubida del precio de 14.28. Se ha examinado una muestra de 75 empresas que re Ins acciones de una de las empresas © por la subida del ccompraron franquicias. En estos casos, los rendimien- precio de las acciones de la ora tos de las acciones ordinarias en torno a la fecha de ee eee nuncio de la recompea fueron positivos 52 veces, ne- Analista Empresa 1 Empresa 2 ftivos 15 y cero 8. Contrase la hipstesis nla de que a 68 72 los rendimientos positivos y los negativos son igual de 53 probables frente a la hipStesis alterativa de que los po- 8 os oe D 62 68 14.26, En una muestra aleatoria de 130 votantes, 44 eran parti- E mM 12 davios de una subida de los impuestos para aumenar F 6s 62 Jos gastos en educacion, 68 eran contrarios y 18 no ma: G 93 101 nifestaron su opini6n, Contraste la hipstesis nula de a ed a due los votantes estan repatidos por igual en esta cues I 02 13 tin frente a una hipstesis alternativa bilateral. J 96 98 14.27, Se ha pedido a una muestra aleatoria de 60 econoristas K 120 120 profesionales que predigan si la tasa de inflacid ser el i ; as Préximo afio més alta, més baja o més 0 menos igual que la de este aft. Los resultados se muestran en la ta- 14.23, Una organizacin ofrece un programa cuyo objetivo es bia adjunta. Contrast la hipstesis mula de que ls eco- aumentar el nivel de comprensign de los estudiantes ‘omistas estén divididos por igual en esta cuests cuando leen trabajos téenicos rSpidamente. Se daa ca- eases seca dda uno de los miembros de una muestra aleatoria de diez Prediecién Nimero estudiantes 30 minutos para leer un artculo. A continua: Maas in, se realiza una prucba del nivel de comprensin. lo- gnido. Este proceso se repite una vez que esos estudian- Més baja 29 tes terminan el programa. La tabla adjunta muestra los Més.o menos igual niveles de comprensiGn de los estudiantes antes y des- Screener aeee rea eee ‘pugs de panicipar en el programa, Uiilice el contraste 14.28 Se pide a una mucsira aleatoria de 120 compradores de signos para contrastar la hipotesis nula de que en es: {que comparen dos nuevas bebidas energéticas. Sesenta ta poblaciGn no hay una mejora general de los niveles ¥.cinco miembros de la muestra preferfan la bebida A, de comprensién después de participar en el programa. 53 preferfan la B y dos no manifestaron ninguna pre- SE aoa ferencia. Utilice 1a aproximactén normal para averi- Eaniiiant x pepe guar si hay una preferencia general por una de las dos a a o) bebidas. B 63 n é ai « 14.29. Se pide a una muestra aleatoria de dice estudiantes que valoren cn una cata a ciegas la calidad de dos marcas D 70 0 de helado, una con poco avicar y una normal. Las valo- E 60 9 raciones se basan en una escala de | (mala) a 10 (exce- F 33 6 lente). La tabla adjunta muestra los resultados. Utilise G 49 8 el contraste de Wilcoxon para contrastar la hipstes H 58 59 rnula de que la distribuciGn de las diferencias pareadas : ie ea estd centrada en 0 frente a la hipstesis alternativa de ‘ Ps ‘que la poblacicn de todos fos estudiantes consumidores de helado prefiere la marca normal. Estudiante Poco avdcar 2 6 Norma ee moamone> 14.30, Dieciséis estudiantes universitarios de primer aflo se agruparon en ocho parejas de tal forma que los dos miem- bros de cada pareja fueran Jo mds parecidos posibles en Io que se referfa a su expediente académico —medido por ‘medio de las calificaciones obtenidas en la enseftanza se- ndavia y en el examen de acceso a la universidad— y a sus origenes sociales. La principal diferencia existente dentro de Tos pares era que uno de los estudiantes proce- fa de la regidn en Ta que estaba la universidad y el otro no. Al final del primer afto de universidad, se registra- ron las ealificaciones medias obtenidas por estos est dianteS; los resultados se muestran en Ta tabla, Ut cl contraste de Wileoxon para analizar los datos, Anali ce las implicaciones de los resultados del contraste. Par De fuera de la regign a 28 B 3 c a7 D 33 E 37 F G H Introduceton a la estadistica no paramétrica 1432. 14,33. n un estudio se pidié a una muestra aleatoria de 40 estudiantes de administracin de empresas que acaba: ban de cursar las asignaturas de introduccion tanto a la estadistica como a la contabilidad, que valoraran et interés de cada una en una escala de 1 (nada interesan- te) a 10 (muy interesante). Se calcularon las 40 diferen- cias entre los pares de valoraciones y se ordenaron las Jiferencias absolutas. La summa menor, que era la de los estudiantes que pensaban que Ia asignatura de contabi- lidad era la ms interesante, era 281. Contraste la hipé- tesis nula de que Ia poblacién de estudiantes de admi- nistracign de empresas valorarfa estos cursos por igual frente a Ia hip6tesisalternativa de que el curso de esta- istica se considera el mds interesante Un consultor tiene interés en saber c6mo afecta Ia in troduccién de un programa de gestiOn de la calidad to- tala la satisfaccién de los trabajadores en el trabajo. Se pide a una muestra aleatoria de 30 trabajadores que va- lore el nivel de satisfaccién en una escala de 1 (muy insatisfecho) a 10 (muy satisfecho) tres meses antes de ue se introduzca el programa, Se pide a los miembros de esta misma muestra que hagan esta valoracién de nuevo tres meses después de Ia introduccién del pro: ‘grama, Se calculan las 30 diferencias entre los pares de valoraciones y se ordenan las diferencias absolutas. La suma menor de todas las sumas de los puestos, que es lade los que estin mAs satisfechos antes de la introduc cidn del programa, es de 169. {Qué conclusiones pue- den extracrse de este resultado? ‘magnetoscopios. Se pide a cada uno de los miembros de la muestra que valore la cantidad de tiempo que de- ddica al mes a ver los programas de television que ha ‘erubado y a ver las cintas alquiladas. A continuacién, se calculan las 80 diferencias entre las cantidades de tiempo y se ondenan sus valores absolutos. La menor de las suas de los puestos correspondientes a los progra- mas de televisién grabados es de 1.502. Analice las im- plicaciones de este resultado, 14.5. Contrastes no paramétricos de muestras aleatorias independientes En este apartado, introducimos dos contrastes que comparan las posiciones centrales de dos distribuciones poblacionales cuando las muestras aleatorias independientes proceden de las dos poblaciones. Los dos contrastes son el contraste U de Mann-Whitney y el contraste de Ia suma de puestos de Wilcoxon. Contraste U de Mann-Whitney a distribucidn del estadistico de Mann-Whitney, U, se aproxima a la distribuci6n normal a un ritmo bas- tante répido a medida que aumenta el mimero de observaciones muestrales. La aproximacién es adecuada 670 Estadistica para administracion y economia si cada muestra contiene al menos diez observaciones. Por tanto, aqui solo consideraremos las muestras en las que n, > 10 y nz > 10. Para contrastar la hipstesis nula de que la posicién central de las dos distrib nes poblacionales es igual, suponemos que, aparte de la existencia de cualquier posible diferencia entre las posiciones centrales, las dos distribuciones poblacionales son idénticas. Estadistico U de Mann-Whitney ‘Supongamos que, aparte de la existencia de posibies diferencias entre las posiciones centrales, la {dos distribuciones poblacionales son idénticas. Supongamos que se dispone de n, observaciones de la primera poblacién y m observaciones de \a segunda. Se juntan las dos muestras y se ordenan las ob- ‘servaciones en sentido ascendente, asignando, en caso de empate, la media de los siguientes puestos correspondientes. Sea 2; la suma de los puestos de las observaciones de la primera poblacién. El eon- traste U de Mann-Whitney se basa en el estadistico U de Mann-Whitney definido de la forma siguiente: tan + D =n R asp Se puede demostrar entonces que sila hipstesis nula es verdadera, la variable aleatoria U tiene la media y la varianza definidas en las Ecuaciones 14.22 y 14.23. Contraste U de Mann-Whitney: aproximacién normal ‘Suponiendo como hipstesis nula que las posiciones centrales de las dos distribuciones poblacionales ‘son iguales, el estadistico U de Mann-Whitney tiene la media y la varianza siguientes: BO) = Wy = (14.22) nym; + m3 + 1) 2 Entonces, cuando las muestras Son de gran tamafo (ambas son como minimo de 10), la distribucion ‘normal es una buena aproximacion de la distribucion de la variable aleatoria Var(U) = 0%) 14.23) u- 2 fu (14.24) u Horas de estudio (contraste U de Mann-Whitney) La Tabla 14,17 muestra el ndimero’ de horas semanales que los estudiantes afirman que dedican a estudiar las asignaturas de introduccién a la economfa financiera y a la contabilidad. Los datos proce- den de muestras aleatorias de diez estudiantes de economia financicra y 12 de contabilidad. ilndican los datos la existencia de una diferencia en el nimero mediano de horas semanales que dedican los estudiantes a estudiar las asignaturas de introduccién a la cconomfa financiera y a la contabilidad? El fichero de datos se lama Hours. Solucién. Nuestra hipstesis nula es que las posiciones centrales (medianas) de las dos distribucio- nes poblacionales son idénticas. Ho: mediana (1) = mediana (2); Los estudiantes dedican e] mismo numero mediano de horas a estudiar las asignaturas de economfa financiera y de contabilidad Introduccion a la estadistica no paramétrica 671 Se juntan las dos muestras y se ordenan las observaciones en sentido ascendente dando a los empates el mismo tratamiento que antes. Las ordenaciones resultantes se muestran en la Tabla 14.18. Tabla 14.17. Namero de horas semanales dedicadas a estudiar las asignaturas de introduccién ‘a la economfa financiera y a la contabilidad. ‘Economia fi 10 6 «8 10 Bon 9 S11 Contabilidad 1317 4 2 0 9 1S 6 oH 8 Tabla 14.18. Ordenaciones de las horas semanales dedicadas a estudiar en el contraste U de Mann-Whitney. Economia financiers PUesto) Contabilidad —_(Puesto) a9) «assy a0) 9 o 15 (20) 16 en) i 3) 8 45) 9 a 7 @) Suma de puestos = 93,5 Suma de puestos = 159,5 Ahora, sila hipétesis nula fuera verdadera, serfa de esperar que las ordenaciones medias de las dos muestras fueran muy parecidas. En este ejemplo, el puesto medio de los estudiantes de economfa financiera es 9,35, mientras que el de los estudiantes de contabilidad es 13,29. Como ocurre siempre que se contrastan hip6tesis, queremos saber cudl es la probabilidad de que hubiera una discrepancia de esta magnitud si la hipétesis nula fuera verdadera. No es necesario calcular las dos sumas de los puestos, pues si conocemos una, podemos deducir la otra, Por ejemplo, en este caso los puestos deben sumar lo mismo que la suma de los enteros de 1 22, es decir, 253, Por tanto, cualquier contraste de la hipstesis puede basarse simplemente en una de las sumas de puestos. Si la economfa financiera es la primera muestra, entonces n= 10 R= 3,5 pot lo que el valor observado del estadistico de Mann-Whitney es, de acuerdo con la Eeuacién 14.21, mut Dg, = aoyaz) + LOO? _ 93,5 = a1. = mm + U=mn, . > 672 Estadistica para admin traction y economia Utilizando 1a hipétesis nula de que las posiciones centrales de las dos distribuciones poblacionales ‘son iguales y la Ecuacién 14.22, la distribuciGn del estadistico tiene una media yng _ (10)(12) 2 “ee EW) = Wy = yuna varianza mynalrn, + my +1) _ (10129023) Var(U) = 04 = 12 2 = 230 Por tanto, 60 T= = 1,42 y p-valor = 0,1556 oy Con el nivel de significacién habitual de 0,05, el resultado del contraste no es suficiente para concluir «que los estudiantes dedican més tiempo a estudiar una de estas materias que la otra. Podrfamos haber utilizado un factor de correccién de continuidad en la aproximaciGn normal. El p-valor sera de algo més de 0.1556. Si los estudiantes de contabitidad son 1a poblacién 1, por to que n, = 12 y Ry = 159,5, el resulta- do es el mismo, ya que Z = ~ 1,42. El p-valor sigue siendo 0,1556. Contraste de la suma de puestos de Wilcoxon El contraste de la suma de puestos de Wilcoxon es parecido al contraste U de Mann-Whitney. Los resul- tados son los mismos con ambos contrastes. Lo incluimos aquf para completar el andlisis, ya que es posible ue se prefiera este contraste por su sencillez. Al igual que en el contraste U de Mann-Whitney, la distribu- cién del contraste de la suma de puestos de Wilcoxon se aproxima a la distribucién normal a un ritmo bastante répido a medida que aumenta el mimero de observaciones muestrales. La aproximaci6n es adecua- da si cada muestra contiene al menos diez observaciones. Estadistico T de la suma de los puestos de Wilcoxon ‘Supongamos que se dispone de n, observaciones de la primera poblaciGn y de n, observaciones de la ‘segunda. Sa juntan las dos muestras y se ordenan las observaciones en sentido ascendente, asignan- do, en caso de empate, la media de los siguientes puestos correspondientes. Sea T la suma de los puestos de las observaciones de la primera poblacion (7 en el contraste de la suma de puestos de Wilcoxon es igual que R, en el contraste U de Mann-Whitney). Suponiendo que la hipétesis nula es verdadera, ol estadistico de la suma de puestos de Wilcoxon, 7, tiene la media nee (14.25) Varcry = of = Ment D (1426) Entonces, cuando jas muestras son de gran tamaho (n, > 10 y n; > 10), la distrbucién normal es una. ‘buena aproximacién de la distribucion de la variable aleatoria Zee (azn or Cuando hay un gran nimero de empates, la Ecuacién 14.26 puede no ser correcta. Introducetén a la estadistica no paramétrica 673 Enel caso de los datos de la Tabla 14.18, T= R, = 93,5 y Obsérvese que la varianza de la distribuci6n en el muestreo del estadistico de la suma de puestos de Wilco- xon, T, es igual que la varianza de la distribucidn en el muestreo del estadfstico de Mann-Whitney, U. Por tanto, =142 = p-valor = 0.1956 SEMEL Beneficios de dos empresas (contraste de la suma de puestos de Wilcoxon) En un estudio que pretendfa comparar los resultados de empresas que revelan las predicciones de la ireccién sobre los beneficios con los resultados de las que no las revelan, se tomaron muestras alea- torias independientes de 80 empresas de cada una de las poblaciones. Se midié la variabilidad de la tasa de crecimiento de los beneficios en los diez periodos anteriores en cada una de las 160 empresas se ordenaron estas variabilidades. La suma de los puestos de las empresas que no revelan las pre- dicciones de la diteccién sobre los beneficios era 7.287 (Jaggi y Grier, 1980). Contraste la hipstesis rnula de que las posiciones centrales de las distribuciones poblacionales de las variabilidades de los bbeneficios son las mismas en estos dos tipos de empresas frente @ una hip6tesis alternativa bilateral, Demuestre que estos resultados son iguales que los del contraste U de Mann-Whitney y los del con- traste de la suma de puestos de Wilcoxon. Soluci6n. Dado que tenemos que n, = 80, ny = 80 y R, = 7.287, el valor calculado del estadisti- co de Mann-Whitney es mint) _ a = coy + SUBD U=nn;+ — 7.287 = 2.353 Segtin la hip6tesis nula, el estadfstico de Mann-Whitney tiene la media nny _ (8080) tw . 5 3.200 y la varianza 2 _ munginy + na +1) _ (80)(80)(161) oy 7 at 85.867 En este caso, tenemos que 2.353 — 3.200 674 — Estadistica para administracién y economia En la Tabla 1 de ta distribucién normal esténdar del apéndice, vemos que el valor de a/2 correspon- diente a un valor de Z de 2,89 es 0,0019, por lo que el p-valor es 0,0038. Por tanto, la hipétesis nula puede rechazarse a todos los niveles de mds de 0,38 %. El contraste de la suma de puestos de Wilcoxon utiliza las Ecuaciones 14.25 a 14.27. La media de Tes = Malt +m +1) _ 800161) 2 2 EQ) La varianza de T es igual que la de U (la Ecuacién 14.23 es igual que la 14.26). Por tanto, por la Eeuacién 14.27, T py _ 7.287 ~ 6.440 or [95.867 y,de nuevo, puede rechazarse la hipStesis nula a todos los niveles de mas de 0,38 %. Se obtienen los ‘mismos resultados utilizando el contraste U de Mann-Whitney que utilizando el de 1a suma de los, ‘puestos de Wilcoxon. Estos datos constituyen, pues, una prueba contundente en contra de la hipdtesis de que las posiciones centrales de las distribuciones de las variablidades poblacionales de las tasas de crecimiento de los beneficios de las empresas que revelan las predicciones de los beneficios son iguales que las de las empresas que no las revelan. ‘Ahora bien, si se nos hubieran dado los datos efectivos en lugar de simplemente los puestos en Ja ordenacién, podrfamos haber realizado un contraste de la hipstesis nula utilizando los métodos del Capitulo 10. Sin embargo, utilizando el contraste de Mann-Whitney, hemos observado que la hipste- sis nula puede rechazarse sin el supuesto de la normalidad de la poblacién. Ze Ejercicios Ejercicios aplicados 14.34. En un estudio se compararon empresas que tenfan un comité de auditorfa con empresas que no lo tenfan, Se ‘midié en mucstras de empresas de cada tipo el grado de participacién de los consejeros en la propiedad por me- dio del numero de acciones que posefa el consejo, de administraciGn en porcentaje det numero total de accio. nes emitidas. En la muestra, la participaci6n de los con- sejeros era, en conjunto, mayor en las empresas que n0 BS 172 16 9 En una muestra aleatoria independiente de diez accio- nes de la lista de venta, los rendimientos porcentuales a lo largo del aio eran los siguientes: 62 89 3 at 24 13 79 102 14.38, tenfan comité de auditoria, Para contrastar la significa- eign estadistica, se calcul6 el estadistico U de Mann- ‘Whitney. Se observ6 que (U~ 1,)/o4, era 2,12. Qué cconclusiones pueden extraerse de este resultado? Un analista bursétil elabor6 a comienzos det ano una lista de acciones para comprar y otra de acciones para vender. En una muestra aleatoria de diez acciones de la lista de compra, los rendimientos porcentuales a lo lar- 0 del afio eran los siguientes: Utilice ef comtraste de Mann-Whitney para interpretar estos datos. 14.36. En una muestra aleatoria de 12 ttulados en administra cidn de empresas de una universidad privada, los suel- dos iniciales aceptados después de titularse (en miles de délares) fueron los siguientes: 262 293 313 287 2A 250 260 272 275 28 326 4,6 14.38, 1. Una empresa entrevis Introduccion a la estadistica no paramétrica 678 En una muestra aleatoria independiente de diez titt- “Aijgmmos 26 24 15 168 29-126 18 lados en administracién de empresas de una univers it isis (ocean a dad pablica, las cifras correspondientes fueron 1as si Alumnas 22 2 17 25 14 21 5 30 as 4127 23 20 25,3 282 292 21 268 Sia ea aco Contraste la hipstesis mula de que en conjunto ef or- den de los alumnos y el de las alumnas es el mismo frente a una hip6tesis alternativa bilateral Analice los datos utilizando el contraste de Mann: Whitney y comente los resultados. Un boletin informativo califica los fondos de inver- sidn, Se eligen muestras aleatorias independientes de diez fondos que tienen la mejor calificacién y diez ‘que tienen la peor calificaciGn. Las cifras siguientes son las tasas porcentuales de rendimiento que obten- {drGn estos 20 fondos el préximo aio, 1a tanto a expertos en marketing ‘como a expertos en economfa financiera para cubrir el puesto de direccién general. Un equipo de altos direc tivos de la empresa realiza una intensa entrevista y rhumerosas pruebas a una muestra aleatoria de diez ti tulados en marketing y a una muestra aleatoria inde- pendiente de 14 titulados en economia financiera A ccontimuacién, ordena a los candidatos de 1 (el mejor Mejor 81 12,7 13,9 23 161 SA 73 calificado 98 143 4.1 para ubri el puesto) a 24, como moesi la tabla ad Por 35 1K0 Il A? 62 133 70 feta, Contrast la hipecssnela de que, en conjunc, calicado 73/46 100 Ton alton sretivos do In etmproea no tonen singe preferencia por los titulados en marketing 0 por los ti- Contraste la hipétesis nula de que no existe ningu- {ulados en economia financiera frente a la hipStesis ax inemekoanas ot eevtioot mise ay ior alicrnativa de que prefieren los titulados en economia tribuciones poblacionales de las tasas de rendimiento financiera. frente a la hipétesis aliernativa de que los fondos me- Sse jorcalificados inden acbtener mayores lass e fen TBsonomia 9. Marketing 17. Marketing imiento qoe los peor ealifcados, aecomomis —\0-Muteting —1Marketing ‘440. Se pregonts una muestra slestoria de 50 exacts aud sueldo deberfa estar dspuesta la universidad a pa far para atraer ala persona i6nen para entenar al equipo de fitbol. Se hace ln misma pregunta a una financiera iuestraalestoria independiente de 50 profesores. A 4.Economia 12. Economia ContinuaciGn, se juntan las 100 cifras sobre cl sicko aes eae onal Y se ondenan (asigndndose el puesto | al sueldo ms bajo). La sta de los pucsts de Tos profesres ex fi 3.Marketing 11, Economia eos Cee 2 es 2.024. Conraste Ia hiptesis aula de-que no existe ninguna diferencia entre ls posiciones centrale de 6.Marketing = 14. Economia 22. Marketing las distribuciones de los sueldos propuestos por los es- Sinancira tudiantes y por tos profexores frente Ia hits +-eoonomfa—15:Beonomia-28-Markving terativa de que en sonjunt ls estudiantes propon- — aaa dita un sueldo mas ato para aac un entenador. 8 Marketing 16.Bconomla 24. Economla 1444. Se compara los steko inciales de Sitlados en ad- financier nancira Iinistracion de empresas Je Jor destacada face des de administracton de empresas, Se toman moet {Um profesr pis una mest leatoria de 15 stom tras aletorigs de 30 estudiantes do cada una y se nos'y @ una muestra aleatora independiente de TS jan y ordnan los 60 suelo niles. La suma de alornas que exeribieran un ensayo a inal de wn our Tos puestor de los estates de una de las acuades tore extra A continuacin, el profesor orden ex 1243, Contrast la hipdtesis nla de que las posi tox ensayos de 1 (el mejor) 430 (6 peor) Eta esl Giones cenirales de las distibciones pobacionales ordenacién, son idénticas 676 14.6. Estadistica para administracion y economia Correlaci6n de orden de Spearman El coeficiente de correlacién muestral puede verse seriamente afectado por las observaciones extremas. Ademés, los contrastes basados en é1 recurren para su validez al supuesto de la normalidad. Se puede obte- ner una medida de 1a correlacidn en la que no influyen seriamente los valores extremos y en la que pueden basarse contrastes vilidos de distribuciones poblacionales muy generales utilizando los puestos en ordena- ciones. El contraste resultante es, pues, no paramétrico. Gorrelacién de orden de Spearman ‘Supongamos que se toma una muestra aleatoria (x,y). (iv x) de n pares de observaciones. Silas +x, las y, 8@ ordenan en sentido ascendente y se calcula la correlacién muestral de estos puestos, e! oefeiente restart ge laa coefelente de correlacién de orden de Spearman. Sino hay empa- tes entre puestos de X o de Y, una férmula equivalente para calcular este coeficiente es 6 yd? “ne =D) Sonk donde las d, son las diferencias entre los pares ordenados. Los siguientes contrastes de la hipétesis nula Hy de que no existe ninguna asociacién en la pobla- ‘ign tlanen un nivel de significacién a. 1. Para contrastar la hipGtesis nula de que no existe ninguna asociacién frente a la hipdtesis alter- nativa de que existe una asociacion positiva, la regia de decisién rechazat Hy $i ty > Ta. (14.29) | 2. Para contrastar la hipétesis nula de que no existe ninguna asociacién frente a la hipétesis alter- rativa de que existe una asociacién negativa, ja regla de decisién es rechazat Hy $17, <~Fia (14,30) 3, Para contrastar la hipdtesis nula de que no existe ninguna asociacién frente a la hipétesis alter- nativa bilateral de que existe alguna asociacidn, la regia de decision es mechazar Ho Sir, <—Fyaa 0 fe> luap aasn Promocién de los cruceros (correlacién de orden de Spearman) Para promover los cruceros por ¢! Mediterraneo, supongamos que una empresa de cruceros se anun- ‘cia en 17 revistas de viajes. Se invita a los lectores a pedir més folletos y literatura. Las dos variables que se quiere relacionar son: X: coste de la publicidad y de la distribucién, en miles de dlares ¥: rendimiento de la publicidad donde este timo se define de Ia forma siguiente: Y = (ingresos estimados de las solicitudes de informacién — coste de la publicidad) ~ coste de la publicidad Introduccion a la estadistica no paramétrica 677 La Tabla 14.19 enumera los puestos de estas dos variables correspondientes a los 17 anuncios de revistas. Calcule el coeficiente de correlacién de orden de Spearman y contraste la asociaciGn entre las variables Tabla 14.19. Calculos de la correlacién de orden de! ejemplo de los cruceros. Revista Orden (X) Orden () dj = orden (x) — orden (Y). d? 1 14 2 2 144 2 8 4 4 16 3 1 16 -15 225 4 16 1 Is 25 5 7 5 2 144 6 13 6 7 49 7 15 8 7 49 8 " "1 -9 81 9 7 9 -2 4 10 3 13 =10 100 u 6 2 -6 36 12 9 7 -8 oF 13 5 al 2 4 4 4 7 “3 9 15 " 14 -3 9 16 2 15 -3 9 7 10 10 o 0 Suma 1.168 Solucién. Aunque la revista 17 tiene un puesto de 10 en X y un puesto de 10 en ¥, solo se conside- ran los empates dentro de los puestos de X 0 dentro de los puestos de ¥y no entre los puestos de X y de ¥. Dado que no hay empates entre puestos de X 0 entre puestos de ¥, utilizamos la Ecuacién 14.28 yy obtenemos a? 6 Ld 6(1.168) n(n? = 1), 1a7y = 1} Dado que hay 17 pares de observaciones, los puntos de corte (véase la Tabla 11 del apéndice) en los contrastes al nivel del 10 % y del $ % son, respectivamente, wocas = 0,490 Puede rechazarse Ia hip6tesis nula de que no existe ninguna asociaci6n frente a la hip6tesis alternati- va bilateral, segtin la regla de decisién, al nivel del 10 %, pero no al nivel del 5 %. Nuestras conclu- siones no se basan en el supuesto de la normalidad de la poblacién. El coeficiente de correlacién negativo indica que cuanto mas se gasta en publicidad, menor es la tasa de rendimiento. —0,431 Toes = 0412. y 678 Estadistica para administracién y economia Si no hay empates entre puestos de X o entre puestos de ¥, entonces es sencillo calcular la correlacién de orden de Spearman con el programa Minitab o con el Excel. Si hay empates, calculamos ta correlacién simple (Apartado 11.7) entre los puestos. Ejercicios Ejercicios aplicados 1442, Los estudiantes de un curso de introduccién al marke- ting tienen que hacer un examen final escrito y un proyecto para obtener la calificacién final. Las califica Rendimiento Actives Rendimiento Actives Rendimiento Actives 23 30 160 421 129 75 216 m 155 9 13610 Ciones de una muestra aeatoria de dic estudiantes tan 3004 152756992 to en el examen com en el proyecto son i 1503079 Examen 81 @ 74 78 93 7283 9 Bt Pe ceete Suidecte eg iseeeC ere EEL ee ws 140 4333719 Proyeno 76 71 69 76 87 62 80 75 2 79 peace a Calcule el coeficiemte de correlacién de orden de Spearman Spearman, oe b. Realice un conte no paramo de hips 14.43. La tabla adjunta muestra el rendimiento porcentual de rnula de que no existe ninguna relacién en la pobla- tuna muestra aleatoria de 20 fondos de inversidn a largo in frente a una hipOtesis alternativa bilateral. plazo en un periodo de 12 meses y los activos totales Analice las ventajas de un contraste no paramétrico (¢n millones de dlares) de estos datos. 14.7. Un contraste no paramétrico de aleatoriedad En el Capitulo 1, presentamos gréficos para representar datos de series temporales. En este apartado, exa- minamos el contraste de rachas, un contrasic no paramétrico de aleatoriedad de series temporales. Eland lisis de series temporales y la prediccién se presentan en el Capitulo 16. Contraste de rachas: pequefias muestras Primero examinamos una serie temporal de n observaciones, siendo n < 20. Representamos las observacio- nes situadas por encima de la mediana con el signo + y las observaciones situadas por debajo de la media- na con el signo ~. Utilizamos estos signos para definir la secuencia de observaciones de la serie prvens he eee fe Naanaw ars snare ngs Sialivelde ‘significacion adecuado para el contraste frente a la El Ejemplo 14.16 ilustra una serie temporal que contiene n = 16 observaciones diarias sobre un indice del volumen de acciones negociadas en la bolsa de Nueva York. Si esta serie fuera aleatoria, e1 volumen Introduccion a la estadistiea no parametrica 679 negociado un dia seria independiente del volumen negociado cualquier otro dia. En conereto, un dia de un clevado volumen de contrataciones no tendrfa mas probabilidades que cualquier otro dfa de ir sezuido de otro dia de un elevado volumen de contrataciones. New York Stock Exchange (contraste de rachas: poquefias muestras) ‘La Tabla 14.20 muestra una serie de 16 observaciones diarias sobre un fndice del volumen de accio- nes negociadas en la New York Stock Exchange. Contraste la hipétesis nula de aleatoriedad. Los datos se encuentran en el fichero de datos Shares Traded. Tabla 14.20. {ndice de! volumen de acciones negociado, Dia Volumen Dia Volumen Dia Volumen Dia Volumen 1 98 3 113 9 4 3 109 2 93 6 Ww 10 107 4 108, 3 82 7 104 u Mm 15 128 4 8 103, Solucién. Primero calculamos la mediana. La mediana de un niimero par de observaciones es la ‘media del par central cuando las observaciones se ordenan en sentido ascendente. En este caso, es _ 107 + 108 mmo mediana 107.5 El contraste de rachas desarrollado aqut divide las observaciones en un subgrupo situado por en- ‘cima de la mediana y un subgrupo situado por debajo de la mediana. Obsérvese que en la Figura 14.3 se ha trazado una recta en Ja mediana de 107.5. 130: 0 —| 107.5 Volume 100 0 5 70 8 Day Figura 14.3. indice del volumen de acciones negociado segtn el da (contraste de rachas). 680 —_Estadistica para administracién y economia Si + representa las observaciones situadas por encima de la mediana y ~ las observaciones si- tuadas por debajo de la mediana, observamos la siguiente pauta a lo largo de los dfas consecutivos: ~t+t--t-tttte- Esta secuencia esté formada por una racha de cuatro signos ~ seguida de una racha de dos sig- nos +, una racha de dos signos ~, una racha de un signo +, una racha de un signo ~, una racha de cinco signos + y, finalmente, una racha de un signo —. En total, hay, pues, R = 7 rachas. Si, como cabria sospechar aquf, existe una asociacién positiva entre las observaciones contiguas en el tiempo, serfa de esperar que hubiera relativamente pocas rachas. Nos preguntamos qué probabi- lidad hay de observar siete rachas o menos si la serie es realmente aleatoria. Para eso es necesario saber cudl es la distribucién del ndimero de rachas cuando la hiptesis nula de la aleatoriedad es ver- dadera. La Tabla 14 del apéndice muestra los valores tabulados de la distribuci6n acumulada. En esa tabla, vemos que cuando n = 16 observaciones, la probabilidad segun la hipétesis nula de encontrar siete rachas 0 menos es 0,214. Por lo tanto, la hipStesis nula de la aleatoriedad solo se puede rechazar frente a la alternativa de la existencia de una asociacién positiva entre las observaciones contiguas al nivel de significaciGn = 0,214. Este no es suficientemente pequefio para que sea razonable rechazar la hipétesis nula. No hemos encontrado simplemente pruebas contundentes para rechazarla. Los con- trastes de aleatoriedad basados en pequerias muestras como esta tienen poca potencia. Contraste de rachas: grandes muestras A continuaci6n, examinamos el contraste de rachas con grandes muestras de 1 observaciones, siendo n> 20. En esta situacién, es adecuada la aproximacién normal de la Ecuaci6n 14.32. El contraste de rachas: grandes muestras Sis ‘Dado que tenemos una serie temporal den nes yn > 20, el numero de rachas, R, es el nd- Febipladeubarbpipbely inl Us a, | Maat inte nck toed Ja hipétesis nula ‘Ho: la serie es alcatoria La distribucién normal es una buena aproximacién de la distribucién del niimero de rachas segin la hipétesis nula. Se puede demostrar que segiin la hipétesis nula, = (1432) ‘a= gue une dat foucien oral epider; Este resultado constituye un contraste de aleatoriedad. ‘Los sigulentes contrastes tienen un nivel de signticacién 2. 1. Sila hipotesis alterativa os una asociacién positva entre las observaciones contiguas, la regia de decision es 4 Introduccion a la estadistica no paramétrica 681 2. Sila hipotesis alternativa es una hipstesis bilateral de ausencia de aleatoriedad, la regia de decision es rechazar Hy si Z~ 434) REEL) Andlisis de los datos sobre las ventas (contraste de rachas: grandes muestras) Le han pedido que averigtle si 30 semanas de ventas siguen una pauta aleatoria de una observaci6n a la siguiente en una serie temporal. Los datos se encuentran en el fichero de datos Weekly Sales. Solucién. La Figura 14.4 es un grifico de series temporales de los datos en el que se ha trazado la ‘mediana, El examen de este grafico muestra que la serie temporal tiene ocho (R = 8) rachas y sugiere ue las observaciones no son independientes, ya que parece que siguen una pauta 17685 Figura 14.4. Datos sobre las ventas semanales a lo largo del tiempo (contraste de rachas). El estadistico del contraste de rachas se puede calcular aplicando la Ecuaci6n 14. n= In Via) 16 En la Tabla 1 del apéndice de Ia distribucién normal esténdar, vemos que el p-valor resultante de un contraste de dos colas es 0,0030, Asimismo, aplicando la Ecuacién 14.34 con un nivel de significa- cidn de 0,01, se observa que 2 -2,97 <~2,576 y se rechaza la hipstesis nula de aleatoriedad. Vemos, pues, que las pruebas a favor de la hipotesis de {que la serie no es aleatoria son abrumadoras. 682 Estadistica para administracion y economia Ejercicios Entre en wrw.mymathlab.com/global o en ‘www pearsonglobaleditions.com/newbok pars aeceder alos Ficheros de datos. Ejercicios basicos 1444, Una serie temporal contiene 16 observaciones. ;Cuil es la probabilidad de que el nimero de rachas sea f. de cinco como méximo? . superior a 12? 14445. Una serie temporal contiene diez observaciones. ;Cudl ¢$ la probabilidad de que el nimero de rachas sea a. inferior a seis? . no inferior a cuatro? 14.48, 1449, 14.46. Una serie temporal contiene $0 observaciones. Cusles 45 la probabilidad de que el némero de rachas ‘a, no sea superior a 14? b. sea inferior a 16? fe. sea superior a 28? 1447. Usilice el contraste de rachas para contrastar la aleatoric~ dad del nimero de clientes que compran en un nuevo cen- tro comercial durante una semana dada. Los datos son: 14381, Ejercicios aplicados EI fichero de datos Exchange Rate muestra un {indice del valor del d6lar estadounidense frente 1 las monedas de sus socios comerciales durante 12 ‘meses consecutivos. Utilice el contraste de rachas para hacer un contraste de aleatoriedad de esta serie. cho de dats Inventory Sales mse exces cae xc svn india el omer de Exes Unison pie So ae 12 an Rete un ome de seal fannie lado elcome deat Echo de aos Stack Maret Index mie © Ci ocintono anes den ne bo til durante 14 afios. Realice un contraste de aleatorie- dad utilizando el contraste de rachas. RELEVANT Magazine leva un registro del tle fico (como el nimero semanal de nuevos vis tantes) de su pégina web a través de diversas redes s0- ciales como Facebook y Twitter (Butcher, 2011) Enel Ejemplo 1.8, construimos grificos de series temporales del ndimero semanal de nuevos visitantes en los nueve primeros meses de 2011 tanto a través de Facebook co- ‘mo a través de Twitter, Realice un contraste de aleato- riedad utiizando el contraste de rachas. Los datos 5¢ ‘encuentran en el fichero de datos RELEVANT Maga Dia ‘Nimero de clientes Tunes 35 Maries 340 Micrcoles 469 Jueves 300 Viernes. 586, tine. Sabado 640 Términos clave + coeficiente de corelacion de orden de Spearman . * contraste de asociacion ‘contraste de la bondad del ajuste ‘© contraste de la bondad del ajuste: parmetros estimados * contraste de la bondad del ajuste cuando se estiman ppardmetros poblacionales . ‘© contraste de la suma de puestos de Wilcoxon © contraste de normalidad de Jaque-Bera vontraste de rachas + comtraste de signos ‘* contraste de Wilcoxon basado en ta ordenacién de las diferencias * contraste U de Mann-Whitney curtosis © sesgo. * variable aleatoria ji-cuadrado Ficheros de datos Closing Stock Prices, 652 Exchange Rate, 682 HET Cost Data Variable Subset, 658 Hours, 670 Income, 667 Shares Traded, 679 Stock Market I Weekly Sales, 681 lex, 682 Introduccion a la estadistica no paramétrica_ 683 Ejercicios y aplicaciones del capitulo 14.52. Suponga que se clasificé una muestra aleatoria de em- Presas que tienen activos insolventes segiin que se amortizaran discrecionalmente y también segin que hhubiera o no pruebas de una fusién o adquisicién poste- rior. Utilizando los datos de la tabla adjunta, contraste la hipstesis nula de que no existe ninguna asociacién entre estas caractersticas ‘Amonizar 1453. 2009, se realiz6 una encuesta en Ia que se observ ron estas preferencias de Ia poblacién del sudeste asif- tico respecto a las compaffas aeronduticas para viajar a China: 40 %, Thai Airlines; 41 %, Singapore Airlines; y 19 %, Cathay Pacific. En 2011, se repiti esta encues- tay en una muestra de 1.000 encuestados, 365 eligieron ‘Thai, 540 eligieron Singapur y 95 eligieron Cathay Pa- cific. {Puede concluir que los consumidores siguen te- niendo las mismas pautas de compra? 14.54. El departamento de recursos humanos est intentando averiguar si la carrera universitaria de un empleado in- fluye en su rendimiento, Las carreras examinadas son administracién de empresas, econom{a, mateméticas y otras, Las valoraciones del personal son excelente, bue- rho y medio. Las clasficaciones se basan en los emplea- ddos que tienen entre dos y cuatro aftos de experiet ‘Administracion deempresas excelente, 21; bueno, 18; medio, 10 Economia excelente, 19; bueno, medio, 5 Mateméticas excelente, 10; bueno, medio, 5 Resto excelente, 5; _ bueno, medio, 13 {lndican estos datos que existe una diferencia entre las valoraciones basadas en la carrera estudiada? 14.58. Se ha pedido a una muestra aleatoria de personas que bocupan tres puestos de trabajo diferentes Hamados A, B yy C que indiquen sus preferencias por tres marcas de limernas de camping: Big Star, Lone Star y Bright Star Las preferencias son las siguientes: Grupo A” Big Star, 54; Lone Star, 67; Bright Star, 39 Grupo B Big Star, 23; Lone Star, 13; Bright Star, 44 Grupo C Big Star, 69; Lone Star, $3; ilndican estos datos que existe una diferencia entre las preferencias de los tres grupos? 14.56, Una universidad tenfa interés en saber si los titulados cn historia y en economia segufan programas de docto- rado diferentes. Encuest6 a una muestra aleatoria de personas recién doctoradas y observ6 que un gran ni ‘mero hizo un doctorado de administracién de empresas, de derecho y de teologfa, La tabla adjunta muestra ta frecuencia de personas en las distintas combinaciones. Basindose en estos resultados. existe alguna prueba de que los titulados en economfa y en historia siguen programas de doctorado diferentes? Estudios de doctoralo ‘Administracion Titulado de empresas Derecho _Teologis Economia 30 20 10 Historia 6 M 20 14,57. Suponga que ha recogido datos de encuesta sobre el se xo y la compra de un producto. Realice un contraste ji- ccuadrado para averiguar si la probabitidad de compra varia de los hombres a las mujeres. Incluya en su res- puesta los valores esperados si se cumple Ia hipstesis nt. Sexo Decisis Hombre Mujer ‘Compra 150 130 No compra 30 250 14.58. Las pautas de turismo son dificiles de predecir; normal- mente varfan de unos pafses a otros y a veces incluso de unos lugares a otros préximos entre sf. En Hong. Kong, se realiz6 una encuesta a 1.600 personas en Ia ue se les pregunts cusl era su destino asiatico favorito para pasar unas cortas vacaciones. Los resultados fue- ron los siguientes: el 43 % va a China, el 23 % va a Tailandia, el 20 % va a Filipinas, el 5 % va a Camboya yeel resto elige otros paises. Esta misma encuesta se ha realizado en Macao (China), que est solo a una hora de Hong Kong en lancha motora, y los resultados son los siguientes: 48 %, China; 20 %, Tailandia; 22%, Fie lipinas; 3 %, Camboya; y el resto, otros destinos. ;Con- cluiria que las pautas son las mismas en las dos ciu- dades? 14.59. Un fabricante de clectrodomésticos querfa saber si exist relacisn entre el tamatio de las familias y el ta- mao de fa lavadora que compraban. Estaba preparan- do unas directrices para el personal de ventas y querfa saber si este debja hacer recomendaciones especificas 4 los clientes. Se pregunts a una muestra aleatoria de 14.60. 1461. Estadistica para administracién y economia 300 familias por su tamaio y por el tamaiio de la lav dora. En las 40 familias en las que habfa una © dos per- sonas, 25 tenfan una lavadora de cinco kilos, diez ‘nfan una lavadora de seis kilos y cinco tenfan una lavadora de siete kilos. En las 140 familias en las que habfa tres © cuatro personas, 37 tenfan una lavadora de cinco kilos, 62 tenfan una lavadora de 6 kilos y 41 rnfan una lavadora de cinco kilos. En las 120 familias restantes en las que habfa cinco personas o mds, ocho tenfan una lavadora de cinco kilos, 53 tenfan una lav dora de seis kilos y 59 tenfan una lavadora de siete kilos. Basdndose en estos resultados, qué conch nes pueden extraerse sobre el tamaiio de la familia y e! tamaiio de la lavadora? Construya una tabla de doble centrada, formule la hipstesis, calcule el estadistico y cextraiga sus conclusiones. E] depariamento de engranajes de una gran empresa produce engranajes de gran calidad. El néimero que produce un mecainico por hora es 1, 2.0 3, como mues- tra la tabla, La direccién de la empresa est interesada {en saber como influye la experiencia de los trabajado- res en el nimero de unidades producidas por hora. La experiencia de los trabajadores se clasifica em tres sub- ‘grupos: un aio © menos, entre dos y cinco aftos y més de cinco aiios. Usilice los datos de Ta tabla para averi- guar si la experiencia y el ndimero de piezas producidas por hora son independientes. Unidades producidas por hora Experiencia 1-2 ~~—=«3 ‘Tol <1 alo 0 30 10 50 2-5 altos 10 2 2% 50 > altos 1 1 30 50 Total 30 6080 Angeles Lara ha estado claborando un plan para abrir nuevas tiendas dentro de su programa de expansin regional. En una ciudad en la que propone expandirse hay tres posibles localizaciones: norte, este y oeste Sabe por experiencia que los tres grandes centros de beneficio de sus tiendas son las herramientas, 1a ma- dera y la pintura. Para seleccionar la localizacién, son importantes las pautas de demanda de las diferentes partes de la ciudad. Encarga un estudio por muestreo sobre la ciudad, a partir del cual se elabora una tabla de doble entrada de las variables localizacién residen- cial y producto comprado. Esta tabla es realizada por el departamento de estudios de mercado utilizando da- tos procedentes de la muestra aleatoria de hogares de las tres grandes zonas residenciales de la ciudad. Cada zona residencial tiene un prefijo telefnico distinto y se eligen los cuatro diltimos digitos utilizando un ge~ nerador informatica de nimeros aleatorios. ;Existe tuna diferencia entre las pautas de demanda de los tres grandes articulos de las diferentes zonas de la ciudad? Demanda del producto Zona Herramientas Madera Pintura Este 100 50 30 Norte 30. 95 45 Sur 65 0 15 14.62, Una empresa de mensajerfa esta realizando un estudio de sus operaciones de envio de paquetes. Para realizar este estudio, ha recogido datos sobre el tipo de paquete segiin la fuente de procedencia en un dia de operacio- ries de una oficina del sudeste, Estos datos se muestran en Ia tabla, Las principales fuentes de procedencia son (1) ciudades pequeflas (ciudades), (2) barrios financie- 10s utbanos (BFU), (3) polfgonos industriales (fabricas) y (4) zonas residenciales. Existen tres grandes tipos de Paquetes sein su tamafio y su tarifa. Los sobres urgen- tes deben pesar tres kilos 0 menos y tienen una tarifa fija de 12 $ cualquiera que sea el destino. Los paquetes ppequefios pesan entre cuatro y diez kilos y tienen limi- {aciones sobre su tamaiio. Los paguetes grandes pueden pesar entre 11 y 75 kilos y tienen ta tarifa mas baja por kilo y son los que mas tardan en egar. “Tamafo del paquete Fuente de procedencia <3 410 11-75 Tow! Ciudades: 0 40 20100 BFU 1963 18 200 Pébricas 1871200 Zonas residenciales 694 7150 a. :Existe alguna diferencia entre las pautas de los pa- Quetes procedentes de los diferentes lugares? '. {Qué dos combinaciones tienen la mayor desviaciéa pporcentual con respecto a una pauta uniform 14,63. Una agencia de viajes tomd una muestra aleatoria de personas de su mercado y les hizo la siguiente pregun- ta: «{Reservé su ultimo Vuelo a través de una agencia de viajes». Cruzando las respuesias a esta pregunta ‘con las respuestas al resto del cuestionario, la agencia ‘obtuvo datos como los de la siguiente tabla de contin; ‘gencia: {Reservé su chtimo vuelo a través de una agencia de viajes? Edad Si No Menos de 30 15 30 Entre 30 y 39 20 a2 Entre 40 y 49 47 a2 Entre 50 y 59 36 50 60.0 mis 45 20 Averigie si existe una asociacién entre la edad de! en- ‘cuestado y la reserva de su Gitimo vuelo a través de un agencia de viajes. 14.64. {Cree que el gobierno deberia rescatar a la industria automovilfstica? Suponga que se hizo recientemente esta pregunta a 460 estadounidenses. También se les Pidié que seleccionaran la categorfa correspondiente a su edad (menos de 30 afios; entre 30 y 50; 0 més de 50). Se observs que 120 encuestados tenian menos de 30 atlos; 220 pertenecfan al grupo de edad de 30 a 50 anos: y 120 tenfan més de 50 afios. En el grupo de en: cuestados que tenfan menos de 30 alos, 60 se opontan al reseate, 40 no tenfan opinién y el resto estaba a fa- vor. En el grupo de encuestados de mAs de 50 aftos, dos lercios se opontan al rescate; el resto estaba a favor; y cen el grupo de edad de 30 a 50 aflos, el 60 % se oponta; el 10 % estaba a favor; y el resto no tenfa opinin. GExiste una relacién entre la opinién y Ia edad de los fencuestados? 14.65, Suponga que se toma una muestra aleatoria de empre- ‘as, a las que se les pide que indiquen si han reeurrido a una bolsa de empleo por Internet para buscar emplea- dos. Tambign se les hace preguntas sobre la tarifa que se paga por utilizar la pgina web. {Existe relacién en- tre el uso de una pagina web y la opinidn de los empre- sarios sobre la tarifa que se paga por utilizarla? “Ha recurrido a una bolsa de empleo Introduccion a la estadistica no paramétrica 688 1467. {Deben los grandes comercios minoristas ofrecer servi Cios bancarios? A los bancos pequefios les preocupa su futuro si entran mas comercios minoristas en el mundo de la banca, Suponga que una empresa de estudios de mercado ha realizado una encuesta nacional para un co- ‘mercio minorista que esté considerando la posibilidad de ofrecer servicios bancarios a sus clientes. Pide alos ‘encuestados que indiquen el proveedor (banco, comer= cio minorista, otros) al que recurtirfan con mayor pro- babilidad para ciertos servicios bancarios (suponiendo que la tarifa no influye). ;Existe alguna relacién entre estas dos variables? Proveedor ‘Comercio Servic Banco minorista Otro ‘Cuenta corriente 100 6 10 Cuenta de ahorro 85 25 45 Crédito hipotecario 30 10 80, 14.68. Muchos productos de adelgazamiento ripido no son is que ardides publicitarios que atraen a la gente con la esperanza de adelgazar répidamente. Suponga que se pregunta a una muestra aleatoria de habitantes de una ciudad si han utilizado alguna vez un producto para adelgazar répidamente. También se les pregunta si piiensan que se deben controlar més estrictamente los nuncios para prohibir la publicidad engaiosa de pro- dductos de adelgazamiento, ;Dependen las opiniones de net para buscar empleados? los encuestados sobre los controles de la publicidad de {que hayan utilizado 0 no un producto de adelgazamien- vita Si No to ripido? Latarifaes demasiado alta 36 50 {Ha uiilizado un producto” Latarifa es més de adelgazamiento ripido’ ‘©-menos correcta 2 8 Publicidad No Es necesario un control 14.66, Una empresa docidié averiguar si la rotaciGn de st ings stricto. 8s 40 equipo de ventas depende de la localizacién de las tien” No necesario das. La empresa decide anotar los meses de empleo de eae ies oe “a dos muestras, una de la tienda situada en el centro (la tienda emblemdtica, que se considera que se encuentra cen e] mejor emplazamiento) y otra de la tienda situada cen la zona residencial. ‘Tienda situada Tienda sitada enel centro cn la zona residencial 0, 11, 18, 19,5, 25, 60,7, 25, 60, 22, 24, 23, 36, 39, 15, 35, 16, 28, 9, 60, 29, 16, 22, 60, 17, 60, 32 8.17, 37.4.8, 28, 27, 11, 60,25, 5, 13, 22.17, 9.4 1, Baséndose en estos datos, ;serfa posible conetuir al nivel del 5 % que la localizacién influye en la reten- cin det personal? b. {Qué contraste utilizaria para demostrarlo? onamiento es uno de los métodos que ut ‘empresas en su intento de reducir los costes. Su ponga que la tabla de contingencia adjunta muestra el inmiero de despidos de tres fabricas durante los Gltimos. ccuatro meses y los meses de antigtiedad de los emplea- dos despedidos. {Existe alguna relacidn entre estas dos variables? Empresa Meses de antiguedad Bae Menos de 6 meses B30 1S Entre 6 meses y 110 Ms de 1 afto wo 9 4 14.70. 14.71, 14.72. 14.73, 14.74. 14.75. 14.76. Estadistica para administracion y economia Hace dos aos, el director de un supermercado local ‘que vende tres marcas nacionales (A, B y C) y una ‘marca blanca (D) de zumo de naranja observ6 que las marcas A y C se preferfan por igual; el 33 % preferia la marca B; y el 27 % preferfa la marca blanea D. Ahora el director piensa que han cambiado las preferencias de los clientes y que la preferencia por la marca blanca ha ‘aumentado y quizé contribuya positivamente al aumen- to de los beneficios. Los resultados de una muestra aleatoria reciente de compradores indican las siguientes, referencias Mareafavorta, ABC Nimero (marea blanca) 126 Han cambiado las preferencias de los clientes desde el estudio realizado hace dos afios? En el Ejemplo 14.2, se pidié a una muestra aleatoria de 200 personas que indicaran sus preferencias sobre las ‘chocolatinas. Suponga que también se recogieron datos demogrificos como el sexo. Se observs que de las 50 personas que preferfan Mr. Goodbar, el 20 % eran mu: Jeres; de las 93 que preferian Hershey's Milk Chocola: te, 70 eran mujeres; de las 45 que preferfan Hershey's Special Dark, el 80 % eran hombres; y del resto que preferfa Krackel, dos tercios eran hombres. ;Indican Tos datos que existe una asociaciGn entre las prefere cias sobre las chocolatinas y el sexo? 2QuE significa que un contraste no sea paramstrico? {iCudles son las ventajas relativas de esos contrastes? En una muestra aleatoria de 12 analistas, siete creen {que el prximo afio las ventas de automéviles en dos Unidos probablemente seran mayores que este ano, dos creen que serdn mucho menores y los dems pre- ‘vén que serdn mis 0 menos iguales que este afl. ;Qué conclusion podemos extraer de estos datos? En una muestra aleatoria de 16 analistas de los tipos de cambio. ocho ereen que el yen japonés serd una exc lente inversiGn este ao, cinco creen que ser una mala inversi6n y tres no tiene ninguna opinién decidida so- bre esta cuestiGn. Qué conclusiones podemos extraer de estos datos? En una muestra aleatoria de 100 estudiantes universita ios, 35 esperan lograr un nivel de vida ms alto que el de sus padres, 43 esperan tener un nivel de vida més. bajo y 22 esperan tener el mismo nivel de vida que sus padres. ;Son estos datos una prueba contundente de ‘que en la poblacién de estudiantes es mayor el mimero de estudiantes que esperan tener un nivel de vida més bajo que el de sus padres que el niimero de estudiantes {que esperan tener un nivel de vida més alto? En una muestra aleatoria de 120 profesores de adminis: lraci6n de empresas, 48 creen que la capacidad de and- lisis de los estudiantes ha mejorado en la dltima déca 147. da, 35 creen que ha empeorado y 37 no ven ningén cambio perceptible. Evalde la fuerza de Ia evidencia imwestral que Sugicre que el nimero de profesores que cereen que Ia capacidad de andlisis ha mejorado es ‘mayor que el niimero de profesores que creen que ha cempeorado, ‘Se pide a una muestra aleatoria de diez analistas de em- presas que valoren en una escala de 1 (muy malas) a 10 (muy buenas) las perspectivas de su propia empresa y las de la economfa en general en el presente afto. Los resultados obtenidos se muestran en la tabla adjunta, Utilizando el contraste de Wilcoxon basado en la orde- rnacién de las diferencias, analice la proposicién de que ‘en conjunto los analistas de empresas son més optimis- tas sobre las perspectivas de sus propias empresas que sobre las perspectivas de la economia en general ‘Analista __Propi sonomfa en general T 8 8 2 7 s 3 6 7 4 5 4 5 8 4 6 6 9 1 7 7 8 3 2 9 4 6 10 9 6 . Se consiruyen nueve pares de perfiles hipotéticos de cempleados de empresas que solicitan la admisién en un master de administraciGn de empresas. Dentro de cada par, los perfiles son idénticos; lo nico que varia es que tuno de los candidatos es un hombre y el otto es una mujer. En las entrevistas realizadas én el proceso de admisin, se evalia en una escala de 1 (poca) a 10 (i cha) la idoneidad de los candidatos para e! programa. Los resultados se muestran en Ia tabla adjunta. Analice estos datos utilizando el contraste de Wilcoxon basado en Ia ordenacidn de las diferencias, Entrevista Hombre Mujer v 8 8 2 9 10 3 1 5 4 4 7 5 8 8 6 9 9 7 5 3 8 4 5 9 6 2 Introduccion a la estadistica no paramétrica 687 14.79, Suponga que se seleccion6 aleatoriamente una muestra fpidudo as escrow FTC Tce naeree ee Horee de 513 individuos y se recogié informacién sobre el _método que utilizaban los sujetos para hacer una reser- ‘Agencia de viajes 36 74 ‘va en una compaiifa aérea (la reserva més reciente por Internet us 142 motivos de negocios o de placer) y su sexo. Contraste Llamas 0 la hipstesis nula de que no existe ninguna asociacién as esananel 66 ae centre estas dos caracteristicas. Los datos se resumen en Ja tabla adjunta: Bibliografia 1. Bera, A. K. y C. M. Jarque, 1981, «An Efficient Large-Sample Test for Normality of Observations and Regression Residuals», Working Papers in Economics and Econometrics, 40, Australian National University. 2. Butcher, Richard, Marketing Assistant. RELEVANT Magazine, 2011, www.RELEVANTmagazine.com 3. Guenther, P. M., J. Reedy, 8. M. Krebs-Smith, B. B. Reeve y P. P. Basiotis, 2007, Development and Evaluation of the Healthy Eating Index-2005: Technical Report, Center for Nutrition Policy and Promotion, U.S. Department of Agriculture. Puede consultarse en hutp://www enpp.usda.gov/HealthyEatingIndex.him, 4, Hu, Winnie, «Math That Moves: Schools Embrace the iPad», New York Times, 5 de enero de 2011, A16, También puede consultarse en htp/Avww.nytimes.com/201 1/01/0S/education/0Stablets.html (consultado el 23 de abril de 2011). 5. Jaggi, B. y P. Grier, 1980, «A Comparative Analysis of Forecast Disclosing and Nondisclosing Firms», Financial Management, 9 (2), pags. 38-43. 6. Michelson, Stuart, J. Stryker y B. Thorne, 2009, «The Sarbanes-Oxley Act of 2002: What Impact Has It Had on Small Business Firms?» Managerial Auditing Journal/Emerald Group Publishing Limited, 24 (8), pigs. 743-766, www.emeraldinsight.convmaj.htm. 7. Mosteller, F. y D. L. Wallace, 1994, Interference and Disputed Authorship: The Federalist, Reading, Mass, Addison-Wesley, Tablas 2.3 y 2.4, Permiso de reimpresién,

You might also like