Tres tipos de pruebas

‡ 1.- Independencia de dos variables categóricas ‡ 2.Homogeneidad de vectores de probabilidades ‡ 2.- Bondad de ajuste a proporciones o probabilidades especificas.

1

h G cal ! §§ i !1 j !1 . la prueba de independencia de criterios de clasificación es: 2 c Oi .O.. j Eij ! O.Prueba de independencia Ho: Pij = Pi Pj para toda celda ij ‡ Con datos de un proceso que se consideran representativos de una población iid.

O ij  Eij Eij 2 2 .

P 11 P 12 Pj 1 Ph 1 = P21 P22 = P2 j P2 h Pi1 Pi 2 Pij Pih Pc1 = Pc 2 Pcj Pch 3 .Prueba de homogeneidad ‡ Con muestras que se suponen representativas de c poblaciones que se muestrean independientemente. La prueba de homogeneidad de proporciones. Se efectúa igual que antes.

Bondad de Ajuste ‡ Se tiene una sola población con una variable categórica con K categorías Vector de probablidades o proporciones poblacionales P 1 P2 Pj PK P 1 Hipótesis de ajuste H: P 10 P20 = Pj 0 PK 0 4 P2 Pj PK .

y que se tienen K categorías de una variable categórica o también pueden ser K categorías de que resultan del cruce de dos o más variables categóricas. Considere que el tamaño de muestra es n. es el caso de variables aleatorias idénticas e independientemente distribuidas (iid). Esto se consigue con un muestreo de probabilidades iguales y con reemplazo o bien. se tiene una muestra disponible en la que se supone que se tiene una muestra aleatoria independiente. 5 . los alumnos de una escuela o las ratas de un laboratorio. Se considera que en la población se tienen las proporciones Pj desconocidas. en los que se supone que los elementos de que se dispone son una muestra aleatoria. Cuando se tiene una muestra representativa y los datos son independientes.Caso de muestras aleatorias con reemplazo. por ejemplo los pacientes de un servicio de un hospital. es decir representativa e independiente de una población de elementos semejantes a los que se tiene en el estudio.

en muestra en categoría k . . ambas tiene un comportamiento muy semejante. si la hipótesis es cierta 6 . de homogeneidad o de independencia se efectúan con el mismo tipo de estadística de prueba. K.Sean Ok=nk los casos observados. las proporciones muestrales Ok nk pk ! ! n n son estimadores insesgados y consistentes de las proporciones poblacionales Pk. En estos casos las pruebas de bondad de ajuste.. Así. con k= 1.. que puede ser la Ji cuadrada de Pearson o la de Razón de Verosimilitud. Se plantea la hipótesis sobre las Pk desconocidas y se estiman las proporciones que cumplen con la hipótesis PEk y con ellas las frecuencias esperadas Ek=n PEk. en una muestra de n.

GP ! § k !1 2 K .

Ok  Ek Ek K 2 K ! n§ k !1 .

si la hipótesis es cierta. se distribuyen como un Ji cuadrada con K-s grados de libertad (gl). 7 . de manera que se rechaza la hipótesis si la estadística de prueba es mayor que el cuantil 1.de la Ji cuadrada central con K-s gl. Si la hipótesis no es cierta se distribuyen como una Ji cuadrada no central.pk  p E k pE k 2 G RV 2 K Ok pk ! 2§ Ok log ! 2n§ pk log Ek pE k k !1 k !1 Estas estadísticas. en este caso los valores de la estadística tenderán a ser mas grandes que las de la Ji cuadrada central. donde s es el número de restricciones que se plantean en las proporciones que cumplen con la hipótesis. donde el alejamiento de la central es función del alejamiento de las proporciones verdaderas de las hipotéticas.

Sólo hay una restricción. la manera de obtener las proporciones estimadas que cumplen con la hipótesis PEk. Ho: Pk= Pko . Estudio descriptivo.Aun que la estadística de prueba tiene la misma forma. . K § Po k !1 k !1 por lo que s = 1. los esperados Ek=nPEk y los gl. Si es una prueba de bondad de ajuste de que las proporciones poblacionales son valores fijos desconocidos. entonces PEk=Pko y las frecuencias esperadas son Ek=nPko. cambian según el tipo de hipótesis. Se muestrea una sola población. 8 . Y los gl son K-1.

ya que además de sumar uno. en este caso el valor de Y o grupos de valores P de Y. las proporciones estimadas cumplen con el estimador del parámetro. ahora s =2 . en el que las categorías son números enteros de la variable. Si es una prueba de bondad de ajuste. 9 . En los grados de libertad.Estudio Descriptivo. por ejemplo casos de cáncer en un día dado en los hospitales de un tipo. y se quiere saber si se puede considerar que las proporciones poblacionales se ajustan a una distribución de Poison Py P (Y ! y ) ! e P y! Entonces se estima el parámetro y con él las probabilidades de cada celda. Se muestrea una sola población.

Estudio Comparativo. r pj ! § Ö k !1 nk p kj n. En cada población o renglón se estiman las proporciones poblacionales Pkj con pkj = Okj/nk.r. con rxc celdas o categorías. Pero la suma de las proporciones estimadas y esperadas por renglón es uno.. y para obtener los esperados se obtiene un promedio ponderado de las proporciones en las poblaciones renglones. 10 ... j=1.. para j=1. con muestra nk adecuada para dar buena precisión en las celdas de una variable categórica con c categorías.. . La hipótesis de homogeneidad establece que Pj1 =Pj2 =... Este diseño es llamado muestreo producto de multinomiales.=Pjr y esto para las c categorías. c.= Pjk=.c.. para cada categoría c... Se tienen r poblaciones o dominios k=1. en cada una de ellas. En este caso se tiene una tabla de contingencia con r renglones y c columnas.

E kj ! nk p j Ö Con estos valores como observados y esperados se obtiene las estadísticas de prueba.Entonces el valor esperado en cada celda es . En este caso los grados de libertad son rc-r-c+1=(r-1)(c-1) 11 .

de una sóla población y en cada elemento se miden dos variables categóricas. es decir el estar en una categoría de la primera variable no modifica las probabilidades de ocurrencia de las categorías de la otra variable. 12 . La hipótesis de interés es la de independencia. Si se toma una muestra de tamaño n. ésta se estima con Okj /n. que establece que las dos variables categóricas son independientes. este es el llamado muestreo multimomial.Estudio descriptivo. una con c categorías y la otra con r. Si en la población la proporción de casos en una celda es Pkj.

ignorando a la primera. c §n pk ! Ö j !1 kj n nk . j ! n 13 . entonces las proporciones estimadas que cumplen con la hipótesis se obtienen estimando las proporciones marginales. ignorando a la otra y Pj la proporción de casos en la categoría j de la segunda variable. ! n §n pj ! Ö k !1 r kj n n.Es decir p kj ! Ö nkj n ! Okj n La independencia implica que Pkj=PkPj . donde Pk y Pj son las probabilidades o proporciones marginales es decir Pk es la proporción de un elemento en categoría k de la primer variable.

se realiza la evaluación de la Ji cuadrada. n. j nk . j nk . ! Ekj ! np j pk ! n Ö Ö n n n con estos valores substituidos en la estadística de prueba. En este caso los grados de libertad también son (r-1)(c-1) 14 .Entonces la proporción de la celda hj estimada que cumple con la Hipótesis es p Ekj ! p k p j Ö Ö Ö y los esperados son n.

Sign up to vote on this title
UsefulNot useful