You are on page 1of 155

SPSS Modelos avanzados 12.

0

Si desea obtener más información sobre los productos de software de SPSS®, visite nuestra página Web en http://www.spss.com o póngase en contacto con SPSS Inc. 233 South Wacker Drive, 11th Floor Chicago, IL 60606-6412 Teléfono: (312) 651-3000 Fax: (312) 651-3668 SPSS es una marca registrada; los demás nombres de productos son marcas comerciales de SPSS Inc. para los programas de software de su propiedad. El material descrito en este software no puede ser reproducido ni distribuido sin la autorización expresa por escrito por parte de los propietarios de la marca registrada y de los derechos de la licencia en el software y en los copyrights de los materiales publicados. El SOFTWARE y la documentación se proporcionan con DERECHOS LIMITADOS. Su uso, duplicación o revelación por parte del Gobierno están sujetos a las restricciones establecidas en la subdivisión (c)(1)(ii) de la cláusula Rights in Technical Data and Computer Software en 52.227-7013. El fabricante es SPSS Inc., 233 South Wacker Drive, 11th Floor, Chicago, IL 60606-6412, EE.UU. Aviso general: El resto de los nombres de productos mencionados en este documento se utilizan sólo con fines identificativos y pueden ser marcas comerciales de sus respectivas empresas. TableLook es una marca comercial de SPSS Inc. Windows es una marca comercial registrada de Microsoft Corporation. DataDirect, DataDirect Connect, INTERSOLV y SequeLink son marcas comerciales registradas de DataDirect Technologies. Algunas partes de este producto se han creado utilizando LEADTOOLS © 1991-2000, LEAD Technologies, Inc. RESERVADOS TODOS LOS DERECHOS. LEAD, LEADTOOLS y LEADVIEW son marcas comerciales registradas de LEAD Technologies, Inc. Algunas partes de este producto están basadas en el trabajo de FreeType Team (http://www.freetype.org). Una parte del software de SPSS contiene tecnología zlib. Copyright © 1995-2002 de Jean-loup Gailly y Mark Adler. El software de zlib se proporciona “tal cual”, sin ningún tipo de garantía implícita o explícita. Los autores de zlib no serán responsables en ningún caso de los daños que puedan producirse por la utilización de este software. Una parte del software de SPSS contiene bibliotecas de tiempo de ejecución Java de Sun. Copyright © 2003 de Sun Microsystems, Inc. Reservados todos los derechos. Las bibliotecas de tiempo de ejecución Java de Sun incluyen código con licencia de RSA Security, Inc. Algunas partes de las bibliotecas tienen licencia de IBM y están disponibles en http://oss.software.ibm.com/icu4j/. Sun no ofrece ninguna garantía para el software. SPSS Modelos avanzados™ 12.0 Copyright © 2003 de SPSS Inc. Todos los derechos reservados. Impreso en Irlanda. Queda prohibida la reproducción, el almacenamiento en sistemas de recuperación o la transmisión de cualquier parte de esta publicación en cualquier forma y por cualquier medio (electrónico o mecánico, fotocopia, grabación o cualquier otro) sin previa autorización expresa y por escrito de parte del editor. 1 2 3 4 5 6 7 8 9 0 06 05 04 03 ISBN 1-56827-949-3

Prefacio

SPSS 12.0 es un paquete de software potente para la gestión y análisis de datos de microcomputadoras. La opción Modelos avanzados es una mejora añadida que proporcionan técnicas de análisis adicionales. Los procedimientos de Modelos avanzados se deben utilizar con SPSS 12.0 Base y están completamente integrados en dicho sistema. La opción Modelos avanzados incluye procedimientos para:
! ! ! !

Modelos lineales generales de medidas repetidas y multivariante Análisis de componentes de la varianza Modelos lineales mixtos Análisis loglineal, incluyendo el análisis loglineal de selección de modelo (jerárquico), el análisis de modelos loglineales generales y el análisis de modelos loglineales logit Análisis de regresión ordinal Análisis de supervivencia, que incluye tablas de mortalidad, análisis de supervivencia de Kaplan-Meier y regresión de Cox.

! !

Instalación

Para instalar Modelos avanzados, siga las indicaciones para añadir o eliminar funciones de las instrucciones de instalación que se suministran con SPSS Base. (Para comenzar, pulse dos veces en el icono de instalación de SPSS.)
iii

spss. Necesitará este número cuando se ponga en contacto con SPSS Inc. Tenga preparado su número de serie para identificarse. consulte la página Web de SPSS en http://www.com. formas de pago o actualización del sistema. póngase en contacto con su oficina local que encontrará en la página Web de SPSS en http://www. Para ponerse en contacto con el servicio de asistencia técnica.Compatibilidad SPSS está diseñado para ejecutarse en gran cantidad de sistemas de ordenadores. tanto públicos como in situ. o póngase en contacto con la oficina más cercana. a su organización y el número de serie de su sistema. El número de serie se incluye en el sistema SPSS Base. Asistencia técnica El servicio de asistencia técnica de SPSS está a disposición de todos los clientes registrados.com/worldwide. Estos cursos tendrán lugar periódicamente en las principales capitales. que encontrará en la página Web de SPSS en http://www. ofrece cursos de preparación. póngase en contacto con su oficina local.com/worldwide.spss. iv .com/worldwide.spss.spss. Servicio al cliente Si tiene cualquier duda referente a la forma de envío o pago. En todos los cursos habrá talleres prácticos. Números de serie El número de serie es su número de identificación con SPSS Inc. Los clientes pueden ponerse en contacto con el servicio técnico si desean recibir asistencia para utilizar los productos de SPSS o ayuda sobre la instalación en uno de los entornos de hardware admitidos. que encontrará en la página Web de SPSS en http://www. para recibir información sobre asistencia. Tenga preparada la información necesaria para identificarse personalmente. Consulte la documentación entregada con su sistema para obtener la información específica acerca de los requisitos mínimos y los recomendados. Cursos de preparación SPSS Inc. Si desea obtener más información sobre estos cursos.

Si desea obtener más información. será publicado por Prentice Hall.com o escriba a SPSS Inc. Nos interesa especialmente recibir noticias sobre aplicaciones nuevas e interesantes para el sistema SPSS.. Envíenos un correo electrónico a suggest@spss. 11th Floor. Las ilustraciones de los cuadros de diálogo están tomadas de SPSS para Windows.spss. Para pedidos telefónicos desde otros países. 233 South Wacker Drive. visite la página Web de SPSS en http://www. Díganos su opinión Sus comentarios son importantes. IL 60606-6412.0 Command Syntax Reference. seleccione su país y pulse Books).UU. SPSS Statistical Procedures Companion.com (pulse Store. Visite nuestra página Web en http://www. Contiene los conceptos básicos de los procedimientos de SPSS Base. Para pedidos telefónicos en Estados Unidos y Canadá. además de regresión logística.Publicaciones adicionales Puede adquirir copias adicionales de los manuales de los productos de SPSS directamente de SPSS Inc. llame a SPSS Inc. Acerca de este manual Este manual es la documentación de la interfaz gráfica del usuario para los procedimientos incluidos en el módulo Modelos avanzados.spss. modelos lineales generales y modelos lineales mixtos. EE. Attn. al 800-543-2185. Chicago. Los cuadros de diálogo de los demás sistemas operativos son similares. disponible en el CD-ROM del producto.com/estore o póngase en contacto con su oficina de SPSS local que encontrará en SPSS página Web en http://www.com/worldwide. póngase en contacto con la oficina más cercana que encontrará en la página Web de SPSS. por Marija Norusis. v .: Director of Product Planning. La Modelos avanzados sintaxis de los comandos se incluye en el manual SPSS 12.spss. Envíenos una carta y cuéntenos sus experiencias con los productos de SPSS.

Cómo ponerse en contacto con SPSS Si desea pertenecer a nuestra lista de correo. póngase en contacto con nuestras oficinas que encontrará en la página Web en http://www. Le remitiremos una copia de nuestro mensaje informativo y le enviaremos información sobre las actividades de SPSS Inc.spss. que se lleven a cabo en su área.com/worldwide. vi .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 Para obtener un análisis de las componentes de la varianza. . . . . . 3 2 MLG Medidas repetidas 19 MLG Medidas repetidas: Consideraciones sobre los datos . . . 41 4 Modelos lineales mixtos 49 Modelos lineales mixtos: Consideraciones sobre los datos . . 3 Para obtener un análisis de varianza MLG multivariante . . . . . . . . . . . . . . . . . . . 23 Para obtener un análisis MLG Medidas repetidas . . 50 Selección de variables de sujetos/repetidas para Modelos lineales mixtos . . . . . . . . . . . . . 50 Modelos lineales mixtos: Selección de las variables de Sujetos/Repetidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 MLG Medidas repetidas: Definir factores . . . . . 52 Obtención de un análisis de Modelos lineales mixtos . . . . 53 vii . 24 3 Análisis de componentes de la varianza 39 Componentes de la varianza: Consideraciones sobre los datos. . . .Contenido 1 Análisis MLG multivariante 1 MLG Multivariante: Consideraciones sobre los datos . . . . . . 22 Para definir los factores de un análisis MLG Medidas repetidas . . . . . . . . . . . . . . . . . . . . . .

. . . . . . . . 101 viii . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 6 Análisis loglineal general 73 Análisis loglineal general: Consideraciones sobre los datos . . . . . . . . . . . . . . . . . 83 8 Regresión ordinal 89 Regresión ordinal: Consideraciones sobre los datos . . . . . . . . 74 7 Análisis loglineal logit 81 Análisis loglineal logit: Consideraciones sobre los datos. . . . . . . . . .5 Análisis loglineal: Selección de modelo 67 Consideraciones sobre los datos de Análisis loglineal: Selección de modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 Para crear una tabla de mortalidad. . . . . . . . . . . . . . . . . . . 82 Para obtener un análisis loglineal logit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68 Para obtener una selección de modelo en el análisis loglineal . . . . . . . . . . . . . . . . . . 74 Para obtener un análisis loglineal general . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 9 Tablas de mortalidad 99 Tablas de mortalidad: Consideraciones sobre los datos . . . . . . . . . . . 90 Obtener una regresión ordinal . . . . . .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10 Análisis de supervivencia de Kaplan-Meier 105 Kaplan-Meier: Consideraciones sobre los datos . . . . . . . . . . . . . . . . . . . . . . . . . . 106 11 Análisis de regresión de Cox 113 Regresión de Cox: Consideraciones sobre los datos . . . . . . . . . . . . . . . . . . . . . . . . . . 114 12 Calcular covariable dependiente del tiempo 123 Para calcular una covariable dependiente del tiempo . . . . . . . . . . . . . . . 131 ix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 Para obtener un análisis de regresión de Cox . . . . 127 Simple . . . . . . . . . . . . . . . . . . . . . . 129 Diferencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 Helmert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 Polinómico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 106 Para obtener un análisis de supervivencia de Kaplan-Meier . . . . . . 124 Apéndices A Esquemas de codificación de variables categóricas 127 Desviación . . 130 Repetido .

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 B Estructuras de covarianza Índice 135 141 x . . . . . . . . . . . . . . . . . . . . . . . . . . .Especial . . 132 Indicador . . . . . . . . . . . . . . .

Capítulo Análisis MLG multivariante 1 El procedimiento MLG Multivariante proporciona un análisis de regresión y un análisis de varianza para variables dependientes múltiples por una o más covariables o variables de factor. Además de contratar hipótesis. se pueden incluir los efectos de las covariables y las interacciones de covariables con los factores. si una prueba F global ha mostrado cierta significación. la traza de Hotelling y el criterio de mayor raíz de Roy con el estadístico F aproximado. Asimismo puede investigar las interacciones entre los factores y también los efectos individuales de los factores. Se considera que un diseño está equilibrado si cada casilla del modelo contiene el mismo número de casos. Además. Las variables de factor dividen la población en grupos. las variables independientes (predictoras) se especifican como covariables. Para el análisis de regresión. Además. Las medias marginales estimadas ofrecen estimaciones de valores de las medias pronosticados para las casillas del modelo. En un modelo multivariado. MLG Multivariante genera estimaciones de los parámetros. se proporciona el análisis multivariado de varianzas usando la traza de Pillai. las sumas de cuadrados debidas a los efectos del modelo y las sumas de cuadrados error se encuentran en forma de matriz en lugar de en la forma escalar del análisis univariado. Utilizando este procedimiento del modelo lineal general. es posible contrastar hipótesis nulas sobre los efectos de las variables de factor sobre las medias de varias agrupaciones de una distribución conjunta de variables dependientes. Estas matrices se denominan matrices SCPC (sumas de cuadrados y productos cruzados). También se encuentran disponibles los contrastes a priori de uso más habitual para contrastar las hipótesis. pueden emplearse las pruebas post hoc para evaluar las diferencias entre las medias específicas. la lambda de Wilks. así como el análisis univariado de varianza para cada variable dependiente. los gráficos de perfil (gráficos de interacciones) de estas medias permiten observar fácilmente 1 . Si se especifica más de una variable dependiente. Se pueden contrastar tanto los modelos equilibrados como los no equilibrados.

Tipo III y Tipo IV pueden emplearse para evaluar las diferentes hipótesis. por ejemplo para compensar la distinta precisión de las medidas. la prueba de Levene sobre la homogeneidad de la varianza. Gabriel. Bonferroni. que es la forma tipificada de la matriz de covarianza residual. Métodos. GT2 de Hochberg. gráficos de residuos. . Duncan. Student-Newman-Keuls (S-N-K). gráficos de perfil (interacción). Ejemplo. También se hallan disponibles una matriz SCPC residual. Scheffé. y la matriz de correlaciones residual. pero que la interacción de los dos factores no es significativa. Tipo II. T2 de Tamhane. Se prueban dos tasas de extrusión y dos cantidades diferentes de aditivo y se miden las tres propiedades para cada combinación de tasa de extrusión y cantidad de aditivo. valores pronosticados. T3 de Dunnett. Un fabricante de plásticos mide tres propiedades de la película de plástico: resistencia. Las sumas de cuadrados de Tipo I. Las pruebas de comparaciones múltiples post hoc se realizan por separado para cada variable dependiente. que es una matriz cuadrada de las sumas de cuadrados y los productos cruzados de los residuos. Tipo III es el valor por defecto. brillo y opacidad. Estadísticos descriptivos: medias observadas. una matriz de covarianza residual. desviaciones típicas y recuentos de todas las variables dependientes en todas las casillas. Diferencia honestamente significativa de Tukey. distancia de Cook y valores de influencia como variables nuevas para comprobar los supuestos. la prueba M de Box sobre la homogeneidad de las matrices de covarianza de las variables dependientes. Sidak. y la prueba de esfericidad de Bartlett. Games-Howell y C de Dunnett. Múltiples F de Ryan-Einot-Gabriel-Welsch (R-E-G-W-F). Pruebas t de Waller Duncan. Estadísticos. En su archivo de datos puede guardar residuos. Rango múltiple de Ryan-Einot-Gabriel-Welsch. Dunnett (unilateral y bilateral). que es la matriz SCPC residual dividida por los grados de libertad de los residuos. El fabricante deduce que la tasa de extrusión y la cantidad de aditivo producen individualmente resultados significativos. Gráficos. Las pruebas de rango post hoc y las comparaciones múltiples: Diferencia menos significativa (DMS). Ponderación MCP permite especificar una variable usada para aplicar a las observaciones una ponderación diferencial en un análisis de mínimos cuadrados ponderados (MCP). Diagramas de dispersión por nivel. b de Tukey.2 Capítulo 1 algunas de estas relaciones.

Para obtener un análisis de varianza MLG multivariante E Elija en los menús: Analizar Modelo lineal general Multivariante. utilice MLG Factorial General. Los factores son categóricos y pueden tener valores numéricos o valores de cadena de hasta ocho caracteres. los datos son una muestra aleatoria de vectores de una población normal multivariada. También puede examinar los residuos y los gráficos de residuos. Para las variables dependientes. Para una variable dependiente única. Las variables dependientes deben ser cuantitativas. Las covariables son variables cuantitativas que están relacionadas con la variable dependiente.. Utilice el procedimiento Explorar para examinar los datos antes de realizar un análisis de varianza. las matrices de varianza-covarianza para todas las casillas son las mismas. . utilice MLG Medidas repetidas. Supuestos. Si ha medido las mismas variables dependientes en varias ocasiones para cada sujeto. Para comprobar los supuestos se pueden utilizar las pruebas de homogeneidad de varianzas (incluyendo la M de Box) y los gráficos de dispersión por nivel.3 Análisis MLG multivariante MLG Multivariante: Consideraciones sobre los datos Datos. en la población.. El análisis de varianza es robusto a las desviaciones de la normalidad. aunque los datos deberán ser simétricos. Procedimientos relacionados.

4 Capítulo 1 Figura 1-1 Cuadro de diálogo Multivariante E Seleccione al menos dos variables dependientes. puede especificar Factores fijos. . Covariables y Ponderación MCP. Si lo desea.

Factores y Covariables. Modelo. Seleccione Personalizado para especificar sólo un subconjunto de interacciones o para especificar interacciones factor por covariable. No contiene interacciones de covariable. puede elegir los efectos principales y las interacciones que sean de interés para el análisis. Muestra una lista de los factores y las covariables etiquetando con (F) los factores fijos y con (C) las covariables. puede excluir la intersección. Después de seleccionar Personalizado. Indique todos los términos que desee incluir en el modelo. El modelo depende de la naturaleza de los datos. Un modelo factorial completo contiene todos los efectos principales del factor. Si supone que los datos pasan por el origen. Determina el método para calcular las sumas de cuadrados. La intersección se incluye normalmente en el modelo. Para los modelos equilibrados o no equilibrados sin casillas perdidas.5 Análisis MLG multivariante MLG Multivariante: Modelo Figura 1-2 Cuadro de diálogo MLG Multivariante: Modelo Especificar modelo. Incluir la intersección en el modelo. . todos los efectos principales de las covariables y todas las interacciones factor por factor. el método más utilizado de suma de cuadrados es el Tipo III. Suma de cuadrados.

6 Capítulo 1 Construir términos Para las covariables y los factores seleccionados: Interacción. Este método también se conoce como el método de descomposición jerárquica de la suma de cuadrados. puede elegir un tipo de suma de cuadrados. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Crea todas las interacciones dobles posibles de las variables seleccionadas. ! ! . Crea un término de efectos principales para cada variable seleccionada. y así sucesivamente. Un modelo puramente anidado en el que el primer efecto especificado está anidado dentro del segundo efecto especificado. El Tipo III es el más utilizado y es el tipo predeterminado. El método Tipo I para la obtención de sumas de cuadrados se utiliza normalmente para: ! Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier efecto de interacción de primer orden. Cada término se corrige sólo para el término que le precede en el modelo. Sumas de cuadrados Para el modelo. Todas de 3. Todas de 4. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Un modelo de regresión polinómica en el que se especifica cualquier término de orden inferior antes que cualquier término de orden superior. Todas de 2. cualquier efecto de interacción de primer orden se especifica antes de cualquier efecto de interacción de segundo orden. Éste es el valor por defecto. Tipo I. Todas de 5. Crea todas las interacciones triples posibles de las variables seleccionadas. y así sucesivamente. Efectos principales. el segundo efecto especificado está anidado dentro del tercero.

El método Tipo II para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! ! ! Un modelo ANOVA equilibrado. Este método calcula cada suma de cuadrados del modelo considerando sólo los efectos pertinentes. Tipo IV. calcula las sumas de cuadrados de un efecto del diseño como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga y ortogonales respecto a cualquier efecto (si existe alguno) que lo contenga. Cuando F está contenida en otros efectos. Cualquier modelo de regresión. El método Tipo III para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I y Tipo II. Cualquier modelo equilibrado o desequilibrado sin casillas vacías. Tipo III. Un diseño puramente anidado (esta forma de anidación puede especificarse utilizando la sintaxis). El método Tipo IV para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I y Tipo II. Así. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el efecto que se está examinando. el Tipo IV distribuye equitativamente los contrastes que se realizan entre los parámetros en F a todos los efectos de nivel superior. Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla. . Cualquier modelo equilibrado o no equilibrado con casillas vacías.7 Análisis MLG multivariante Tipo II. Este método. Para cualquier efecto F del diseño. si F no está contenida en cualquier otro efecto. siempre que la forma general de estimabilidad permanezca constante. Este método está diseñado para una situación en la que faltan casillas. que es el predeterminado. este tipo de sumas de cuadrados se considera a menudo útil para un modelo no equilibrado sin casillas perdidas. entonces el Tipo IV = Tipo III = Tipo II. En un diseño factorial sin casillas perdidas. este método equivale a la técnica de cuadrados ponderados de las medias de Yates. Cualquier modelo que sólo tenga efectos de factor principal.

repetidos y polinómicos. Compara la media de cada nivel (excepto una categoría de referencia) con la media de todos los niveles (media global). de Helmert. Tipos de contrastes Desviación. El contraste de hipótesis se basa en la hipótesis nula LBM = 0. . Cuando se especifica un contraste. la traza de Hotelling y la mayor raíz de Roy. donde L es la matriz de coeficientes de contraste. Los niveles del factor pueden colocarse en cualquier orden. basados en la distribución t de Student para las diferencias de contraste en todas las variables dependientes. SPSS crea una matriz L de modo que las columnas correspondientes al factor coincidan con el contraste. M es la matriz identidad. la lambda de Wilks. Puede especificar un contraste para cada factor del modelo. Los contrastes representan las combinaciones lineales de los parámetros. Los contrastes disponibles son de desviación. El resto de las columnas se corrigen para que la matriz L sea estimable.8 Capítulo 1 MLG Multivariante: Contrastes Figura 1-3 Cuadro de diálogo MLG Multivariante: Contrastes Los contrastes se utilizan para comprobar si los niveles de un efecto son significativamente diferentes unos de otros. También se ofrecen las pruebas multivariadas que utilizan los criterios de la traza de Pillai. simples. En los contrastes de desviación y los contrastes simples. Se ofrecen la prueba univariada que utiliza los estadísticos F y los intervalos de confianza simultáneos de tipo Bonferroni. que tiene una dimensión igual al número de variables dependientes y B es el vector de parámetros. es posible determinar que la categoría de referencia sea la primera o la última categoría. de diferencias.

Compara el efecto lineal. Polinómico. cuadrático. cúbico. el segundo grado de libertad. El primer grado de libertad contiene el efecto lineal a través de todas las categorías. MLG Multivariante: Gráficos de perfil Figura 1-4 Cuadro de diálogo MLG Multivariante: Gráficos de perfil . Este tipo de contraste resulta útil cuando existe un grupo de control. (a veces también se denominan contrastes de Helmert inversos). etc. Compara la media de cada nivel (excepto el primero) con la media de los niveles anteriores (a veces también se denominan contrastes de Helmert inversos). Repetidas. Compara la media de cada nivel del factor (excepto el último) con la media de los niveles siguientes. Compara la media de cada nivel (excepto el último) con la media del nivel siguiente. y así sucesivamente. Helmert. Diferencia. Puede seleccionar la primera o la última categoría como referencia. Compara la media de cada nivel con la media de un nivel especificado.9 Análisis MLG multivariante Simple. Estos contrastes se utilizan a menudo para estimar las tendencias polinómicas. el efecto cuadrático.

Un gráfico de perfil es un gráfico de líneas en el que cada punto indica la media marginal estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un factor. Para dos o más factores. lo que significa que puede investigar los niveles de un único factor. para líneas distintas y para gráficos distintos. . Un gráfico de perfil de un factor muestra si las medias marginales estimadas aumentan o disminuyen a través de los niveles. Estos gráficos se crean para cada variable dependiente. Todos los factores fijos están disponibles para los gráficos. Figura 1-5 Gráfico no paralelo (izquierda) y gráfico paralelo (derecha) Después de especificar un gráfico seleccionando factores para el eje horizontal y. de manera opcional. Las líneas que se cruzan indican una interacción. Los niveles de un segundo factor se pueden utilizar para generar líneas diferentes.10 Capítulo 1 Los gráficos de perfil (gráficos de interacción) sirven para comparar las medias marginales en el modelo. las líneas paralelas indican que no existe interacción entre los factores. Cada nivel en un tercer factor se puede utilizar para crear un gráfico diferente. el gráfico debe añadirse a la lista Gráficos.

basada en el estadístico t de Student.11 Análisis MLG multivariante MLG Multivariante: Comparaciones múltiples post hoc de las medias observadas Figura 1-6 Cuadro de diálogo Comparaciones múltiples post hoc de las medias observadas Comparaciones múltiples post hoc. Para un número reducido de pares. Una vez que se ha determinado que existen diferencias entre las medias. Bonferroni es más potente. La prueba de Bonferroni. la prueba de la diferencia honestamente significativa de Tukey es más potente que la prueba de Bonferroni. La prueba t de Sidak ajusta también el nivel de significación y ofrece límites más rígidos que la prueba de Bonferroni. Las pruebas de comparaciones múltiples post hoc se realizan por separado para cada variable dependiente. En las pruebas de Bonferroni y de la diferencia honestamente significativa de Tukey se utilizan normalmente pruebas de comparaciones múltiples. La prueba de la diferencia honestamente significativa de Tukey utiliza el estadístico de rango estudentizado para hacer todas las comparaciones por parejas entre los grupos y calcula el porcentaje de error del experimento en relación con el porcentaje de error de todas las comparaciones por parejas. corrige el nivel crítico por el hecho de que se realizan comparaciones múltiples. Las comparaciones se realizan sobre valores sin corregir. . Cuando se contrasta un gran número de parejas de medias. las pruebas de rango post hoc y las comparaciones múltiples por parejas permiten determinar qué medias difieren. Estas pruebas sólo se utilizan para los factores inter-sujetos.

Si no son iguales. El resultado es que . R-E-G-W F se basa en una prueba F y R-E-G-W Q se basa en el rango estudentizado. utilice una prueba bilateral. Ryan. Estas pruebas son más potentes que las de rangos múltiples de Duncan y de Student-Newman-Keuls (que también son procedimientos múltiples por pasos). Del mismo modo. Para contrastar si la media en cualquier nivel del factor es menor que la de la categoría de control. para probar si la media de cualquier nivel del factor es mayor que la de la categoría de control. la de Student-Newman-Keuls (S-N-K) y la b de Tukey son pruebas de rangos que asignan rangos a medias de grupo y calculan un valor de rango. pero se utiliza el módulo máximo estudentizado. Si lo desea. La prueba de comparación por parejas de Gabriel también utiliza el módulo máximo estudentizado y es generalmente más potente que la GT2 de Hochberg cuando los tamaños de las casillas son desiguales. Los procedimientos múltiples por pasos contrastan en primer lugar si todas las medias son iguales. Asimismo. no sólo las comparaciones por parejas disponibles en esta función. puede elegir una prueba unilateral o bilateral. Cuando las varianzas no son iguales. La prueba t de Waller-Duncan utiliza una aproximación Bayesiana. la prueba de Tukey es más potente.12 Capítulo 1 GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de Tukey. Normalmente. prueba de comparaciones por parejas de Games-Howell (a veces liberal) o C de Dunnett (prueba de comparaciones por parejas basada en el rango estudentizado). Einot. La prueba t de comparación múltiple por parejas de Dunnett compara un conjunto de tratamientos con una media de control simple. El nivel de significación de la prueba de Scheffé está diseñado para permitir todas las combinaciones lineales posibles de las medias de grupo que se van a contrastar. seleccione > Control. La última categoría es la categoría de control por defecto. pero no son aconsejables si los tamaños de las casillas son desiguales. Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos múltiples por pasos. utilice T2 de Tamhane (prueba conservadora de comparaciones por parejas basada en una prueba t). seleccione < Control. Esta prueba de rango emplea la media armónica del tamaño muestral cuando los tamaños muestrales no son iguales. T3 de Dunnett (prueba de comparaciones por parejas basada en el módulo máximo estudentizado). La prueba de Gabriel se puede convertir en liberal cuando los tamaños de las casillas varían mucho. Estas pruebas no se utilizan con tanta frecuencia como las pruebas explicadas previamente. La prueba de rangos múltiples de Duncan. puede seleccionar la primera categoría. se contrasta la igualdad en los subconjuntos de medias. Para comprobar que la media de cualquier nivel del factor (excepto la categoría de control) no es igual a la de la categoría de control.

Se proporcionan comparaciones por parejas para DMS. Games y Howell. Duncan. Muchas de estas variables se pueden utilizar para examinar supuestos sobre los datos. También se facilitan subconjuntos homogéneos para las pruebas de rango para S-N-K. R-E-G-W Q y Waller. Tukeyb de Tukey. MLG Multivariante: Guardar Figura 1-7 Cuadro de diálogo MLG Multivariante: Guardar Es posible guardar los valores pronosticados por el modelo. R-E-G-W F. guárdelos en el archivo de datos actual. Pruebas que se muestran. La desventaja de esta prueba es que no se realiza ningún intento de corregir el nivel crítico para realizar las comparaciones múltiples. C y T3 de Dunnett. la prueba de Gabriel y la prueba de Scheffé son tanto pruebas de comparaciones múltiples como de rango. GT2 de Hochberg. La prueba de comparaciones múltiples por parejas de la diferencia menos significativa (DMS) es equivalente a múltiples pruebas t individuales entre todas las parejas de grupos. . Bonferroni. La prueba de la diferencia honestamente significativamente de Tukey. los residuos y las medidas relacionadas como variables nuevas en el Editor de datos. lo que significa que se precisa una mayor diferencia entre las medias para la significación. Si desea almacenar los valores para utilizarlos en otra sesión de SPSS.13 Análisis MLG multivariante la prueba de Scheffé es normalmente más conservadora que otras pruebas. Sidak. T2 y T3 de Tamhane.

Si ha seleccionado una variable MCP. Son los valores que predice el modelo para cada caso. dispondrá asimismo de la opción de valores pronosticados no tipificados ponderados. ! Residuos no tipificados. Si ha seleccionado una variable MCP (WLS). Los residuos no tipificados ponderados. dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes. Diferencia entre un valor observado y el valor pronosticado por el modelo. También se encuentran disponibles residuos eliminados. Residuo dividido por una estimación de su desviación típica que varía de caso en caso. Es igual a la diferencia entre el valor de la variable dependiente y el valor pronosticado corregido. Residuos. ! Residuo eliminado. Sólo están disponibles si se seleccionó previamente una variable de ponderación WLS. contará además con residuos no tipificados ponderados. Diagnósticos. estudentizados y tipificados. ! Residuo estudentizado. Medida de cuánto cambiarían los residuos de todos los casos si se excluyera un caso determinado del cálculo de los coeficientes de regresión. ! Tipificados. Son medidas para identificar casos con combinaciones poco usuales de valores para las variables independientes y casos que puedan tener un gran impacto en el modelo. Las opciones disponibles incluyen la distancia de Cook y los valores de influencia no centrados.14 Capítulo 1 Valores pronosticados. ! Distancia de Cook. Guardar en archivo nuevo. para cada variable dependiente habrá una fila de estimaciones de los parámetros. Graba un archivo de datos de SPSS que contiene una matriz de varianza-covarianza de las estimaciones de los parámetros del modelo. Influencia relativa de una observación en el ajuste del modelo. El residuo dividido por una estimación de su error típico. Están disponibles los valores pronosticados no tipificados y los errores tipificados de los valores pronosticados. ! Valor de influencia. Una distancia de Cook grande indica que la exclusión de ese caso del cálculo de los estadísticos de regresión hará variar substancialmente los coeficientes. Residuo para un caso cuando éste se excluye del cálculo de los coeficientes de regresión. Asimismo. una fila de valores de significación para los estadísticos t correspondientes a las . ! Residuos ponderados. Los residuos tipificados se conocen también como residuos de Pearson. Un residuo no tipificado es el valor real de la variable dependiente menos el valor pronosticado por el modelo.

existen filas similares para cada variable dependiente. Medias marginales estimadas. Las interacciones sólo están disponibles si se ha especificado un modelo personalizado. si las hay. MLG Multivariante: Opciones Figura 1-8 Cuadro de diálogo MLG Multivariante: Opciones Este cuadro de diálogo contiene estadísticos opcionales. Proporciona comparaciones por parejas no corregidas entre las medias marginales estimadas para cualquier efecto principal del modelo. Puede utilizar estos datos en otros procedimientos de SPSS. Los estadísticos se calculan utilizando un modelo de efectos fijos. En un modelo multivariado.15 Análisis MLG multivariante estimaciones de los parámetros y una fila de grados de residuos de libertad. Seleccione los factores e interacciones para los que desee obtener estimaciones de las medias marginales de la población en las casillas. ! Comparar los efectos principales. tanto para los factores inter-sujetos como para los intra-sujetos. . Estas medias se corrigen respecto a las covariables.

desviaciones típicas y frecuencias para cada variable dependiente en todas las celdas.16 Capítulo 1 Este elemento sólo se encuentra disponible si los efectos principales están seleccionados en la lista Mostrar las medias para. Asimismo. los intervalos de confianza y la potencia observada para cada prueba. Seleccione Gráficos de los residuos para producir un gráfico de los residuos observados respecto a los pronosticados respecto a los tipificados para cada variable dependiente. Seleccione un ajuste de diferencia menor significativa (DMS). Seleccione Estimaciones de los parámetros para generar las estimaciones de los parámetros. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hipótesis alternativa se ha establecido basándose en el valor observado. Se pueden mostrar Matrices SCPC de error y de hipótesis y la Matriz SCPC residual más la prueba de esfericidad de Bartlett de la matriz de covarianza residual. La opción Estimaciones del tamaño del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimación de parámetros. Bonferroni o Sidak para los intervalos de confianza y la significación. los errores típicos. La función estimable general permite construir pruebas de hipótesis personales basadas en la función estimable general. El valor especificado también se utiliza para calcular la potencia observada . las pruebas t. Las opciones de diagramas de dispersión por nivel y gráfico de los residuos son útiles para comprobar los supuestos sobre los datos. Seleccione la Prueba de falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relación entre la variable dependiente y las variables independientes. Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos sólo para factores inter-sujetos. Estos gráficos son útiles para investigar el supuesto de varianzas iguales. Seleccione Estadísticos descriptivos para producir medias observadas. Nivel de significación. Las filas en las matrices de coeficientes de contraste son combinaciones lineales de la función estimable general. las pruebas de homogeneidad incluyen la prueba M de Box sobre la homogeneidad de las matrices de covarianza de las variables dependientes a lo largo de todas las combinaciones de niveles de los factores inter-sujetos. Puede que le interese corregir el nivel de significación usado en las pruebas post hoc y el nivel de confianza empleado para construir intervalos de confianza. Estos elementos no estarán activado si no hay factores. Este elemento sólo estará disponible si se selecciona Comparar los efectos principales. ! Ajuste del intervalo de confianza. Mostrar. El estadístico eta cuadrado describe la proporción de variabilidad total atribuible a un factor.

. una matriz M o una matriz K (utilizando los subcomandos LMATRIX. ! ! Construir un archivo de datos matricial que contenga estadísticos de la tabla de ANOVA inter-sujetos (utilizando el subcomando OUTFILE). Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING). ! Especificar nombres para las variables temporales (utilizando el subcomando SAVE). ! Construir una matriz L. Especificar términos de error para las comparaciones post hoc (utilizando el subcomando POSTHOC).17 Análisis MLG multivariante para la prueba. multivariados o de medidas repetidas. Especificar contrastes de los efectos respecto a una combinación lineal de efectos o un valor (utilizando el subcomando TEST). Guardar la matriz del diseño en un nuevo archivo de datos (utilizando el subcomando OUTFILE). Si especifica un nivel de significación. Funciones adicionales del comando GLM Estas funciones se pueden aplicar a los análisis univariados. Especificar contrastes múltiples (utilizando el subcomando CONTRAST). El lenguaje de comandos de SPSS también permite: ! ! ! ! ! Especificar efectos anidados en el diseño (utilizando el subcomando DESIGN). Especificar la métrica para los contrastes polinómicos (utilizando el subcomando CONTRAST). ! Construir un archivo de datos matricial de correlaciones (utilizando el subcomando OUTFILE). el cuadro de diálogo mostrará el nivel asociado de los intervalos de confianza. Especificar criterios EPS (mediante el subcomando CRITERIA). ! ! ! Especificar una categoría de referencia intermedia (utilizando el subcomando CONTRAST para los contrastes de desviación o simples). ! Calcular medias marginales estimadas para cualquier factor o interacción entre los factores en la lista de factores (utilizando el subcomando EMMEANS). MMATRIX o KMATRIX).

consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). .18 Capítulo 1 Si desea información completa sobre la sintaxis.

si una prueba F global ha mostrado cierta significación. 19 . También se pueden incluir los efectos de covariables constantes y de las interacciones de las covariables con los factores inter-sujetos. Estas matrices se denominan matrices SCPC (sumas de cuadrados y productos cruzados). las sumas de cuadrados debidas a los efectos del modelo y las sumas de cuadrados error se encuentran en forma de matriz en lugar de en la forma escalar del análisis univariado. puede contrastar hipótesis nulas sobre los efectos tanto de los factores inter-sujetos como de los factores intra-sujetos. MLG Medidas repetidas genera estimaciones de los parámetros. El procedimiento MLG Medidas repetidas ofrece análisis univariados y multivariados para datos de medidas repetidas. Se pueden contrastar tanto los modelos equilibrados como los no equilibrados. las variables dependientes representan medidas de más de una variable para los diferentes niveles de los factores intra-sujetos. Si se especifican factores inter-sujetos. Además. pueden emplearse las pruebas post hoc para evaluar las diferencias entre las medias específicas. En un modelo multivariado. En un diseño doblemente multivariado de medidas repetidas. Se considera que un diseño está equilibrado si cada casilla del modelo contiene el mismo número de casos.Capítulo MLG Medidas repetidas 2 El procedimiento MLG Medidas repetidas proporciona un análisis de varianza cuando se toma la misma medida varias veces a cada sujeto o caso. Se encuentran disponibles los contrastes a priori utilizados habitualmente para elaborar hipótesis que contrastan los factores inter-sujetos. éstos dividen la población en grupos. Además de contrastar las hipótesis. se pueden haber medido el pulso y la respiración de cada sujeto en tres momentos diferentes. los gráficos de perfil (gráficos de interacciones) de estas medias permiten observar fácilmente algunas de estas relaciones. Por ejemplo. Asimismo puede investigar las interacciones entre los factores y también los efectos individuales de los factores. Las medias marginales estimadas ofrecen estimaciones de valores de las medias pronosticados para las casillas del modelo. Utilizando este procedimiento del modelo lineal general.

Las sumas de cuadrados de Tipo I. T3 de Dunnett. Tipo III y Tipo IV pueden emplearse para evaluar las diferentes hipótesis. GT2 de Hochberg. . que es una matriz cuadrada de las sumas de cuadrados y los productos cruzados de los residuos. Diagramas de dispersión por nivel. y la prueba de esfericidad de Mauchly. Ejemplo. Gabriel. Duncan. Estadísticos descriptivos: medias observadas. Se asignan doce estudiantes a un grupo de alta o de baja ansiedad basándose en las puntuaciones obtenidas en una prueba de nivel de ansiedad. valores pronosticados. y la matriz de correlaciones residual. Student-Newman-Keuls (S-N-K). Rango múltiple de Ryan-Einot-Gabriel-Welsch. Scheffé. por ejemplo para compensar la distinta precisión de las medidas. Pruebas t de Waller Duncan. desviaciones típicas y recuentos de todas las variables dependientes en todas las casillas. Tipo II. la prueba de Levene sobre la homogeneidad de la varianza. Se descubre que el efecto de los ensayos es significativo. Estadísticos. El nivel de ansiedad es un factor inter-sujetos porque divide a los sujetos en grupos. Games-Howell y C de Dunnett. Bonferroni. Tipo III es el valor por defecto.20 Capítulo 2 En su archivo de datos puede guardar residuos. Métodos. Ponderación MCP permite especificar una variable usada para aplicar a las observaciones una ponderación diferencial en un análisis de mínimos cuadrados ponderados (MCP). Sidak. la M de Box. También se hallan disponibles una matriz SCPC residual. b de Tukey. T2 de Tamhane. que es la forma tipificada de la matriz de covarianza residual. distancia de Cook y valores de influencia como variables nuevas para comprobar los supuestos. que es la matriz SCPC residual dividida por los grados de libertad de los residuos. Gráficos. Diferencia honestamente significativa de Tukey. gráficos de residuos. Los errores de cada ensayo se registran en variables distintas y se define un factor intra-sujetos (ensayo) con cuatro niveles para cada uno de los cuatro ensayos. una matriz de covarianza residual. A cada estudiante se le dan cuatro ensayos para una determinada tarea de aprendizaje y se registra el número de errores por ensayo. Múltiples F de Ryan-Einot-Gabriel-Welsch (R-E-G-W-F). Pruebas de rango post hoc y comparaciones múltiples (para los factores inter-sujetos): Diferencia menos significativa (DMS). Dunnett (unilateral y bilateral). mientras que la interacción ensayo-ansiedad no es significativa. gráficos de perfil (interacción).

Se define un factor intra-sujetos para el grupo con el número de niveles igual al número de repeticiones. que realiza una prueba de esfericidad sobre la matriz de varianza-covarianza de la variable dependiente transformada y ortonormalizada. En las muestras de tamaño reducido. el número total de medidas sería 12 para cada sujeto. Por ejemplo. Los factores intra-sujetos se definen en el cuadro de diálogo MLG Medidas repetidas: Definir factores. La prueba de Mauchly aparece automáticamente en el análisis de medidas repetidas. Se realizan ciertos supuestos sobre la matriz de varianza-covarianza de las variables dependientes. Para un análisis de medidas repetidas. Supuestos. las covariables deberán permanecer constantes en cada nivel de la variable intra-sujetos. 1979). Para contrastar este supuesto se puede utilizar la prueba de esfericidad de Mauchly. Las variables dependientes deben ser cuantitativas. Un análisis de medidas repetidas se puede enfocar de dos formas: univariado y multivariado. El archivo de datos debe contener un conjunto de variables para cada grupo de medidas tomadas a los sujetos.21 MLG Medidas repetidas MLG Medidas repetidas: Consideraciones sobre los datos Datos. El conjunto tiene una variable para cada repetición de la medida dentro del grupo. Las medidas en un sujeto deben ser una muestra de una distribución normal multivariada y las matrices de varianza-covarianza son las mismas en todas las casillas formadas por los efectos inter-sujetos. Las covariables son variables cuantitativas que están relacionadas con la variable dependiente. el factor intra-sujetos podría especificarse como día con cinco niveles. El enfoque univariado (también conocido como la aproximación de modelo mixto o split-plot) considera las variables dependientes como respuestas a los niveles de los factores intra-sujetos. Los factores inter-sujetos dividen la muestra en subgrupos discretos. Para múltiples factores intra-sujetos. esta prueba no resulta muy potente. se podrían tomar medidas del peso en días diferentes. si las mediciones se tomaran en tres momentos diferentes del día durante cuatro días. la prueba puede . En las de gran tamaño. Estos factores son categóricos y pueden tener valores numéricos o valores de cadena de hasta ocho caracteres. Por ejemplo. Si las medidas de esa misma propiedad se han tomado durante cinco días. como hombre y mujer. La validez del estadístico F utilizado en el enfoque univariado puede garantizarse si la matriz de varianza-covarianza es de forma circular (Huynh y Mandeville. el número de medidas de cada sujeto es igual al producto del número de niveles de cada factor. Los factores intra-sujetos podrían especificarse como día(4) y mediciones(3).

Observe que estos factores no son las variables existentes en sus datos. El enfoque multivariado considera que las medidas de un sujeto son una muestra de una distribución normal multivariada y las matrices de varianza-covarianza son las mismas en todas las casillas formadas por los efectos inter-sujetos. . Se encuentran disponibles tres estimaciones para dicha corrección. Si no existen medidas repetidas para cada sujeto. se puede realizar una corrección en los grados de libertad del numerador y del denominador para validar el estadístico F univariado. En un estudio sobre la pérdida de peso. Este cuadro de diálogo permite definir uno o varios factores intra-sujetos para utilizarlos en MLG Medidas repetidas. Para contrastar si las matrices de varianza-covarianza de todas las casillas son las mismas. Si sólo existen dos medidas para cada sujeto (por ejemplo. Los factores intra-sujetos deben definirse en este cuadro de diálogo. se puede utilizar la prueba M de Box. Sin embargo. En el archivo de datos. peso2. Para utilizar Medidas repetidas. Los pesos.22 Capítulo 2 ser significativa incluso si es pequeño el impacto de la desviación en los resultados. cada persona es un sujeto o caso. sino los factores que deberá definir aquí. Tenga en cuenta que el orden en el que se especifiquen los factores intra-sujetos es importante. El sexo de cada persona se registra en otra variable. etc. suponga que se mide cada semana el peso de varias personas durante cinco semanas. Cada factor constituye un nivel dentro del factor precedente. se puede asumir la hipótesis de esfericidad. en el procedimiento MLG Medidas repetidas. MLG Medidas repetidas: Definir factores MLG Medidas repetidas analiza grupos de variables dependientes relacionadas que representan diferentes medidas del mismo atributo. denominada épsilon. Los pesos de las distintas semanas se registran en las variables peso1. Ejemplo. si la significación es pequeña y parece que se ha violado el supuesto de esfericidad. Utilice el procedimiento Explorar para examinar los datos antes de realizar un análisis de varianza. deberá definir los datos correctamente. un pre-test y un post-test ) y no hay factores inter-sujetos. Los grados de libertad tanto del numerador como del denominador deben multiplicarse por épsilon y la significación del cociente F debe evaluarse con los nuevos grados de libertad. puede utilizar el procedimiento Prueba T para muestras relacionadas. utilice MLG Univariante o MLG Multivariante. Procedimientos relacionados. Si la significación de la prueba es grande.

para estudiar las diferencias entre hombres y mujeres.. La variable del archivo de datos que agrupa a hombres y mujeres (sexo) puede especificarse como un factor inter-sujetos. defina las medidas. ... En el cuadro de diálogo principal. . Figura 2-1 Cuadro de diálogo MLG Medidas repetidas: Definir factores E Escriba un nombre para el factor intra-sujetos y su número de niveles. Si los sujetos se comparan en más de una medida cada vez... se podría medir el ritmo de la respiración y el pulso para cada sujeto todos los días durante una semana. las variables peso1. peso5 se utilizan para asignar los cinco niveles de semana. Este factor podría denominarse semana. Por ejemplo. definido con cinco niveles. E Pulse en Añadir. se pueden agrupar definiendo un factor intra-sujetos. Medidas. Un modelo con más de una medida a veces se denomina modelo doblemente multivariado de medidas repetidas. El nombre de las medidas no existen como un nombre de variables en el propio archivo de datos sino se define aquí.23 MLG Medidas repetidas medidos repetidamente para cada sujeto. Para definir los factores de un análisis MLG Medidas repetidas E Elija en los menús: Analizar Modelo lineal general Medidas repetidas.

24 Capítulo 2 E Repita estos pasos para cada factor intra-sujetos. medidas). Para definir factores de medidas en un diseño doblemente multivariado de medidas repetidas: E Escriba el nombre de la medida. de forma opcional. Para cambiar las posiciones de las variables. E Pulse en Añadir. Después de definir todos los factores y las medidas: E Pulse en Definir. Para obtener un análisis MLG Medidas repetidas Figura 2-2 Cuadro de diálogo MLG Medidas repetidas E Seleccione en la lista una variable dependiente que corresponda a cada combinación de factores intra-sujetos (y. utilice las flechas arriba y abajo. .

Seleccione Personalizado para especificar sólo un subconjunto de interacciones o para especificar interacciones factor por covariable. No contiene interacciones de covariable. Indique todos los términos que desee incluir en el modelo. Inter-sujetos. El modelo depende de la naturaleza de los datos. Las covariables aparecen con una (C). Un modelo factorial completo contiene todos los efectos principales del factor. Si lo desea. puede seleccionar los efectos y las interacciones intra-sujetos y los efectos y las interacciones inter-sujetos que sean de interés para el análisis. todos los efectos principales de las covariables y todas las interacciones factor por factor. puede especificar covariables y factores inter-sujetos. puede volver a abrir el cuadro de diálogo MLG Medidas repetidas: Definir factores sin cerrar el cuadro de diálogo principal. Tras elegir Personalizado.25 MLG Medidas repetidas Para realizar cambios en los factores intra-sujetos. MLG Medidas repetidas: Modelo Figura 2-3 Cuadro de diálogo MLG Medidas repetidas: Modelo Especificar modelo. Modelo. .

y así sucesivamente. Todas de 2. puede elegir un tipo de suma de cuadrados. Todas de 3. Éste es el valor por defecto. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Efectos principales. Crea todas las interacciones dobles posibles de las variables seleccionadas. Este método también se conoce como el método de descomposición jerárquica de la suma de cuadrados. El método Tipo I para la obtención de sumas de cuadrados se utiliza normalmente para: ! Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier efecto de interacción de primer orden. Crea un término de efectos principales para cada variable seleccionada. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Construir términos Para las covariables y los factores seleccionados: Interacción. Determina el método de cálculo de las sumas de cuadrados para el modelo inter-sujetos. Crea todas las interacciones triples posibles de las variables seleccionadas. Para los modelos inter-sujetos equilibrados y no equilibrados sin casillas perdidas. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Tipo I. Todas de 5. el método más utilizado para la suma de cuadrados es el Tipo III. Todas de 4. Cada término se corrige sólo respecto al término que le precede en el modelo. El Tipo III es el más utilizado y es el tipo predeterminado. . Sumas de cuadrados Para el modelo.26 Capítulo 2 Suma de cuadrados. cualquier efecto de interacción de primer orden se especifica antes de cualquier efecto de interacción de segundo orden.

este método equivale a la técnica de cuadrados ponderados de las medias de Yates. Este método calcula cada suma de cuadrados del modelo considerando sólo los efectos pertinentes. si F no está contenida en cualquier otro efecto. Cuando F está contenida en otros efectos. entonces el Tipo IV = Tipo III = Tipo II. Cualquier modelo equilibrado o desequilibrado sin casillas vacías. Cualquier modelo que sólo tenga efectos de factor principal. Un modelo puramente anidado en el que el primer efecto especificado está anidado dentro del segundo efecto especificado. Esta forma de anidamiento puede especificarse utilizando la sintaxis. este tipo de sumas de cuadrados se considera a menudo útil para un modelo no equilibrado sin casillas perdidas. El método Tipo II para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! ! ! Un modelo ANOVA equilibrado. Tipo IV. que es el predeterminado. el segundo efecto especificado está anidado dentro del tercero. Este método está diseñado para una situación en la que faltan casillas. Así. Un diseño puramente anidado (esta forma de anidación puede especificarse utilizando la sintaxis). calcula las sumas de cuadrados de un efecto del diseño como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga y ortogonales respecto a cualquier efecto (si existe alguno) que lo contenga.27 MLG Medidas repetidas ! ! Un modelo de regresión polinómica en el que se especifica cualquier término de orden inferior antes que cualquier término de orden superior. y así sucesivamente. Tipo II. Este método. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis. Un efecto pertinente es el que corresponde a todos los efectos que no contienen el efecto que se está examinando. El método Tipo III para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I y Tipo II. Cualquier modelo de regresión. siempre que la forma general de estimabilidad permanezca constante. Para cualquier efecto F del diseño. Tipo III. el Tipo IV distribuye equitativamente los contrastes que se realizan entre los parámetros en F a . Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla. En un diseño factorial sin casillas perdidas.

Puede especificar un contraste para cada factor inter-sujetos del modelo. Los contrastes disponibles son de desviación. El contraste de hipótesis se basa en la hipótesis nula LBM = 0. la matriz M será (0. es posible determinar que la categoría de referencia sea la primera o la última categoría. de Helmert. si existen cuatro variables dependientes. SPSS crea una matriz L de modo que las columnas correspondientes al factor inter-sujetos coincidan con el contraste. repetidos y polinómicos. Puede mostrar esta matriz de transformación seleccionando la opción Matriz de transformación en el cuadro de diálogo MLG Medidas repetidas: Opciones.28 Capítulo 2 todos los efectos de nivel superior. Cuando se especifica un contraste. Los contrastes representan las combinaciones lineales de los parámetros. B es el vector de parámetros y M es la matriz promedio que corresponde a la transformación promedio para la variable dependiente. El método Tipo IV para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I y Tipo II. En los contrastes de desviación y los contrastes simples. de diferencias. un factor intra-sujetos de cuatro niveles y se utilizan contrastes polinómicos (valor por defecto) para los factores intra-sujetos. MLG Medidas repetidas: Contrastes Figura 2-4 Cuadro de diálogo MLG Medidas repetidas: Contrastes Los contrastes se utilizan para contrastar las diferencias entre los niveles de un factor inter-sujetos. simples. Por ejemplo.5)'. . Cualquier modelo equilibrado o no equilibrado con casillas vacías. El resto de las columnas se corrigen para que la matriz L sea estimable.5 0. donde L es la matriz de coeficientes de contraste.5 0.

El primer grado de libertad contiene el efecto lineal a través de todas las categorías. el segundo grado de libertad. etc. el efecto cuadrático. (a veces también se denominan contrastes de Helmert inversos). Puede seleccionar la primera o la última categoría como referencia. Compara el efecto lineal.29 MLG Medidas repetidas Tipos de contrastes Desviación. Repetidas. Polinómico. Helmert. Compara la media de cada nivel (excepto el primero) con la media de los niveles anteriores (a veces también se denominan contrastes de Helmert inversos). Compara la media de cada nivel (excepto una categoría de referencia) con la media de todos los niveles (media global). cuadrático. cúbico. Simple. Compara la media de cada nivel (excepto el último) con la media del nivel siguiente. Compara la media de cada nivel del factor (excepto el último) con la media de los niveles siguientes. . y así sucesivamente. Estos contrastes se utilizan a menudo para estimar las tendencias polinómicas. Los niveles del factor pueden colocarse en cualquier orden. Compara la media de cada nivel con la media de un nivel especificado. Este tipo de contraste resulta útil cuando existe un grupo de control. Diferencia.

lo que significa que puede investigar los niveles de un único factor. las líneas paralelas indican que no existe interacción entre los factores. Los niveles de un segundo factor se pueden utilizar para generar líneas diferentes. Un gráfico de perfil de un factor muestra si las medias marginales estimadas aumentan o disminuyen a través de los niveles. Un gráfico de perfil es un gráfico de líneas en el que cada punto indica la media marginal estimada de una variable dependiente (corregida respecto a las covariables) en un nivel de un factor. Para dos o más factores. Las líneas no paralelas indican una interacción.30 Capítulo 2 MLG Medidas repetidas: Gráficos de perfil Figura 2-5 Cuadro de diálogo MLG Medidas repetidas: Gráficos de perfil Los gráficos de perfil (gráficos de interacción) sirven para comparar las medias marginales en el modelo. En los gráficos de perfil pueden utilizarse tanto los factores inter-sujetos como los intra-sujetos. . Cada nivel en un tercer factor se puede utilizar para crear un gráfico diferente.

MLG Medidas repetidas: Comparaciones múltiples post hoc de las medias observadas Figura 2-7 Cuadro de diálogo Comparaciones múltiples post hoc de las medias observadas Comparaciones múltiples post hoc. Estas pruebas sólo se utilizan para los factores inter-sujetos fijos. Una vez que se ha determinado que existen diferencias entre las medias. las pruebas de rango post hoc y las comparaciones múltiples por parejas permiten determinar qué medias difieren.31 MLG Medidas repetidas Figura 2-6 Gráfico no paralelo (izquierda) y gráfico paralelo (derecha) Después de especificar un gráfico seleccionando los factores para el eje horizontal y. factores para líneas distintas y para gráficos distintos. el gráfico debe añadirse a la lista Gráficos. de manera opcional. No estarán disponibles si no hay factores .

Estas pruebas son más potentes que las de rangos múltiples de Duncan y de Student-Newman-Keuls (que también son procedimientos múltiples por pasos). Normalmente. R-E-G-W F se basa en una prueba F y R-E-G-W Q se basa en el rango estudentizado. Einot. La prueba de la diferencia honestamente significativa de Tukey utiliza el estadístico de rango estudentizado para hacer todas las comparaciones por parejas entre los grupos y calcula el porcentaje de error del experimento en relación con el porcentaje de error de todas las comparaciones por parejas. Para un número reducido de pares. La última categoría es la categoría de control por defecto. puede seleccionar la primera categoría. Para contrastar si la media en cualquier nivel del factor es menor que la de la categoría de control. utilice una prueba bilateral. La prueba t de comparación múltiple por parejas de Dunnett compara un conjunto de tratamientos con una media de control simple. pero se utiliza el módulo máximo estudentizado. Gabriel y Welsch (R-E-G-W) desarrollaron dos pruebas de rangos múltiples por pasos. se contrasta la igualdad en los subconjuntos de medias. Para comprobar que la media de cualquier nivel del factor (excepto la categoría de control) no es igual a la de la categoría de control. pero no son aconsejables si los tamaños de las casillas son desiguales. Los procedimientos múltiples por pasos contrastan en primer lugar si todas las medias son iguales. GT2 de Hochberg es similar a la prueba de la diferencia honestamente significativa de Tukey. la prueba de Tukey es más potente.32 Capítulo 2 inter-sujetos. Si lo desea. La prueba de Gabriel se puede convertir en liberal cuando los tamaños de las casillas varían mucho. puede elegir una prueba unilateral o bilateral. La prueba de Bonferroni. Las pruebas de comparaciones múltiples post hoc se realizan para la media a través de los niveles de los factores intra-sujetos. la prueba de la diferencia honestamente significativa de Tukey es más potente que la prueba de Bonferroni. seleccione > Control. Cuando se contrasta un gran número de parejas de medias. Ryan. corrige el nivel crítico por el hecho de que se realizan comparaciones múltiples. basada en el estadístico t de Student. Si no son iguales. La prueba de comparación por parejas de Gabriel también utiliza el módulo máximo estudentizado y es generalmente más potente que la GT2 de Hochberg cuando los tamaños de las casillas son desiguales. seleccione < Control. La prueba t de Sidak ajusta también el nivel de significación y ofrece límites más rígidos que la prueba de Bonferroni. Del mismo modo. Bonferroni es más potente. para probar si la media de cualquier nivel del factor es mayor que la de la categoría de control. En las pruebas de Bonferroni y de la diferencia honestamente significativa de Tukey se utilizan normalmente pruebas de comparaciones múltiples. . Asimismo.

La prueba de la diferencia honestamente significativamente de Tukey. lo que significa que se precisa una mayor diferencia entre las medias para la significación. no sólo las comparaciones por parejas disponibles en esta función. También se facilitan subconjuntos homogéneos para las pruebas de rango para S-N-K. Sidak. la de Student-Newman-Keuls (S-N-K) y la b de Tukey son pruebas de rangos que asignan rangos a medias de grupo y calculan un valor de rango. El resultado es que la prueba de Scheffé es normalmente más conservadora que otras pruebas. R-E-G-W Q y Waller. Tukeyb de Tukey. El nivel de significación de la prueba de Scheffé está diseñado para permitir todas las combinaciones lineales posibles de las medias de grupo que se van a contrastar. la prueba de Gabriel y la prueba de Scheffé son tanto pruebas de comparaciones múltiples como de rango. (a veces liberal) de Games-Howell o C de Dunnett (prueba de comparaciones por parejas basada en el rango estudentizado). . Games y Howell. Bonferroni. R-E-G-W F. La prueba t de Waller-Duncan utiliza una aproximación Bayesiana. T3 de Dunnett (prueba de comparaciones por parejas basada en el módulo máximo estudentizado). Se proporcionan comparaciones por parejas para DMS. La prueba de rangos múltiples de Duncan.33 MLG Medidas repetidas Cuando las varianzas no son iguales. Estas pruebas no se utilizan con tanta frecuencia como las pruebas explicadas previamente. Pruebas que se muestran. La desventaja de esta prueba es que no se realiza ningún intento de corregir el nivel crítico para realizar las comparaciones múltiples. GT2 de Hochberg. T2 y T3 de Tamhane. Esta prueba de rango emplea la media armónica del tamaño muestral cuando los tamaños muestrales no son iguales. utilice T2 de Tamhane (prueba conservadora de comparaciones por parejas basada en una prueba t). prueba de comparaciones por parejas. Duncan. La prueba de comparaciones múltiples por parejas de la diferencia menos significativa (DMS) es equivalente a múltiples pruebas t individuales entre todas las parejas de grupos. C y T3 de Dunnett.

Son los valores que predice el modelo para cada caso.34 Capítulo 2 MLG medidas repetidas: Guardar Figura 2-8 Cuadro de diálogo MLG Medidas repetidas: Guardar Es posible guardar los valores pronosticados por el modelo. Diagnósticos. Influencia relativa de una observación en el ajuste del modelo. Valores pronosticados. guárdelos en el archivo de datos actual. los residuos y las medidas relacionadas como variables nuevas en el Editor de datos. Medida de cuánto cambiarían los residuos de todos los casos si se excluyera un caso determinado del cálculo de los coeficientes de regresión. Están disponibles los valores pronosticados no tipificados y los errores tipificados de los valores pronosticados. Muchas de estas variables se pueden utilizar para examinar supuestos sobre los datos. Las opciones disponibles incluyen la distancia de Cook y los valores de influencia no centrados. Si desea almacenar los valores para utilizarlos en otra sesión de SPSS. . Un residuo no tipificado es el valor real de la variable dependiente menos el valor pronosticado por el modelo. ! Distancia de Cook. Una distancia de Cook grande indica que la exclusión de ese caso del cálculo de los estadísticos de regresión hará variar substancialmente los coeficientes. También se encuentran disponibles residuos eliminados. Son medidas para identificar casos con combinaciones poco usuales de valores para las variables independientes y casos que puedan tener un gran impacto en el modelo. estudentizados y tipificados. Residuos. ! Valor de influencia.

Diferencia entre un valor observado y el valor pronosticado por el modelo. Residuo dividido por una estimación de su desviación típica que varía de caso en caso. Los residuos tipificados se conocen también como residuos de Pearson.35 MLG Medidas repetidas ! Residuos no tipificados. ! Residuo estudentizado. En un modelo multivariado. existen filas similares para cada variable dependiente. una fila de valores de significación para los estadísticos t correspondientes a las estimaciones de los parámetros y una fila de grados de residuos de libertad. ! Residuo eliminado. Graba un archivo de datos de SPSS que contiene una matriz de varianza-covarianza de las estimaciones de los parámetros del modelo. Residuo para un caso cuando éste se excluye del cálculo de los coeficientes de regresión. El residuo dividido por una estimación de su error típico. . Guardar en archivo nuevo. puede usar este archivo matricial en otros procedimientos que lean un archivo matricial de SPSS. ! Tipificados. Es igual a la diferencia entre el valor de la variable dependiente y el valor pronosticado corregido. Si lo desea. Asimismo. dependiendo de la distancia de los valores de cada caso en las variables independientes respecto a las medias en las variables independientes. para cada variable dependiente habrá una fila de estimaciones de los parámetros.

Se pueden seleccionar tanto factores intra-sujetos como inter-sujetos. . Bonferroni o Sidak para los intervalos de confianza y la significación. Estas medias se corrigen respecto a las covariables. tanto para los factores inter-sujetos como para los intra-sujetos. Este elemento sólo se encuentra disponible si los efectos principales están seleccionados en la lista Mostrar las medias para. si las hay. Seleccione los factores e interacciones para los que desee obtener estimaciones de las medias marginales de la población en las casillas. Los estadísticos se calculan utilizando un modelo de efectos fijos. Seleccione un ajuste de diferencia menor significativa (DMS). Proporciona comparaciones por parejas no corregidas entre las medias marginales estimadas para cualquier efecto principal del modelo.36 Capítulo 2 MLG Medidas repetidas: Opciones Figura 2-9 Cuadro de diálogo MLG Medidas repetidas: Opciones Este cuadro de diálogo contiene estadísticos opcionales. ! Comparar los efectos principales. Este elemento sólo estará disponible si se selecciona Comparar los efectos principales. Medias marginales estimadas. ! Ajuste del intervalo de confianza.

Seleccione Estadísticos descriptivos para producir medias observadas. desviaciones típicas y frecuencias para cada variable dependiente en todas las celdas. Las opciones de diagramas de dispersión por nivel y gráfico de los residuos son útiles para comprobar los supuestos sobre los datos. Nivel de significación. Seleccione Potencia observada para obtener la potencia de la prueba cuando la hipótesis alternativa se ha establecido basándose en el valor observado. Se pueden mostrar Matrices SCPC de error y de hipótesis y la Matriz SCPC residual más la prueba de esfericidad de Bartlett de la matriz de covarianza residual. las pruebas t. Puede que le interese corregir el nivel de significación usado en las pruebas post hoc y el nivel de confianza empleado para construir intervalos de confianza. La opción Estimaciones del tamaño del efecto ofrece un valor parcial de eta-cuadrado para cada efecto y cada estimación de parámetros. . Las pruebas de homogeneidad producen la prueba de homogeneidad de varianzas de Levene para cada variable dependiente en todas las combinaciones de nivel de los factores inter-sujetos sólo para factores inter-sujetos. el cuadro de diálogo mostrará el nivel asociado de los intervalos de confianza. Estos gráficos son útiles para investigar el supuesto de varianzas iguales. las pruebas de homogeneidad incluyen la prueba M de Box sobre la homogeneidad de las matrices de covarianza de las variables dependientes a lo largo de todas las combinaciones de niveles de los factores inter-sujetos. La función estimable general permite construir pruebas de hipótesis personales basadas en la función estimable general. los errores típicos. Si especifica un nivel de significación. Asimismo. los intervalos de confianza y la potencia observada para cada prueba. Seleccione Estimaciones de los parámetros para generar las estimaciones de los parámetros. Las filas en las matrices de coeficientes de contraste son combinaciones lineales de la función estimable general. El valor especificado también se utiliza para calcular la potencia observada para la prueba. Seleccione Gráficos de los residuos para producir un gráfico de los residuos observados respecto a los pronosticados respecto a los tipificados para cada variable dependiente. Seleccione la Prueba de falta de ajuste para comprobar si el modelo puede describir de forma adecuada la relación entre la variable dependiente y las variables independientes. Estos elementos no estarán activado si no hay factores.37 MLG Medidas repetidas Mostrar. El estadístico eta cuadrado describe la proporción de variabilidad total atribuible a un factor.

Guardar la matriz del diseño en un nuevo archivo de datos (utilizando el subcomando OUTFILE). ! ! Construir un archivo de datos matricial que contenga estadísticos de la tabla de ANOVA inter-sujetos (utilizando el subcomando OUTFILE). Especificar contrastes de los efectos respecto a una combinación lineal de efectos o un valor (utilizando el subcomando TEST). El lenguaje de comandos de SPSS también permite: ! ! ! ! ! Especificar efectos anidados en el diseño (utilizando el subcomando DESIGN). MMATRIX y KMATRIX). . ! Especificar nombres para las variables temporales (utilizando el subcomando SAVE). Si desea información completa sobre la sintaxis. ! Construir un archivo de datos matricial de correlaciones (utilizando el subcomando OUTFILE). una matriz M o una matriz K (utilizando los subcomandos LMATRIX. ! ! ! Especificar una categoría de referencia intermedia (utilizando el subcomando CONTRAST para los contrastes de desviación o simples). Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING). Especificar la métrica para los contrastes polinómicos (utilizando el subcomando CONTRAST). Especificar términos de error para las comparaciones post hoc (utilizando el subcomando POSTHOC). ! Construir una matriz L. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).38 Capítulo 2 Funciones adicionales del comando GLM Estas funciones se pueden aplicar a los análisis univariados. Especificar contrastes múltiples (utilizando el subcomando CONTRAST). multivariados o de medidas repetidas. Especificar criterios EPS (mediante el subcomando CRITERIA). ! Calcular medias marginales estimadas para cualquier factor o interacción entre los factores en la lista de factores (utilizando el subcomando EMMEANS).

Los resultados por defecto para todos los métodos incluyen las estimaciones de componentes de la varianza. para modelos de efectos mixtos. Al calcular las componentes de la varianza. Este procedimiento resulta de particular interés para el análisis de modelos mixtos. La opción Ponderación MCP permite especificar una variable usada para aplicar a las observaciones diferentes ponderaciones para un análisis ponderado. El investigador deduce que la varianza del aumento 39 . análisis de varianza (ANOVA). como los diseños split-plot. se mostrará también una tabla con la matriz de covarianza asintótica. los diseños de medidas repetidas univariados y los diseños de bloques aleatorios. Ejemplo. estima la contribución de cada efecto aleatorio a la varianza de la variable dependiente. Las seis camadas estudiadas son una muestra aleatoria de una amplia población de camadas de cerdos. Otros resultados disponibles incluyen una tabla de ANOVA y las medias cuadráticas esperadas para el método ANOVA. por ejemplo. El procedimiento Componentes de la varianza es totalmente compatible con el procedimiento MLG Factorial general.Capítulo Análisis de componentes de la varianza 3 El procedimiento Componentes de la varianza. para compensar la distinta precisión de las medidas. MINQUE). se mide el aumento de peso de los cerdos de seis camadas diferentes después de un mes. máxima verosimilitud (MV. Se dispone de diversas especificaciones para los diferentes métodos. En una escuela agrícola. se puede determinar dónde centrar la atención para reducir la varianza. Se dispone de cuatro métodos diferentes para estimar las componentes de la varianza: estimador mínimo no cuadrático insesgado (EMNCI. La variable camada es un factor aleatorio con seis niveles. ML) y máxima verosimilitud restringida (MVR. y la historia de iteraciones para los métodos MV y MVR. Si se usa el método MV o el método MVR. RML).

Procedimientos relacionados. Basándose en estos supuestos. Componentes de la varianza: Consideraciones sobre los datos Datos. MLG Multivariado y MLG Medidas repetidas. pueden tener valores numéricos o valores de cadena de hasta ocho caracteres. Los parámetros del modelo para diferentes efectos aleatorios son también independientes. Las covariables son variables cuantitativas que están relacionadas con la variable dependiente. La variable dependiente es cuantitativa. Al menos uno de los factores debe ser aleatorio. Pueden tener valores numéricos o valores de cadena de hasta ocho caracteres. El término residual también tiene una media de cero y una varianza constante finita. utilice MLG Factorial general. No tiene correlación con respecto a los parámetros del modelo de cualquier efecto aleatorio. ANOVA y EMNCI no requieren supuestos de normalidad. Ambos son robustos a las desviaciones moderadas del supuesto de normalidad. Use el procedimiento Explorar para examinar los datos antes de realizar el análisis de componentes de la varianza.40 Capítulo 3 de peso se puede atribuir a la diferencia entre las camadas más que a la diferencia entre los cerdos de una misma camada. Este hecho distingue un modelo de componentes de la varianza a partir de un modelo lineal general. las observaciones del mismo nivel de un factor aleatorio están correlacionadas. Todos los métodos suponen que los parámetros del modelo para un efecto aleatorio tienen de media cero y varianzas constantes finitas y no están correlacionados mutuamente. los niveles del factor deben ser una muestra aleatoria de los posibles niveles. . Los factores son categóricos. MV y MVR requieren que el parámetro del modelo y el término residual se distribuyan de forma normal. Se asume que los términos residuales de diferentes observaciones no están correlacionados. Supuestos. Para contrastar hipótesis. Es decir.

Figura 3-1 Cuadro de diálogo Componentes de la varianza E Seleccione una variable dependiente. . en función de los datos. Para especificar una variable de ponderación.41 Análisis de componentes de la varianza Para obtener un análisis de las componentes de la varianza E Elija en los menús: Analizar Modelo lineal general Componentes de la varianza. utilice Ponderación MCP. E Seleccione variables para Factor(es) fijo(s).. Factor(es) aleatorio(s) y Covariable(s)..

puede elegir los efectos principales y las interacciones que sean de interés para el análisis. puede excluir la intersección. una (R) para un factor aleatorio o una (C) para una covariable. El modelo depende de la naturaleza de los datos. Incluir la intersección en el modelo. Modelo. No contiene interacciones de covariable. Factores y Covariables. Normalmente se incluye la intersección en el modelo. El modelo debe contener un factor aleatorio. Indique todos los términos que desee incluir en el modelo. . Si supone que los datos pasan por el origen. Un modelo factorial completo contiene todos los efectos principales del factor.42 Capítulo 3 Componentes de la varianza: Modelo Figura 3-2 Cuadro de diálogo Componentes de la varianza: Modelo Especificar modelo. Seleccione Personalizado para especificar sólo un subconjunto de interacciones o para especificar interacciones factor por covariable. Después de seleccionar Personalizado. Los factores y covariables aparecen en la lista con una (F) para un factor fijo. todos los efectos principales de las covariables y todas las interacciones factor por factor.

Todas de 3. Componentes de la varianza: Opciones Figura 3-3 Cuadro de diálogo Componentes de la varianza Método. Puede seleccionar uno de los cuatro métodos para estimar las componentes de la varianza. . Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Éste es el valor por defecto.43 Análisis de componentes de la varianza Construir términos Para las covariables y los factores seleccionados: Interacción. Todas de 4. Crea un término de efectos principales para cada variable seleccionada. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 2. Efectos principales. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 5.

Puede especificar el criterio de convergencia y el número máximo de iteraciones. un método de estimación inadecuado o la necesidad de más datos. Puesto que este método se corrige respecto a los efectos fijos. Las estimaciones MV y MVR son invariables a la traslación. Sólo se encuentra disponible para el método ANOVA. Mostrar. Si selecciona Tipo III.Uniforme implica que todos los efectos aleatorios y el término residual tienen un impacto igual en las observaciones. Este método no tiene en cuenta los grados de libertad utilizados para estimar los efectos fijos. El método ANOVA a veces produce estimaciones de varianza negativas. Sólo se encuentra disponible para el método EMNCI. Si selecciona el método de Máxima verosimilitud o el de Máxima verosimilitud restringida. Para el método ANOVA. Estas estimaciones pueden estar sesgadas. Si los datos se distribuyen normalmente y las estimaciones son correctas. ! Las estimaciones de máxima verosimilitud restringida (MVR) reducen las estimaciones ANOVA para muchos (si no todos) los casos de datos equilibrados. ! Máxima verosimilitud (MV) genera estimaciones que serán lo más coherente posible con los datos observados realmente. puede seleccionar mostrar sumas de cuadrados y medias cuadráticas esperadas. ! ANOVA (análisis de varianza) calcula las estimaciones insesgadas utilizando las sumas de cuadrados de Tipo I o Tipo III para cada efecto.44 Capítulo 3 ! EMNCI (estimador mínimo no cuadrático insesgado) produce estimaciones que son invariables con respecto a los efectos fijos. Puede seleccionar un método para las ponderaciones previas de los efectos aleatorios. El esquema Cero equivale a asumir varianzas de efecto aleatorio cero. deberá dar errores típicos menores que el método MV. Este método tiene en consideración los grados de libertad utilizados para estimar los efectos fijos. utilizando iteraciones. Este método es asintóticamente normal. puede mostrar una historia de las iteraciones. Las sumas de cuadrados de Tipo I se utilizan para el modelo jerárquico. este método produce la varianza inferior entre todos los estimadores insesgados. . Sólo se encuentra disponible para los métodos MV o MVR. que es el valor por defecto en MLG. Previas de los efectos aleatorios. el cual es empleado con frecuencia en las obras sobre componentes de la varianza. las estimaciones de la varianza podrán utilizarse en MLG Factorial general para contrastar hipótesis con sumas de cuadrados de Tipo III. Criterios. Suma de cuadrados. que pueden indicar un modelo erróneo.

y así sucesivamente. Así. Cualquier modelo equilibrado o desequilibrado sin casillas vacías. Tipo I. El método Tipo I para la obtención de sumas de cuadrados se utiliza normalmente para: ! Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier efecto de interacción de primer orden. En un diseño factorial sin casillas perdidas. este método equivale a la técnica de cuadrados ponderados de las medias de Yates. que es el predeterminado. .45 Análisis de componentes de la varianza Sumas de cuadrados (Componentes de la varianza) Para el modelo. Un modelo de regresión polinómica en el que se especifica cualquier término de orden inferior antes que cualquier término de orden superior. Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla. Este método. ! ! Tipo III. y así sucesivamente. este tipo de sumas de cuadrados se considera a menudo útil para un modelo no equilibrado sin casillas perdidas. cualquier efecto de interacción de primer orden se especifica antes de cualquier efecto de interacción de segundo orden. el segundo efecto especificado está anidado dentro del tercero. El método Tipo III para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis. Este método también se conoce como el método de descomposición jerárquica de la suma de cuadrados. calcula las sumas de cuadrados de un efecto del diseño como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga y ortogonales respecto a cualquier efecto (si existe alguno) que lo contenga. El Tipo III es el más utilizado y es el tipo predeterminado. Un modelo puramente anidado en el que el primer efecto especificado está anidado dentro del segundo efecto especificado. puede elegir un tipo de suma de cuadrados. Cada término se corrige sólo respecto al término que le precede en el modelo. siempre que la forma general de estimabilidad permanezca constante.

46 Capítulo 3

Componentes de la varianza: Guardar en archivo nuevo
Figura 3-4 Cuadro de diálogo Componentes de la varianza: Guardar en archivo nuevo

Se pueden guardar algunos resultados de este procedimiento en un nuevo archivo de datos de SPSS.
Estimaciones de las componentes de la varianza. Guarda las estimaciones de las

componentes de la varianza y las etiquetas de estimación en un archivo de datos. Se puede utilizar para calcular más estadísticos o en otros análisis de los procedimientos MLG. Por ejemplo, se pueden usar para calcular intervalos de confianza o para contrastar hipótesis.
Covariación de las componentes. Guarda una matriz varianza-covarianza o una matriz de correlaciones en un archivo de datos. Sólo está disponible si se han especificado los métodos de máxima verosimilitud o máxima verosimilitud restringida. Guardar en un archivo. Permite especificar un nombre para el archivo que contenga las

estimaciones de las componentes de la varianza y/o la matriz. Se puede utilizar el comando MATRIX para extraer los datos que necesite del archivo nuevo y después calcular los intervalos de confianza o realizar pruebas.

Funciones adicionales del comando VARCOMP
El lenguaje de comandos de SPSS también permite:
! ! !

Especificar efectos anidados en el diseño (utilizando el subcomando DESIGN). Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING). Especificar criterios EPS (mediante el subcomando CRITERIA).

47 Análisis de componentes de la varianza

Si desea información completa sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

Estadísticos descriptivos: tamaños de las muestras. Cada semana se envía por correo un vale distinto a los clientes. Estadísticos. Información de los niveles del factor: valores ordenados de los niveles de cada factor y las frecuencias correspondientes. medias y desviaciones típicas de la variable dependiente y las covariables para cada combinación de niveles de los factores. El modelo lineal mixto proporciona. Asimismo. Se toma una muestra aleatoria de los clientes habituales para observar el gasto de cada cliente durante 10 semanas. El procedimiento Modelos lineales mixtos es asimismo una herramienta flexible para ajustar otros modelos que puedan ser formulados como modelos lineales mixtos. Los modelos lineales mixtos se utilizan para estimar el efecto de los distintos vales en el gasto. por tanto. las pruebas de Wald y los intervalos de confianza para los parámetros de las matrices de covarianzas. Dichos modelos incluyen los modelos multinivel. Una cadena de tiendas de comestibles está interesada en los efectos de varios vales en el gasto de los clientes. a la vez que se corrige respecto a la correlación debida a las observaciones repetidas de cada sujeto durante las 10 semanas. Estimación de máxima verosimilitud (MV) y máxima verosimilitud restringida (MVR). la flexibilidad necesaria para modelar no sólo las medias sino también las varianzas y covarianzas de los datos. Ejemplo.Capítulo Modelos lineales mixtos 4 El procedimiento Modelos lineales mixtos expande el modelo lineal general de modo que los datos puedan presentar variabilidad correlacionada y no constante. 49 . Tipo III es el valor por defecto. las estimaciones de los parámetros y los intervalos de confianza para los efectos fijos. Pueden emplearse las sumas de cuadrados de Tipo I y Tipo III para evaluar diferentes hipótesis. los modelos lineales jerárquicos y los modelos con coeficientes aleatorios. Métodos.

puede usar el procedimiento MLG Univariante o MLG Medidas repetidas. Los factores deben ser categóricos y pueden tener valores numéricos o valores de cadena. en un estudio médico. cabe esperar que estén correlacionadas las lecturas de la presión sanguínea de un único paciente en una serie de visitas consecutivas al médico. Use el procedimiento Explorar para examinar los datos antes de realizar un análisis. Los efectos aleatorios modelan la estructura de las covarianzas de la variable dependiente. sin embargo. Se asume que la variable dependiente está relacionada linealmente con los factores fijos. Las medidas repetidas modelan la estructura de las covarianzas de los residuos. Las variables de sujetos y repetidas pueden ser de cualquier tipo. Se asume además que la variable dependiente procede de una distribución normal. se puede establecer una correlación entre los términos del modelo especificados para el mismo efecto aleatorio. Sujetos. La definición de los sujetos es particularmente importante cuando se dan medidas repetidas para cada sujeto y desea modelar la correlación entre estas observaciones. La variable dependiente debe ser cuantitativa. Supuestos. Por ejemplo. Si no cree que haya una variabilidad correlacionada o no constante. los factores aleatorios y las covariables. las lecturas de la presión sanguínea de un paciente se pueden considerar independientes de las lecturas de otros pacientes. Modelos lineales mixtos: Selección de las variables de Sujetos/Repetidas Este cuadro de diálogo le permite seleccionar variables que definen sujetos y observaciones repetidas. Los efectos aleatorios múltiples se consideran independientes entre sí y se calculan por separado las matrices de covarianzas de cada uno de ellos. Un sujeto es una unidad de observación. puede usar el procedimiento Análisis de componentes de la varianza en caso de que los efectos aleatorios tengan una estructura de covarianzas en los componentes de la varianza y no haya medidas repetidas. Alternativamente. Procedimientos relacionados. Las covariables y la variable de ponderación deben ser cuantitativas. . y elegir una estructura de covarianzas para los residuos. Por ejemplo. Los efectos fijos modelan la media de la variable dependiente.50 Capítulo 4 Modelos lineales mixtos: Consideraciones sobre los datos Datos. la cual se puede considerar independiente de otros sujetos.

51 Modelos lineales mixtos Los sujetos se pueden definir además mediante la combinación de los niveles de los factores de múltiples variables. una única variable Semana puede identificar las 10 semanas de observaciones de un estudio médico o se pueden usar Mes y Día para identificar las observaciones diarias realizadas a lo largo de un año. Especifica la estructura de la covarianza para los residuos.1) Simetría compuesta Simetría compuesta: Métrica de correlación Simetría compuesta: Heterogénea Diagonal Factor analítico: Primer orden Factor analítico: Primer orden. Repetidas. puede especificar el Sexo y la Categoría de edad como variables de sujetos para modelar la creencia de que los hombres de más de 65 años son similares entre sí. Puede usar todas o algunas de las variables que definen los sujetos para la estructura de la covarianza de los efectos aleatorios. Las estructuras disponibles son las siguientes: ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! Dependencia Ante: Primer orden AR(1) AR(1): Heterogénea ARMA(1. Todas las variables especificadas en la lista Sujetos se usan con el fin de definir los sujetos para la estructura de la covarianza residual. Por ejemplo. Tipo de covarianza para Repetidas. pero independientes de los hombres de menos de 65 años y de las mujeres. Las variables especificadas en esta lista se usan para identificar las observaciones repetidas. Heterogéneo Huynh-Feldt Identidad escalada Toeplitz Toeplitz: Heterogénea Sin estructura Sin estructura: Correlaciones . por ejemplo.

. puede seleccionar una o más variables repetidas. Selección de variables de sujetos/repetidas para Modelos lineales mixtos E Elija en los menús: Analizar Modelos mixtos Lineal. . rellenado E Si lo desea.52 Capítulo 4 Si desea obtener más información. E Si lo desea. E Pulse en Continuar.. Figura 4-1 Modelos lineales mixtos: Especificación de las variables de Sujetos/Repetidas como. puede seleccionar una o más variables de sujetos. E Si lo desea. puede seleccionar una estructura de covarianza residual. consulte “Estructuras de covarianza” en Apéndice B en la página 135.

53 Modelos lineales mixtos Obtención de un análisis de Modelos lineales mixtos Figura 4-2 Cuadro de diálogo Modelos lineales mixtos E Seleccione una variable dependiente. E Pulse en Fijos o Aleatorios y especifique al menos un modelo de efectos fijos o aleatorios. . seleccione una variable de ponderación. Si lo desea. E Seleccione al menos un factor o covariable.

Construir términos no anidados Para las covariables y los factores seleccionados: Factorial.54 Capítulo 4 Efectos fijos de los Modelos lineales mixtos Figura 4-3 Cuadro de diálogo Efectos fijos de los modelos lineales mixtos Efectos fijos. puede excluir la intersección. Si asume que los datos pasan por el origen. La intersección se incluye normalmente en el modelo. No existe un modelo por defecto. Puede elegir entre términos anidados o no anidados. Suma de cuadrados. Éste es el valor por defecto. por lo que debe especificar de forma explícita los efectos fijos. . Determina el método para calcular las sumas de cuadrados. Crea todas las interacciones y efectos principales posibles para las variables seleccionadas. En el caso de los modelos sin casillas perdidas. el método Tipo III es por lo general el más utilizado. Incluir intersección.

Por consiguiente. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. se puede decir que el efecto de Cliente está anidado dentro del efecto de Ubicación de la tienda. Por consiguiente. Dado que cada cliente frecuenta tan sólo una de estas ubicaciones. Además. si A es un factor. Crea todas las interacciones dobles posibles de las variables seleccionadas. Construir términos anidados En este procedimiento. Por consiguiente. una cadena de tiendas de comestibles desea realizar un seguimiento del gasto de sus clientes en las diversas ubicaciones de sus tiendas. Todas de 5. Crea un término de efectos principales para cada variable seleccionada. Los términos anidados resultan útiles para modelar el efecto de un factor o covariable cuyos valores no interactúan con los niveles de otro factor. Crea todas las interacciones triples posibles de las variables seleccionadas. Por ejemplo. no es válido especificar A(A). Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Limitaciones. puede incluir efectos de interacción o añadir varios niveles de anidación al término anidado. Todos los factores incluidos en un efecto anidado deben ser exclusivos entre sí. Efectos principales. No se puede anidar ningún efecto dentro de una covariable. no es válido especificar A*A. puede construir términos anidados para el modelo. Todas de 2. Existen las siguientes restricciones para los términos anidados: ! ! ! Todos los factores incluidos en una interacción deben ser exclusivos entre sí.55 Modelos lineales mixtos Interacción. Todas de 4. si A es un factor. si A es un factor y X es una covariable. no es válido especificar A(X). Crea el término de interacción de mayor nivel con todas las variables seleccionadas. . Todas de 3.

este tipo de sumas de cuadrados se suele considerar de gran utilidad para un modelo no equilibrado sin casillas perdidas. . puede elegir un tipo de suma de cuadrados. Este método también se conoce como el método de descomposición jerárquica de la suma de cuadrados. El Tipo III es el más utilizado y es el tipo predeterminado. Las sumas de cuadrados de Tipo III tienen una gran ventaja por ser invariables respecto a las frecuencias de casilla. Es el método por defecto. El método Tipo III para la obtención de sumas de cuadrados se utiliza normalmente para: ! ! Cualquiera de los modelos que aparecen en Tipo I. el segundo efecto especificado está anidado dentro del tercero. y así sucesivamente. Un modelo puramente anidado en el que el primer efecto especificado está anidado dentro del segundo efecto especificado. Esta forma de anidamiento solamente puede especificarse utilizando la sintaxis. Cada término se corrige sólo para el término que le precede en el modelo. Este método calcula las sumas de cuadrados de un efecto del diseño como las sumas de cuadrados corregidas respecto a cualquier otro efecto que no lo contenga y ortogonales a cualquier efecto (si existe) que lo contenga. El método Tipo I para la obtención de sumas de cuadrados se utiliza normalmente para: ! Un modelo ANOVA equilibrado en el que se especifica cualquier efecto principal antes de cualquier efecto de interacción de primer orden. En un diseño factorial sin casillas perdidas. Cualquier modelo equilibrado o desequilibrado sin casillas vacías. Un modelo de regresión polinómica en el que se especifica cualquier término de orden inferior antes que cualquier término de orden superior. y así sucesivamente. ! ! Tipo III. Así. Tipo I. este método equivale a la técnica de cuadrados ponderados de las medias de Yates. cualquier efecto de interacción de primer orden se especifica antes de cualquier efecto de interacción de segundo orden. siempre que la forma general de estimabilidad permanezca constante.56 Capítulo 4 Suma de cuadrados Para el modelo.

57 Modelos lineales mixtos Efectos aleatorios de los Modelos lineales mixtos Figura 4-4 Cuadro de diálogo Efectos aleatorios de los modelos lineales mixtos Efectos aleatorios. pulse en Siguiente para construir el siguiente modelo. es decir. Puede elegir entre términos anidados o no anidados. Puede asimismo incluir un término de intersección en el modelo de efectos aleatorios. por lo que debe especificar de forma explícita los efectos aleatorios. Puede especificar varios modelos de efectos aleatorios. Cada modelo de efecto aleatorio se supone que es independiente del resto de los modelos de efectos aleatorios. se calcularán diferentes matrices de covarianzas para cada uno . No existe un modelo por defecto. Una vez construido el primer modelo. Pulse en Anterior para desplazarse hacia atrás por los modelos existentes.

Le permite especificar la estructura de las covarianzas para el modelo de efectos aleatorios. Elija todas o algunas de las variables para definir los sujetos en el modelo de efectos aleatorios. consulte “Estructuras de covarianza” en Apéndice B en la página 135. Para cada efecto aleatorio se estima una matriz de covarianzas por separado. Agrupaciones de sujetos. Las estructuras disponibles son las siguientes: ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! ! Dependencia Ante: Primer orden AR(1) AR(1): Heterogénea ARMA(1.58 Capítulo 4 de ellos. Las variables incluidas son las seleccionadas como variables de sujetos en el cuadro de diálogo Selección de variables de sujetos/repetidas. Heterogéneo Huynh-Feldt Identidad escalada Toeplitz Toeplitz: Heterogénea Sin estructura Sin estructura: Métrica de correlación Componentes de la varianza Si desea obtener más información. . Se puede establecer una correlación entre los términos especificados en el mismo modelo de efectos aleatorios.1) Simetría compuesta Simetría compuesta: Métrica de correlación Simetría compuesta: Heterogénea Diagonal Factor analítico: Primer orden Factor analítico: Primer orden. Tipo de covarianza.

Especifique un número entero no negativo.59 Modelos lineales mixtos Estimación de los Modelos lineales mixtos Figura 4-5 Cuadro de diálogo Estimación de modelos lineales mixtos Método. Iteraciones: ! Iteraciones máximas. Seleccione la estimación de máxima verosimilitud o de máxima verosimilitud restringida. .

Muestra una tabla que incluye el valor de la función del logaritmo de la verosimilitud y las estimaciones de los parámetros cada n iteraciones. la última iteración se imprimirá siempre independientemente del valor de n. se reduce el tamaño del paso mediante un factor de 0. Se asume la convergencia si el cambio absoluto o relativo en la función del logaritmo de la verosimilitud es inferior al valor especificado. Tolerancia para la singularidad. Se asume la convergencia si el cambio absoluto o relativo máximo en las estimaciones de los parámetros es inferior al valor especificado. Si el valor especificado es igual a 0. En el caso de la especificación Absoluta. el cual debe ser no negativo. Convergencia del logaritmo de la verosimilitud. no se utiliza el criterio. Convergencia de los parámetros. Si decide imprimir el historial de iteraciones.5 hasta que aumenta el logaritmo de la verosimilitud o se alcanza la máxima subdivisión por pasos. Especifique un valor positivo. En el caso de la especificación Relativa. Especifique un número entero positivo. Especifique un número entero positivo. se asume la convergencia si el estadístico es inferior al producto del valor especificado y el valor absoluto del logaritmo de la verosimilitud. En cada iteración. Este valor se utiliza como tolerancia en la comprobación de la singularidad. comenzando por la iteración 0 (las estimaciones iniciales). . Convergencia hessiana. ! Imprimir el historial de iteraciones para cada n pasos. no se utiliza el criterio.60 Capítulo 4 ! Máxima subdivisión por pasos. Si el valor especificado es igual a 0. Máximo de pasos para puntuar. Si el valor especificado es igual a 0. no se utiliza el criterio. el cual debe ser no negativo. se asume la convergencia si un estadístico basado en la hessiana es inferior al valor especificado. Solicita utilizar el algoritmo de puntuación de Fisher hasta el número de iteraciones n.

Genera tablas correspondientes a: ! ! ! Estimaciones de los parámetros. . Genera tablas correspondientes a: ! Estadísticos descriptivos. Contrastes sobre parámetros de covarianza. las variables de medidas repetidas. Estos estadísticos se muestran para cada combinación de niveles de los factores. Muestra los valores ordenados de los factores. medias y desviaciones típicas de la variable dependiente y las covariables (si se especifican).61 Modelos lineales mixtos Estadísticos de Modelos lineales mixtos Figura 4-6 Cuadro de diálogo Estadísticos de modelos lineales mixtos Estadísticos de resumen. Correlaciones de las estimaciones de los parámetros. ! Resumen de procesamiento de casos. Muestra la matriz de correlaciones asintóticas de las estimaciones de los parámetros de los efectos fijos. los sujetos de medidas repetidas y los sujetos de los efectos aleatorios junto con las frecuencias correspondientes. Muestra los errores típicos asintóticos y las pruebas de Wald de los parámetros de covarianza. Estadísticos del modelo. Muestra las estimaciones de los parámetros de los efectos fijos y aleatorios y los errores típicos aproximados correspondientes. Muestra los tamaños de las muestras.

Si se especifica una variable de sujetos. Este valor se usa siempre que se genera un intervalo de confianza. Esta opción está disponible sólo si especifica al menos un efecto aleatorio. Muestra la matriz de covarianzas residual estimada. Muestra la matriz de covarianzas asintóticas de las estimaciones de los parámetros de los efectos fijos. Muestra la matriz de covarianzas estimada de los efectos aleatorios. ! Covarianzas de los efectos aleatorios. Especifique un valor mayor o igual a 0 e inferior a 100. ! Covarianzas de los residuos. Medias marginales estimadas de modelos lineales mixtos Figura 4-7 Cuadro de diálogo Medias marginales estimadas de modelos lineales mixtos . se muestra el bloque común.62 Capítulo 4 ! Covarianzas de las estimaciones de los parámetros. Intervalo de confianza. El valor por defecto es 95. ! Matriz de coeficientes del contraste. se muestra el bloque común. Esta opción muestra las funciones estimables utilizadas para contrastar los efectos fijos y las hipótesis personalizadas. Esta opción está disponible sólo en caso de que se haya especificado una variable para repetidas. Si se especifica una variable de sujetos para un efecto aleatorio.

63 Modelos lineales mixtos

Medias marginales estimadas de modelos ajustados. Este grupo permite solicitar las medias marginales estimadas pronosticadas por el modelo de la variable dependiente en las casillas, así como los errores típicos correspondientes a los factores especificados. Además, puede solicitar una comparación de los niveles de los factores de los efectos principales.
!

Factores e interacciones de los factores. Esta lista contiene los factores y las

interacciones de los factores que se han especificado en el cuadro de diálogo Fijo, además de un término GLOBAL. Los términos del modelo construidos a partir de covariables no se incluyen en esta lista.
!

Mostrar las medias para. El procedimiento calculará las medias marginales

estimadas para los factores y las iteraciones de factores seleccionadas en esta lista. Si se ha seleccionado GLOBAL, se mostrarán las medias marginales estimadas de la variable dependiente, contrayendo todos los factores. Tenga en cuenta que permanecerán seleccionados todos los factores y las iteraciones de los factores, a menos que se haya eliminado una variable asociada de la lista Factores en el cuadro de diálogo principal.
!

Comparar los efectos principales. Esta opción permite solicitar comparaciones

por parejas de los niveles de los efectos principales seleccionados. La opción Corrección del intervalo de confianza permite aplicar ajustes a los intervalos de confianza y los valores de significación para explicar comparaciones múltiples. Los métodos disponibles son: LSD (ningún ajuste), Bonferroni y Sidak. Por último, para cada factor, se puede seleccionar la categoría de referencia con la que se realizan las comparaciones. Si no se selecciona ninguna categoría de referencia, se construirán todas las comparaciones por parejas. Las opciones disponibles para la categoría de referencia son la primera, la última o una personalizada (en cuyo caso, se introduce el valor de la categoría de referencia).

64 Capítulo 4

Guardar Modelos lineales mixtos
Figura 4-8 Cuadro de diálogo Guardar modelos lineales mixtos

Este cuadro de diálogo le permite guardar diversos resultados del modelo en el archivo de trabajo.
Valores pronosticados fijos. Guarda las variables relacionadas con las medias de

regresión sin los efectos.
! ! !

Valores pronosticados. Las medias de regresión sin los efectos aleatorios. Errores típicos. Los errores típicos de las estimaciones. Grados de libertad. Los grados de libertad asociados a las estimaciones.

Valores pronosticados y residuos. Guarda las variables relacionadas con el valor

ajustado por el modelo.
! ! ! !

Valores pronosticados. El valor ajustado por el modelo. Errores típicos. Los errores típicos de las estimaciones. Grados de libertad. Los grados de libertad asociados a las estimaciones. Residuos. El valor de los datos menos el valor pronosticado.

65 Modelos lineales mixtos

Funciones adicionales del comando MIXED
El lenguaje de comandos de SPSS también permite:
! ! ! !

Especificar contrastes de los efectos respecto a una combinación lineal de efectos o un valor (utilizando el subcomando TEST). Incluir los valores perdidos definidos por el usuario (utilizando el subcomando MISSING). Calcular las medias marginales estimadas de los valores especificados de las covariables (utilizando la palabra clave WITH del subcomando EMMEANS). Comparar los efectos principales simples de las iteraciones (utilizando el subcomando EMMEANS).

Si desea información completa sobre la sintaxis, consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

.

combinando las diversas categorías de grado de dureza del agua (blanda. residuos. intervalos de confianza y pruebas de asociación parcial. Ajusta modelos loglineales jerárquicos a las tablas de contingencia multidimensionales utilizando un algoritmo de ajuste proporcional. estimaciones de los parámetros.Capítulo Análisis loglineal: Selección de modelo 5 El procedimiento de análisis loglineal de selección de modelo analiza tablas de contingencia de varios factores. uso previo de una de las dos marcas y temperaturas de lavado (frío o caliente). Ejemplo. En un estudio sobre las preferencias del consumidor por uno de entre dos detergentes. gráficos de residuos y gráficos de probabilidad normal. Para los modelos personalizados. Averiguaron que la temperatura está relacionada con la dureza del agua y con la preferencia por una u otra marca. Para construir los modelos se encuentran disponibles métodos de entrada forzada y de eliminación hacia atrás. 67 . Para los modelos saturados.5 a todas las casillas. Un modelo saturado añade 0. Estadísticos. media o dura). Este procedimiento ayuda a encontrar cuáles de las variables categóricas están asociadas. errores típicos. es posible solicitar estimaciones de los parámetros y pruebas de asociación parcial. los investigadores contaron las personas presentes en cada grupo. Frecuencias.

puede pasar a evaluar el modelo utilizando el Análisis loglineal general o el Análisis loglineal logit. Todas las variables que se vayan a analizar deben ser numéricas. Es posible utilizar la recodificación automática para recodificar las variables de cadena. Las variables categóricas de cadena se pueden recodificar en variables numéricas antes de comenzar el análisis para la selección del modelo. Procedimientos relacionados. utilice Recodificar para crear valores enteros consecutivos. Tales especificaciones pueden conducir a una situación en la que muchas casillas posean un número reducido de observaciones y los valores de chi-cuadrado puede que no sean útiles. Si una variable numérica posee categorías vacías.68 Capítulo 5 Consideraciones sobre los datos de Análisis loglineal: Selección de modelo Datos.. . Para obtener una selección de modelo en el análisis loglineal Elija en los menús: Analizar Loglineal Selección de modelo. El procedimiento Selección de modelo puede ayudar a identificar los términos que se necesitan en el modelo. Las variables de factor son categóricas.. Evite especificar muchas variables con un número elevado de niveles. A continuación.

E Defina el rango de valores para cada variable de factor. Análisis loglineal: Definir rango Figura 5-2 Cuadro de diálogo Análisis loglineal: Definir rango . Si lo desea. puede seleccionar una variable de ponderación de casilla para especificar los ceros estructurales. E Seleccione una opción en la sección Construcción de modelos.69 Análisis loglineal: Selección de modelo Figura 5-1 Cuadro de diálogo Análisis loglineal: Selección de modelo E Seleccione dos o varios factores categóricos numéricos. E Seleccione una o más variables de factor en la lista Factores y pulse en Definir rango.

El modelo resultante contendrá la interacción triple A*B*C especificada. Los valores para Mínimo y Máximo corresponden a las categorías menor y mayor de la variable de factor. Clase generadora. Un modelo saturado contiene todos los efectos principales de factor y todas las interacciones factor por factor. . si especifica un valor mínimo de 1 y uno máximo de 3.70 Capítulo 5 Se debe indicar el rango de categorías para cada variable de factor. B y C. Se excluyen los casos con valores fuera de los límites. No especifique los relativos de orden inferior en la clase generadora. Seleccione Personalizado para especificar una clase generadora para un modelo no saturado. SPSS construye un modelo jerárquico que contiene los términos que definen la clase generadora y todos los relativos de orden inferior. Por ejemplo. a continuación. Supongamos que se seleccionan las variables variables A. A*C y B*C. solamente se utilizarán los valores 1. B y C en la lista Factores y. Ambos valores deben ser enteros y el valor mínimo debe ser menor que el máximo. así como los efectos principales para A. Análisis loglineal: Modelo Figura 5-3 Cuadro de diálogo Análisis loglineal: Modelo Especificar modelo. 2 y 3. Repita este proceso para cada variable de factor. las interacciones dobles A*B. Interacción en la lista desplegable Construir términos. Una clase generadora es una lista de los términos de mayor orden en los que se encuentran implicados los factores.

Todas de 3. Todas de 5. Efectos principales.71 Análisis loglineal: Selección de modelo Construir términos Para las covariables y los factores seleccionados: Interacción. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Crea un término de efectos principales para cada variable seleccionada. Puede elegir entre Frecuencias. En un modelo saturado. Crea todas las interacciones dobles posibles de las variables seleccionadas. y los residuos son iguales a 0. Todas de 4. Crea todas las interacciones triples posibles de las variables seleccionadas. las frecuencias observadas y las esperadas son iguales. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Análisis loglineal: Opciones Figura 5-4 Cuadro de diálogo Análisis loglineal: Opciones Mostrar. Éste es el valor por defecto. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Todas de 2. . Residuos o ambos.

Funciones adicionales del comando HILOGLINEAR El lenguaje de comandos de SPSS también permite: ! ! Especificar las ponderaciones de casilla en forma de matriz (utilizando el subcomando CWEIGHT). Criterios del modelo. Para los modelos personalizados es posible elegir uno o ambos tipos de gráficos. Es posible suprimir uno o más criterios de estimación especificando N° máximo de iteraciones. Gráfico. Las estimaciones de los parámetros pueden ayudar a determinar qué términos se pueden excluir del modelo. Para un modelo saturado.72 Capítulo 5 Mostrar para el modelo saturado. . Si desea información completa sobre la sintaxis. SPSS utiliza un algoritmo iterativo de ajuste proporcional para obtener las estimaciones de los parámetros. También se encuentra disponible una tabla de asociación que enumera pruebas de asociación parcial. Éstos ayudarán a determinar cómo se ajusta el modelo a los datos. es posible elegir Estimaciones de los parámetros. Residuos y Probabilidad normal. Generar análisis de varios modelos con un único comando (utilizando el subcomando DESIGN). consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). Esta opción supone un proceso de cálculo muy extenso cuando se trata de tablas con muchos factores. Convergencia o Delta (un valor añadido a todas las frecuencias de casilla para los modelos saturados).

residuos de desviación y probabilidad normal. GLOR (log-razón de las ventajas generalizada). Cada una de las clasificaciones cruzadas de la tabla constituye una casilla y cada variable categórica se denomina factor. incluir en el modelo un término de desplazamiento. Además es posible mostrar una variedad de estadísticos y gráficos. estimaciones de los parámetros. ajustar un modelo log-tasa o implementar el método de corrección de las tablas marginales. La razón de las ventajas indica la evidencia significativa de una relación. 73 . Las variables de contraste permiten el cálculo del logaritmo de la razón de ventajas genereralizadas (GLOR). o guardar los valores pronosticados y los residuos en el archivo de datos de trabajo. Estadísticos. Frecuencias esperadas y observadas. SPSS muestra automáticamente información sobre el modelo y estadísticos de bondad de ajuste. Ejemplo. razón de las ventajas. Es posible analizar una distribución multinomial o de Poisson. residuos de desviación. Los datos de un informe sobre accidentes de automóviles en Florida se utilizan para determinar la relación existente entre el hecho de llevar puesto el cinturón de seguridad y si el daño fue mortal o no. Este procedimiento estima los parámetros de máxima verosimilitud de modelos loglineales jerárquicos y no jerárquicos utilizando el método de Newton-Raphson.Capítulo Análisis loglineal general 6 El procedimiento Análisis loglineal general analiza las frecuencias de las observaciones incluidas en cada categoría de la clasificación cruzada de una tabla de contingencia. estadístico de Wald. Gráficos: residuos corregidos. matriz del diseño. corregidos y brutos. Se pueden seleccionar hasta 10 factores para definir las casillas de una tabla. log-razón de las ventajas. La variable dependiente es el número de casos (la frecuencia) en una casilla de la tabla de contingencia y las variables explicativas son los factores y las covariables. intervalos de confianza. Una variable de estructura de casilla permite definir ceros estructurales para tablas incompletas.

. Para obtener un análisis loglineal general E Elija en los menús: Analizar Loglineal General. . Una variable de estructura de casilla asigna ponderaciones. No utilice una variable de estructura de casilla para ponderar los datos agregados. Cuando una covariable se encuentra en el modelo. SPSS asigna el valor medio de la covariable para los casos de una casilla a esa casilla. Bajo el supuesto de distribución multinomial: ! ! Procedimientos relacionados. elija Ponderar casos en el menú Datos. Se utilizan para calcular los logaritmos de la razón de las ventajas generalizadas. Utilice el procedimiento Tablas de contingencia para examinar las tablas de contingencia. Existen dos distribuciones disponibles en el análisis loglineal general: Poisson y multinomial. Las variables de contraste son continuas. Los valores de la variable de contraste son los coeficientes para la combinación lineal de los logaritmos de las frecuencias esperadas de casilla.. El tamaño muestral total es fijo o el análisis está condicionado al tamaño muestral total. Emplee el procedimiento Loglineal logit cuando resulte natural considerar una o más variables categóricas como variables de respuesta y las demás como variables explicativas. El evento de una observación que está en una casilla es estadísticamente independiente de los recuentos de casilla de otras casillas. Supuestos. Bajo el supuesto de distribución de Poisson: ! ! El tamaño total de la muestra no se fija antes del estudio o el análisis no es condicional al tamaño total de la muestra. si algunas de las casillas son ceros estructurales. Por ejemplo. la variable de estructura de casilla posee un valor de 0 ó 1.74 Capítulo 6 Análisis loglineal general: Consideraciones sobre los datos Datos. En su lugar. Los factores son categóricos y las covariables de casilla son continuas. Los recuentos de casilla no son estadísticamente independientes.

seleccione un máximo de diez variables de factor.75 Análisis loglineal general Figura 6-1 Cuadro de diálogo Análisis loglineal general E En el cuadro de diálogo Análisis loglineal general. Seleccionar una variable de estructura de casilla para definir ceros estructurales o incluir un término de desplazamiento. Seleccionar una variable de contraste. . tiene la posibilidad de: ! ! ! Seleccionar covariables de casilla. Si lo desea.

que indica una covariable. . El modelo depende de la naturaleza de los datos. Términos del modelo. Un modelo saturado contiene todos los efectos principales e interacciones que impliquen a las variables de factor. puede elegir los efectos principales y las interacciones que sean de interés para el análisis. Indique todos los términos que desee incluir en el modelo. No contiene términos para las covariables.76 Capítulo 6 Análisis loglineal general: Modelo Figura 6-2 Cuadro de diálogo Análisis loglineal general: Modelo Especificar modelo. Los factores y covariables se enumeran con la abreviatura (Cov). Seleccione Personalizado para especificar sólo un subconjunto de interacciones o para especificar interacciones factor por covariable. Después de seleccionar Personalizado. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Factores y Covariables. Éste es el valor por defecto. Construir términos Para las covariables y los factores seleccionados: Interacción.

Puede elegir entre varias opciones de estadísticos: frecuencias esperadas y observadas de casilla. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. una matriz del diseño del modelo y estimaciones de los parámetros para el modelo. Todas de 3. Crea todas las interacciones triples posibles de las variables seleccionadas. Todas de 4. corregidos y simples (o brutos). Todas de 2.77 Análisis loglineal general Efectos principales. Crea todas las interacciones dobles posibles de las variables seleccionadas. . tiene la posibilidad de elegir una o varias de las opciones siguientes: Mostrar. Todas de 5. Análisis loglineal general: Opciones Figura 6-3 Cuadro de diálogo Análisis loglineal general: Opciones El procedimiento Análisis loglineal general muestra información sobre el modelo y los estadísticos de bondad de ajuste. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. residuos de desviación. Además. Crea un término de efectos principales para cada variable seleccionada.

se debería agregar los datos para obtener los recuentos de casilla.78 Capítulo 6 Gráfico. Además es posible mostrar gráficos de probabilidad normal y gráficos normales sin tendencia de los residuos de desviación o corregidos. El sufijo n añadido a los nuevos nombres de variable se incrementa para formar un nombre exclusivo para cada variable guardada. Para que los valores guardados tengan sentido. Los gráficos. Se utiliza el método de Newton-Raphson para obtener estimaciones maximo-verosímiles de los parámetros. . Se puede ajustar el intervalo de confianza para las estimaciones de los parámetros. Es posible introducir nuevos valores para el número máximo de iteraciones. el valor a guardar para una casilla de la tabla de contingencia es introducido en el Editor de datos para cada caso de esa casilla. aunque los datos estén registrados como observaciones individuales en el Editor de datos. Si se guardan los valores pronosticados o los residuos para datos no agregados. Análisis loglineal general: Guardar Figura 6-4 Cuadro de diálogo Análisis loglineal general: Guardar Seleccione los valores que desea guardar como variables nuevas en el archivo de datos de trabajo. Intervalo de confianza. incluyen dos diagramas de dispersión matriciales: residuos corregidos o residuos de desviación respecto a los recuentos observados y los esperados de las casillas. La delta permanece en las casillas para los modelos saturados. Criterios. los cuales sólo están disponibles para los modelos personalizados. el criterio de convergencia y la delta (constante añadida a todas las casillas para las aproximaciones iniciales). Los valores guardados hacen referencia a los datos agregados (las casillas de la tabla de contingencia).

Residuos corregidos. ! Residuos de desviación. Dado que los residuos corregidos son asintóticamente normales típicos. Mostrar los residuos tipificados (utilizando el subcomando PRINT).79 Análisis loglineal general Se pueden guardar cuatro tipos de residuos: de desviación. es la diferencia entre la frecuencia observada para la casilla y su frecuencia esperada. Funciones adicionales del comando GENLOG El lenguaje de comandos de SPSS también permite: ! Calcular combinaciones lineales de las frecuencias observadas de casilla y las frecuencias esperadas de casilla e imprimir los residuos. tipificados y brutos. También se pueden guardar los valores pronosticados. Los residuos de desviación tienen una distribución normal típica asintótica. residuos tipificados y residuos corregidos de esa combinación (utilizando el subcomando GERESID). El residuo tipificado dividido por la estimación de su error típico. Cambiar el valor por defecto del umbral para la comprobación de la redundancia (utilizando el subcomando CRITERIA). Residuos tipificados. Los residuos tipificados se conocen también como residuos de Pearson. con signo. corregidos. donde el signo es el signo del residuo (frecuencia observada menos frecuencia esperada). de la contribución individual al estadístico de chi-cuadrado de la razón de verosimilitud (G al cuadrado). ! ! Si desea información completa sobre la sintaxis. Raíz cuadrada. se prefieren a los residuos tipificados a la hora de contrastar la normalidad. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). El residuo dividido por una estimación de su error típico. . cuando el modelo seleccionado es el correcto. ! ! ! Residuos. También llamado residuo simple o bruto.

.

pueden ser continuas pero no se aplican en forma de caso por caso. Además es posible mostrar una variedad de estadísticos y gráficos. Los valores de la variable de contraste son los coeficientes para la combinación lineal de los logaritmos de las frecuencias esperadas de casilla.70 veces menor que para un caimán grande. Una variable de estructura de casilla permite definir ceros estructurales para tablas incompletas. además la ventaja de preferir fundamentalmente reptiles en vez de peces fue más alta en el lago 3. Se supone automáticamente una distribución multinomial. mientras que las variables independientes pueden ser categóricas (factores). ¿Cómo varía el tipo de comida de los caimanes en función del tamaño del caimán y de los cuatro lagos en los que viven? Los resultados del estudio mostraron que la ventaja para un caimán pequeño preferir reptiles a peces es 0. incluir en el modelo un término de desplazamiento. Ejemplo. A una casilla dada se le aplica la media ponderada de la covariable para los casos de esa casilla.Capítulo Análisis loglineal logit 7 El procedimiento Análisis loglineal logit analiza la relación entre variables dependientes (o de respuesta) y variables independientes (o explicativas). Es posible seleccionar de 1 a 10 variables dependientes y de factor en combinación. Otras variables independientes. En un estudio en Florida se incluyeron 219 caimanes. 81 . ajustar un modelo log-tasa o implementar el método de corrección de las tablas marginales. Este procedimiento estima los parámetros de los modelos loglineales logit utilizando el algoritmo de Newton-Raphson. El logaritmo de las ventajas de las variables dependientes se expresa como una combinación lineal de parámetros. Las variables de contraste permiten el cálculo del logaritmo de la razón de ventajas genereralizadas (GLOR). o guardar los valores pronosticados y los residuos en el archivo de datos de trabajo. estos modelos se denominan a veces modelos logit multinomiales. SPSS muestra automáticamente información sobre el modelo y estadísticos de bondad de ajuste. Las variables dependientes siempre son categóricas. las covariables de casilla.

pueden tener valores numéricos o valores de cadena de hasta ocho caracteres. . Los valores de la variable de contraste son los coeficientes para la combinación lineal de los logaritmos de las frecuencias esperadas de casilla. Una variable de estructura de casilla asigna ponderaciones. SPSS aplica a una casilla dada el valor medio de la covariable para los casos de a esa casilla. Análisis loglineal logit: Consideraciones sobre los datos Datos. Utilice el procedimiento Análisis loglineal general cuando quiera analizar la relación entre una frecuencia observada y un conjunto de variables explicativas. Frecuencias observadas y esperadas. En su lugar. corregidos y de desviación. Se utilizan para calcular el logaritmo de la razón de las ventajas (GLOR). matriz de diseño. Los recuentos de casilla no son estadísticamente independientes. la variable de estructura de casilla posee un valor de 0 o 1. Procedimientos relacionados. Se asume que los recuentos dentro de cada combinación de categorías de las variables explicativas poseen una distribución multinomial. residuos brutos. logaritmo de la razón de las ventajas generalizadas. Las variables de contraste son continuas. Por ejemplo. estadístico de Wald. Las variables dependientes son categóricas. si algunas de las casillas son ceros estructurales. intervalos de confianza. estimaciones de los parámetros. No utilice una variable de estructura de casilla para ponderar datos de agregación. Utilice el procedimiento Tablas de contingencia para mostrar las tablas de contingencia.82 Capítulo 7 Estadísticos. Supuestos. Los factores son categóricos. pero cuando una covariable está en el modelo. residuos de desviación y gráficos de probabilidad normal. Las covariables de casilla pueden ser continuas. Bajo el supuesto de distribución multinomial: ! ! El tamaño muestral total es fijo o el análisis está condicionado al tamaño muestral total. utilice Ponderar casos del menú Datos. Gráficos: residuos corregidos.

tiene la posibilidad de: ! ! ! Seleccionar covariables de casilla. E Seleccione una o más variables de factor. seleccione una o más variables dependientes.. Si lo desea. Seleccionar una variable de estructura de casilla para definir ceros estructurales o incluir un término de desplazamiento. . Figura 7-1 Cuadro de diálogo Análisis loglineal logit E En el cuadro de diálogo Análisis loglineal logit.. Seleccionar una o más variables de contraste.83 Análisis loglineal logit Para obtener un análisis loglineal logit E Elija en los menús: Analizar Loglineal Logit. El número total de variables dependientes y de factor debe ser menor o igual a 10.

El modelo depende de la naturaleza de los datos. Si se selecciona la opción Incluir una constante para la dependiente. Los términos se añaden al diseño tomando todas las combinaciones posibles de los términos dependientes y haciendo emparejando cada combinación con cada término de la lista de términos del modelo. que indica una covariable. Los factores y covariables se enumeran con la abreviatura (Cov). Seleccione Personalizado para especificar sólo un subconjunto de interacciones o para especificar interacciones factor por covariable. Si la lista Términos del modelo contiene M1 y M2 y se incluye una . Factores y Covariables. Términos del modelo. también se añade un término unidad (1) a la lista del modelo. El procedimiento Análisis loglineal logit crea una lista de términos dependientes (D1. D2. No contiene términos para las covariables. Por ejemplo. Indique todos los términos que desee incluir en el modelo. D1*D2).84 Capítulo 7 Análisis loglineal logit: Modelo Figura 7-2 Cuadro de diálogo Análisis loglineal logit: Modelo Especificar modelo. puede elegir los efectos principales y las interacciones que sean de interés para el análisis. Un modelo saturado contiene todos los efectos principales e interacciones que impliquen a las variables de factor. Después de seleccionar Personalizado. supongamos que las variables D1 y D2 son las variables dependientes.

M1 y M2. Crea un término de efectos principales para cada variable seleccionada. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Construir términos Para las covariables y los factores seleccionados: Interacción. Todas de 4. la lista del modelo contendrá 1. . Crea todas las interacciones triples posibles de las variables seleccionadas. M1*D1*D2 M2*D1. El diseño resultante incluye combinaciones de cada término del modelo con cada término dependiente: D1. Crea todas las interacciones dobles posibles de las variables seleccionadas. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Incluye una constante para la variable dependiente en un modelo personalizado. Éste es el valor por defecto. D1*D2 M1*D1. D2. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Todas de 3. M2*D2. M2*D1*D2 Incluir una constante para la dependiente. M1*D2. Todas de 2. Todas de 5.85 Análisis loglineal logit constante. Efectos principales.

es posible elegir una o más de las siguientes opciones: Mostrar. Criterios. Matriz del diseño del modelo y Estimaciones de parámetros para el modelo. Gráfico. Residuos de desviación. corregidos y brutos. el criterio de convergencia y la delta (constante . Los gráficos disponibles para los modelos personalizados incluyen dos diagramas de dispersión matriciales (los residuos corregidos o los residuos de desviación respecto a las frecuencias de casilla observadas y esperadas). Existen varios estadísticos disponibles para su presentación: Frecuencias de casillas observadas y esperadas. Se utiliza el método de Newton-Raphson para obtener estimaciones maximo-verosímiles de los parámetros. Además es posible mostrar gráficos de probabilidad normal y gráficos normales sin tendencia de los residuos de desviación o corregidos. Además. Se puede ajustar el intervalo de confianza para las estimaciones de los parámetros. Es posible introducir nuevos valores para el número máximo de iteraciones.86 Capítulo 7 Análisis loglineal logit: Opciones Figura 7-3 Cuadro de diálogo Análisis loglineal logit: Opciones El procedimiento Análisis loglineal logit muestra información sobre el modelo y estadísticos de bondad de ajuste. Intervalo de confianza.

Análisis loglineal logit: Guardar Figura 7-4 Cuadro de diálogo Análisis loglineal logit: Guardar Seleccione los valores que desea guardar como variables nuevas en el archivo de datos de trabajo. Los residuos tipificados se conocen también como residuos de Pearson. También se pueden guardar los valores pronosticados. Se pueden guardar cuatro tipos de residuos: de desviación. El sufijo n añadido a los nuevos nombres de variable se incrementa para formar un nombre exclusivo para cada variable guardada. Si se guardan los valores pronosticados o los residuos para datos no agregados. se debería agregar los datos para obtener los recuentos de casilla. aunque los datos se encuentren registrados como observaciones individuales en el Editor de datos. Residuos tipificados. También llamado residuo simple o bruto. es la diferencia entre la frecuencia observada para la casilla y su frecuencia esperada. . tipificados y brutos. Los valores guardados hacen referencia a los datos agregados (a casillas de la tabla de contingencia). ! ! Residuos. el valor a guardar para una casilla de la tabla de contingencia es introducido en el Editor de datos para cada caso de esa casilla.87 Análisis loglineal logit añadida a todas las casillas para las aproximaciones iniciales). Para que los valores guardados tengan sentido. La delta permanece en las casillas para los modelos saturados. El residuo dividido por una estimación de su error típico. corregidos.

Los residuos de desviación tienen una distribución normal típica asintótica. Dado que los residuos corregidos son asintóticamente normales típicos. residuos tipificados y residuos corregidos de esa combinación (utilizando el subcomando GERESID). Raíz cuadrada. El residuo tipificado dividido por la estimación de su error típico. de la contribución individual al estadístico de chi-cuadrado de la razón de verosimilitud (G al cuadrado). ! ! Si desea información completa sobre la sintaxis. Mostrar los residuos tipificados (utilizando el subcomando PRINT). cuando el modelo seleccionado es el correcto.88 Capítulo 7 ! Residuos corregidos. se prefieren a los residuos tipificados a la hora de contrastar la normalidad. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). con signo. ! Residuos de desviación. Funciones adicionales del comando GENLOG El lenguaje de comandos de SPSS también permite: ! Calcular combinaciones lineales de las frecuencias observadas de casilla y las frecuencias esperadas de casilla e imprimir los residuos. . donde el signo es el signo del residuo (frecuencia observada menos frecuencia esperada). Cambiar el valor por defecto del umbral para la comprobación de la redundancia (utilizando el subcomando CRITERIA).

en las que la elección y el número de categorías de respuesta pueden ser bastante arbitrarios. La diferencia entre una reacción ligera y una moderada es difícil o imposible de cuantificar y se basa en la apreciación. “moderada” o “grave”. “ligera”. residuos de Pearson para las frecuencias y las frecuencias acumuladas. en el sentido en que los cambios en el nivel de la respuesta son equivalentes en todo el rango de la respuesta. probabilidades observadas y esperadas. estadísticos de bondad de ajuste. Por ejemplo. chi-cuadrado de Pearson y chi-cuadrado de la razón de verosimilitud. probabilidades acumuladas observadas y esperadas para cada categoría de respuesta por patrón en las covariables. El diseño de la regresión ordinal se basa en la metodología de McCullagh (1980.Capítulo Regresión ordinal 8 La regresión ordinal permite dar forma a la dependencia de una respuesta ordinal politómica sobre un conjunto de predictores. Ejemplo. El análisis de regresión lineal ordinario implica minimizar las diferencias de la suma de los cuadrados entre una variable de respuesta (la dependiente) y una combinación ponderada de las variables predictoras (las independientes). que tiene el mismo significado que la diferencia de altura entre una persona que mide 210 cm y una que mide 200 cm. Estadísticos y gráficos. que pueden ser factores o covariables. la diferencia entre una respuesta ligera y una moderada podría ser superior o inferior a la diferencia entre una respuesta moderada y una grave. la diferencia de altura entre una persona que mide 150 cm y una que mide 140 cm es de 10 cm. Los coeficientes estimados reflejan cómo los cambios en los predictores afectan a la respuesta. Se considera que la respuesta es numérica. Frecuencias observadas y esperadas y frecuencias acumuladas. 89 . La regresión ordinal podría utilizarse para estudiar la reacción de los pacientes con respecto a una dosis de un fármaco. matrices de correlaciones asintóticas y de covarianzas entre las estimaciones de los parámetros. Además. Las reacciones posibles podrían clasificarse como “ninguna”. Estas relaciones no se mantienen necesariamente con las variables ordinales. 1998) y en la sintaxis se hace referencia al procedimiento como PLUM.

90 Capítulo 8

historial de iteraciones, contraste del supuesto de líneas paralelas, estimaciones de los parámetros, errores típicos, intervalos de confianza y estadísticos R2 de Cox y Snell, de Nagelkerke y de McFadden.

Regresión ordinal: Consideraciones sobre los datos
Datos. Se asume que la variable dependiente es ordinal y puede ser numérica o de

cadena. El orden se determina al clasificar los valores de la variable dependiente en orden ascendente. El valor inferior define la primera categoría. Se asume que las variables de factor son categóricas. Las covariables deben ser numéricas. Observe que al usar más de una covariable continua, se puede llegar a crear una tabla de probabilidades de casilla muy grande.
Supuestos. Sólo se permite una variable de respuesta y debe especificarse. Además,

para cada patrón distinto de valores en las variables independientes, se supone que las respuestas son variables multinomiales independientes.
Procedimientos relacionados. La regresión logística nominal utiliza modelos similares

para las variables dependientes nominales.

Obtener una regresión ordinal
E Elija en los menús: Analizar Regresión Ordinal...

91 Regresión ordinal Figura 8-1 Cuadro de diálogo Regresión ordinal

E Seleccione una variable dependiente. E Pulse en Aceptar.

Regresión ordinal: Opciones
El cuadro de diálogo Opciones le permite ajustar los parámetros utilizados en el algoritmo de estimación iterativo, seleccionar un nivel de confianza para las estimaciones de los parámetros y seleccionar una función de vínculo.

92 Capítulo 8 Figura 8-2 Cuadro de diálogo Regresión ordinal: Opciones

Iteraciones. El algoritmo iterativo puede personalizarse.
! ! !

Iteraciones máximas. Especifique un número entero no negativo. Si se especifica

el 0, el procedimiento devolverá las estimaciones iniciales.
Máxima subdivisión por pasos. Especifique un número entero positivo. Convergencia del logaritmo de la verosimilitud. El algoritmo se detiene si el cambio

absoluto o relativo en el logaritmo de la verosimilitud es inferior a este valor. Si se especifica 0, no se utiliza el criterio.
!

Convergencia de los parámetros. El algoritmo se detiene si el cambio absoluto o

relativo en cada una de las estimaciones de los parámetros es inferior a este valor. Si se especifica 0, no se utiliza el criterio.
Intervalo de confianza. Especifique un valor mayor o igual a 0 e inferior a 100. Delta. El valor añadido a las frecuencias de casilla de cero. Especifique un valor no negativo inferior a 1. Tolerancia para la singularidad. Utilizada para comprobar los predictores con alta

dependencia. Seleccione un valor en la lista de opciones.
Vínculo. Seleccione una de las siguientes funciones: Cauchit, log-log complementario,

logit, log-log negativo y probit.

Estimaciones de los parámetros. ! ! ! Estadísticos de resumen. R2 de Cox y Snell. Matriz de las correlaciones entre las estimaciones de los parámetros. Correlación asintótica de las estimaciones de los parámetros. Estadísticos chi-cuadrado de Pearson y chi-cuadrado de la razón de verosimilitud. Estos estadísticos se calculan según la clasificación especificada en la lista de variables. Siempre se imprimen la primera y la última iteración. . El logaritmo de la verosimilitud y las estimaciones de los parámetros se imprimen con la frecuencia de iteraciones a imprimir especificada. de Nagelkerke y de McFadden.93 Regresión ordinal Resultados de la regresión ordinal El cuadro de diálogo Resultados le permite generar tablas que se pueden visualizar en el Visor y guardar variables en el archivo de trabajo. Figura 8-3 Cuadro de diálogo Regresión ordinal: Resultados Mostrar. ! Estadísticos de bondad de ajuste. errores típicos e intervalos de confianza. Genera tablas correspondientes a: ! Imprimir el historial de iteraciones. Estimaciones de los parámetros.

Probabilidades estimadas por el modelo para la clasificación de un patrón de factor/covariable en las categorías de respuesta. ! Probabilidad de la categoría real. Para comparar los resultados con los productos que no incluyan la constante. Matriz de las covarianzas entre las estimaciones de los parámetros. Guarda las siguientes variables en el archivo de trabajo: ! Probabilidades de respuesta estimadas. El número de probabilidades es igual al número de categorías de respuesta. residuos de Pearson para las frecuencias y las frecuencias acumuladas. Variables guardadas. Probabilidad de la categoría pronosticada.94 Capítulo 8 ! ! Covarianza asintótica de las estimaciones de los parámetros. Información de casilla. Imprimir log-verosimilitud. ! Prueba de líneas paralelas. . Probabilidad estimada de la clasificación de un patrón factor/covariable en la categoría real. puede seleccionar la opción de excluirla. Prueba correspondiente a la hipótesis de que los parámetros de ubicación son equivalentes en todos los niveles de la variable dependiente. probabilidades esperadas y observadas y probabilidades esperadas y observadas de cada categoría de respuesta según el patrón en las covariables. Esta probabilidad también es el máximo de las probabilidades estimadas para el patrón de factor/covariable. Tenga en cuenta que en el caso de modelos con muchos patrones de covariables (por ejemplo. ! ! Categoría pronosticada. Probabilidades estimada de la clasificación de un patrón factor/covariable en la categoría pronosticada. Controla la representación del logaritmo de la verosimilitud. Frecuencias esperadas y observadas y frecuencias acumuladas. Esta prueba está disponible únicamente para el modelo de sólo ubicación. modelos con covariables continuas). esta opción puede generar una tabla grande y poco manejable. La categoría de respuesta con la mayor probabilidad estimada para un patrón de factor/covariable. Incluir constante multinomial ofrece el valor completo de la verosimilitud.

Factores y covariables. Muestra una lista de los factores y las covariables. . El modelo depende de los efectos principales y de los de interacción que seleccione. pero no contiene efectos de interacción. Crea el término de interacción de mayor nivel con todas las variables seleccionadas. etiquetando con (F) los factores y con (C) las covariables.95 Regresión ordinal Modelo de ubicación de la regresión ordinal El cuadro de diálogo Ubicación le permite especificar el modelo de ubicación para el análisis. Figura 8-4 Cuadro de diálogo Regresión ordinal: Ubicación Especificar modelo. Puede crear un modelo personalizado para especificar subconjuntos de interacciones entre los factores o bien interacciones entre las covariables. Modelo de ubicación. Construir términos Para las covariables y los factores seleccionados: Interacción. Un modelo de efectos principales contiene los efectos principales de las covariables y los factores.

Crea todas las interacciones triples posibles de las variables seleccionadas. Crea todas las interacciones dobles posibles de las variables seleccionadas. Todas de 5. Todas de 4.96 Capítulo 8 Efectos principales. El modelo depende de los efectos principales y de los de interacción que seleccione. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Todas de 3. etiquetando con (F) los factores y con (C) las covariables. Crea un término de efectos principales para cada variable seleccionada. Modelo de escala de la regresión ordinal El cuadro de diálogo Escala le permite especificar el modelo de escala para el análisis. Modelo de escala. Todas de 2. Muestra una lista de los factores y las covariables. Figura 8-5 Cuadro de diálogo Regresión ordinal: Escala Factores y covariables. .

Todas de 5. Crea todas las interacciones triples posibles de las variables seleccionadas.97 Regresión ordinal Construir términos Para las covariables y los factores seleccionados: Interacción. Funciones adicionales del comando PLUM Se puede personalizar la regresión ordinal si se pegan las selecciones en una ventana de sintaxis y se edita la sintaxis del comando PLUM resultante. Crea todas las interacciones quíntuples posibles de las variables seleccionadas. Efectos principales. Todas de 4. Todas de 3. El lenguaje de comandos de SPSS también permite: ! Crear contrastes de hipótesis personalizados especificando las hipótesis nulas como combinaciones lineales de los parámetros. Crea todas las interacciones cuádruples posibles de las variables seleccionadas. Todas de 2. . Crea el término de interacción de mayor nivel con todas las variables seleccionadas. Crea un término de efectos principales para cada variable seleccionada. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). Crea todas las interacciones dobles posibles de las variables seleccionadas. Si desea información completa sobre la sintaxis.

.

Capítulo Tablas de mortalidad 9 Existen muchas situaciones en las se desea examinar la distribución de un período entre dos eventos. ¿Funciona la nueva terapia de parches de nicotina mejor que la terapia de parches tradicional a la hora de ayudar a la gente a dejar de fumar? Se podría llevar a cabo un estudio utilizando dos grupos de fumadores. Existe una técnica estadística útil para este tipo de datos llamada tabla de mortalidad de “seguimiento”. Estos casos se conocen globalmente como casos censurados y hacen que el uso de técnicas tradicionales como las pruebas t o la regresión lineal sea inapropiado para este tipo de estudio. Si desea obtener información más 99 . con el fin de determinar si el tratamiento experimental representa una mejora con respecto a la terapia tradicional. el investigador puede haber perdido el seguimiento de su estado en algún momento anterior a que finalice el estudio. La idea básica de la tabla de mortalidad es subdividir el período de observación en intervalos de tiempo más pequeños. Las razones para que no se verifique el segundo evento pueden ser muy variadas: en algunos casos. uno que haya seguido la terapia tradicional y el otro la terapia experimental. Ejemplo. Sin embargo. en otros. Al construir las tablas de mortalidad a partir de los datos podrá comparar las tasas de abstinencia globales para los dos grupos. este tipo de datos suele incluir algunos casos para los que no se registra el segundo evento. se utiliza toda la gente que se ha observado como mínimo durante ese período de tiempo para calcular la probabilidad de que un evento terminal tenga lugar dentro de ese intervalo. como la duración del empleo (tiempo transcurrido entre el contrato y el abandono de la empresa). el evento simplemente no tiene lugar antes de que finalice el estudio. y existen además casos que no pueden continuar por razones ajenas al estudio (como el caso en que un empleado caiga enfermo y se acoja a una baja laboral). por ejemplo. la gente que todavía trabaja en la empresa al final del estudio. Las probabilidades estimadas para cada intervalo se utilizan para estimar la probabilidad global de que el evento tenga lugar en diferentes puntos temporales. En cada intervalo.

Si dispone de variables que cree que están relacionadas con el tiempo de supervivencia o variables que desea controlar (covariables). proporción que sobrevive. log de la supervivencia. número expuesto a riesgo. densidad de probabilidad (y error típico). Número que entra. los resultados pueden resultar sesgados. Si las covariables pueden tener distintos valores en diferentes puntos temporales para el mismo caso. proporción acumulada que sobrevive (y error típico). La variable de tiempo deberá ser cuantitativa.100 Capítulo 9 detallada. Las probabilidades para el evento de interés deben depender solamente del tiempo transcurrido desde el evento inicial (se asume que son estables con respecto al tiempo absoluto). Este método es recomendable si se tiene un número pequeño de observaciones. el cual no se basa en la partición del período de observación en intervalos de tiempo más pequeños. Supuestos. Estadísticos. los casos que se introducen en el estudio en horas diferentes (por ejemplo. Es decir. utilice el procedimiento Regresión de Cox. densidad. codificadas como valores enteros. Si. también es posible representar gráficamente las funciones de impacto o de supervivencia y compararlas visualmente. pacientes que inician el tratamiento en horas diferentes) se deberían comportar de manera similar. Gráficos: gráficos de las funciones para supervivencia. El procedimiento Tablas de mortalidad utiliza un enfoque actuarial en esta clase de análisis (conocido de manera genérica como Análisis de supervivencia). por ejemplo. Procedimientos relacionados. La variable de estado deberá ser dicotómica o categórica. codificada en forma de números enteros. El procedimiento Análisis de supervivencia de Kaplan-Meier utiliza un método ligeramente diferente para calcular las tablas de mortalidad. con los eventos codificados en forma de un valor único o un rango de valores consecutivos. utilice el procedimiento Regresión de Cox con covariables dependientes del tiempo. . tasa de impacto y uno menos la supervivencia. de manera que habrá solamente un pequeño número de observaciones en cada intervalo de tiempo de supervivencia. tasa de impacto (y error típico) para cada intervalo de tiempo en cada grupo. Las variables de factor deberán ser categóricas. Tampoco deben existir diferencias sistemáticas entre los casos censurados y los no censurados. número que abandona. proporción que termina. muchos de los casos censurados son pacientes en condiciones más graves. número de eventos terminales. Tablas de mortalidad: Consideraciones sobre los datos Datos.

. Figura 9-1 Cuadro de diálogo Tablas de mortalidad E Seleccione una numéricos variables de supervivencia. E Especifique los intervalos de tiempo que se van a examinar. Se generan tablas actuariales de la variable de supervivencia para cada categoría de la variable de factor. Si lo desea. puede seleccionar una variable de factor de primer orden.101 Tablas de mortalidad Para crear una tabla de mortalidad E Elija en los menús: Analizar Superviv. E Seleccione una variable de estado para definir casos para los que tuvo lugar el evento terminal. .. Tablas de mortalidad. el cual indica que ha tenido lugar un evento. E Pulse en Definir evento para especificar el valor de la variable de estado.

. Todos los demás casos se consideran censurados. Las tablas actuariales de la variable de supervivencia se generan para cada combinación de las variables de factor de primer y segundo orden. Tablas de mortalidad: Definir rango Figura 9-3 Cuadro de diálogo Tablas de mortalidad: Definir rango Los casos con valores para la variable de factor dentro del rango especificado se incluirán en el análisis y se generarán tablas individuales (y gráficos si se solicita) para cada valor individual dentro del rango.102 Capítulo 9 Además es posible seleccionar una variable por factor de segundo orden. Tablas de mortalidad: Definir evento para la variable de estado Figura 9-2 Cuadro de diálogo Tablas de mortalidad: Definir evento para la variable de estado Las apariciones del valor o valores seleccionados para la variable de estado indican que el evento terminal ha tenido lugar para esos casos. Introduzca un único valor o un rango de valores que identifiquen el evento de interés.

se generan gráficos para cada subgrupo definido por las variables de factor. Densidad y Uno menos la supervivencia. Comparar los niveles del primer factor. .103 Tablas de mortalidad Tablas de mortalidad: Opciones Figura 9-4 Cuadro de diálogo Tablas de mortalidad: Opciones Es posible controlar diversos aspectos del análisis de Tablas de mortalidad. Tablas de mortalidad. Si se han definido variables de factor. en una escala lineal. la cual compara la supervivencia para los subgrupos. Si ha definido un factor de segundo orden. Representa la función uno menos la supervivencia en una escala lineal. Las pruebas se realizan en el factor de primer orden. Muestra la función de supervivencia acumulada. Si tiene una variable de control de primer orden. Log de la supervivencia. ! Gráfico de impacto. Uno menos la supervivencia. Muestra la función de densidad. Muestra la función de impacto acumulada. Los gráficos disponibles son Supervivencia. desactive Tablas de mortalidad. Muestra la función de supervivencia acumulada. en una escala lineal. Para suprimir la presentación de las tablas de mortalidad en los resultados. Permite solicitar gráficos de las funciones de supervivencia. se puede seleccionar una de las opciones de este grupo para realizar la prueba de Wilcoxon (Gehan). Impacto. en una escala logarítmica. ! ! Gráfico de densidad. Gráfico del log de la supervivencia. Gráfico. ! ! Gráfico de supervivencia. se realizarán pruebas para cada nivel de la variable de segundo orden.

Calcular comparaciones aproximadas. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). Especificar intervalos espaciados de forma desigual. .104 Capítulo 9 Funciones adicionales del comando SURVIVAL El lenguaje de comandos de SPSS también permite: ! ! ! ! ! Especificar más de una variable dependiente. Especificar comparaciones que no incluyan todas las variables de control y de factor. Si desea información completa sobre la sintaxis. no exactas. Especificar más de una variable de estado.

log de la supervivencia y uno menos la supervivencia. Al construir un modelo de Kaplan-Meier a partir de los datos. Gráficos: supervivencia. también es posible representar gráficamente las funciones de impacto o de supervivencia y compararlas visualmente. Si desea obtener información más detallada. el estado. La tabla de supervivencia. Sin embargo. este tipo de datos incluye generalmente algunos casos censurados. la gente que todavía está trabajando en la empresa al final del estudio). la media y mediana del tiempo de supervivencia. ¿Posee algún beneficio terapéutico sobre la prolongación de la vida un nuevo tratamiento para el SIDA Se podría dirigir un estudio utilizando dos grupos de pacientes de SIDA. uno que reciba la terapia tradicional y otro que reciba el tratamiento experimental. El procedimiento de Kaplan-Meier es un método de estimación de modelos hasta el evento en presencia de casos censurados. El modelo de Kaplan-Meier se basa en la estimación de las probabilidades condicionales en cada punto temporal cuando tiene lugar un evento y en tomar el límite del producto de esas probabilidades para estimar la tasa de supervivencia en cada punto temporal. impacto. Estadísticos. Los casos censurados son casos para los que no se registra el segundo evento (por ejemplo. se podrán comparar las tasas de supervivencia globales entre los dos grupos. la supervivencia acumulada y el error típico. para determinar si el tratamiento experimental representa una mejora con respecto a la terapia tradicional. que incluye el tiempo. los eventos acumulados y el número que permanece. como la duración del empleo (tiempo transcurrido entre el contrato y el abandono de la empresa).Análisis de supervivencia de Kaplan-Meier 10 Capítulo Existen muchas situaciones en las se desea examinar la distribución de un período entre dos eventos. Ejemplo. 105 . con el error típico y el intervalo de confianza al 95%.

los casos que se introducen en el estudio en horas diferentes (por ejemplo. pacientes que inician el tratamiento en horas diferentes) se deberían comportar de manera similar. Las probabilidades para el evento de interés deben depender solamente del tiempo transcurrido desde el evento inicial (se asume que son estables con respecto al tiempo absoluto). Procedimientos relacionados. Es decir. . Si.106 Capítulo 10 Kaplan-Meier: Consideraciones sobre los datos Datos. El procedimiento de Kaplan-Meier utiliza un método de cálculo de las tablas de mortalidad que estima la función de impacto o supervivencia para el tiempo en que tiene lugar cada evento. La variable de tiempo deberá ser continua. los resultados pueden resultar sesgados.. El procedimiento Tablas de mortalidad utiliza una aproximación actuarial al análisis de supervivencia que se basa en la partición del período de observación en intervalos de tiempo menores y puede ser útil para trabajar con grandes muestras. Tampoco deben existir diferencias sistemáticas entre los casos censurados y los no censurados. la variable de estado puede ser continua o categórica y las variables de estrato y de factor deberán ser categóricas. Para obtener un análisis de supervivencia de Kaplan-Meier E Elija en los menús: Analizar Superviv. utilice el procedimiento Regresión de Cox con covariables dependientes del tiempo. por ejemplo. utilice el procedimiento Regresión de Cox. Supuestos. Si las covariables pueden tener distintos valores en diferentes puntos temporales para el mismo caso. Kaplan-Meier.. muchos de los casos censurados son pacientes en condiciones más graves. Si dispone de variables que cree que están relacionadas con el tiempo de supervivencia o variables que desea controlar (covariables).

Esta variable puede ser numérica o de cadena corta. que generará análisis diferentes para cada nivel (cada estrato) de la variable. pulse en Definir evento. . E Seleccione una variable de estado que identifique los casos para los que ha tenido lugar el evento terminal. Si lo desea. puede seleccionar una variable de factor para examinar las diferencias entre grupos.107 Análisis de supervivencia de Kaplan-Meier Figura 10-1 Cuadro de diálogo Kaplan-Meier E Seleccione una variable de tiempo. A continuación. Además es posible seleccionar una variable de estrato.

Seleccione una de las opciones para especificar las comparaciones que se van a realizar: Combinada sobre los estratos.108 Capítulo 10 Kaplan-Meier: Definir evento para la variable de estado Figura 10-2 Cuadro de diálogo Kaplan-Meier: Definir evento para la variable de estado Introduzca el valor o valores que indican que el evento terminal ha tenido lugar. ! Log rango. Kaplan-Meier: Comparar niveles de los factores Figura 10-3 Cuadro de diálogo Kaplan-Meier: Comparar niveles de los factores Se pueden solicitar estadísticos para contrastar la igualdad de las distribuciones de supervivencia para los diferentes niveles del factor. La opción Rango de valores solamente estará disponible si la variable de estado es numérica. todos los puntos del tiempo son ponderados por igual. Breslow y Tarone-Ware. . un rango de valores o una lista de valores. Los estadísticos disponibles son Log rango. Para cada estrato. Prueba para comparar la igualdad de distribuciones de supervivencia. En esta prueba. Por parejas sobre los estratos o Por parejas en cada estrato. Se puede introducir un solo valor.

como nuevas variables. Permite contrastar la tendencia lineal a lo largo de los niveles del factor. Se pueden guardar estimaciones de la supervivencia. ! ! ! Combinada sobre los estratos. No están disponibles las pruebas de tendencia por parejas. el error típico de la supervivencia. Compara cada pareja diferente de niveles del factor. ! Tarone-Ware. Prueba para comparar la igualdad de distribuciones de supervivencia. Realiza una prueba de igualdad para todos los niveles del factor. para contrastar la igualdad de las curvas de supervivencia. No están disponibles las pruebas de tendencia por parejas. Si no dispone de una variable de estratificación. Los puntos del tiempo se ponderan mediante la raíz cuadrada del número de casos bajo riesgo que hay en cada punto del tiempo. . el impacto y los eventos acumulados. Para cada estrato. no se realiza ninguna prueba. Kaplan-Meier: Guardar variables nuevas Figura 10-4 Cuadro de diálogo Kaplan-Meier: Guardar variables nuevas Es posible guardar información de la tabla de Kaplan-Meier como nuevas variables. Esta opción solamente estará disponible para las comparaciones globales (en vez de por parejas) de los niveles del factor.109 Análisis de supervivencia de Kaplan-Meier ! Breslow. Por parejas sobre los estratos. Los puntos temporales se ponderan por el número de casos que hay bajo riesgo en cada punto del tiempo. Compara cada pareja de niveles del factor diferente. Tendencia lineal para los niveles del factor. Prueba para comparar la igualdad de distribuciones de supervivencia. en cada estrato. Si no dispone de una variable de estratificación. no se realiza ninguna prueba. información que se podrá utilizar en análisis subsiguientes para contrastar hipótesis o verificar los supuestos. ! Por parejas en cada estrato. distinta para cada estrato. Compara todos los niveles del factor en una única prueba.

El nombre de variable por defecto es el prefijo haz_ con un número secuencial. si cum_1 ya existe. Por ejemplo. cuando los casos se ordenan por los tiempos de supervivencia y por los códigos de estado. ! Eventos acumulados. incluyendo las tablas de supervivencia. Kaplan-Meier: Opciones Figura 10-5 Cuadro de diálogo Kaplan-Meier: Opciones Es posible solicitar varios tipos de resultados del análisis Kaplan-Meier. . Estimación de la función de impacto acumulada. Es posible seleccionar que se muestren estadísticos para las funciones de supervivencia calculadas. Kaplan-Meier asigna el nombre de variable se_2. Kaplan-Meier asigna el nombre de variable sur_2. El nombre de variable por defecto es el prefijo sur_ con un número secuencial. El nombre de variable por defecto es el prefijo cum_ con un número secuencial. Error típico de la estimación de la supervivencia acumulada. Kaplan-Meier asigna el nombre de variable cum_2. Si se han incluido variables de factor.Estimación de la probabilidad de supervivencia acumulada. El nombre de variable por defecto es el prefijo se_ con un número secuencial. ! Impacto. Estadísticos. Por ejemplo. la media y mediana de supervivencia y los cuartiles.110 Capítulo 10 ! Supervivencia. ! Error típico de supervivencia. si se_1 ya existe. Por ejemplo. se generan estadísticos separados para cada grupo. si haz_1 ya existe. Por ejemplo. Frecuencia acumulada de los eventos. Kaplan-Meier asigna el nombre de variable haz_2. si sur_1 ya existe.

se representarán las funciones para cada grupo. log de la supervivencia y uno menos la supervivencia. Obtener percentiles diferentes a los cuartiles para la variable del tiempo de supervivencia. Muestra la función de impacto acumulada. ! ! Gráfico de supervivencia. Si se han incluido variables de factor.111 Análisis de supervivencia de Kaplan-Meier Gráficos. Si desea información completa sobre la sintaxis. Especificar el espaciado desigual para la prueba de la tendencia lineal. Permite examinar visualmente las funciones de supervivencia. Uno menos la supervivencia. en una escala lineal. impacto. Muestra la función de supervivencia acumulada. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference ). ! Gráfico de impacto. en una escala lineal. Muestra la función de supervivencia acumulada. ! Gráfico del log de la supervivencia. Funciones adicionales del comando KM El lenguaje de comandos de SPSS también permite: ! ! ! Obtener tablas de frecuencias que consideren los casos perdidos durante el seguimiento como una categoría diferente de los casos censurados. Representa la función uno menos la supervivencia en una escala lineal. . en una escala logarítmica.

.

cuyas covariables sean el consumo diario de cigarrillos y el sexo. Por ejemplo. la regresión de Cox permite incluir en los modelos variables predictoras (covariables). deberán ser auxiliares (dummy) o estar codificadas con indicadores (existe una opción dentro del procedimiento para 113 . Las variables independientes (las covariables) pueden ser continuas o categóricas. permitiendo evaluar el impacto de múltiples covariables en el mismo modelo. es posible contrastar las hipótesis sobre los efectos del consumo de tabaco y del sexo sobre el tiempo hasta el momento de la aparición de un cáncer de pulmón. Estadísticos. la regresión de Cox es un método para crear modelos para datos de tiempos de espera hasta un evento con casos censurados presentes. Para cada modelo: –2LL. el estadístico de la razón de verosimilitud y el chi-cuadrado global. Sin embargo. Errores típicos y Estadísticos de Wald. La variable de tiempo debería ser cuantitativa y la variable de estado puede ser categórica o continua. ¿Corren los hombres y las mujeres diferentes riesgos de desarrollar cáncer de pulmón a causa del consumo de cigarrillos ? Construyendo un modelo de regresión de Cox. Para las variables dentro del modelo: Estimaciones de los parámetros. si son categóricas. La regresión de Cox gestionará los casos censurados correctamente y proporcionará las estimaciones de los coeficientes para cada una de las covariables. Para variables que no estén en el modelo: Estadísticos de puntuación y Chi-cuadrado residual. Además. Regresión de Cox: Consideraciones sobre los datos Datos. Ejemplo. podrá construir un modelo de la duración en el empleo como función del nivel educativo y de la categoría laboral.Análisis de regresión de Cox 11 Capítulo Del mismo modo que las tablas de mortalidad y el análisis de supervivencia de Kaplan-Meier. es posible utilizar la regresión de Cox para examinar el efecto de covariables continuas.

Regresión de Cox.. El último supuesto se conoce como el supuesto de impactos proporcionales. .114 Capítulo 11 recodificar las variables categóricas automáticamente). es posible utilizar el procedimiento Regresión lineal para modelar la relación entre las variables predictoras y el tiempo de espera hasta el evento. la proporcionalidad de los impactos de un caso a otro no debe variar en función del tiempo. Si no posee covariables o si solamente posee una covariable categórica. es posible utilizar las Tablas de mortalidad o el procedimiento de Kaplan-Meier para examinar las funciones de impacto o de supervivencia para las muestras. Procedimientos relacionados. Si no posee datos censurados en la muestra (es decir. es posible que deba utilizar el procedimiento de Cox con covariables dependientes del tiempo. Supuestos. Para obtener un análisis de regresión de Cox E Elija en los menús: Analizar Superviv. si todos los casos experimentaron el evento terminal). codificadas como valores enteros o cadenas cortas. es decir.. Si el supuesto de impactos proporcionales no se conserva (véase más arriba). Las observaciones deben ser independientes y la tasa de impacto debe ser constante a lo largo del tiempo. Las variables de estratos deberían ser categóricas.

115 Análisis de regresión de Cox Figura 11-1 Cuadro de diálogo Regresión de Cox

E Seleccione una variable de tiempo. No se analizan aquellos casos en los que los

valores del tiempo son negativos.
E Seleccione una variable de estado y pulse en Definir evento. E Seleccione una o varias covariables. Para incluir términos de interacción, seleccione todas las variables contenidas en la interacción y seleccione >a*b>.

Si lo desea, es posible calcular modelos diferentes para diferentes grupos definiendo una variable para los estratos.

116 Capítulo 11

Regresión de Cox: Definir variables categóricas
Figura 11-2 Cuadro de diálogo Regresión de Cox: Definir variables categóricas

Es posible especificar los detalles sobre cómo gestionará el procedimiento de Regresión de Cox las variables categóricas:
Covariables. Muestra una lista de todas las covariables especificadas en el cuadro de

diálogo principal para cualquier capa, bien por ellas mismas o como parte de una interacción. Si alguna de éstas son variables de cadena o son categóricas, sólo puede utilizarlas como covariables categóricas.
Covariables categóricas. Lista las variables identificadas como categóricas. Cada

variable incluye una notación entre paréntesis indicando el esquema de codificación de contraste que va a utilizarse. Las variables de cadena (señaladas con el símbolo < a continuación del nombre) estarán presentes ya en la lista Covariables categóricas. Seleccione cualquier otra covariable categórica de la lista Covariables y muévala a la lista Covariables categóricas.
Cambiar el contraste. Le permite cambiar el método de contraste. Los métodos de

contraste disponibles son:
!

Indicador. Los contrastes indican la presencia o ausencia de la pertenencia a una

categoría. La categoría de referencia se representa en la matriz de contraste como una fila de ceros.
!

Simple. Cada categoría de la variable predictora (excepto la propia categoría de

referencia) se compara con la categoría de referencia.

117 Análisis de regresión de Cox !

Diferencia. Cada categoría de la variable predictora, excepto la primera categoría,

se compara con el efecto promedio de las categorías anteriores. También se conoce como contrastes de Helmert inversos.
! ! !

Helmert. Cada categoría de la variable predictora, excepto la última categoría, se

compara con el efecto promedio de las categorías subsiguientes.
Repetidas. Cada categoría de la variable predictora, excepto la primera categoría,

se compara con la categoría que la precede.
Polinómico. Contrastes polinómicos ortogonales. Se supone que las categorías

están espaciadas equidistantemente. Los contrastes polinómicos sólo están disponibles para variables numéricas.
!

Desviación. Cada categoría de la variable predictora, excepto la categoría de

referencia, se compara con el efecto global. Si selecciona Desviación, Simple o Indicador, elija Primera o Última como categoría de referencia. Observe que el método no cambia realmente hasta que se pulsa en Cambiar. Las covariables de cadena deben ser covariables categóricas. Para eliminar una variable de cadena de la lista Covariables categóricas, debe eliminar de la lista Covariables del cuadro de diálogo principal todos los términos que contengan la variable.

Regresión de Cox: Gráficos
Figura 11-3 Cuadro de diálogo Regresión de Cox: Gráficos

! Uno menos la supervivencia. log-menos-log y uno menos la supervivencia. . de impacto. desplazando esa covariable al cuadro de texto Líneas separadas para. Muestra la función de supervivencia acumulada. La estimación de la supervivencia acumulada tras la transformación In(-ln) se aplica a la estimación. El valor por defecto es utilizar la media de cada covariable como un valor constante pero es posible introducir los propios valores para el gráfico utilizando el grupo de control Cambiar el valor. Esta opción solamente estará disponible para covariables categóricas. Es posible representar gráficamente las funciones de supervivencia. Representa la función uno menos la supervivencia en una escala lineal. ! Log menos log. Regresión de Cox: Guardar nuevas variables Figura 11-4 Cuadro de diálogo Regresión de Cox: Guardar nuevas variables Es posible guardar varios resultados del análisis como nuevas variables. Estas variables se pueden utilizar en análisis siguientes para contrastar hipótesis o para comprobar supuestos. ! Gráfico de impacto. Es posible representar gráficamente una línea diferente para cada valor de una covariable categórica. se deben utilizar valores constantes para las covariables con el fin de representar gráficamente las funciones respecto al tiempo. Muestra la función de impacto acumulada. Como estas funciones dependen de los valores de las covariables. con la expresión (Cat) marcada después de sus nombres en la lista Valores de las covariables representados en. en una escala lineal.118 Capítulo 11 Los gráficos pueden ayudarle a evaluar el modelo estimado e interpretar los resultados. ! Gráfico de supervivencia. en una escala lineal.

Cambio estimado en un coeficiente si se elimina un caso. por sus correspondientes parámetros estimados para cada caso. Puntuación de la predicción lineal. Las DfBetas están disponibles sólo para los modelos que contienen al menos una covariable. Permite guardar la función de impacto. Guarda la estimación de función de impacto acumulada (también llamado el residuo de Cox-Snell). Regresión de Cox: Opciones Figura 11-5 Cuadro de diálogo Regresión de Cox: Opciones Es posible controlar diferentes aspectos del análisis y los resultados. Los residuos parciales están disponibles sólo para los modelos que contienen al menos una covariable. Se guarda una variable por cada covariable en el modelo final. Residuos parciales. el DfBeta o DfBetas son las únicas variables que se pueden guardar. Permite guardar las estimaciones de log-menos-log. . ! ! Función de impacto. el error típico y la función de supervivencia como nuevas variables. centradas en la media (las puntuaciones diferenciales). Se guarda una variable por cada covariable en el modelo final.119 Análisis de regresión de Cox Supervivencia. los residuos parciales y el DfBeta o DfBetas para la regresión como nuevas variables. Puede representar los residuos parciales respecto al tiempo para contrastar el supuesto de proporcionalidad de los impactos. Además es posible guardar la variable de predicción lineal X*Beta. ! X*Beta. Si está ejecutando Cox con una covariable dependiente del tiempo. ! DfBetas. La suma del producto de los valores de las covariables. Diagnósticos.

El valor de Entrada debe ser menor que el valor de Salida. Permite especificar el número máximo de iteraciones para el modelo. Si se ha seleccionado un método por pasos sucesivos. Se puede introducir un solo valor. un rango de valores o una lista de valores. Especificar los criterios de iteración adicionales. simple y de desviación. Seleccionar una categoría de referencia. Controlar el tratamiento de los valores perdidos. Es posible obtener estadísticos para los parámetros del modelo. que controla durante cuánto tiempo el procedimiento buscará una solución. Mostrar la función de línea base. incluyendo los intervalos de confianza para exp(B) y la correlación de las estimaciones. . La opción Rango de valores solamente estará disponible si la variable de estado es numérica. Esta visualización no está disponible si se han especificado covariables dependientes del tiempo. Es posible solicitar estos estadísticos en cada paso o solamente en el último paso. Permite visualizar la función de impacto basal y la supervivencia acumulada en la media de las covariables. que no sea la primera ni la última. Funciones adicionales del comando COXREG El lenguaje de comandos de SPSS también permite: ! ! ! ! ! Obtener tablas de frecuencias que consideren los casos perdidos durante el seguimiento como una categoría diferente de los casos censurados. Especificar un espaciado desigual entre las categorías para el método de contraste polinómico.120 Capítulo 11 Estadísticos del modelo. Regresión de Cox: Definir evento para la variable de estado Introduzca el valor o valores que indican que el evento terminal ha tenido lugar. para los métodos de contraste de indicador. Una variable será introducida si el nivel de significación de su F para entrar es menor que el valor de Entrada y una variable será eliminada si el nivel de significación es mayor que el valor de Salida. Nº máximo de iteraciones. es posible especificar la probabilidad para la entrada o la exclusión desde el modelo. Probabilidad para el método por pasos.

Mantener los datos de cada grupo de segmentación del archivo en un archivo temporal externo durante el proceso. . Guardar los resultados en un archivo de sistema de SPSS externo.121 Análisis de regresión de Cox ! ! ! Especificar los nombres para las variables guardadas. Esto puede contribuir a conservar los recursos de memoria cuando se ejecutan los análisis con grandes conjuntos de datos. Si desea información completa sobre la sintaxis. No se encuentra disponible con covariables dependientes del tiempo. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference).

.

(Estas covariables se pueden especificar usando la sintaxis de comandos). Para facilitar esta tarea cuenta con una variable del sistema que representa el tiempo. pero también se pueden especificar funciones más complejas. pero no se cumple el supuesto de tasas de impacto proporcionales. La comparación de la significación del coeficiente de la covariable dependiente del tiempo le indicará si es razonable el supuesto de proporcionalidad de los impactos. Esta variable se llama T_. pero no están sistemáticamente relacionadas con el tiempo.Calcular covariable dependiente del tiempo 12 Capítulo Existen ciertas situaciones en las que interesa calcular un modelo de regresión de Cox. Un ejemplo común sería el simple producto de la variable de tiempo y la covariable. que permita especificar las covariables dependientes del tiempo. defina la covariable dependiente del tiempo como una función de la variable de tiempo T_ y la covariable en cuestión. los valores de una (o de varias) de las covariables son diferentes en los distintos puntos del tiempo. Es decir. En esos casos. que las tasas de impacto cambian con el tiempo. lo cual puede llevarse a cabo usando las expresiones lógicas. es necesario utilizar un modelo de regresión de Cox extendido. . debe definir primero una covariable dependiente del tiempo (también se pueden especificar múltiples covariables dependientes del tiempo usando la sintaxis de comandos). Puede utilizar esta variable para definir covariables dependientes del tiempo empleando dos métodos generales: ! Si desea contrastar el supuesto de tasas de impacto proporcionales con respecto a una covariable particular o bien desea estimar un modelo de regresión de Cox extendido que permita impactos no proporcionales. Las expresiones lógicas 123 ! Algunas variables pueden tener valores distintos en períodos diferentes del tiempo. Con el fin de analizar dicho modelo. En tales casos es necesario definir una covariable dependiente del tiempo segmentada.

124 Capítulo 12 toman el valor 1 cuando son verdaderas y el valor 0 cuando son falsas. Estos valores no se utilizan en el análisis. En otras palabras.. incluso para los puntos del tiempo posteriores a la eliminación del caso del conjunto bajo riesgo (ya sea por el evento o por la censura). si se toma la tensión una vez a la semana durante cuatro semanas (identificadas como BP1 a BP4). o bien introducirla directamente en el área de texto Expresión para T_COV_.. Puede utilizar los controles de generación de funciones para crear la expresión para la covariable dependiente del tiempo. La variable resultante se llama T_COV_ y se debe incluir como una covariable en el modelo de regresión de Cox. con el punto como separador de la parte decimal. puede definir la covariable dependiente del tiempo como (T_ < 1) * BP1 + (T_ >= 1 & T_ < 2) * BP2 + (T_ >= 2 & T_ < 3) * BP3 + (T_ >= 3 & T_ < 4) * BP4. si es más de una semana pero menos de dos. pero deben ser valores válidos de SPSS para evitar que los casos sean excluidos. Para calcular una covariable dependiente del tiempo E Elija en los menús: Analizar Superviv. Es posible crear una covariable dependiente del tiempo a partir de un conjunto de medidas. Tenga en cuenta que las constantes de cadena deben ir entre comillas o apóstrofes y que las constantes numéricas se deben escribir en formato americano. utilice BP2. Cox con covariable dep. y así sucesivamente”. los casos para los que falte cualquiera de los valores quedarán eliminados del análisis. del tiempo. usando una serie de expresiones lógicas. Para las covariables dependientes del tiempo segmentadas. esta función se puede interpretar diciendo que “Si el tiempo es inferior a una semana. Por ejemplo. con la definición anterior. . debe asegurarse de que todos los casos tengan valores para todos los puntos del tiempo medidos en la covariable. un caso censurado en la segunda semana debe tener todavía valores para BP3 y BP4 (pueden ser 0 o cualquier otro número. Tenga en cuenta que exactamente uno de los términos entre paréntesis será igual a uno para cualquier caso dado y el resto serán todos 0. Por ejemplo. Por tanto. puesto que no se usan en el análisis). use BP1.

E Seleccione Modelo para continuar con la regresión de Cox. Dispone además de otras funciones de sintaxis de comandos para la regresión de Cox con o sin covariables dependientes del tiempo. Si desea información completa sobre la sintaxis.125 Calcular covariable dependiente del tiempo Figura 12-1 Cuadro de diálogo Calcular covariable dependiente del tiempo E Introduzca una expresión para la covariable dependiente del tiempo. consulte “Análisis de regresión de Cox” en Capítulo 11 en la página 113. . Regresión de Cox con covariables dependientes del tiempo: Funciones adicionales El lenguaje de comandos de SPSS permite especificar múltiples covariables dependientes del tiempo. Si desea obtener más información. consulte la referencia de sintaxis de comandos de SPSS (SPSS Command Syntax Reference). Nota: Asegúrese de incluir la nueva variable T_COV_ como covariable en el modelo de regresión de Cox.

.

. gl(k–1) ( –1/k ( 1/k ( 1–1/k ( –1/k 1/k –1/k 1–1/k . estos contrastes tiene la forma: media gl(1) gl(2) . se puede solicitar la sustitución automática de una variable independiente categórica por un conjunto de variables de contraste.. se omite la última categoría.. Desviación Desviación desde la media global. En términos matriciales.. 1–1/k –1/k ) . .... –1/k . . Puede especificar cómo se va a codificar el conjunto de variables de contraste. Por ejemplo. . normalmente en el subcomando CONTRAST. Ese apéndice explica e ilustra el funcionamiento real de los distintos tipos de contrastes solicitados en CONTRAST.Apéndice Esquemas de codificación de variables categóricas A En muchos procedimientos de SPSS. los contrastes de desviación para una variable independiente con tres categorías son los siguientes: 127 . por defecto. .. que se podrán introducir o eliminar de una ecuación como un bloque. 1/k –1/k –1/k 1/k ) –1/k ) –1/k ) donde k es el número de categorías para la variable independiente y.

.. los contrastes simples para una variable independiente con cuatro categorías son los siguientes: ( 1/4 (1 1/4 0 1/4 0 1/4 ) –1 ) . La matriz de contraste resultante será ( 1/3 ( 2/3 ( –1/3 1/3 –1/3 –1/3 1/3 ) –1/3 ) 2/3 ) Simple Contrastes simples.. 0 .. . Por ejemplo. . 1 –1 ) . Por ejemplo. ... especifique el número de la categoría omitida entre el paréntesis que sucede a la palabra clave DEVIATION. el siguiente subcomando obtiene las desviaciones para la primera y tercera categorías y omite la segunda: /CONTRAST(FACTOR)=DEVIATION(2) Suponga que factor tiene tres categorías. Compara cada nivel de un factor con el último. La forma de la matriz general es media gl(1) gl(2) .128 Apéndice A ( 1/3 ( 2/3 ( –1/3 1/3 –1/3 2/3 1/3 ) –1/3 ) –1/3 ) Para omitir una categoría distinta de la última. gl(k–1) (0 ( 1/k (1 (0 1/k 0 1 .. .. 1/k 0 0 1/k ) –1 ) –1 ) donde k es el número de categorías para la variable independiente.

Por ejemplo. el siguiente subcomando CONTRAST obtiene una matriz de contraste que omite la segunda categoría: /CONTRAST(FACTOR)=DEVIATION(2) Suponga que factor tiene cuatro categorías. 1/k –1/(k–1) –1/(k–2) 1/k ) –1/(k–1) ) –1/(k–2) ) donde k es el número de categorías de la variable independiente. . Por ejemplo. que no es necesariamente el valor asociado con dicha categoría. . –1/2 1 –1/2 –1 ) . una variable independiente con cuatro categorías tiene una matriz de contraste de Helmert con la siguiente forma: . especifique entre paréntesis tras la palabra clave SIMPLE el número de secuencia de la categoría de referencia.. Compara categorías de una variable independiente con la media de las categorías subsiguientes.. La forma de la matriz general es media gl(1) gl(2) .. gl(k–2) gl(k–1) (0 (0 ( 1/k (1 (0 1/k –1/(k–1) 1 . La matriz de contraste resultante será ( 1/4 (1 (0 (0 1/4 –1 –1 –1 1/4 0 1 0 1/4 ) 0) 0) 1) Helmert Contrastes de Helmert. 0 0 1 .. .. ...129 Esquemas de codificación de variables categóricas (0 (0 1 0 0 1 –1 ) –1 ) Para utilizar otra categoría en lugar de la última como categoría de referencia..

. . El primer grado de libertad contiene el efecto lineal a través de todas las categorías. Compara categorías de una variable independiente con la media de las categorías anteriores de la variable.. . el efecto cuadrático. . –1/(k–1) –1/(k–1) . y así sucesivamente hasta los efectos de orden superior. La forma de la matriz general es media gl(1) gl(2) . el segundo grado de libertad. 1/k ) 0) 0) donde k es el número de categorías para la variable independiente.. Por ejemplo.. . el cúbico... gl(k–1) ( –1/(k–1) ( 1/k ( –1 ( –1/2 1/k 1 –1/2 . los contrastes de diferencia para una variable independiente con cuatro categorías son los siguientes: ( 1/4 ( –1 ( –1/2 ( –1/3 1/4 1 –1/2 –1/3 1/4 0 1 –1/3 1/4 ) 0) 0) 1) Polinómico Contrastes polinómicos ortogonales.. 1) 1/k 0 1 . .130 Apéndice A ( 1/4 (1 (0 (0 1/4 –1/3 1 0 1/4 –1/3 –1/2 1 1/4 ) –1/3 ) –1/2 ) –1 ) Diferencia Diferencia o contrastes de Helmert inversos. el tercer grado de libertad..

y la dosis del tercer grupo es siete veces la del primer grupo. Repetido Compara niveles adyacentes de una variable independiente. las categorías del tratamiento están espaciadas por igual y una métrica adecuada para esta situación se compone de enteros consecutivos: /CONTRAST(DRUG)=POLYNOMIAL(1.2. el espaciado igual no es siempre necesario.3) No obstante. como una regresión curvilínea. Por ejemplo. que es el valor por defecto si se omite la métrica. Si la variable fármaco tiene tres categorías. si la dosis administrada al segundo grupo es cuatro veces la administrada al primer grupo.7) En cualquier caso. También se pueden utilizar contrastes polinómicos para realizar ajustes de curvas no lineales. supongamos que fármaco representa las diferentes dosis de un fármaco administrado a tres grupos. donde k es el número de categorías.4. una métrica adecuada sería /CONTRAST(DRUG)=POLYNOMIAL(1. Los contrastes polinómicos son especialmente útiles en contrastes de tendencias y para investigar la naturaleza de superficies de respuestas.131 Esquemas de codificación de variables categóricas Se puede especificar el espaciado entre niveles del tratamiento medido por la variable categórica dada. Se puede especificar un espaciado igual. Si la dosis administrada al segundo grupo es el doble que la administrada al primer grupo y la dosis administrada al tercer grupo es el triple que la del primer grupo. como enteros consecutivos desde 1 hasta k. el resultado de la especificación de contrastes es que el primer grado de libertad para fármaco contiene el efecto lineal de los niveles de dosificación y el segundo grado de libertad contiene el efecto cuadrático.3) De todas maneras. el subcomando /CONTRAST(DRUG)=POLYNOMIAL es idéntico a /CONTRAST(DRUG)=POLYNOMIAL(1. La forma de la matriz general es .2.

. 0 1/k 0 –1 .132 Apéndice A media gl(1) gl(2) . sobre la variable dada.. y representa el conjunto de ponderaciones que indican cómo promediar las demás variables independientes. Generalmente. Los productos de los correspondientes coeficientes para todos los pares de filas disjuntas también suman cero. la suma de los coeficientes de contrastes es igual a cero. . la primera fila introducida es siempre el efecto promedio. los contrastes repetidos para una variable independiente con cuatro categorías son los siguientes: ( 1/4 (1 (0 (0 1/4 –1 1 0 1/4 0 –1 1 1/4 ) 0) 0) –1 ) Estos contrastes son útiles en el análisis de perfiles y siempre que sean necesarias puntuaciones de diferencia. Permite la introducción de contrastes especiales en forma de matrices cuadradas con tantas filas y columnas como categorías haya de la variable independiente.. o constante.... 1 –1 ) donde k es el número de categorías para la variable independiente. Por ejemplo. si las hay. este contraste es un vector de contrastes.. . Para MANOVA y LOGLINEAR. los contrastes ortogonales son los más útiles. Normalmente. . ... Las restantes filas de la matriz contienen los contrastes especiales que indican las comparaciones deseadas entre categorías de la variable. Los contrastes son ortogonales si: ! ! Para cada fila. Este tipo de contrastes son estadísticamente independientes y son no redundantes. Especial Un contraste definido por el usuario. gl(k–1) ( 1/k (1 (0 1/k –1 1 . 1/k 0 0 1/k ) 0) 0) (0 0 .

. LOGISTICREGRESSION y COXREG: /CONTRAST(TREATMNT)=SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 ) Para LOGLINEAR. es necesario especificar: /CONTRAST(TREATMNT)=BASIS SPECIAL( 1 1 1 1 3 -1 -1 -1 0 2 -1 -1 0 0 1 -1 ) Cada fila. Si lo son. excepto la fila de las medias suman cero. de diferencia y polinómicos son todos contrastes ortogonales. Los contrastes de Helmert. el procedimiento informará de la dependencia lineal y detendrá el procesamiento. supongamos que el tratamiento tiene cuatro niveles y que deseamos comparar los diversos niveles del tratamiento entre sí. Los productos de cada par de filas disjuntas también suman cero: Filas 2 y 3: Filas 2 y 4: Filas 3 y 4: (3)(0) + (–1)(2) + (–1)(–1) + (–1)(–1) = 0 (3)(0) + (–1)(0) + (–1)(1) + (–1)(–1) = 0 (0)(0) + (2)(0) + (–1)(1) + (–1)(–1) = 0 No es necesario que los contrastes especiales sean ortogonales. Un contraste especial adecuado sería (1 (3 (0 (0 1 –1 2 0 1 –1 –1 1 1) –1 ) –1 ) –1 ) ponderaciones para el cálculo de la media compare 1º con 2º hasta 4º compare 2º con 3º y 4º compare 3º con 4º todo lo cual se especifica mediante el siguiente subcomando CONTRAST para MANOVA. No obstante.133 Esquemas de codificación de variables categóricas Por ejemplo. no deben ser combinaciones lineales de unos con otros.

134 Apéndice A Indicador Codificación de la variable indicadora. El número de variables nuevas codificadas es k–1. . que se codificará como 1. no está disponible en LOGLINEAR ni MANOVA. Los casos que pertenezcan a la categoría de referencia se codificarán como 0 para las k–variables 1. También conocida como variable auxiliara o dummy. Un caso en la categoría iésima se codificará como 0 para todas las variables indicadoras excepto la iésima.

Se trata de una estructura autorregresiva de primer orden con varianzas homogéneas. Rho está limitado y debe estar comprendido entre –1 y 1.Apéndice Estructuras de covarianza B Esta sección ofrece información adicional sobre las estructuras de covarianza. La correlación entre dos elementos cualesquiera es igual a rho en el caso de elementos adyacentes. Rho está limitado de manera que –1<rho<1. AR(1). Esta estructura de covarianza tiene varianzas y correlaciones heterogéneas entre elementos adyacentes. La correlación entre dos elementos que no son adyacentes es el producto de las correlaciones entre los elementos que se encuentran entre los elementos de interés. La correlación entre dos elementos es igual a rho en el caso de elementos adyacentes. y así sucesivamente. Se trata de una estructura autorregresiva de primer orden con varianzas heterogéneas. rho2 cuando se trata de elementos separados entre sí por un tercero. 135 . Dependencia Ante: Primer orden. rho^2 cuando se trata de dos elementos separados entre sí por un tercero. y así sucesivamente. AR(1): Heterogénea.

. Se trata de una estructura de media móvil autorregresiva. Esta estructura de covarianza tiene varianzas heterogéneas y una correlación constante entre los elementos. Simetría compuesta: Heterogénea. La correlación entre dos elementos es igual a phi*rho en el caso de elementos adyacentes. Simetría compuesta. y así sucesivamente.1). ambos incluidos. Esta estructura de covarianza tiene varianzas y correlaciones homogéneas entre los elementos. respectivamente. Tiene varianzas homogéneas. Esta estructura tiene una varianza y una covarianza constantes. y sus valores deben estar comprendidos entre –1 y 1. phi*(rho^2) cuando se trata de elementos separados entre sí por un tercero. Rho y phi son los parámetros autorregresivo y de media móvil.136 Apéndice B ARMA(1. Simetría compuesta: Métrica de correlación.

Esta estructura de covarianza tiene varianzas heterogéneas que están compuestas de dos términos que son heterogéneos en los elementos. Se trata de una matriz “circular” en la que la covarianza entre dos elementos es igual a la media de las varianzas menos una constante.137 Estructuras de covarianza Diagonal. Factor analítico: Primer orden. La covarianza entre dos elementos es la raíz cuadrada del producto de sus términos de varianza heterogéneos. . Heterogéneo. Factor analítico: Primer orden. Huynh-Feldt. Esta estructura de covarianza tiene varianzas heterogéneas y una correlación cero entre los elementos. Esta estructura de covarianza tiene varianzas heterogéneas que están compuestas de un término que es heterogéneo en los elementos y un término que es homogéneo en los elementos. Ni las varianzas ni las covarianzas son constantes. La covarianza entre dos elementos es la raíz cuadrada del producto del primero de sus términos de varianza heterogéneos.

Toeplitz: Heterogénea. Esta estructura tiene una varianza constante. . y así sucesivamente. Se asume que no existe correlación alguna entre los elementos. La correlación entre elementos adyacentes es homogénea en pares de elementos adyacentes. La correlación entre elementos adyacentes es homogénea en pares de elementos adyacentes. y así sucesivamente. La correlación entre elementos separados por un tercero vuelve a ser homogénea. Toeplitz. Esta estructura de covarianza tiene varianzas heterogéneas y correlaciones heterogéneas entre los elementos. La correlación entre elementos separados por un tercero vuelve a ser homogénea.138 Apéndice B Identidad escalada. Esta estructura de covarianza tiene varianzas homogéneas y correlaciones heterogéneas entre los elementos.

Esta estructura de covarianza tiene varianzas heterogéneas y correlaciones heterogéneas.139 Estructuras de covarianza Sin estructura. Es una matriz de covarianza completamente general. Esta estructura asigna una estructura de identidad escalada (ID) a cada uno de los efectos aleatorios especificados. . Componentes de la varianza. Sin estructura: Métrica de correlación.

.

1 bondad de ajuste. 43. 1 en MLG multivariante. 77 residuos. 113 en las tablas de mortalidad. 113 en Kaplan-Meier. 41. 86 opciones de presentación. 19. 113 en las tablas de mortalidad. 22 en MLG medidas repetidas. 113. 43 análisis de supervivencia.Índice análisis de covarianza. 105. 87 supuestos. 78. 116 en la regresión de Cox. 43 en los componentes de la varianza. 105. 99 Regresión de Cox dependiente del tiempo. 99 chi-cuadrado de Pearson. 39. 86 intervalos de confianza. 105 en la regresión de Cox. 74 distribución de recuentos de casillas. 93 en regresión ordinal. 42 opciones. 59 convergencia de los parámetros. 81. 69. 81 factores. 70 en el análisis loglineal de selección de modelo. 1 ANOVA multivariada. 99. 70. 74 especificación de modelo. 46 almacenamiento de resultados. 86. 81 gráficos. 81 covariables de casilla. 86 residuos. 68. 81. 81 criterios. 42. 116 141 . 78 contrastes. 73 factores. 116 en el análisis loglineal general. 73. 99. 86 distribución de recuentos de casillas. 59 covariables en la regresión de Cox. 82. 116 covariables categóricas. 84 estructuras de casilla. 123 en Kaplan-Meier. 82 valores pronosticados. 21 ANOVA. 19. 59 en modelos lineales mixtos. 72 definición de los rangos del factor. 93 clase generadora. 71. 1. 73 gráficos. 81 Análisis loglineal general. 22 en MLG multivariante. 81. 73 Análisis loglineal logit. 77 intervalos de confianza. 105 en la regresión de Cox. 76. 43 supuestos. 73 criterios. 74. 93 en regresión ordinal. 40 contrastes. 67. 68. 81 Análisis loglineal: Selección de modelo. 93 casos censurados. 81 especificación de modelo. 81 en la regresión de Cox. 87 almacenamiento de variables. 81. 123 análisis loglineal. 69 modelos. 40. 76 estructuras de casilla. 78 almacenamiento de variables. 74. 73. 79 almacenamiento de valores pronosticados. 116 convergencia del logaritmo de la verosimilitud. 46. 77. 1 análisis de la varianza. 74 Análisis loglineal logit. 84. 87 contrastes. 116 covariables de cadena. 46 modelo. 73 distribución multinomial. 87 análisis split-plot. 73. 73 en el análisis loglineal logit. 68 Análisis loglineal general. 70 opciones. 71 supuestos. 78 supuestos. 77 distribución de Poisson. 70 Componentes de la varianza. 67. 83. 59 en modelos lineales mixtos. 77 opciones de presentación. 74. 73 covariables de casilla.

81. 71 frecuencias acumuladas. 36. 93 frecuencias observadas. 43 en los componentes de la varianza. 36 en MLG medidas repetidas. 15. 61 en regresión ordinal. 15 en modelos lineales mixtos. 81 en MLG medidas repetidas. 36 en MLG multivariante. 99 GLOR. 71 . 82 efectos aleatorios. 74 distribución multinomial. 36 en MLG medidas repetidas. 45 desviación típica. 81 estadísticos de chi-cuadrado de la razón de verosimilitud. 123 en la regresión de Cox. 71 en el análisis loglineal de selección de modelo. 36 en MLG medidas repetidas. 15. 34. 99 en las tablas de mortalidad. 93 estimaciones de potencia. 74 en el análisis loglineal logit. 36 en MLG multivariante. 15 en modelos lineales mixtos.142 Índice covariables segmentadas dependientes del tiempo. 135 eta-cuadrado. 15 estructuras de covarianza. 93 función de supervivencia. 36 en MLG medidas repetidas. 135 en modelos lineales mixtos. 36. 15 gráficos de probabilidad normal. 73 en el análisis loglineal logit. 73 en el análisis loglineal general. 36 en MLG medidas repetidas. 57 efectos fijos. 93 frecuencias esperadas. 74 en el análisis loglineal general. 93 en regresión ordinal. 86 gráficos de los residuos. 73. 61 estimación de la máxima verosimilitud. 36 en MLG multivariante. 34 distribución de Poisson. 15. 71 en el análisis loglineal de selección de modelo. 82 en el análisis loglineal general. 57 en modelos lineales mixtos. 36 en MLG medidas repetidas. 15. 43 estimaciones de los parámetros. 15 estimaciones de tamaño de efecto. 43 en los componentes de la varianza. 15. 86 en el análisis loglineal general. 71 en el análisis loglineal general. 93 en regresión ordinal. 61 en MLG medidas repetidas. 54 en modelos lineales mixtos. 123 descomposición jerárquica en MLG. 73 en el análisis loglineal logit. 36 en MLG multivariante. 93 estadísticos descriptivos. 67 en el análisis loglineal de selección de modelo. 73 gráficos. 36 en MLG multivariante. 34 en MLG medidas repetidas. 77. 93 en regresión ordinal. 34. 43 en los componentes de la varianza. 36 en MLG multivariante. 93 en el análisis loglineal de selección de modelo. 67 EMNCI. 36 en MLG multivariante. 77 en el análisis loglineal logit. 15 estadístico de Wald. 43 estimación de la máxima verosimilitud restringida. 36 en MLG medidas repetidas. 54 eliminación hacia atrás. 93 en regresión ordinal. 74. 15. 36 en MLG multivariante. 71. 15 diagramas de dispersión por nivel. 15 Distancia de Cook. 15. 43 error típico. 15 frecuencias. 36 en MLG multivariante. 15. 73. 81 en el análisis loglineal general. 61. 15.

93 en modelos lineales mixtos. 93 en modelos lineales mixtos. 61 en modelos lineales mixtos. 106 tablas de supervivencia. 106 definición de eventos. 36 en MLG medidas repetidas. 61 medias marginales estimadas. 61. 108 ejemplo. 71 Kaplan-Meier. 15. 42 en los componentes de la varianza. 36. 110 tendencia lineal para los niveles del factor. 105. 110 funciones adicionales del comando. 81 en el análisis loglineal general. 61 intervalos de confianza. 61 iteraciones. 77 en el análisis loglineal logit. 25. 65. 96 en regresión ordinal. 36. 53. 15. 61 en modelos lineales mixtos. 1 modelo de escala. 108 log-razón de las ventajas generalizadas. 25 opciones. 64. 111 gráficos. 71 en el análisis loglineal de selección de modelo. 86 en MLG medidas repetidas. 61. 61 en modelos lineales mixtos. 3. 21 MLG multivariante. 3. 59. 15. 59.143 Índice historial de iteraciones. 61 matriz de covarianzas residuales. 55. 36. 86 en el análisis loglineal general. 15 opciones. 96 modelo de impactos proporcionales. 108 variables de estado de supervivencia. 61 matriz de covarianzas de los parámetros. 105 estadísticos. 135 almacenamiento de variables. 93 matriz de covarianzas. 36 medias marginales estimadas. 61. 73 en el análisis loglineal logit. 15 presentación. 110 procedimientos relacionados. 15. 15 factores. 109 comparación de niveles del factor. 77. 36. 61 en regresión ordinal. 95 en regresión ordinal. 57 . 93 en modelos lineales mixtos. 52. 110 datos. 61 en modelos lineales mixtos. 73 matriz de correlaciones. 81 MLG Medidas repetidas. 36 supuestos. 93 matriz de covarianzas de efectos aleatorios. 1 diagnósticos. 1 MLG Multivariante. 15 método de Newton-Raphson. 113 modelo de ubicación. 62 medias observadas. 36. 73 en el análisis loglineal general. 59 efectos aleatorios. 34 diagnósticos. 55 criterios de estimación. 1. 36 modelo. 108 cuartiles. 23. 106 supuestos. 36 presentación. 50. 62. 73. 15. 34. 25 Modelos lineales mixtos. 95 modelos factoriales completos. 1 medias marginales estimadas. 36 en MLG multivariante. 21. 113 en la regresión de Cox. 15. 93 información de los niveles del factor. 24. 36 en MLG multivariante. 54. 61. 25. 110 media y mediana de tiempos de supervivencia. 49. 64 construcción de términos. 3 variable dependiente. 105 almacenamiento de nuevas variables. 36 en MLG medidas repetidas. 61 en regresión ordinal. 15 en modelos lineales mixtos. 42 en MLG medidas repetidas. 15 supuestos. 17 covariables. 59 en regresión ordinal. 15 en modelos lineales mixtos. 38 almacenamiento de variables. 57. 54. 54. 22. 19. 36 en MLG multivariante.

119 estadísticos. 61 prueba de Tarone-Ware. 15 en MLG multivariante. 54 modelos logit multinomiales. 123. 50 términos de interacción. 118 función de supervivencia. 116 covariables dependientes del tiempo. 89 previas de los efectos aleatorios. 125 datos. 93 en regresión ordinal. 59 razón de ventajas. 36 en MLG medidas repetidas. 108 prueba de esfericidad de Bartlett. 67 modelos mixtos. 135 medias marginales estimadas. 113 entrada o exclusión por pasos. 21. 103 en las tablas de mortalidad. 70 en el análisis loglineal de selección de modelo. 59 en modelos lineales mixtos. 93 en regresión ordinal. 25. 120 funciones de línea base. 36 en MLG medidas repetidas. 70 en el análisis loglineal de selección de modelo. 113 covariables categóricas. 118 supuestos. 15 matrices de hipótesis y error. 103 Prueba M de Box. 113 variable del estado de supervivencia. 113 definición de eventos. 36 en MLG multivariante. 61 en modelos lineales mixtos. 42. 93 Regresión de Cox. 81 modelos loglineales jerárquicos. 49 modelos personalizados. 15 puntuación. 118 ejemplo. 25 modelos saturados. 62 modelo. 15 prueba de esfericidad de Mauchly. 15. 93 R cuadrado de McFadden. 73 R-cuadrado de Cox y Snell. 15 prueba de líneas paralelas. 15 pruebas de homogeneidad de las varianzas. 43 productos cruzados. 93 en regresión ordinal. 116 covariables. 108 en Kaplan-Meier. 73 en el análisis loglineal general. 116 covariables de cadena. 21. 36 en MLG medidas repetidas. 119 función de impacto. 70 en los componentes de la varianza. 117 iteraciones. 119 gráficos. 15 pruebas t. 103 prueba de Levene. 15 en MLG multivariante. 113.144 Índice efectos fijos. 21. 54 estructura de covarianza. 119 procedimientos relacionados. 108 prueba de Wilcoxon. 59 puntuación de Fisher. 108 en Kaplan-Meier. 61 supuestos. 108 prueba de parámetros de covarianza. 15. 113 residuos parciales. 70 PLUM en regresión ordinal. 103 en las tablas de mortalidad. 15 prueba de Breslow. 36 en MLG medidas repetidas. 59 en modelos lineales mixtos. 43 en los componentes de la varianza. 118 funciones adicionales del comando. 113. 118 contrastes. 36 en MLG multivariante. 36 prueba de Gehan. 108 en Kaplan-Meier. 49 lineales. 120 DfBetas. 123 almacenamiento de nuevas variables. 93 en regresión ordinal. 36 en MLG multivariante. 15. 93 R-cuadrado de Nagelkerke. 93 prueba de log rango. 42 en MLG medidas repetidas. 120 .

59 en modelos lineales mixtos. 67 tablas de contingencia. 34 variables de medidas repetidas. 91 residuos. 50 en modelos lineales mixtos. 67. 99 variables de estado de supervivencia. 59 suma de cuadrados. 102 variables del factor. 64 residuo SCPC. 90. 99 estadísticos. 45. 102 tasa de impacto. 99 funciones adicionales del comando. 15. 99 función de supervivencia. 36 en MLG medidas repetidas. 50 variables de sujetos. 56 en los componentes de la varianza. 87 en el análisis loglineal general. 71 en el análisis loglineal general. 73 Tablas de mortalidad. 34 residuos tipificados. 15. 103 procedimientos relacionados. 100 prueba de Wilcoxon (Gehan). 97 estadísticos. 56 matrices de hipótesis y error. 34 en MLG medidas repetidas. 90 vínculo. 73 en el análisis loglineal general.145 Índice Regresión ordinal. 103 consideraciones sobre los datos. 36 en MLG medidas repetidas. 89. 95. 34 residuos no tipificados. 34 en MLG medidas repetidas. 93. 91 supuestos. 15. 54 tolerancia para la singularidad. 100 comparación de niveles del factor. 64 valores pronosticados fijos en modelos lineales mixtos. 90. 54 en modelos lineales mixtos. 78 en el análisis loglineal logit. 34 en MLG medidas repetidas. 34 SCPC. 55 términos de interacción. 50 vínculo en regresión ordinal. 78. 93 residuos eliminados. 99 casos censurados. 15 subdivisión por pasos. 78 en el análisis loglineal logit. 99 en las tablas de mortalidad. 55 en modelos lineales mixtos. 59 en modelos lineales mixtos. 45 en modelos lineales mixtos. 89 opciones. 93 en regresión ordinal. 34 valores pronosticados. 96. 103 supuestos. 87 en el análisis loglineal de selección de modelo. 34 en MLG medidas repetidas. 36 en MLG multivariante. 50 en modelos lineales mixtos. 104 gráficos. 15 residuos de Pearson. 103 supresión de la presentación de tablas. 15 tabla de contingencia en el análisis loglineal de selección de modelo. 100 tasa de impacto. 87 en modelos lineales mixtos. 100 ejemplo. 71. 78. 99 términos anidados. 34 en MLG medidas repetidas. 59 valores de influencia. 64 valores pronosticados ponderados. 91. 91 . 36 en MLG multivariante. 87 en modelos lineales mixtos.