You are on page 1of 13

AYUDA SPSS-ESCALAMIENTO MULTIDIMENSIONAL TUTORIAL MDS Tutorial en SPSS 10.

07 ESCALAMIENTO MULTIDIMENSIONAL (MDS)
(PROXSCAL: PROXimites SCALing) Por Rubén José Rodríguez 8 de abril de 2008 Escalamiento Multidimensional (MDS) Menú Analizar >

Concepto: El escalamiento multidimensional trata de encontrar la estructura existente en un conjunto de medidas de proximidades entre objetos. Esto se logra asignando las observaciones a posiciones específicas en un espacio conceptual de pocas dimensiones, de modo que las distancias entre los puntos en el espacio concuerden al máximo con las similaridades (o disimilaridades) dadas. El resultado es una representación de mínimos cuadrados de los objetos en dicho espacio de pocas di-

1

mensiones que. Pulse en Temas relacionados para obtener información sobre los estadísticos. ponderaciones del espacio individual. gráficos de transformación. descomposición del stress. puede intentar determinar las variables que son importantes en la visión que el público tiene del producto y ajustar la imagen de acuerdo con ello.   Pulse en Cómo. gráficos del stress. Por ejemplo. Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo para ver su descripción.  2 . coordenadas del espacio común. diagramas de dispersión de los espacios individuales. en muchos casos. Estadísticos y gráficos. distancias entre objetos dentro de la configuración final. situado más arriba. al considerar la imagen de un producto e empresa. proximidades transformadas. Ejemplo. Mediante estas proximidades y las variables independientes (como el precio). para obtener información detallada. el formato y consideraciones sobre los datos (incluidos los procedimientos relacionados). los gráficos. diagramas de dispersión del espacio común. espacios individuales. medidas de stress. Historial de iteraciones. variables independientes transformadas. se puede llevar a cabo un estudio con el fin de obtener un conjunto de datos que describa la similaridad percibida (o proximidad) de este producto con el de la competencia. gráficos residuales de Shepard y gráficos de transformación de las variables independientes . le ayudará a entender mejor los datos. diagramas de dispersión de la ponderación del espacio individual. El escalamiento multidimensional puede ser muy útil en la determinación de relaciones perceptuales.

si es necesario). las dimensiones de este espacio conceptual son interpretables y se pueden utilizar para comprender mejor de los datos. como podrían ser múltiples evaluadores o múltiples sujetos evaluados por un cuestionario. y OPCIONES generan ventanas segundarias que disponen del botón CONTINUAR que habilita el retorno a la ventana de origen. El escalamiento multidimensional puede también aplicarse a valoraciones subjetivas de disimilaridad entre objetos o conceptos. puede utilizar el escalamiento multidimensional como técnica de reducción de datos (el procedimiento Escalamiento multidimensional permitirá calcular las distancias a partir de los datos multivariados. Esto se logra asignando las observaciones a posiciones específicas en un espacio conceptual (normalmente de dos o tres dimensiones) de modo que las distancias entre los puntos en el espacio concuerden al máximo con las disimilaridades dadas. La ventana principal de MDS tiene cuatro botones. el procedimiento Escalamiento multidimensional puede tratar datos de disimilaridad procedentes de múltiples fuentes.Ventana ESCALAMIENTO MULTIDIMENSIONAL 1 Concepto: El escalamiento multidimensional trata de encontrar la estructura de un conjunto de medidas de distancia entre objetos o casos. MEDIDA. 1 Las ventanas primarias o principales contienen el botón ACEPTAR mientras que los botones FORMA. MODELO. Si las variables se han medido objetivamente. Además. En muchos casos. 3 .

por ejemplo. Cómo: Para obtener un Análisis de Escalamiento Multidimensional (MDS). Para cada modelo: Matriz de datos. situado más arriba. Para modelos de diferencias individuales (INDSCAL): ponderaciones del sujeto e índice de peculiaridad para cada sujeto. que el precio y el tamaño de un vehículo definen un espacio de dos dimensiones. Para cada matriz en los modelos de escalamiento multidimensional replicado: stress y R² para cada estímulo. S-stress (de Young). puede utilizar el escalamiento multidimensional para identificar las dimensiones que describan las preferencias de los consumidores. capaz de explicar las similaridades de las que informan los encuestados. debe seleccionar al menos cuatro variables numéricas para el análisis y puede pulsar en el botón Forma para indicar la forma de la matriz de distancias. Si los datos son distancias. R². Puede encontrar. Stress (de Kruskal). debe seleccionar al menos una variable numérica y puede pulsar en el botón Medida para especificar el tipo de medida de distancia que desea. Diagramas: coordenadas de los estímulos (de dos o tres dimensiones). En Distancias. Matriz de datos escalada óptimamente. Estadísticos. Si quiere que SPSS cree las distancias antes de analizarlas. Pulse en Temas relacionados.. 4 . Stress promedio y R² para cada estímulo (modelos RMDS). Coordenadas de los estímulos. ¿Cómo percibe el público las diferencias entre distintos coches? Si posee datos de las valoraciones de similaridad emitidas por los sujetos sobre las diferentes marcas y modelos de coches. seleccione Los datos son distancias o bien Crear distancias a partir de datos. diagrama de dispersión de las disparidades frente a las distancias.. Elija en los menús: Analizar > Escalas > Escalamiento multidimensional. Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo para ver su descripción. para obtener descripciones de cuadros de diálogo y procedimientos relacionados.Ejemplo.

Si su objetivo es la reducción de los datos. Elija una opción: Cuadrada simétrica. de intervalo.Botón FORMA Si el archivo de datos de trabajo representa distancias entre un o dos conjuntos de objetos. Si los datos son de disimilaridad. debe especificar la forma de la matriz de datos para obtener los resultados correctos. Si desea identificar grupos de casos similares. las variables pueden ser datos cuantitativos. debe considerar el tipificarlas (esto puede llevarse a cabo automáticamente con el propio procedimiento Escalamiento multidimensional). binarios o de recuento. El procedimiento Escalamiento multidimensional está relativamente libre de supuestos distribucionales. Compruebe que selecciona el nivel de medida adecuado (ordinal. o de razón) en Opciones para asegurar que los resultados se calculan correctamente. ya que las diferencias en el escalamiento pueden afectar a la solución. Consideraciones sobre los datos Datos. 5 . considere complementar el Análisis de Escalamiento Multidimensional con un análisis de conglomerados jerárquico o de kmedias. Procedimientos relacionados. Nota: No puede seleccionar Cuadrada simétrica si el cuadro de diálogo Modelo especifica condicionalidad de filas. todas las disimilaridades deben ser cuantitativas y deben estar medidas en la misma métrica. Cuadrada asimétrica o bien Rectangular. Supuestos. un método alternativo a tener en cuenta es el Análisis Factorial. Si los datos son datos multivariantes. Si las variables tienen grandes diferencias en el escalamiento (por ejemplo. sobre todo si las variables son cuantitativas. una variable se mide en dólares y otra en años). El escalamiento de las variables es un tema importante.

Botón MEDIDA 6 .

7 .

Minkowski o Personalizada. como cuando las variables se miden en escalas muy distintas. a continuación. En determinados casos. Distancia euclídea al cuadrado.Crear la medida a partir de los datos El escalamiento multidimensional utiliza datos de disimilaridad para crear una solución de escalamiento. Varianza. Medida. Recuento. 8 . Seleccione un método de tipificación de la lista desplegable Estandarizar (si no se requiere ninguna tipificación. Distancia euclídea. Las opciones disponibles son: Intervalo: Distancia euclídea. Crear matriz de distancias. seleccione una de las medidas de la lista desplegable correspondiente a ese tipo de medida. Diferencia de tamaño. Seleccione una opción del grupo Medida que se corresponda con el tipo de datos y. Diferencia de configuración. Transformar valores. Las opciones son Entre variables o Entre casos. Le permite elegir la unidad de análisis. Medida de chi-cuadrado o Medida de phi-cuadrado. Puede especificar los detalles para la creación de las medidas de disimilaridad a partir de los datos. debe crear los datos de disimilaridad para poder calcular una solución de escalamiento multidimensional. Si los datos son datos multivariantes (los valores de las variables medidas). Chebychev. Binaria. puede que desee tipificar los valores antes de calcular las proximidades (no es aplicable a datos binarios). Bloque. Distancia euclídea al cuadrado. seleccione Ninguna). Le permite especificar la medida de disimilaridad para el análisis. Lance y Williams.

Le permite especificar los supuestos bajo los que se realiza el escalamiento. Fila o Incondicional. se permite un mínimo de 1 sólo si selecciona Distancia euclídea como modelo de escalamiento. Condicionalidad. de forma que los empates (valores iguales para casos diferentes) se resuelvan óptimamente. si se selecciona Desempatar observaciones empatadas se solicitará que sean consideradas como variables continuas. Nivel de medida. Modelo de escalamiento. Las opciones disponibles son Distancia euclídea o Distancia euclídea de diferencias individuales (también conocida como INDSCAL). Las opciones son Ordinal. Las opciones son Matriz. Para el modelo de Distancia euclídea de diferencias individuales. Se calcula una solución para cada número del rango especificado. Para una solución única. Cuando las variables son ordinales. si es adecuado para los datos. Dimensiones. Le permite especificar la dimensionalidad de la solución o soluciones del escalamiento. puede seleccionar Permitir ponderaciones negativas de sujetos. especifique el mismo número para el mínimo y el máximo. Le permite especificar qué comparaciones tienen sentido. Intervalo y Razón. Le permite especificar el nivel de medida de los datos. 9 . Especifique números enteros entre 1 y 6.Botón MODELO La estimación correcta de un modelo de escalamiento multidimensional depende de aspectos que atañen a los datos y al modelo en sí.

Varianza. Esta medida oscila entre 0 y 1. Se calcula como el número de casos discordantes. Lance y Williams. Se calcula a partir de una tabla 2*2 como bc/(n**2). Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo para ver su descripción. donde b y c representan las casillas diagonales correspondientes a los casos presentes en un elemento pero ausentes en el otro y n es el número total de observaciones. Oscila de 0 a 1. Se calcula a partir de una tabla 2*2 como (b+c)/(2a+b+c). 10 . situado más arriba. Su valor mínimo es 0 y no tiene límite superior. para obtener descripciones de cuadros de diálogo y procedimientos relacionados. Distancia euclídea al cuadrado. Oscila de 0 a 1. Se calcula a partir de una tabla 2*2 como SQRT (b+c). También se conoce como el coeficiente no métrico de Bray-Curtis. donde b y c representan las casillas diagonales correspondientes a los casos presentes en un elemento pero ausentes en el otro y n es el número total de observaciones. Diferencia de configuración. puede cambiar los campos Presente y Ausente para especificar los valores que indican que una característica está presente o ausente. donde b y c representan las casillas diagonales correspondientes a los casos presentes en un elemento pero ausentes en el otro.Medidas de disimilaridad para datos binarios en el escalamiento multidimensional Las medidas de disimilaridad siguientes son las disponibles para los datos binarios:  Distancia euclídea. Se trata de un índice de asimetría. Diferencia de tamaño.      Si lo desea. Medida de disimilaridad para datos binarios que oscila de 0 a 1. Pulse en Temas relacionados. El procedimiento ignorará todos los demás valores. Se calcula a partir de una tabla 2x2 como (b+c)/4n. donde a representa la casilla correspondiente a los casos presentes en ambos elementos y b y c representan las casillas diagonales correspondientes a los casos presentes en un elemento pero ausentes en el otro.

La raíz cuadrada de la suma de los cuadrados de las diferencias entre los valores de los elementos. La raíz r-ésima de la suma de las diferencias absolutas elevada a la potencia p-ésima entre los valores de los elementos. La diferencia absoluta máxima entre los valores de los elementos. La suma de las diferencias absolutas entre los valores de los elementos. Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo para ver su descripción. Medida de Phi-cuadrado.      Pulse en Temas relacionados. Ésta es la medida por defecto para datos de intervalo. Chebychev. También se conoce como la distancia de Manhattan.  Pulse en Temas relacionados. situado más arriba.Medidas de disimilaridad para datos de intervalo en el escalamiento multidimensional Las siguientes medidas de disimilaridad están disponibles para datos de intervalo:  Distancia euclídea. Ésta es la medida por defecto para datos de recuento. Esta medida es igual a la medida de chicuadrado normalizada por la raíz cuadrada de la frecuencia combinada. para obtener descripciones de cuadros de diálogo y procedimientos relacionados. Bloque. Personalizada. para obtener descripciones de cuadros de diálogo y procedimientos relacionados. Basado en la prueba de igualdad de chicuadrado para dos conjuntos de frecuencias. Minkowski. Distancia euclídea al cuadrado. situado más arriba. Medidas de disimilaridad para datos de recuento en el escalamiento multidimensional Las siguientes medidas de disimilaridad son las disponibles para los datos de recuento:  Medida de chi-cuadrado. Pulse con el botón derecho del ratón en un elemento del cuadro de diálogo para ver su descripción. La suma de los cuadrados de las diferencias entre los valores de los elementos. La raíz p-ésima de la suma de las diferencias absolutas elevada a la potencia p-ésima entre los valores de los elementos. 11 .

El procedimiento divide cada valor de la variable o caso que se tipifica por la desviación típica de los valores. Las opciones son Por variable o Por caso. Rango -1 a 1. Matriz de datos y Resumen del modelo y de las opciones. Ventana OPCIONES Puede especificar opciones para el análisis de escalamiento multidimensional: Mostrar. El procedimiento divide cada valor del elemento que se tipifica por la media de los valores. Las opciones disponibles son Gráficos de grupo. El procedimiento sustrae el valor mínimo de cada elemento que se tipifica y después lo divide por el rango. Rango 0 a 1. 12 . Media 1. Cada valor del elemento que se tipifica se divide por el rango de los valores. Además. Desviación típica 1. Gráficos para los sujetos individuales. Los valores se estandarizan a una puntuación Z. Magnitud máxima de 1. con una media de 0 y una desviación típica de 1. Le permite seleccionar varios tipos de resultados. El procedimiento divide cada valor del elemento que se tipifica por el máximo de los valores. se puede escoger el modo de realizar la tipificación.Transformación de valores en el escalamiento multidimensional Las siguientes opciones están disponibles para la transformación de valores:       Puntuaciones Z.

Tratar distancias menores que n como perdidas. Para cambiar los valores por defecto. Le permite determinar cuándo debe detenerse la iteración. introduzca valores para la Convergencia de s-stress. el Valor mínimo de s-stress y el Nº máximo de iteraciones.Criterios. 13 . Las distancias menores que este valor se excluyen del análisis.