You are on page 1of 42

Cualitative Data Optimization CDO MODELANDO DATOS CUALITATIVOS DE PREGUNTAS ABIERTAS MEDIANTE

ESCALAMIENTO MULTIDIMENSIONAL.

CARLOS GABRIEL CONTRERAS MSC ESTADÍSTICO. UNIVERSITY OF CALIFORNIA LOS ANGELES.

1

Escalamiento multidimensional.
• El escalamiento multidimensional, es en si una teoría sobre la que se han desarrollado diferentes técnicas para tratar de responder una pregunta: • ¿Cómo es la estructura de pensamiento de una persona? • ¿Qué tiene que hacer un dibujante cuando usted le pide un retrato de su rostro en un papel tamaño carta?
• Básicamente debe escalar.

• Como investigadores debemos plasmar en términos prácticos y accionables, realidades que son complejas y grandes (como aquellas que se reflejan en preguntas abiertas de cuestionarios y entrevistas) así que nuestro trabajo es similar al de un dibujante,
• DEBEMOS ESCALAR.

2

El reto
Una marca de cerveza, necesita saber las razones que hacen que un consumidor acepte consumir un producto cuando se lo ofrecen, en otras palabras, desea saber los motivos que hacen al consumidor sensible a las acciones de advocacy; para ello, se diseña una conjunto de preguntas en un cuestionario.

1. ¿Le han ofrecido la cerveza X? 2. ¿Acepto consumir la cerveza X cuando se la ofrecieron? 3. ¿Por qué acepto consumir la cerveza X cuando se la ofrecieron?
La pregunta que se hace el gerente de marca, se responde con la pregunta abierta del anterior conjunto, el enfoque tradicional implica que se haga un conteo de frecuencias y se presenten todas las narraciones codificadas con sus respectivas frecuencias. El enfoque planteado en este trabajo propone explorar la estructura que motiva al consumidor a responder lo que responde.

3

La solución.
El escalamiento multidimensional diría que: Cada narración del consumidor se codifica. Cada código es una variable. Cada variable es dicotomica, es decir, tiene dos valores, 1 si la persona narra algo asociado al código y 0 si la persona no narra nada asociado al código.

El escalamiento multidimensional puede explorar las proximidades entre cada código (narración) para detectar la estructura mental que hace que el consumidor responda como lo hace ante la pregunta abierta.

4

5 . Presentación. Verificación de supuestos Modeling Detección del procedimiento Configuración.El algoritmo. Bondad de ajuste Escalamiento Optimización Verificación. Construcción de la base de datos.

Construcción de la base de datos. Objetivo: Ubicar cada uno de los códigos dentro de la base de forma que sean estadísticamente manipulables. .

Construcción de la base de datos. En este caso puntual fue: ¿Por qué razón acepto consumir el producto cuando se lo ofrecieron? Es necesario ver que la base de datos se encuentra en formato binomial. Inicialmente. se cuenta con una base de datos en donde las variables son cada uno de los códigos otorgados a las narraciones que el encuestado da para contestar la pregunta abierta hecha. donde 1 significa que el encuestado si hizo narraciones asociadas al código y 0 implica que el encuestado no hizo tales narraciones. .

Guttman etc) aun así. 8 .Construcción de la base de datos. Deben ser programadas como ordinales ya que 1 (si narro) es diferente y superior a 0 (no narro) El modelo puede configurarse con diferentes formatos de pregunta (Likert. Torgeson. Diferencia semantico. para efectos de modelar respuestas de preguntas abiertas el formato siempre será binomial y se programa como ordinal. Las variables deben tener algunas características importantes para ingresar en el proceso de modelamiento Las variables vienen en formato binomial.

Verificación de supuestos. Objetivo: Garantizar que todos los códigos (datos) cuentan con el nivel de calidad suficiente como para ingresar en el análisis. .

Ver prueba de Rachas. si se evaluaran 15 códigos como en este caso. la muestra debe ser de por lo menos 75 encuestados. este supuesto se controla mediante la prueba de Rachas. es decir.Verificación de supuestos. es decir. no todo puede ser 0 (no narro) o 1 (si narro). debe haber mínimo 5 encuestados. Algunos autores sugieren un equilibrio 60/40 Debe haber aleatoriedad en las respuestas. Por cada código. 10 . Debe haber variabilidad en el código. de esta forma se controla error ya sea por sesgo de encuestado o por error de codificación. entra a participar todos los códigos. En el modelo. aun así es importante tener en cuenta que se cumplan los siguientes supuestos.

11 . es decir.Verificación de supuestos (prueba de Rachas) La prueba de rachas es un procedimiento no parametrico que intenta detectar si los datos de las variables son o no aleatorios. por lo que no es prudente usar ese código. La aleatoriedad implica menor nivel de error. del encuestador. es probable que la contaminación con error sea muy alta. Si los datos no son aleatorios. de las personas de codificación o de digitación. La contaminación puede darse por sesgo del encuestado. que la variable o código esta en cierto grado libre de contaminación.

12 .Verificación de supuestos (prueba de Rachas) Todos los códigos deben ser evaluados. No se puede usar la media ya que son datos cualitativos y una mediana es poco conveniente ya que tenemos solo dos categorías en la variable. El punto de corte debe ser la moda básicamente porque es el estadístico de tendencia central que mejor describe las distribuciones binomiales.

Verificación de supuestos (prueba de Rachas) Cuando la muestra tiende a ser pequeña. el nivel de confiabilidad esperado será del 95% . una conclusión estadística es significativa. es recomendable calcular los errores del procedimiento con el método de Monte Carlo. como investigadores asumimos el 5% de error. La significancia indica si la conclusión a la que se llega mediante el procedimiento estadístico esta dentro o fuera del margen de error que como investigadores queremos asumir. 13 Como el máximo error que se pretende tener es del 5%. si el error del procedimiento es inferior al 5% Cuando N es menor a 500. en este caso menor a 500. Habitualmente. es prudente calcular niveles de significancia mediante pruebas exactas.

se rechaza la hipótesis nula y se concluye que el código "ya había oído de la marca" tiene una distribución aleatoria por ende tiene controlada varias fuentes externas de error.05. Como el nivel de significancia es inferior a 0.Verificación de supuestos (prueba de Rachas) La hipótesis nula (H0) de la prueba de rachas dice que los datos no son aleatorios mientras que la hipótesis alterna (Ha) indica que los datos si son aleatorios. 14 .05 (5% de error) se rechaza la hipótesis nula y se acepta la hipótesis alterna. Si la significancia de la prueba es < a 0..

Modeling 1: detección del procedimiento. para el caso puntual de preguntas abiertas se recomienda PROXSCAL . Objetivo: El Escalamiento multidimensional tiene muchas técnicas.

Para términos de modelamiento. SPSS ofrece dos algoritmos básicos ALSCAL PROXSCAL Cada uno tiene usos distintos.Modeling 1: Detección del procedimiento. 16 . para el modelamiento de preguntas abiertas se usa PROXSCAL. Existen diferentes técnicas de Escalamiento multidimensional. se recomienda utilizar PROXSCAL ya que permite ver paso a paso el proceso y de esa forma diagnosticar errores en el mismo. y dentro de las técnicas hay diferentes metodologías.

ordinales) no son por si mismos una medida de distancia de las narraciones de las personas. Los datos. Es por ello. como los tenemos configurados (binomiales. Dado que la pregunta esta orientada solo a una marca. de hecho son solamente las narraciones en bruto.Modeling 1: Detección del procedimiento. 17 . y todas las respuestas del encuestado están orientadas solo a una marca en particular. que es necesario crear proximidades de los datos. se maneja solo una fuente matricial (solo un conjunto de respuestas) Si fuésemos a comparar la pregunta abierta entre marcas. se usarían varias fuentes matriciales.

aun asi es importante tener en cuenta que se cumplan los siguientes supuestos. este supuesto se controla mediante la prueba de Rachas. es decir. En el modelo. es decir. entra a participar todos los códigos. si se evaluaran 15 códigos como en este caso.Modeling 1: Detección del procedimiento. Algunos autores sugieren un equilibrio 60/40 Debe haber aleatoriedad en las respuestas. Debe haber variabilidad en el código. de esta forma se controla error ya sea por sesgo de encuestado o por error de codificación. Ver prueba de Rachas. no todo puede ser 0 (no narro) o 1 (si narro). Por cada código. 18 . debe haber mínimo 5 encuestados. la muestra debe ser de por lo menos 75 encuestados.

un modelo de escalamiento multidimensional puede configurarse desde diferentes tipos de datos. En la opción medida. no es necesario indicar la medida de distancia pero si es importante indicar que 1 significa que si hubo narración (presente) y 0 es no hubo narración (ausente) De igual manera se pueden escalar tanto variables como casos. debe indicarse que los datos del modelo son binarios. en este caso. datos numéricos.Modeling 1: Detección del procedimiento. se escalaran variables. Como se indico anteriormente. recordemos que cada variable es un código y por lo tanto. 19 . Por ahora. de frecuencias o medidas binarias.

Modeling 2: Configuración del procedimiento (dimensionalidad). . Objetivo: El procedimiento seleccionado. debe tener un buen ajuste a la realidad del consumidor (bondad de ajuste) para ello es necesario modelar la cantidad de dimensiones que el consumidor utiliza para responder la pregunta abierta.

la pregunta ahora es ¿a cuantas dimensiones se debe escalar la respuesta? La respuesta se busca inicialmente en la opción modelo donde se pide mostrar de 2 a 5 dimensiones Posteriormente. es necesario escalarla. esta en N-1000 dimensiones. para comprender esa respuesta.Modeling 2: Dimensionalidad. Las respuestas que están dando los consumidores a la pregunta abierta. en la opción gráficos se marca la opción Stress. 21 .

Esto ocurre entre 2 y 3 dimensiones. comprender 5 dimensiones puede ser complicado y en términos de mercadeo táctico y estratégico puede no ser tan útil. es obtener el diagrama de sedimentación. 22 . el estadístico Stress será mejor porque es mas parecido a la realidad. El producto de seleccionar de 2 a 5 dimensiones y de solicitar el grafico de Stress. se elige el numero de dimensiones hasta donde el estadístico Stress decrezca mas abruptamente. Lógicamente en cuantas mas dimensiones tenga el modelo.Modeling 2: Dimensionalidad. Por ello. Este diagrama muestra la variación del estadístico Stress dependiendo de la cantidad de dimensiones que se incluyan en el modelo. parece ser razonable que el modelo explique la opinión del consumidor a la pregunta ¿Por qué razón acepto consumir el producto cuando se lo ofrecieron? desde 3 dimensiones. pero en términos conceptuales.

.Modeling 4: Bondad de ajuste (medida de similaridad) Objetivo: Elegir la estrategia matemática para medir la similaridad entre las respuestas que el consumidor da a la pregunta abierta .

El Stress es un indicador que informa sobre lo mal ajustado del modelo. ahora es necesario modelar la mejor forma de tratar los datos binarios. Para esto. Se elije la configuración que permita obtener los menores niveles de Stress y los mayores niveles de dispersión explicada y de congruencia. siempre buscamos obtener el menor Stress posible para asegurar que el modelo este bien ajustado a la realidad. 24 . Modeling 4: similaridad. se evalúan las diferentes alternativas para medir la distancia entre cada código.Teniendo en cuenta que ya sabemos que el modelo nos permite explicar la opinión del consumidor en 3 dimensiones.

esperamos tener los mayores niveles posibles 25 . Diferencia de tamaño. se construirá con esta estrategia. razón por la cual nuestro modelo de 3 dimensiones para explicar la opinión del consumidor a la pregunta abierta. La dispersión explicada es una medida de que tal bien ajustado esta el modelo. esperamos tener el mayor nivel posible. es la que arroja mejores indicadores de bondad de ajuste.La técnica de diferencia de configuración. Distancia euclídea al cuadrado. Varianza. Diferencia de configuración. Lance y Williams. Distancia euclidea La congruencia indica que tal ajustado a la realidad es el modelo.

debemos volverlos cuantitativos. es necesario detectar la mejor forma de transformar los datos cualitativos en cuantitativos. para escalarlos. .Modeling 5: Escalamiento Objetivo: Los datos son cualitativos.

El escalamiento multidimensional. Ya sabemos que nuestro modelo tendrá 3 dimensiones. es decir. será construido mediante la técnica de diferencia de configuración pero ahora ¿Qué escala numérica debemos asignarle? La tarea ahora es probar diferentes escalas numéricas. ordinal con empate y lineal sp. a los datos cualitativos. es una técnica que se construye sobre escalamiento optimo. 27 .Modeling 5: Escalamiento. ordinal sin empate. se les asigna un patrón numérico para poder cuantificarlos y de esta forma analizarlos en profundidad. de razón. intervalo. Se sabe que un modelo esta bien escalado si los datos se ajustan a una línea recta (ya que el objetivo del escalamiento optimo es asemejar los datos a un modelo lineal) entonces la mejor configuración será aquella que mejor se ajuste a un patrón de línea recta.

3: hay mayor dispersión. que hay causas conocidas de error. 2. es el de razón. Ordinal empatado Lineal Sp Intervalo Ordinal no empatado 28 . de todos es el que tiende a estar mas empinado (pendiente mas positiva). El mejor modelo.Modeling 5: Escalamiento. por varias motivos: 1. a diferencia de los modelos ordinales que si tienen patrones definidos. es decir. Razón. presenta una tendencia lineal. lo que indica que el error es sistemático. eso quiere decir que el error no tiene una causa sistemática o conocida.

.Modeling 6: Optimización. Objetivo: Es un ajuste final del modelo. Es detectar la mejor configuración. la que sea mas ajustada a la realidad y la que reúna todos los elementos anteriormente vistos.

observar la mejor forma de optimizar el nivel de Stress y generar el mejor ajuste posible de los datos.Modeling 6: Optimización. Por ultimo. es necesario mirar la configuración inicial del modelo. 30 . la tarea es probarlos para observar cual es el que mejor optimiza el nivel de Stress es decir. el mejor modelo será aquel que provoque el menor Stress posible de los datos. es decir. Para ello se cuenta con 4 métodos.

Método de optimización: Togueson. 4. En este momento.Sin lugar a duda la metodología que mejor optimiza el nivel de Stress del modelo es la de Togueson. 1. ya se tiene entonces todos los elementos para construir el modelo con las siguientes características. Método de medición: Diferencia de configuración Método escalamiento: Razón. TOGUESON SIMPLEX ALEATORIO ÚNICO ALEATORIO MÚLTIPLES 31 . 3. 2. 3 dimensiones para explicar la opinión del consumidor.

. que sea simple de entender. que no contenga contradicciones y que sea matemática y estadísticamente confiable.Modeling 7: Verificación. Objetivo: Observar el ajuste final del modelo y verificar que tenga coherencia con la realidad.

Modeling 7: Verificación. El modelo final es congruente con la realidad en un 98% y explica satisfactoriamente la variabilidad de los datos en un 97% La tabla de descomposición del Stress. 33 . aun así. todos son muy inferiores a 1 lo que indica que todos los elementos están bien representados en el modelo. los mayores puntajes serian los códigos mejor ajustados. intenta ver cual es el código que no logra entrar en el modelo.

(eje z) 34 .Modeling 7: Verificación. Ahora es importante conocer las dimensiones del modelo. pero tácticamente que puede hacerse? Dimensión 1 Desempeño del producto (eje X) Dimensión 2 Sensibilidad del consumidor a la recomendación (eje y) Dimensión 3 Disposición a probar el producto. El consumidor básicamente tiene 3 elementos en mente a la hora de aceptar o no la sugerencia a consumir el producto: Esta respuesta es buena a nivel de marketing estratégico. es decir. conocer las dimensiones que hacen que el consumidor sea sensible al advocacy.

Objetivo: Graficar de forma atractiva la solución. .Presentación. de forma que el cliente comprenda grafica y narrativamente las conclusiones que le estamos vendiendo.

36 . que no hacen sensible al consumidor al advocacy. Asociado al desempeño del producto Dimensión 1: No Sensibiliza al consumidor. No asociado al desempeño del producto Razones secundarias. Dimensión 1: Sensibiliza al consumidor. es decir. Dispone a comprar el producto. Reales razones por las cuales el consumidor es sensible al advocacy.Paso 1: El ilustrativo.

Paso 2: El Terminado. 37 . Dispone a comprar el producto. Mis amigos aceptaron consumirla El mesero fue convincente Ya habia oido de la marca El sitio tenia publicidad de la marca Tenia animo para probarla Me dio curiosidad probarla No asociado al desempeño del producto La publicidad de la marca es convincente Es una marca premium La marca tiene un buen sabor Asociado al desempeño del producto Ya iba decidido a consumirla Con seguridad es una buena marca La presentacion de la marca ayuda Queria probarla Ya habia escuchado buenos comentarios de la marca Es una marca con estilo Italiano Dimensión 1: No Sensibiliza al consumidor. Dimensión 1: Sensibiliza al consumidor.

2: El recuerdo que el consumidor tenga del desempeño del producto y 3: La disposición que el consumidor tenga hacia la compra. la especial para presentar el producto. 1: La sensibilidad del consumidor a la recomendación. 38 .Paso 3: Explicativo 1. Dispone a comprar el producto. Mis amigos aceptaron consumirla El mesero fue convincente Conclusiones a nivel de mercadeo estratégico: Ya habia oido de la marca Hay tres elementos que hacen sensible al consumidor al advocacy. Tenia animo para probarla El sitio tenia publicidad de la marca Me dio curiosidad probarla Recomendación: de los tres elementos. Conclusiones a nivel de mercadeo Táctico: Ya iba decidido a consumirla Asociado al desempeño del producto Ya habia escuchado buenos comentarios de la Es importante que el mesero desarrolle y se apropie marca de un ritual Con seguridad es una de igual forma. sabor es convincente calidad. así que un voz a voz que hable sobre desempeño de producto será positivo. Es una marca con estilo Italiano Es necesario activar la curiosidad del consumidor ante el producto. buena marca notoriedad de la publicidad en la mesa y en general en el sitio La presentacion de la marca ayuda Queria probarla posibilidad de compra facilita que el consumidor se involucre con la de consumir. Dimensión 1: Sensibiliza al consumidor. lo único Es una marca premium queasociado se puede al controlar es el desempeño del No desempeño producto así que a nivel de comunicación y delpublicitaria producto es necesario trasmitir activación La marca tiene un buen La publicidad de la asociados marca atributos de producto a Premium. sabor. Dimensión 1: No Sensibiliza al consumidor. confianza y desempeño.

Paso 3: Explicativo 2. contemple la posibilidad de una prueba discreta del producto a mujeres. debe ir siempre acompañado de otros drivers de comunicación que suplan las necesidades del consumidor a la hora de consumir cerveza. convincente Conclusiones a nivel de mercadeo estratégico: Ya habia oido de la marca Tenia para Conclusiones a nivel de animo mercadeo estratégico: probarla Los comentarios que el consumidor haya escuchado antes sobre el desempeño del producto El sitio tenia publicidad no son lo suficientemente de sensibilizadores al la marca advocacy. es convincente El tema de italiano es un diferencial no un activador. 39 . y la percepción de buena calidad por si misma no es un elemento que del producto haga al La consumidor sensible publicidad de la marca a advocacy. Dimensión 1: Sensibiliza al consumidor. Mis amigos aceptaron consumirla El mesero fue Dispone a comprar el producto. La presentacion de la marca ayuda Queria probarla Asociado al desempeño del producto Ya habia escuchado buenos comentarios de la Con seguridad es una marca buena marca Ya iba decidido a consumirla Es una marca con estilo Italiano Dimensión 1: No Sensibiliza al consumidor. que el ritual desplegado por el mesero. la Me dio curiosidad mujer lo compartirá con su acompañante y de esa probarla forma se puede despertar la curiosidad por probar mas la cerveza. Es una marca premium La marca tiene un buen sabor No asociado alde desempeño La proveniencia la marca. por lo que es bueno.

ayuda a El sitio tenia publicidad posicionar atributos relevantes y a activar la marca de la marca en la mente del consumidor. pero no hace que el consumidor sea Me dio curiosidad sensible a advocacy. Tenia animo para probarla La activación publicitaria que resalta y hace efectivo el advocacy es aquella que esta en el sitio de consumo.Paso 3: Explicativo 3. Conclusiones a nivel de mercadeo Táctico: Ya habia oido de la marca La publicidad de la marca en general. Es una marca premium La marca tiene un buen sabor probarla No asociado al desempeño del producto La publicidad de la marca es convincente Asociado al desempeño del producto Ya habia escuchado buenos comentarios de la marca Con seguridad es una buena marca Ya iba decidido a consumirla La presentacion de la marca ayuda Queria probarla Es una marca con estilo Italiano Dimensión 1: No Sensibiliza al consumidor. La publicidad hace que la marca entre en consideración. 40 . Dimensión 1: Sensibiliza al consumidor. Mis amigos aceptaron consumirla El mesero fue convincente Dispone a comprar el producto.

Dimensión 1: Sensibiliza al consumidor. el animo que el consumidor tiene para consumir el producto es variable a lo largo de la semana y en lo diferentes sitios. Ya habia oido de la marca Conclusiones a nivel de mercadeo Táctico: El ritual de consumo no debe ser siempre el mismo. Mis amigos aceptaron consumirla El mesero fue convincente Dispone a comprar el producto. el ritual Asociado al no puede ser igual un lunes desempeño del en un restaurante que un lunes en un bar.Me dio curiosidad El sitio tenia publicidad de la marca Tenia animo para probarla probarla No asociado al desempeño del producto Conclusiones a nivel de mercadeo Táctico: La publicidad de la marca es convincente El ritual debe ser versátil para activar curiosidad de prueba. Dimensión 1: No Sensibiliza al consumidor.Paso 3: Explicativo 3. La presentacion de la marca ayuda Ya iba decidido a consumirla Es una marca con estilo Italiano Queria probarla Actividades musicales. la Marca invita una ronda etc. Es una marca premium La marca tiene un buen Debe sabor variar. producto Con seguridad es una buena marca Ya habia escuchado buenos comentarios de la marca Facilitar actividades durante el ritual de consumo que active la participación de amigos y la prueba de producto simultáneamente puede ser conveniente para la activación y sensibilización del consumidor hacia el advocacy. 41 .

SPSS es una herramienta versátil a la que todos los analistas de mercado debe tener acceso para desarrollar habilidades de modelamiento. explotarlas para extraer la mayor cantidad de información posible es el reto del investigador.Conclusiones. tienen por si mismas. amplias riquezas conceptuales y estratégicas. El escalamiento multidimensional es una herramienta que nació en la psicología matemática y se perfeccionó en la estadística con el objetivo de comprender las estructuras mentales de las personas. • Las preguntas abiertas. Su aplicación en el terreno de mercadeo es reciente por lo que cualquiera de sus soluciones serán siempre innovadoras. • • 42 .