You are on page 1of 7

Ejercicios de Análisis Clúster – con Software estadístico

Pregunta 1. Actitud hacia las compras I


Se realizó un estudio de mercado en una muestra de consumidores para medir la actitud que
tienen cuando salen de compras. De acuerdo con la investigación, se identificaron seis variables
de actitud y se pidió a los entrevistados que expresaran su grado de acuerdo con las afirmaciones
siguientes, con base en una escala de siete puntos (1= en desacuerdo, 7= de acuerdo). Las
variables son las siguientes:

X1 = "Salir de compras es divertido".


X2 = "Salir de compras afecta el presupuesto".
X3 = "Combino la salida de compras con la comida fuera de casa".
X4 = "Cuando salgo de compras, trato de hacer las mejores".
X5 = "No me importa salir de compras".
X6 = "Puede ahora ahorrar mucho dinero si comparo los precios".

Los datos obtenidos de una muestra de prueba a 20 consumidores se encuentra en el archivo


actitud.sav. Se desea clasificar a los consumidores de acuerdo a su actitud hacia las compras.
Responda lo siguiente:
i) Obtenga la tabla que refleja el historial de aglomeración y responda:
ii) ¿Qué ocurre en la etapa o paso 3?
iii) ¿En el paso 15, cuántos clústeres se han formado y qué consumidores pertenecen a cada
uno de ellos?
iv) Obtenga el diagrama de témpanos y determine ¿cuántos consumidores forman el grupo
más grande, si se desea formar 4 grupos?
v) Utilizando el método de variación del coeficiente de conglomeración, determine ¿cuántos
conglomerados son adecuados?
vi) En base al número adecuado de conglomerados, obtener e interpretar el perfil de medias
(tabla y gráfico de líneas) para los grupos formados y asigne un nombre adecuado a cada
grupo formado.

Pregunta 2. HATCO II
i) Realice un análisis de agrupamiento jerárquico para variables con los datos del caso
HATCO utilizando las 7 primeras variables de percepción, escoja el método que aparece
por defecto.
a) En el paso 3, ¿cuántos clústeres se han formado y cuáles son las variables que
pertenecen a cada uno de ellos?
b) En el paso 4, ¿qué clústeres de variables se han unido?
c) Utilizando el método de variación del coeficiente de conglomeración, determine ¿cuántos
conglomerados son adecuados?

ii) Realice un análisis de agrupamiento no jerárquico para formar 4 grupos de clientes con los
datos del caso HATCO, utilizando las 7 primeras variables de percepción.
a) ¿Cuántos clientes conforman cada grupo?
b) Con 1% de significación, ¿qué variable(s) no es (son) significativa(s) en la conformación
de los grupos?
c) Obtener e interpretar el perfil de medias (tabla y gráfico de líneas) para los grupos
formados y asigne un nombre adecuado a cada grupo formado.
Pregunta 3. Gráfico del Dendrograma
El gráfico siguiente resultó de un análisis de conglomerados para formar grupos de variables.

i) Si se desea formar 4 grupos de variables, ¿Qué variables conforman cada uno de los
conglomerados?
ii) ¿Cuántas etapas o pasos fueron necesarios para formar cuatro conglomerados o clúster?
Justifique.
iii) ¿En qué etapa se llegó a formar 5 grupos? Justifique.
iv) ¿Qué clústeres o conglomerados se unieron en la etapa 6? Indique las variables que
formaban cada clúster antes de la unión.

Pregunta 4. Sambors Co.


Sanbors Co. tiene una cadena de centros comerciales en todo el país y con el objeto de conocer
el grado de aceptación de sus clientes ha levantado un sondeo de opinión. El procedimiento fue
entrevistar a los clientes que se retiraban del centro comercial. Las variables investigadas se
midieron en una escala de 0 al 10 (0 = Muy Mala y 10 = Muy buena) y su descripción se presenta
a continuación:

Variable Etiqueta
Var1 Calificación sobre la atención al cliente
Var2 Calificación sobre el trato de los empleados
Var3 Calificación sobre la presencia de los empleados
Var4 Calificación sobre los precios ofrecidos
Var5 Calificación sobre las facilidades de pago
Var6 Calificación sobre las promociones y descuentos
Var7 Calificación sobre la infraestructura del establecimiento
Var8 Calificación sobre la tecnología del establecimiento
Var9 Calificación sobre la comodidad del establecimiento
Se realizó un análisis de agrupamiento jerárquico de variables, obteniéndose el siguiente historial
de conglomeración:
Historial de conglomeración
Conglomerado que se combina Etapa en la que el
Próxima
conglomerado
Etapa Conglomerado Conglomerado Coeficientes Conglomerado Conglomerado aparece por
etapa
1 2 1 primera vez 2
1 7 8 .914 0 0 6
2 4 5 .867 0 0 6
3 1 2 .718 0 0 5
4 6 9 .683 0 0 7
5 1 3 .603 3 0 8
6 4 7 .578 2 1 7
7 4 6 .540 6 4 8
8 1 4 .163 5 7 0

i) ¿Qué ocurre en la etapa 6?


ii) ¿Cuántos grupos están formados en la etapa 5 y qué variables forman cada uno de los
grupos?
iii) Utilizando el método de variación del coeficiente de conglomeración, determine ¿cuántos
conglomerados son adecuados?

Pregunta 5. Capacidad de Ventas II.


Se desea clasificar a los vendedores del estudio sobre capacidad de ventas cuyos datos se
encuentran en el archivo Capa_ventas.sav.
i) Utilizando el método de clasificación, que empieza con la ubicación de los centroides
iniciales, si se quiere formar 3 grupos, responda lo siguiente:
a) Indique el número de vendedores que conforman cada uno de los grupos:

Grupo Número de vendedores


1
2
3

b) Con 1% de significación, ¿qué variable(s) no es (son) significativa(s) en la conformación


de los grupos?
ii) Utilizando el método de clasificación que empieza con la ubicación de los casos más
cercanos, si se quiere formar 3 grupos, responda lo siguiente:
a) Indique el número de vendedores que conforman cada uno de los grupos:

Grupo Número de vendedores


1
2
3

b) ¿Qué ocurre en el paso 18 del Historial de conglomeración?


Pregunta 6. Servicios de Transporte Urbano II.
Continuando con el caso de “Percepción de la calidad de los servicios de transporte urbano” ahora
se desea clasificar a las personas en 2 grupos (clusteres). Los datos del estudio se encuentran
en el archivo transporte.sav.
i) Utilizando el método de clasificación K medias responda lo siguiente:
a) Indique el número de personas que conforman cada uno de los grupos:
Grupo Número de personas
1
2

b) Determine a qué grupo pertenecen las siguientes personas:


Personas Número de Grupo al que pertenece
P2
P10
P28
P50

ii) Utilizando el método de clasificación Jerárquico agrupe variables y responda lo siguiente:


a) Indique el número de variables que conforman cada uno de los grupos:
Grupo Número de variables

1
2
3

b) ¿Qué ocurre en el paso 2 del Historial de conglomeración (Agglomeration Schedule)


c) Si se desea formar 4 grupos determine qué variables conforman el grupo más pequeño.

Pregunta 7. Vehículos motorizados.


Una corporación internacional fabricante de vehículos motorizados cuenta en el Perú con 49
empresas comercializadoras de sus vehículos. La gerencia de marketing de la corporación realizó
un estudio con la finalidad de clasificar a las empresas según el nivel de satisfacción de sus clientes
en el Perú. Para tal investigación se aplicó un cuestionario de 9 ítems, donde cada ítem mide la
satisfacción en una escala de 1 al 20 (20 indica máxima satisfacción). Los resultados se muestran
en el archivo de datos clientes.sav. Los ítems (variables) utilizados en el cuestionario son:

Variable Descripción
X1 Estado de los vehículos cuando llegan al establecimiento
X2 Variedad de modelos de los vehículos
X3 Variedad de colores de los vehículos
X4 Tiempo de distribución de los vehículos al establecimiento
X5 Disposición para agilizar los trámites de importación
X6 Nivel general de precios base de los vehículos
X7 Ofertas y promociones para el establecimiento
X8 Flexibilidad en el tiempo de pago
X9 Amabilidad del personal de negociación
i) Utilice el método de clasificación jerárquica y responda lo siguiente:
a) ¿Cuál es la distancia euclidiana al cuadrado entre las siguientes empresas?

Empresas Distancia euclidiano al cuadrado

Entre A10 y A20

Entre A15 y A30

b) ¿Cuántos clúster se han formado hasta la etapa 15?


c) Del historial de conglomeración, describa lo que ocurre en la etapas 4.
d) Analice el dendrograma y comente brevemente lo que observa.
e) Determine el número adecuado de grupos a ser formados.
f) Con el número adecuado de grupos, ¿qué empresas integran el grupo más pequeño?
g) Con el número adecuado de grupos, obtenga la tabla y el gráfico de perfil de medias.
h) Según el perfil de medias anterior describa los grupos formados.

ii) Utilizando el número adecuado de grupos determinado en el punto 1, aplique el método de


clasificación k-medias y responda siguiente:
a) ¿Cuántas semillas son necesarias para iniciar la conglomeración?
b) Determine el número de empresas de cada grupo formado.
c) ¿Cuál es la distancia de la empresa A10 al centro de su grupo formado?
d) Realice el análisis de varianza ANOVA para los grupos formados.
e) Obtenga la tabla y el gráfico de perfil de medias y describa los grupos formados.

iii) ¿Qué diferencias importantes encuentra en los resultados de los métodos de clasificación?

Pregunta 8. Mapa de Pobreza.


El mapa de pobreza elaborado por FONCODES en el año 2006 a nivel departamental, consiste
en la determinación de indicadores que permiten ordenar los departamentos desde los más pobres
hasta los menos pobres. En el archivo pobreza.sav se brinda información del mapa de pobreza
conteniendo las siguientes variables:

Variable Descripción
Dpto Nombre del departamento
Carencia Índice de carencias (De 0=Sin carencias a 1=Todas las carencias)
Agua Proporción de población sin agua
Desague Proporción de población sin desagüe
Electricidad Proporción de población sin electricidad
Analfabe Proporción de analfabetismo en mujeres
Desnutri Tasa de desnutrición

Se desea clasificar los departamentos en función al nivel de pobreza.


i) Utilizando el método de clasificación K medias, clasifique a los departamentos en 3 grupos
y responda lo siguiente:
a) ¿Cuántos centroides iniciales o semillas utilizó?
b) Según los resultados ¿con que otros departamentos se encuentra agrupado el
departamento de AREQUIPA?
c) En el mismo grupo de AREQUIPA ¿qué departamento se encuentra más cerca al centro
de este grupo?
d) Con 1% de significación ¿cree usted que existen diferencias significativas en la tasa de
desnutrición entre los tres grupos formados? Sustente con prueba de hipótesis.
ii) Utilizando el método de clasificación jerárquica, clasifique a los departamentos en 4 grupos
y responda lo siguiente:
a) ¿Qué ocurre en la etapa 5 del historial de conglomeración?
b) Según los resultados ¿con que otros departamentos se encuentra agrupado el
departamento de ANCASH?
c) Analizando los resultados y gráficos que crea pertinente, determine ¿Cuál de los 4
grupos formados es considerado el más pobre? Indique los nombres de los
departamentos de este gripo.

Pregunta 9. AUDIÓFILOS.
Una revista para audiófilos probó 19 marcas de parlantes de medio rango. Los resultados de las
pruebas y los precios de estos parlantes son mostrados a continuación:

Marca Precio Potencia


A 600 38
B 598 18
C 550 36
D 500 29
E 630 15
F 580 5
G 460 15
H 600 29
I 590 15
J 599 23
K 598 23
L 618 12
M 600 46
N 600 29
O 600 36
P 500 45
Q 539 23
R 569 21
S 680 36

El “Precio” es el precio de lista sugerido por el fabricante. “Potencia” mide en watts por canal la
potencia amplificadora mínima que el parlante necesita para reproducir música a un volumen
moderado. La revista desea agrupar estas marcas en grupos homogéneos.
i) Realice un análisis de clúster jerárquico con el SPSS, utilizando el método que aparece por
defecto y midiendo las distancias con las distancias euclidianas cuadradas. En el paso 5,
cuántos clústeres se han formado y que marcas los conforman.
ii) Considerando el análisis realizado en el acápite anterior, si se tuviera que considerar tres
clústeres, ¿qué marcas los conformarían?
iii) Realice el análisis de k-medias, para obtener 4 grupos. ¿Cómo describiría los clústeres
formados? ¿En qué clúster se encuentran los parlantes más caros?
iv) Con respecto al análisis realizado en el acápite anterior, diga en que clúster estarían
considerados los parlantes A, M, Q.

Pregunta 10. Comunidades Autónomas Españolas


Los gastos por distintos conceptos en algunas comunidades autónomas españolas se encuentran
en el archivo comunidades.sav, a continuación se especifican los gastos considerados:
 AL=Alimentación, bebidas y tabaco
 VES=Vestido y calzado
 VIV=Vivienda, calefacción y alumbrado
 SER=Artículos de mobiliario, menaje y conservación del hogar
 MED=Servicios médicos y sanitarios
 TRANS=Transportes y comunicaciones
 ESP=Esparcimiento, enseñanza y cultura
 OBIEN=Otros bienes y servicios
 OGAS=Otros gastos

i) Realice un análisis de conglomerados no jerárquico para formar cuatro grupos y conteste:


a) ¿Cuáles serían los integrantes de cada uno de ellos?

Grupo 1
Grupo 2
Grupo 3
Grupo 4

b) ¿La variable “Vestido y calzado” es importante en la formación de los grupos? Use 5%


de significación.

ii) Realice un análisis de conglomerados jerárquico de casos para formar cuatro grupos y
conteste:
a) ¿Cuáles serían los integrantes de cada uno de ellos?

Grupo 1
Grupo 2
Grupo 3
Grupo 4

b) Hasta el paso 4 del Historial de Aglomeración, ¿cuántos grupos se han formado?


c) En el paso 7, ¿qué conglomerados se han unido? (especificar claramente los casos que
formaban cada grupo antes de la unión)
d) ¿Cuáles son los casos más cercanos?, ¿y los más lejanos?