You are on page 1of 7

UNIVERSIDAD ESAN

PROGRAMA DE ALTA ESPECIALIZACIN DE BUSINESS


INTELLIGENCE

CURSO: Minera de Datos en la Gestin Empresarial

PROFESOR: Jorge Aguinaga Alvites


TTULO: Captulo 13 Quin compra qu? Conociendo a los compradores de los
supermercados. Caso 1: Analizando los patrones de compra por etnia

El presente trabajo ha sido realizado de acuerdo a los reglamentos de la UNIVERSIDAD ESAN


Por
Grupo 1
Erika Ins Acua Salinas
Libio Antero Benites Condori
Jorge Luis Pastor Flores
Sebastin Rodrigo Osorio Snchez

Surco, 20 junio de 2016

Analizando los patrones de compra por etnia


1. Introduccin
La empresa que realiza este anlisis se dedica a fabricar alimentos en productos envasados. El
objetivo es implementar una campaa de marketing dirigido a compradores de habla hispana en
el sur de Texas. Para este estudio se ha analizado los datos proporcionados por una cadena de
supermercados lder en Texas, y donde se describe como este fabricante aprendi sobre los
patrones de compra de los grupos tnicos estudiados.
Introduccin al problema de la empresa
Antes de realizar la campaa de mercadeo tnico, los gestores de marca necesitaban saber si
existen diferencias significativas en los gustos y preferencias que puedan diferenciar la
poblacin objetivo del mercado como un todo. Este proyecto fue un programa piloto para
determinar el inmenso poder de una herramienta de visualizacin y de minera de datos.
El proyecto piloto demostr que aunque no hay mucha variacin en el desempeo de categoras
tales como "cereales listos para comer" entre los distintos grupos tnicos.
Los datos se recogieron a partir de una cadena de supermercados en Texas, un estado con una gran
poblacin de habla espaola suficiente como para justificar un programa especial de marketing. Adems
de cifras semanales de ventas por categora y sub categora, y datos demogrficos de la zona circundante
de cada tienda.
De especial inters para este estudio fue el porcentaje de clientes hispanos. Nuestro objetivo fue conocer
si los datos proporcionados revelaron diferencias entre los almacenes con un alto porcentaje de
clientes que hablan espaol y los que tienen menos.
Los datos consistan en cifras de ventas semanales para el perodo de junio de 1996 hasta diciembre de
1997 para los productos en cinco categoras bsicas:
Cereales listos para comer
Postres
Snacks
Comidas principales
Pancake y variedad de mezclas para hornear
Para cada almacn, hemos tenido informacin sobre el tamao de la tienda, el porcentaje de compradores
hispanos, afroamericanos.

2. Entendimiento de la informacin antes aplicar minera de datos

El primer paso fue realizar transformaciones de traer la informacin ms cerca de la


superficie (entenderla). Una de las transformaciones ms importantes para este
conjunto de datos era para decodificar variables que llev ms de un dato a los
diseadores de bases de datos a menudo combinan varias piezas independientes de
informacin dentro de una sola variable.
Otro conjunto de transformaciones fue necesario comparar las ventas entre tiendas
de diferentes tamaos. Para hacer estas comparaciones vlidas, tuvimos que
normalizar los valores tomando el volumen de ventas de la tienda en cuenta. Estas
variables derivadas dividen las unidades, dlares y cajas equivalentes por el
volumen total de ventas de la tienda, as como para expresar todas estas medidas
en relacin con el tamao de la tienda.

An ms transformaciones fueron necesarias para comparar el rendimiento de las ventas de un


producto a travs de diferentes niveles de poblacin hispana. Para este propsito, las tiendas
fueron divididos en tres grupos: baja, media y alta hispana
La parte ms valiosa
Como suele ser el caso, la parte ms valiosa del proyecto era preparar los datos y familiarizarse con l, en
lugar de poner en marcha los algoritmos de minera de datos.

3. Aplicando Minera de datos


Una visualizacin que pareca interesante pero no era
Utilizando esta herramienta, la cual muestra los resultados de una tcnica de minera de datos estadsticos
conocidos como modelos bayesianos, el analista puede determinar rpidamente qu valores o rangos de
valores para las variables que son buenas pruebas, ya sea a favor o en contra de una clasificacin
determinada. La herramienta puede ser utilizada de forma interactiva para anlisis de tipo "qu pasa si" en
una forma que recuerda una consulta OLAP herramienta grfica.
Las variables que ms fuertemente correlacionados con el porcentaje de hispanos fueron
El porcentaje de afroamericanos
Si o no la tienda estaba en San Antonio
El tamao de la tienda

Una explicacin:
La variable ms importante resulta ser el porcentaje de los afroamericanos. En primer lugar, tenemos la
hiptesis de que tal vez los afroamericanos y mexicano-americanos, se encuentran en los mismos barrios,
porque en todo el pas, ambos grupos tienden a ser ms pobres que la media, se descubri que un alto
porcentaje de un grupo se correlaciona con un porcentaje bajo de los dems. La razn es que, aunque en el
resto del mundo, los hablantes de espaol son de diferentes razas y hay muchos de raza afro descendiente
que tengan el espaol como lengua materna, en esta parte de Texas, la poblacin hispana es la mexicana
y la poblacin negra es principalmente no-hispana. Un momento de pensamiento muestra que en una
poblacin donde los dos rasgos son bastante excluyentes, si un determinado barrio es ms del 80 por
ciento en negro, no puede ser ms del 20 por ciento hispana. Al principio pareca una minera de datos
directa.
Ya sabamos que, y que no nos ayuda a decidir qu productos promocionar en espaol. La segunda
muestra que la cadena ha construido grandes almacenes en algunos tipos de barrios que en otros. Este
hecho es interesante en s mismo, sino que tambin arroja poca luz sobre el problema en cuestin.

Los prximos tres variables, cdigo de producto, segmentar y sub segmentar, son un poco ms
interesantes. Eso pareca muy sorprendente, hasta que nos enteramos de que los cdigos de los productos
no son asignados aleatoriamente; productos similares tienen cdigos similares. De hecho, el cdigo de
producto y rangos estn expresando la misma informacin que los segmentos y sub-segmentos. Un
segmento de mantequilla de man podra tener sub segmentos cremoso y espeso, y todos los elementos en
el segmento adyacente tendra cdigos de producto.
Para el siguiente paso, decidimos crear una canasta bsica de anlisis de estilo utilizando la cantidad de
cada producto vendido como un factor de replicacin para cada registro. Cada registro incluye tambin un
estado que indica si vino de un almacn con alta, media o baja de la poblacin hispana. Nuestra esperanza
era que podramos encontrar algunos productos en los que el alto o bajo nivel hispano aparecera junto con
ciertos productos, a menudo lo suficiente como para permitir que algunas reglas de asociacin que se
generar.
Por desgracia no se encontraron reglas. Rebajamos los estndares para la formacin de la regla que
finalmente se produce la nica regla que se ilustra en la siguiente figura

El grfico de convergencia dice que las ventas de una determinada marca de cereales en paquetes
de 10 onzas tiene un indicador bajo de compra en la poblacin de nivel bajo hispano. Lo que
significa que ms de la mitad del tiempo este producto es comprado en una tienda de nohispanos. Sin embargo, la prevalencia es baja, lo que significa que no hay muchos ejemplos de
esta combinacin de datos.

4. Resultados finales
Los resultados ms interesantes vinieron de visualizar la poblacin hispana con las puntuaciones para cada
producto. La poblacin hispana dio mayor puntuacin a un producto estos es la diferencia entre el
promedio normalizado del volumen de ventas en la mayora de los hispanos y tiendas hispanas. As, un
producto que se vende mejor en tiendas hispanas con poblacin hispana tiene aspectos positivos, mientras
que uno se vende en tiendas no hispanos tiene consecuencias negativas.
El siguiente grfico de dispersin muestra las puntuaciones poblacin hispana. El color de cada bloque de
la puntuacin la poblacin hispana, que representa la popularidad del producto con los clientes hispanos.
Vara desde el rojo que significa "muy popular" en azul, que significa "muy impopular." La barra vertical
representa las unidades vendidas. El tamao del cuadro indica el volumen en dlares. Informacin acerca
de los productos que fueron favorecidos y desfavorecidos por los compradores en las zonas de habla
espaol salt a la derecha de la pantalla. Esta grfica muestra que una marca determinada de cereales con
hojuelas es un favorito entre los consumidores hispanos. Tambin de inters es el grupo de cuadros azul
oscuro en la parte inferior derecha de la imagen, estos resultan ser de diversas marcas, formas y
tamaos de trigo triturado, productos que aparentemente no son comprados por los hispano hablantes de
Texas que son los posibles objetivos de una campaa de marketing tnico.

Los preguntas
Qu productos que no son comprados por hispano hablantes de acuerdo al nivel de poder
adquisitivo, deben se promocionados hacia la poblacin hispana en Texas por el plan de mercadeo?
Por qu los datos proporcionados revelaron diferencias entre los almacenes con un alto porcentaje
de clientes que hablan espaol y los que tienen menos?
Por qu ciertos productos se venden ms en tiendas hispanas y porque otros productos no son
comprados en las tiendas hispanas?

Lo que haramos de nuevo (mejoras propuestas)


La propuesta de mejora es relacionado con los cdigos de los productos que no son asignados
aleatoriamente; Entonces tendra que mejorar esta clasificacin de cdigos para que no exista
productos similares con cdigos similares. Diferenciado el segmento y el sub segmento para cada
producto y que no se comparta con otro producto para poder diferenciar y seguir buscando patrones
de compras.

Lo que repetiramos
El anlisis de poblacin hispana, tienda hispana y producto ms comprando teniendo en
cuenta todos los productos con menos puntacin para poder ofrecerles en una campaa de
marketing orientada a la poblacin hispana.

Conclusiones

Antes de empezar aplicar minera de datos, es importante entender los datos, ordenarlos.
El anlisis de los patrones de compras en la poblacin de hispanos en relacin a productos
de alimentos envasados, no tiene correlacin con la poblacin afroamericana.
El anlisis de los patrones de compras en la poblacin de hispanos en relacin a productos
de alimentos envasados, tenemos que mejorar la codificacin de productos para diferenciar
los segmentos y sub segmentos.
Al entender anlisis de los patrones de compras en la poblacin de hispanos en relacin a
productos de alimentos envasados, se encuentra que los productos preferidos por la
poblacin hispana en una tienda hispana presentan buenos resultados (cereal de hojuelas), y
se observa tambin una lista de productos que no son de preferencia de la poblacin
hispana.

You might also like