Professional Documents
Culture Documents
Una explicacin:
La variable ms importante resulta ser el porcentaje de los afroamericanos. En primer lugar, tenemos la
hiptesis de que tal vez los afroamericanos y mexicano-americanos, se encuentran en los mismos barrios,
porque en todo el pas, ambos grupos tienden a ser ms pobres que la media, se descubri que un alto
porcentaje de un grupo se correlaciona con un porcentaje bajo de los dems. La razn es que, aunque en el
resto del mundo, los hablantes de espaol son de diferentes razas y hay muchos de raza afro descendiente
que tengan el espaol como lengua materna, en esta parte de Texas, la poblacin hispana es la mexicana
y la poblacin negra es principalmente no-hispana. Un momento de pensamiento muestra que en una
poblacin donde los dos rasgos son bastante excluyentes, si un determinado barrio es ms del 80 por
ciento en negro, no puede ser ms del 20 por ciento hispana. Al principio pareca una minera de datos
directa.
Ya sabamos que, y que no nos ayuda a decidir qu productos promocionar en espaol. La segunda
muestra que la cadena ha construido grandes almacenes en algunos tipos de barrios que en otros. Este
hecho es interesante en s mismo, sino que tambin arroja poca luz sobre el problema en cuestin.
Los prximos tres variables, cdigo de producto, segmentar y sub segmentar, son un poco ms
interesantes. Eso pareca muy sorprendente, hasta que nos enteramos de que los cdigos de los productos
no son asignados aleatoriamente; productos similares tienen cdigos similares. De hecho, el cdigo de
producto y rangos estn expresando la misma informacin que los segmentos y sub-segmentos. Un
segmento de mantequilla de man podra tener sub segmentos cremoso y espeso, y todos los elementos en
el segmento adyacente tendra cdigos de producto.
Para el siguiente paso, decidimos crear una canasta bsica de anlisis de estilo utilizando la cantidad de
cada producto vendido como un factor de replicacin para cada registro. Cada registro incluye tambin un
estado que indica si vino de un almacn con alta, media o baja de la poblacin hispana. Nuestra esperanza
era que podramos encontrar algunos productos en los que el alto o bajo nivel hispano aparecera junto con
ciertos productos, a menudo lo suficiente como para permitir que algunas reglas de asociacin que se
generar.
Por desgracia no se encontraron reglas. Rebajamos los estndares para la formacin de la regla que
finalmente se produce la nica regla que se ilustra en la siguiente figura
El grfico de convergencia dice que las ventas de una determinada marca de cereales en paquetes
de 10 onzas tiene un indicador bajo de compra en la poblacin de nivel bajo hispano. Lo que
significa que ms de la mitad del tiempo este producto es comprado en una tienda de nohispanos. Sin embargo, la prevalencia es baja, lo que significa que no hay muchos ejemplos de
esta combinacin de datos.
4. Resultados finales
Los resultados ms interesantes vinieron de visualizar la poblacin hispana con las puntuaciones para cada
producto. La poblacin hispana dio mayor puntuacin a un producto estos es la diferencia entre el
promedio normalizado del volumen de ventas en la mayora de los hispanos y tiendas hispanas. As, un
producto que se vende mejor en tiendas hispanas con poblacin hispana tiene aspectos positivos, mientras
que uno se vende en tiendas no hispanos tiene consecuencias negativas.
El siguiente grfico de dispersin muestra las puntuaciones poblacin hispana. El color de cada bloque de
la puntuacin la poblacin hispana, que representa la popularidad del producto con los clientes hispanos.
Vara desde el rojo que significa "muy popular" en azul, que significa "muy impopular." La barra vertical
representa las unidades vendidas. El tamao del cuadro indica el volumen en dlares. Informacin acerca
de los productos que fueron favorecidos y desfavorecidos por los compradores en las zonas de habla
espaol salt a la derecha de la pantalla. Esta grfica muestra que una marca determinada de cereales con
hojuelas es un favorito entre los consumidores hispanos. Tambin de inters es el grupo de cuadros azul
oscuro en la parte inferior derecha de la imagen, estos resultan ser de diversas marcas, formas y
tamaos de trigo triturado, productos que aparentemente no son comprados por los hispano hablantes de
Texas que son los posibles objetivos de una campaa de marketing tnico.
Los preguntas
Qu productos que no son comprados por hispano hablantes de acuerdo al nivel de poder
adquisitivo, deben se promocionados hacia la poblacin hispana en Texas por el plan de mercadeo?
Por qu los datos proporcionados revelaron diferencias entre los almacenes con un alto porcentaje
de clientes que hablan espaol y los que tienen menos?
Por qu ciertos productos se venden ms en tiendas hispanas y porque otros productos no son
comprados en las tiendas hispanas?
Lo que repetiramos
El anlisis de poblacin hispana, tienda hispana y producto ms comprando teniendo en
cuenta todos los productos con menos puntacin para poder ofrecerles en una campaa de
marketing orientada a la poblacin hispana.
Conclusiones
Antes de empezar aplicar minera de datos, es importante entender los datos, ordenarlos.
El anlisis de los patrones de compras en la poblacin de hispanos en relacin a productos
de alimentos envasados, no tiene correlacin con la poblacin afroamericana.
El anlisis de los patrones de compras en la poblacin de hispanos en relacin a productos
de alimentos envasados, tenemos que mejorar la codificacin de productos para diferenciar
los segmentos y sub segmentos.
Al entender anlisis de los patrones de compras en la poblacin de hispanos en relacin a
productos de alimentos envasados, se encuentra que los productos preferidos por la
poblacin hispana en una tienda hispana presentan buenos resultados (cereal de hojuelas), y
se observa tambin una lista de productos que no son de preferencia de la poblacin
hispana.