Actualmente la empresa cuenta con una base datos en postgresql un sistema
transaccional en migracin de Excel a un entorno web interno corporativo el cual nos brinda las siguientes caractersticas para una arquitectura tecnolgica acorde con los requerimientos de la empresa.
Fuentes de Datos: La base de datos de la cual se realizar la extraccin es una base de datos PostgreSQL. PostgreSQL es un SGBDrelacional orientado a objetos y libre, publicado bajo la licencia BSD. Como muchos otros proyectos de cdigo abierto, el desarrollo de PostgreSQL no es manejado por una empresa y/o persona, sino que es dirigido por una comunidad de desarrolladores que trabajan de forma desinteresada, altruista, libre y/o apoyada por organizaciones comerciales.
Proceso ETL: El proceso ETL ser realizado mediante la utilizacin de TOS (Talend Open Studio). Talend Open Studio es una solucin de cdigo abierto, ponderosa y verstil, que soluciona todas las necesidades de integracin de una organizacin: - Sincronizacin o replicacin de bases de datos - Intercambios de datos ajustados en tiempo o por lotes - ETL (Extract Transform Load) para Bl o anlisis - Migracin de datos - Transformaciones y cargas complejas de datos - Calidad de datos bsica.
Proceso de Minera de Datos: El proceso de minera de Datos ser realizado mediante el WorkBench y el uso de la herramienta RapidMiner 5. RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un programa informtico para el anlisis y minera de datos. Permite el desarrollo de procesos de anlisis de datos mediante el encadenamiento de operadores a travs de un entorno grfico. Se usa en investigacin educacin, capacitacin, creacin rpida de prototipos y en aplicaciones empresariales.