You are on page 1of 2

PROCESO DE EXTRACCIN

Ventas:

Se necesita realizar una extraccin de datos de un nmero de


archivos de extensin csv.
Cada archivo tiene un nmero de columnas n, de las cuales solo
una cantidad de columnas m sern extradas.
El programa debe tener una interfaz en la cual el usuario indique
los encabezados de las columnas que va a utilizar en cada archivo,
se debe tener en cuenta que estos archivos no siempre comparten
el mismo orden de las columnas que se desean obtener
Por cada archivo csv debe generarse un archivo resultante con la
extraccin de datos.
Es posible que en algunos archivos, algunas de las columnas que
se deseen extraer se encuentren concatenadas en una sola
columna con un nombre determinado, para estos casos la interfaz
de usuario debe ofrecer la posibilidad al usuario de definir este
tipo de campos equivalentes, de modo tal que si uno de los
encabezados iniciales no se encuentra en el archivo, el programa
busque alguna de las columnas equivalentes y extraiga la
informacin.
Despus de obtener la extraccin esta debe ser cruzada con un
archivo llamado target (a este se le debe eliminar la informacin
duplicada); se debe generar un archivo resultante en donde solo
figuren la informacin que cruce entre el target y el archivo de
extraccin.

Servicios:

Se necesita realizar una extraccin de datos de un nmero de


archivos de extensin csv.
Cada archivo tiene un nmero de columnas n, de las cuales solo
una cantidad de columnas m sern extradas.
El programa debe tener una interfaz en la cual el usuario indique
los encabezados de las columnas que va a utilizar en cada archivo,
se debe tener en cuenta que estos archivos no siempre comparten
el mismo orden de las columnas que se desean obtener
Por cada archivo csv debe generarse un archivo resultante con la
extraccin de datos.
Es posible que en algunos archivos, algunas de las columnas que
se deseen extraer se encuentren concatenadas en una sola
columna con un nombre determinado, para estos casos la interfaz
de usuario debe ofrecer la posibilidad al usuario de definir este
tipo de campos equivalentes, de modo tal que si uno de los
encabezados iniciales no se encuentra en el archivo, el programa
busque alguna de las columnas equivalentes y extraiga la
informacin.
Despus de obtener la extraccin esta debe ser cruzada con un
archivo llamado target (a este se le debe eliminar la informacin
duplicada); se debe generar un archivo resultante en donde solo
figuren la informacin que cruce entre el target y el archivo de
extraccin.

You might also like