Se necesita realizar una extraccin de datos de un nmero de
archivos de extensin csv. Cada archivo tiene un nmero de columnas n, de las cuales solo una cantidad de columnas m sern extradas. El programa debe tener una interfaz en la cual el usuario indique los encabezados de las columnas que va a utilizar en cada archivo, se debe tener en cuenta que estos archivos no siempre comparten el mismo orden de las columnas que se desean obtener Por cada archivo csv debe generarse un archivo resultante con la extraccin de datos. Es posible que en algunos archivos, algunas de las columnas que se deseen extraer se encuentren concatenadas en una sola columna con un nombre determinado, para estos casos la interfaz de usuario debe ofrecer la posibilidad al usuario de definir este tipo de campos equivalentes, de modo tal que si uno de los encabezados iniciales no se encuentra en el archivo, el programa busque alguna de las columnas equivalentes y extraiga la informacin. Despus de obtener la extraccin esta debe ser cruzada con un archivo llamado target (a este se le debe eliminar la informacin duplicada); se debe generar un archivo resultante en donde solo figuren la informacin que cruce entre el target y el archivo de extraccin.
Servicios:
Se necesita realizar una extraccin de datos de un nmero de
archivos de extensin csv. Cada archivo tiene un nmero de columnas n, de las cuales solo una cantidad de columnas m sern extradas. El programa debe tener una interfaz en la cual el usuario indique los encabezados de las columnas que va a utilizar en cada archivo, se debe tener en cuenta que estos archivos no siempre comparten el mismo orden de las columnas que se desean obtener Por cada archivo csv debe generarse un archivo resultante con la extraccin de datos. Es posible que en algunos archivos, algunas de las columnas que se deseen extraer se encuentren concatenadas en una sola columna con un nombre determinado, para estos casos la interfaz de usuario debe ofrecer la posibilidad al usuario de definir este tipo de campos equivalentes, de modo tal que si uno de los encabezados iniciales no se encuentra en el archivo, el programa busque alguna de las columnas equivalentes y extraiga la informacin. Despus de obtener la extraccin esta debe ser cruzada con un archivo llamado target (a este se le debe eliminar la informacin duplicada); se debe generar un archivo resultante en donde solo figuren la informacin que cruce entre el target y el archivo de extraccin.