You are on page 1of 6

Semestre: 4to Materia: Fundamentos de Base de Datos Grupo: ISD Tema: 1.8.

- Tpicos Selectos De Base de Datos Catedrtico: CASTAON OLGUIN EDUARDO Alumno: Santiago Legaspi Isaac David Nmero de Control: 11161087

1.8.- Tpicos Selectos de Bases de Datos ETL


Cuando hablbamos de Data Warehousing, pasamos por encima de las herramientas ETL, considerndolas un elemento fundamental en la construccin, explotacin y evolucin de nuestro Data Warehouse (DW).

Esquema Tipico de Herramienta ETL

Decamos que las herramientas ETL, deberan de proporcionar, de forma general, las siguientes funcionalidades: Control de la extraccin de los datos y su automatizacin, disminuyendo el tiempo empleado en el descubrimiento de procesos no documentados, minimizando el margen de error y permitiendo mayor flexibilidad. Acceso a diferentes tecnologas, haciendo un uso efectivo del hardware, software, datos y recursos humanos existentes. Proporcionar la gestin integrada del Data Warehouse y los Data Marts existente, integrando la extraccin, transformacin y carga para la construccin del Data Warehouse corporativo y de los Data Marts. Uso de la arquitectura de metadatos, facilitando la definicin de los objetos de negocio y las reglas de consolidacin. Acceso a una gran variedad de fuentes de datos diferentes. Manejo de excepciones. Planificacin, logs, interfaces a schedulers de terceros, que nos permitirn llevan una gestin de la planificacin de todos los procesos necesarios para la carga del DW. Interfaz independiente de hardware.

Soporte en la explotacin del Data Warehouse.

Es hora de ampliar las definiciones y entrar un poco mas a fondo en lo que son realmente las ETLs:

Definicin de ETL
Si ampliamos las definiciones, en la Wikipedia se dice lo siguiente de las herramientas ETL: ETL son las siglas en ingls de Extraer, Transformar y Cargar (Extract, Transform and Load). Es el proceso que permite a las organizaciones mover datos desde mltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otra base de datos,data mart, o data warehouse para analizar, o en otro sistema operacional para apoyar un proceso de negocio. Los procesos ETL tambin se pueden utilizar para la integracin con sistemas heredados (aplicaciones antiguas existentes en las organizaciones que se han de integrar con los nuevos aplicativos, por ejemplo, ERPs. La tecnologa utilizada en dichas aplicaciones puede hacer dificil la integracin con los nuevos programas).

(Roberto, 2010)

ERP Como indica google en su wikipedia. ERP son las siglas de Enterprise Resource Planning o Planificacin de Recursos de la Empresa y bsicamente es una arquitectura de software para empresas que facilita e integra la informacin entre las funciones de manifactura, logstica, finanzas y recursos humanos de una empresa. Algunas Caractersticas de los Software ERP - Base de datos centralizada - Componentes de un Erp interactan entre si consolidando todas las operaciones. - En un software ERP los datos se ingresan una sola vez (ya les gustara). Datos deben ser completos consistentes y comunes (Bueno esto es lo ideal pero todava me acuerdo de una vez que encontramos un pedido de compra con tan solo la cabecera y sin datos de posicin en las tablas ? ) - Las empresas deben de modificar algunos de sus procesos para alinearlos con los del sistema ERP.

Principales Software ERP: SAP (15,6%) - Me ha sorprendido este porcentaje crea que era ms alto PeopleSoft (4,9%) Oracle(4,8%) Bann(3,0%) J.D.Ewards(2,2%) (tracer, 2006) Data WareHouse Oracle tambin posee una herramienta de desarrollo de aplicaciones para el almacn de datos. Oracle Warehouse Builder. Warehouse Builder es una herramienta para el diseo e implantacin de todos los aspectos de un almacn de datos, incluyendo el diseo del esquema, asignaciones de datos y transformaciones, procesamiento de carga de datos y gestin de metadatos. Oracle Warehouse Builder soporta los esquemas 3FN y en estrella y puede tambin importar diseos desde Oracle Designer. (Silberschatz, Korth, & Sudarshan, 2002) Elementos bsicos de un Data WareHouse Sistema fuente: sistemas operacionales de registros donde sus funciones son capturar las transacciones del negocio. A los sistemas fuentes tambin se le conoce como Legacy System. rea de trfico de datos: es un rea de almacenamiento y grupo de procesos, que limpian transforman, combinan, remover los duplicados, guardan, archivan y preparan los datos fuente para ser usados en el Data WareHouse. Servidor de presentacin: la maquina fsica objetivo en donde los datos del Data WareHouse son organizados y almacenados para queries directos por los usuarios finales, reportes y otras aplicaciones. Modelo dimensional: una disciplina especfica para el modelado de datos que es una alternativa para los modelos de entidad relacin. Procesos de negocios: un coherente grupo de actividades de negocio que hacen sentido a los usuarios del negocio del Data WareHouse.

Data Mart: un subgrupo lgico del Data WareHouse completo. Data WareHouse: bsquedas fuentes de datos de la empresa. Y es la unin de todos los data marts que la constituyen. Almacenamiento operacional de datos: es el punto de integracin por los sistemas operacionales. Es el acceso al soporte de decisiones por los ejecutivos. OLAP: actividad general de bsquedas para presentacin de texto y nmeros del Data WareHouse, tambin un estilo dimensional especifico de bsquedas y presentacin de informacin y que es ejemplificada por vendedores de OLAP. ROLAP: un grupo de interfaces de usuarios y aplicaciones que le dan a la base de datos relacional un estilo dimensional. MOLAP: un grupo de interfaces de usuarios, aplicaciones y propietarios de tecnologa de bases de datos que tienen un fuerte estilo dimensional. Aplicaciones para usuarios finales: una coleccin de herramientas que hacen los queries, analizan y presentan la informacin objetivo para el soporte de las necesidades del negocio. Herramientas de acceso a datos por usuarios finales: un cliente de Data WareHouse. Ad Hoc Query Tool: un tipo especifico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propios queries manipulando directamente las tablas relacionales y sus uniones. Modelado de aplicaciones: un sofisticado tipo de cliente de Data WareHouse con capacidades analticas que transforma o digiere las salidas del Data WareHouse. Meta Data: toda la informacin en el ambiente del Data WareHouse que no son as mismo los datos actuales.

Los procesos bsicos del Data WareHouse (ETL) Extraccin: este es el primer paso de obtener la informacin hacia el ambiente del Data WareHouse. Transformacin: una vez que la informacin es extrada hacia el rea de trafico de datos, hay posibles paso de transformacin como; limpieza de la informacin, tirar la basura que no nos sirve, seleccionar nicamente los campos necesarios para el Data WareHouse, combinar fuentes de datos, hacindolas coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una dimensin. Carga: al final del proceso de transformacin, los datos estn en forma para ser cargados. (drgutierrez, 2008) Utilidad de los tpicos selectos de base de datos La utilidad que tienen las herramientas ETR y ERP son indispensables para el manejo de las bases de datos, ya que de esta forma podemos extraer, transformar y cargar los datos. Un data warehouse es un sistema de almacen que nos permite trabajar con diversas bases de datos y actuar en conjunto entre ellas mismas. Nos permiten una gran flexibilidad para almacenar datos de diferentes conceptos y entornos. Bibliografa:
drgutierrez. (2008). monografias. Obtenido de http://www.monografias.com/trabajos17/datawarehouse/data-warehouse.shtml Roberto, E. (febrero de 2010). Data PRIX. Obtenido de http://www.dataprix.com/blogs/respinosamilla/herramientas-etl-que-son-para-quevalen-productos-mas-conocidos-etl-s-open-sour Silberschatz, A., Korth, H., & Sudarshan, S. (2002). Fundamentos de Base de Datos. Madrid: McGRAW-HILL/INTERAMERICANA DE ESPAA. tracer. (04 de 2006). Mundo SAP. Obtenido de http://www.mundosap.com/foro/showthread.php?t=424

You might also like