Professional Documents
Culture Documents
Organizacin
Objetivo
Agenda
1. Caracterizacin necesidades de integracin.
2. Tecnologas disponibles para hacer integracin.
3. Conclusiones.
Caracterizacin necesidades de
integracin
La mayora de las organizaciones poseen un alto
nmero de aplicaciones de misin crtica de las cuales
dependen para su normal funcionamiento.
Esas aplicaciones estn, generalmente, lgicamente
interconectadas.
Mantienen datos vigentes (poca o ninguna historia) y
estn optimizadas para una funcin especfica.
Informacin fragmentada en diferentes repositorios.
Caracterizacin necesidades de
integracin
Aplicaciones soportan consultas locales de tipo
operativo. Ejemplo: Cuntas rdenes pendientes
tenemos en este momento?.
En algunas situaciones se requiere integracin
dinmica de
datos operacionales vigentes de
diferentes fuentes. Ejemplo: Cual es el saldo total de
todos los productos de un cliente?.
Informacin mas estratgica requiere integrar datos
histricos de diferentes fuentes. Ejemplo: Predecir
comportamiento y valor futuro de un cliente.
Caracterizacin necesidades de
integracin
En la era del comercio electrnico, el enfoque CRM
requiere:
Visin completa y actualizada de los datos de todas las
interacciones del cliente, tanto presentes como pasadas.
Convertir datos en inteligencia del cliente.
Compartir hallazgos con todos los niveles de la organizacin.
federados
(EII:
Herramientas de Integracin
Funcional (EAI)
Comunicacin Punto a Punto.
Solucin con mediador:
Herramientas de Integracin
Funcional : Comunicacin Punto a
Punto
Aplicacin B
Aplicacin C
Aplicacin D
Herramientas de Integracin
Funcional: Mediador
Mediador EAI
OLTP
Aplicacin A
OLT
P
Cola de
Mensajes
OLTP
Adaptador
A
Cola de
Mensajes
OLTP
Adaptador
B
Cola de
Mensajes
OLTP
Base de Datos A
Cola de
Mensajes
OLTP
Aplicacin B
OLT
P
OLTP
Base de Datos B
<Mensaj
e XML >
Enrutador <Mensaj
e XML >
E.T.L.
Generador
Cubos
visualizadorOLAP
Herramienta Extraccin
Transformacin Cargue
Bodega de Datos
Cubos
Multidimensionales
Indicadores
Minera
ALMACEN
IdAlmacen
Nombre
Direccion
Ciudad
Region
Dimensin
PRODUCTO
IdProducto
Nombre
Subcategoria
Categoria
...
Tabla de
Hechos
VENTAS
IdAlmacen
IdProducto
IdFecha
Cantidad
PesosVendidos
Costo
...
Dimensin
TIEMPO
IdFecha
Fecha
DiaSemana
Mes
Trimestre
...
Geografa
VENTAS
Producto
ETL Convencional
OLTP
Aplicacin A
Deteccin
de cambios
/ Snapshot
Batch
Batch
DataMart
A
Batch
DataMart
B
OLTP
Base de Datos A
OLTP
Aplicacin B
Deteccin
de cambios
/ Snapshot
OLTP
Base de Datos B
Batch
Manejo
Dimension
es
Corporativ
as
Aproximadamente
Tiempo Real
Particin
En
Tiempo Real
A
Batch
Aproximadamente
Tiempo Real
Particin
En
Tiempo Real
B
Batch
DataMart
A
DataMart
B
Microbatch ETL
Similar al ETL convencional, solo que la frecuencia
aumenta (Ejemplo: Cada hora).
Alimentan la particin en tiempo real.
Una vez al da, las particiones en tiempo real se pasan
a la parte histrica.
OLTP
Aplicacin B
Deteccin
de cambios
/ Snapshot
Deteccin
de cambios
/ Snapshot
OLTP
Base de Datos B
Micro
Micro
Batch
Batch
Micro
Batch
Manejo
Dimension
es
Corporativ
as
Particin
En
Tiempo Real
A
Batch
Micro
Batch
DataMart
A
Particin
En
Tiempo Real
B
Batch
DataMart
B
Microbatch ETL
Puede afectar rendimiento de sistemas fuente, al
imponer deteccin de cambios mas frecuente.
Buena alternativa para Bodegas cuyos requerimientos
de actualizacin pueden tolerar retardos de una hora.
Herramientas de Captura,
Transformacin y Flujo (CTF)
Intercambios directos entre Bases de Datos, con baja
latencia (pocos segundos).
Pueden hacer ciertas transformaciones, elementales si
se comparan con las ofrecidas por herramientas ETL.
Pueden simplificar la retroalimentacin de la Bodega
hacia los sistemas fuente (con inteligencia de clientes,
por ejemplo).
Herramientas de Captura,
Transformacin y Flujo (CTF)
Bodega
Lgica
CTF Tiempo Real/
Transformacin
Superficial
OLTP
Aplicacin A
Staging
A
Transformacion
es ms
complejas
Particin
Tiempo
Real
Data Mart
A
Batc
h
OLT
P
OLTP
Base de Datos A
ERP
Adaptador
ERP
Mediador EAI
Adaptador
Data Mart
A
Aproximadame
nte Tiempo
Real
Particin
En
Tiempo Real
A
OLTP
Enrutador
Base de Datos
ERP
CRM
Adaptador
CRM
Adaptador
Administrador
Dimensin
Cliente
OLTP
Base de Datos
CRM
Batc
h
Administrador
Dimensin
Cliente
Adaptado de (1) Pgina 443
Adaptador
Data Mart
B
Aproximadame
nte Tiempo
Real
DataMart
A
Particin
En
Tiempo Real
B
Batc
h
DataMart
B
Cliente
Cliente
...
Cliente
EII
Metadata
Procesador
Procesador
de
de
Consultas
Consultas
Adaptadores
Adaptadores
Fuente 1
Fuente 2
Adaptadores
...
Fuente n
Conclusiones
Globalizacin e Internet reducen cada vez mas la ventana de
tiempo disponible para actualizar las Bodegas de Datos.
Inteligencia de negocios requiere una latencia cada vez menor
entre los sistemas OLTP y la Bodega.
Informacin de inteligencia de la Bodega retroalimenta los
sistemas OLTP.
El costo y complejidad de las soluciones para reducir la latencia
crece de manera no lineal.
Metas y expectativas sobre el grado de actualizacin requerido de
los datos deben ser realistas.
Conclusiones
Bodegas de Datos en Tiempo Real pueden ser una
solucin para latencias de hasta unos minutos (5?).
Latencias inferiores a 5 minutos requieren de Sistemas
Federados (EII), que trabajen directamente sobre los
sistemas fuente.
Si se requiere retroalimentacin de la Bodega hacia los
OLTP, CTF o EAI pueden ser la solucin.
EAI es mas adecuado si el nmero de aplicaciones a
integrar es importante.
Bibliografa
1. Kimball, R., Caserta, J. The Data Warehouse ETL
Toolkit. Wiley. 2004.
2. Stonebraker, M. Too Much Middleware. SIGMOD
Record. Vol 31 N 1, Marzo 2002.
3. Halevy, A.(Editor). Enterprise Information Integration:
Successes, Challenges and Controversies. SIGMOD
junio 14-16 2005.
4. Selip, S. A Single Source of Truth: Creating and
Sustaining Data-Integration Governance and
Stewardship. Burton Group. Jul 27, 2005.