Professional Documents
Culture Documents
CONCEPTOS
DATAWAREHOUSE
Almacn de datos Bill Imon
Integracin y/o dep. de inf. De uno o mas fuentes. Anlisis desde mltiples perspectivas. Caractersticas: -Integrado -Temtico -Histrico -No voltil
APORTACIONES DE UN DATAWAREHOUSE
-Herramientas para la toma de decisiones. -Aplicacin de tcnicas estadsticas (relaciones ocultas de datos). -Aprender de datos pasados. -Permite la implantacin de sistemas de Gestin integral. -Supone una automatizacin tecnolgica y econmica.
DATAMART
Almacn de datos de una rea de datos especifica. Informacin a detalle desde todas las perspectivas que afecten a los procesos de negocio.
OLAP - ONLINE ANALYTICAL Orientado al procesamiento analtico. Lectura de grandes cantidades de datos para llegar a extraer algn tipo de informacin til. Presenta informacin a detalle, se alimentan de informacin de los sistemas transaccionales a travs del proceso de ETL.
DATA MINING
Conjunto de tcnicas y metodologas que permiten explorar las grandes Base de Datos para encontrar reglas patrones comportamiento de datos.
PROCESO DE DATAMINING
-Determinacin de objetivos. -Pre - procesamiento de datos. -Determinacin del modelo. Seleccin de variables Extraccin de conocimiento -Anlisis de resultados
BUSINESS INTELLIGENCE
DATOS INFORMACION
TOMA DE DECISIONES
CONOCIMIENTO
B.I. - TECNOLOGIAS
Reporte empresarial Anlisis de cubos Consultas AD HOC DATA MINING y anlisis estadsticos Envio pro activo de datos-
MOLAP
Datos fuentes como datos agregados o pre calculados residen en el mismo formato multidimensional. Utiliza una arquitectura de dos niveles. -B.D. multidimensional -Motor analtico Mejora el tiempo de respuesta.
ROLAP
Los datos pre calculados y agregados como los datos fuentes residen en la misma base de datos relacional. Tres niveles: -Base de datos relacional -Motor ROLAP -Nivel de Aplicacin.
HOLAP
Los datos agregados y pre calculados se almacenan en estructuras multidimensionales y los de menor detalle en el relacional. -Para cubos que requieren rpida respuesta. -Sumarizaciones basada en una gran cantidad de datos.
PROCESO ETL
EXTRACCION Extraer datos relevantes desde diferentes fuentes OLTP. Los sistemas orgenes pueden usar una organizacin diferente de datos o formatos.
TRANSFORMACION Convierte datos inconsistentes en datos compatibles y congruentes para ser cargados en el datawarehouse. Ejemplo: -Traducir cdigos.
H M origen 1 2 destino
CARGA Cargar el DW con: -Datos transformados que residen en tablas temporales. -Datos OLTP que tienen correspondencia directa. Formas: Carga inicial (Initial load) Incremental load. Full load
CONSULTAS
Obtener indicadores desde una tabla de hechos, restringidas por las propiedades o condiciones de los atributos. DRILL DOWN DRILL UP SEGURIDAD -De acceso -De informacin
DIMENSION Define la organizacin lgica de los datos Una dimensin tiene atributos.
MEDIDAS - HECHOS Datos numricos de inters primario para los usuarios de un cubo. Indicadores Sumarizados: -Representan los valores que son analizados. Ejemplo: Cantidad de pacientes con tal enfermedad. Llamadas efectuadas.
JERARQUIAS
Una jerarqua representa una relacin lgica entre dos o mas atributos, si poseen una relacin padre hijo. Ejemplo: Jerarqua --- Tiempo
*AO *MES
*AO *TRIMESTRE *MES
GRANULARIDAD Nivel de detalle de la informacin. METRICAS Medicin matemtica de una variable de negocio. CUBO Estructura para almacenar informacin permite realizar analisis multidimensional. que
Algoritmo
Modelo
Conjunto de datos
Encuentra