1. UNIDAD1: INTRODUCCIN A LA INTELIGENCIA DE NEGOCIOS.
1.1 Tipos de sistemas de informacin. 1.1.1 Sistemas OLTP. 1.1.2 Sistemas OLAP. 1.2 Inteligencia de Negocios. 1.2.1 Definicin. 1.2.2 Importancia. 1.2.3 Componentes de la inteligencia de negocios. 1.2.3.1 Aplicaciones Analticas. 1.2.3.2 Sistemas de reportes. 1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse. 1.2.3.4 Data Mining. 1.2.3.5 Administracin del Conocimiento. 1.3 Principales herramientas de la Inteligencia de Negocios.
Captulo 1. Unidad1: Introduccin a la Inteligencia de Negocios. Competencia especfica a desarrollar Identificar los conceptos bsicos, herramientas y componentes de la inteligencia de negocios. La Inteligencia de Negocios (Business Intelligence) se ha visto marcada por una clara evolucin que lo destaca como un mercado maduro en los ltimos aos. La inteligencia de negocios es la habilidad para transformar los datos en informacin, y la informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de decisiones en los negocios. Se ha producido un fortalecimiento mediante la compra de empresas pequeas por parte de los principales agentes del mercado (SAP, IBM, Microsoft). Se ha enriquecido con soluciones open source que cubren la gama de necesidades de una organizacin para la explotacin de la informacin. Han aparecido nuevas empresas enfocadas en la innovacin cubriendo nuevos nichos en el mercado de la inteligencia de negocio como la visualizacin, y el anlisis predictivo.
1.1TIPOS DE SISTEMAS DE INFORMACIN. La introduccin de los sistemas de informacin (SI), en las empresas a contribuido al proceso de toma de decisiones, facilitan el logro de ventajas competitivas y automatizan los procesos operativos de las empresas. Para poder entender que es un sistema de informacin, primeramente se definen algunos conceptos relacionados al tema como son: Sistema: Conjunto de elementos que interactan para realizar un conjunto de funciones especficas. Datos: Representacin formal de hechos, conceptos o instrucciones adecuada para su comunicacin, interpretacin y procesamiento por seres humanos o medios automticos. Informacin: El significado que un ser humano le asigna a los datos. Existen varios tipos de Sistemas de Informacin, desde el punto de vista administrativo stos se pueden clasificar como se muestra en la siguiente imagen.
Nivel operativo Apoyan a los gerentes operativos en el seguimiento de las actividades y transacciones elementales de la organizacin como ventas, ingresos, depsitos en efectivo, nomina, decisiones de crdito y flujo de materiales en una fbrica. Ejemplo: Un sistema para registrar los depsitos realizados en un cajero automtico o uno que lleve el registro del nmero de horas trabajadas cada da por los empleados de una fbrica. Sistema de Procesamiento de Transacciones (TPS) Recolectan, almacenan, modifican y recuperan la informacin generada por las transacciones producidas en una organizacin. Si durante una transaccin se produce un error, el TPS debe ser capaz de deshacer las operaciones realizadas hasta ese momento. Es muy til para el procesamiento de transacciones on-line. Nivel de conocimiento Se utilizan para el mejoramiento de la calidad de los servicios de la organizacin y aporte de nuevos conocimientos, adems de incrementar la productividad de los usuarios del sistema. Sistemas de Conocimiento (KWS) (Knowledgeworksystem) (Sistemas del trabajo del conocimiento) Auxilian a los trabajadores en la creacin e integracin de nuevo conocimiento en la organizacin. Estn diseados para aumentar la productividad de los trabajadores. Ejemplo: aplicaciones como Photoshop con la que diseadores pueden crear arte publicitario.
Sistemas de Automatizacin de Oficina (OAS) Aplicaciones destinadas a ayudar al trabajo diario del administrativo de una organizacin, forman parte de este tipo de software los procesadores de textos, las hojas de clculo, los editores de presentaciones, los clientes de correo electrnico, etc. Ejemplo: Microsoft Office. Nivel administrativo Son utilizados por los administradores de nivel medio en la toma de decisiones. Tratan y comparan resultados notables para la compaa, y estudian sus trayectorias. Sistemas de Informacin Gerencial (MIS) Son el resultado de interaccin participativa entre personas, tecnologas y procedimientos. Apoyan a nivel administrativo entregando informacin til para el planteamiento, control y toma de decisiones. Ejemplo: sistema que rena informacin de sistemas de informacin de nivel productivo sobre los productos (pedidos, costos y gastos) y genere reportes para la toma de decisiones. La mayora de los informes para control administrativo estn basados en resmenes de las transacciones. Sistemas de Apoyo a la Toma de Decisiones (DSS) Herramienta para realizar el anlisis de las diferentes variables de un negocio con la finalidad de apoyar el proceso de toma de decisiones. Su principal caracterstica es la capacidad de anlisis multidimensional (OLAP)(Procesamiento Analtico en Lnea) que permite profundizar en la informacin hasta llegar a un alto nivel de detalle, analizar datos desde diferentes perspectivas, realizar proyecciones de informacin para pronosticar lo que puede ocurrir en el futuro, anlisis de tendencias, anlisis prospectivo, etc. Ejemplo: el sistema implantado por la New York State Office of General Services que permite que los ejecutivos verifiquen el estado por programa, comparando presupuestos y gastos y mostrando el gasto estimado hasta el final del ao fiscal. Nivel estratgico Estn basados en los resultados estratgicos a largo plazo de la compaa, son tiles para poder hacer frente a los impactos producidos por cambios en los negocios. Sistemas de Soporte Gerencial (SSG) Trabajan con informacin interna y externa a la organizacin y estn diseados para abordar la toma de decisiones que requieren juicio, evaluacin y comprensin. Ejemplo: un ejecutivo puede utilizar el sistema para conocer las ventas por pas, lnea de producto y, adems, obtener el crecimiento esperado del segmento para los prximos 5 aos en bases de datos externos. Sistemas Expertos (SE) Es una aplicacin informtica capaz de solucionar un conjunto de problemas que exigen un gran conocimiento sobre un determinado tema. Imitan el comportamiento de un experto en un dominio concreto y en ocasiones son usados por stos. Con los sistemas expertos se busca una mejor calidad y rapidez en las respuestas dando as lugar a una mejora de la productividad del experto. Ejemplo: un sistema MRP (ManufacturingResourePlanning; Fabricacin y Planificacin de Recursos) diseado para reducir el desperdicio en el proceso productivo. Los Sistemas de Planificacin de Recursos Empresariales (ERP) Los ERP son sistemas que integran y manejan todo lo asociado con las operaciones de produccin y aspectos de distribucin y que son necesarios para el funcionamiento de los procesos de negocio de una organizacin, es decir, permiten la disponibilidad de toda la informacin para todo el mundo todo el tiempo. Son tambin llamados back office ya que no se involucra directamente a clientes y pblico general. 1.1.1 Sistemas OLTP
OLTP es la sigla en ingls de Procesamiento de Transacciones En Lnea (OnLineTransactionProcessing) es un tipo de procesamiento que facilita y administra aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y procesamiento de transacciones (gestor transaccional). Los Sistemas de tipo OLTP lo conforman todos los sistemas de informacin que ejecutan datos operacionales del da a da y aumentar la capacidad de procesamiento de transacciones. Estos sistemas realizan principalmente 3 tipos de acciones sobre una Base de Datos, las cuales son: INSERT, DELETE y UPDATE que se manejan a nivel de transacciones Entre algunos ejemplos de sistemas OLTP de tienen los siguientes:
SAP Business One de la compaa SAP SAP R3 de la compaa SAP E-Business Suite de la compaa Oracle JD Edwards Enterprise One de la compaa Oracle PeopleSoft ERP de la compaa Oracle ERP O7/Solution
Estos tipos de sistema consisten principalmente de transacciones de tipo DML (Data ManipulationLanguage(Lenguaje de Manipulacin de Datos), sentencias de tipo insert, update o delete para el manejo de datos) dentro de la Base de Datos.
En la imagen de abajo se puede observar el flujo principal dentro de un sistema OLTP
Algunas de las caractersticas ms comunes de este tipo de transacciones podran ser: Altas/Bajas/Modificaciones Consultas rpidas, escuetas y predecibles Poco volumen de informacin e informacin disgregada Transacciones rpidas Gran nivel de concurrencia Modo de actualizacin on-line Baja redundancia de datos
Algunos ejemplos de este tipo de aplicaciones son: Compras Ventas Inventario Sueldos La tecnologa OLTP se utiliza en innumerables aplicaciones, como en banca electrnica, procesamiento de pedidos, comercio electrnico, supermercados o industria. Requisitos. El proceso de transacciones en lnea cada vez necesita ms recursos para las transacciones que se transmiten por una red y que pueden integrar a ms de una empresa. Por esta razn, el software actual para sistemas OLTP utiliza procesamiento cliente- servidor y software de intermediacin (middleware) que permite a las transacciones correr en diferentes plataformas en una red. Middleware: Es un software que asiste a una aplicacin para interactuar o comunicarse con otras aplicaciones, software, redes, hardware y/o sistemas operativos. En grandes aplicaciones, la eficiencia del OLTP puede depender de lo perfeccionado que sea el software de gestin de transacciones (como CICS en plataformas IBM) o de que tcticas de optimizacin se utilizan para facilitar la gran cantidad de actualizaciones concurrentes que se pueden producir en una base de datos orientada a OLTP. En los sistemas de bases de datos descentralizados ms exigentes, los programas de intermediacin OLTP distribuyen el procesamiento de transacciones entre varios ordenadores en una red. A menudo OLTP se integra en una arquitectura orientada a servicios o en un servicio Web. El OLTP emplea una estrategia de consignacin o recuperacin para asegurar que cada transaccin sea procesada de manera correcta. Esta estrategia es esencial, porque las transacciones requieren una secuencia de pasos, y cada paso debe de llevarse a cabo de manera correcta para que se concluya la transaccin. Funcin de la Consignacin o Recuperacin Se explica por medio del siguiente ejemplo: Si una persona retira efectivo de un cajero automtico, la computadora del banco verifica que su cuenta contenga fondos suficientes antes de deducir el retiro de su cuenta y permitir que el cajero entregue el efectivo. Sin embargo, si el cajero no tiene efectivo, la transaccin no procede, y el retiro no se deduce de su cuenta. Un TPS (sistema de procesamiento de transacciones) manda (consigna) una transaccin y actualiza de manera permanente los registros de una base de datos solo si cada paso de la transaccin se procesa de manera satisfactoria. Si falla un paso, fracasa toda la transaccin y una recuperacin devuelve los registros a su estado original. En la siguiente imagen se muestran los procesos que ocurren en un TPS
Un sistema de procesamiento de transacciones (TPS) se caracteriza por su capacidad para: Recopilar, exhibir y modificar transacciones. Guardar transacciones. Enlistar transacciones. Limitaciones de un TPS Su capacidad para generar informes es limitada. Solo genera informes de detalles que ofrecen solo un registro bsico de las transacciones concluidas.
1.1.2 Sistemas OLAP OLAP es la sigla en ingls de Procesamiento Analtico en Lnea (On-Line AnalyticalProcess). Son aplicaciones que se encargan de analizar datos del negocio para generar informacin tctica y estratgica que sirve de soporte para la toma de decisiones. Mientras que las transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP logra su mxima eficiencia y flexibilidad operando sobre Bases de datos Multidimensionales. Podemos nombrar las siguientes caractersticas como las ms sobresalientes de estas aplicaciones: Estructura de datos transparente al usuario. Solo Consulta, trabajan sobre la informacin operacional generada por los sistemas OLTP. Consultas sobre grandes volmenes de datos no predecibles. Informacin histrica. Modo de actualizacin Batch. Alta redundancia de datos para facilitar la generacin de consultas y obtener buenos tiempos de respuesta. Poderoso Back-end analtico para mltiples aplicaciones de usuarios. Trabaja con resmenes de miles de registros condensados en una sola respuesta.
Su objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos (un data warehouse, por ejemplo). Estos tipos de sistemas analticos buscan facilitar la creatividad, centrndose en la estrategia a largo plazo y la ventaja competitiva dentro del negocio de una empresa.
Diferencias entre sistemas OLTP y OLAP
Sistemas OLTP Sistemas OLAP Datos Valores actuales Datos histricos y/o calculados Organizacin Por aplicacin Por reas de la empresa Acceso Muy frecuente (lectura/escritura) Baja frecuencia Actualizaciones Actualizaciones de campo No se actualiza se manipula Tiempo de respuesta Medido por el tiempo de la transaccin (del orden de segundos) Medido por el tiempo de la consulta (del orden de minutos) Tamao de la BD 100 MB GB 100 GB TB Usuarios Miles Cientos Unidad de Trabajo Transacciones Consultas complejas
Ventajas de OLAP Es un poderoso paradigma de visualizacin. Proporciona tiempos de respuesta rpidos. Permite realizar consultas de manera interactiva. Es bueno para analizar grupos de datos organizados por series de tiempo. Permite identificar semejanzas y diferencias en la data. Permite realizar Pivot. Permite realizar Slice&Dice. Permite realizar Drill&Down.
1.2 INTELIGENCIA DE NEGOCIOS
1.2.1 Definicin Se entiende por inteligencia de negocios (Business Intelligence) al conjunto de metodologas, aplicaciones, prcticas y capacidades enfocadas a la creacin y administracin de informacin que permite tomar mejores decisiones a los usuarios de una organizacin.
Algunas de las tecnologas que forman parte de la inteligencia de negocios son: Data warehouse:Es una coleccin de datos que es extrada desde diferentes fuentes de informacin a lo largo de la empresa Reporting:Herramientas para la elaboracin de informes y listados, tanto en detalle como sobre informacin agregada Anlisis OLAP (On-Line AnalyticalProcessing):Herramientas que manejan cuestiones complejas de bases de datos relacionales, proporcionando un acceso multidimensional a los datos Anlisis visual: Permite comunicar complejos datos de negocios de forma rpida e intuitiva. Anlisis predictivo:Es el proceso de seleccionar, explorar, y modelar grandes volmenes de datos que develen informacin previamente desconocida para beneficio del negocio. Cuadro de mando: Es un conjunto de indicadores que aportan informacin sumarizada e inteligente al usuario. Cuadro de mando integral: Es un instrumento o metodologa de gestin que facilita la implantacin de la estrategia de la empresa de una forma eficiente Minera de datos:Es una tcnica orientada a extraer informacin desde grandes volmenes de datos. Gestin del rendimiento: Describe la metodologa, las mtricas, los procesos y sistemas empleados para supervisar y gestionar el rendimiento de una compaa
Reglas de negocio: Son un componente clave en cmo se toman las decisiones en una empresa. Dashboards: Son resmenes visuales de informacin del negocio, que muestran de una mirada la comprensin del global de las condiciones del negocio mediante mtricas eIndicadores Clave de Desempeo (KPIs). Integracin de datos (que incluye ETL,Extraccion, Transformacion y Carga):Permiten operar con fuentes de datos de cualquier tipo (integrando los datos en una base de datos nica (Datamart, Datawarehouse, etc.). 1.2.2 Importancia Un sistema de inteligencia de negocios es de gran importancia para las empresas en la actualidad ya que con su implantacin proporciona diversos beneficios entre los que podemos destacar: Crear un circulo integro de la informacin, esto se lograra con la transformacin de los datos en informacin y esta genera un conocimiento que le permite a la empresa tomar mejores decisiones que se traducen en mejores resultados y que generan nuevos datos. Permitir una visin nica, conformada, histrica, persistente y de calidad de toda la informacin. Crear, manejar y mantener mtricas, indicadores claves de rendimiento (KPI, Key Performance Indicador) e indicadores claves de metas (KGI, Key GoalIndicator) fundamentales para la empresa. Aportar informacin actualizada tanto a nivel agregado como en detalle. Reducir las diferencias de enfoque de negocio entre el departamento de TI y la organizacin. Mejorar la comprensin y documentacin de los sistemas de informacin en el contexto de una organizacin. Mejora de la competitividad de la organizacin como resultado de ser capaces de: Diferenciar lo relevante sobre lo innecesario. Acceder ms rpido a la informacin. Tener mayor agilidad en la toma de decisiones. Los beneficios de la inteligencia de negocios pueden clasificarse en tres categoras principales, las cuales son: Reduccin de costos. Incremento de ingresos. Mejoramiento de la satisfaccin de los clientes. Y esta lista no es exhaustiva ni detallada, pues los usuarios continan encontrando formas nuevas de implementar inteligencia de negocios
1.2.3 Componentes de la Inteligencia de Negocios.
Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:
Multidimensionalidad: La informacin multidimensional se puede encontrar en hojas de clculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir informacin dispersa en toda la empresa e incluso en diferentes fuentes para as proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la informacin. Por ejemplo, un pronstico de ventas de un nuevo producto en varias regiones no est completo si no se toma en cuenta tambin el comportamiento histrico de las ventas de cada regin y la forma en que la introduccin de nuevos productos se ha desarrollado en cada regin en cuestin.
Data Mining (minera de datos): Las empresas suelen generar grandes cantidades de informacin sobre sus procesos productivos, desempeo operacional, mercados y clientes. Pero el xito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no slo para extraer informacin, sino tambin para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no muy evidentes.
Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a un nivel muy bsico sin necesidad de intervencin humana. Por ejemplo: un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.
Data Warehouse (almacn de datos): Es la respuesta de la tecnologa de informacin a la descentralizacin en la toma de decisiones. Coloca informacin de todas las reas funcionales de la organizacin en manos de quien toma las decisiones. Tambin proporciona herramientas para bsqueda y anlisis.
1.2.3.1 Aplicaciones Analticas. Data Mining, herramientas para minera de datos. OLAP, herramientas de procesamiento analtico de datos.
Herramientas de consulta y reporte de datos.
Herramientas de produccin de reportes personalizados. ELT, herramientas de extraccin, traduccin y carga de datos.
Herramientas de administracin de sistemas.
Portales de informacin empresarial.
Sistemas de base de datos.
Sistemas de administracin del conocimiento.
Simulacin y prediccin. Son aplicaciones para simular escenarios y predecir tendencias en el futuro. Si el precio de la materia prima crece un 5% a lo largo del ao y en tres meses el dlar sube 10%, cmo afecta a nuestra venta al final del ao? Si invertimos 10% ms en esta lnea de productos, cmo cambia nuestra productividad y ROI?
Activity-BasedCosting (actividad basada en costos). La determinacin de los costes basados en actividades descubre los costes reales de los productos, servicios o clientes ms all de la contabilidad tradicional y desvela que por ejemplo dos clientes aparentemente igual de rentables segn sus compras, en realidad causan costes muy diferentes, o que 25% de la actividad de la empresa causa80% de los costes.
Minera de Datos. Sistemas basados en algoritmos matemticos para descubrir tendencias escondidas entre grandes volmenes de datos. Aplicada desde la deteccin de fraude hasta el anlisis de cesta de compra.
BalancedScorecard/Cuadro de Mando Integral. Un concepto de gestin de la estratgica empresarial desarrollado por Norton y Kaplan. Permite ver la empresa no slo bajo la perspectiva financiera, sino tambin bajo otras como clientes, procesos o potenciales. Los objetivos estratgicos de las empresas se definen y su alcance se mide constantemente con datos reales.
Gestin de riesgo. Especialmente las entidades financieras y las aseguradoras, pero tambin otras empresas, necesitan calcular riesgos y simular escenarios. Las aplicaciones BI proporcionan todo el proceso.
Alertas y vigilancia. Ya no es necesario leer cada maana muchas pginas de informes o mirar cada hora una pantalla para detectar si existe una situacin crtica en algn lugar de la empresa. Se pueden vigilar automticamente los indicadores de la actividad empresarial y generar avisos por email o SMS si un indicador est fuera de su rango normal, a cualquier ritmo y hora del da.
Fidelizacin de Clientes. Las aplicaciones ayudan a identificar que son los mejores o ms rentables clientes y porque clientes abandonan la empresa. Proporcionan los datos para campaas y evalan las respuestas y el impacto.
Consolidacin. Automatizacin de consolidaciones contables entre empresas de un mismo grupo oentre sucursales. Tambin se aplican en fusiones de empresas y adquisiciones.
1.2.3.2 Sistemas de Reportes.
Consultas y reportes
Se usa con propsito analtico Manipular los datos Realiza un pedido de datos Realiza la carga de los datos Darle formato a los datos Presentar los datos
QueryTool (herramienta de consultas): Un tipo especfico de herramientas de acceso a datos por usuarios finales que invita al usuario a formas sus propias consultas manipulando directamente las tablas relacionales y sus uniones. Se disean Reportes de todo tipo incluyendo grficos y parmetros de ingreso dejndolos en una librera para ser accedidos, mediante permisos, por los usuarios que correspondan.
1.2.3.3 Base de Datos Multidimensionales y Data Warehouse.
Base de datos multidimensionales Modelos Multidimensionales Tcnica de diseo lgico para diseo de Data Warehouses. Proporcionan los mejores resultados. Diseos de acuerdo a un estndar que es intuitivo y fcil de entender. Permite accesos de alto rendimiento. Formado por una tabla cuya clave es compuesta, TableFact (tabla de hechos) y un conjunto de tablas ms pequeas denominadas Tablas de Dimensin. Su apariencia hace que se les denomine diagramas STAR.
Data Warehouse Un Data Warehouse (DW) o almacn de datos es una coleccin de datos que es extrada desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones. Un sistema de DW apunta a disponer de una visin nica de los clientes y proveer la mayor cantidad posible de informacin a los usuarios de la empresa, facilitndose el monitoreo del negocio. Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que estn orientados a temas, diferencindose as de los sistemas transaccionales que estructuran los datos en procesos funcionales. Por otro lado, se trata de datos integrados, es decir, estn consolidados, lo cual supone un proceso previo de depuracin y homogeneizacin, etapa que puede ser una de las ms complejas al implementar un DW. Por ltimo, los datos son historiados, ya que mantienen el registro histrico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean voltiles.
1.2.3.4 Data Mining (minera de datos).
Las tcnicas de Data Mining son el resultado de un largo proceso de investigacin y desarrollo de productos. Esta evolucin comenz cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continu con mejoras en el acceso a los datos, y ms recientemente con tecnologas generadas para permitir a los usuarios navegar a travs de los datos en tiempo real. Data Mining toma este proceso de evolucin ms all del acceso y navegacin retrospectiva de los datos, hacia la entrega de informacin prospectiva y proactiva. Data Mining est lista para su aplicacin en la comunidad de negocios porque est soportado por tres tecnologas que ya estn suficientemente maduras:
Recoleccin masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.
Principales caractersticas y objetivos de la Minera de Datos
Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen informacin almacenada durante varios aos. En algunos casos, los datos se consolidan en un almacn de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet. El entorno de la minera de datos suele tener una arquitectura cliente servidor. Las herramientas de la minera de datos ayudan a extraer el mineral de la informacin enterrado en archivos corporativos o en registros pblicos, archivados. El minero es, muchas veces un usuario final con poca o ninguna habilidad de programacin, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas ad-hoc y obtener rpidamente respuestas. Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados. Las herramientas de la minera de datos se combinan fcilmente y pueden analizarse y procesarse rpidamente. Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minera de datos.
La minera de datos produce cinco tipos de informacin: Asociaciones. Secuencias. Clasicaciones. Agrupamientos. Pronsticos. Los mineros de datos usan varias herramientas y tcnicas.
1.2.3.5 Administracin del Conocimiento.
De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algn significado especial pasan a convertirse en informacin. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretacin de la informacin y ese modelo representen un valor agregado, entonces nos referimos al conocimiento.
El objetivo fundamental del KDD es encontrar conocimiento til, vlido, relevante y nuevo sobre un fenmeno o actividad mediante algoritmos ecientes, dadas las crecientes rdenes de magnitud en los datos. Al mismo tiempo hay un profundo inters por presentar los resultados de manera visual o al menos de manera que su interpretacin sea muy clara. Otro aspecto es que la interaccin humano-mquina deber ser exible, dinmica y colaboradora. El resultado de la exploracin deber ser interesante y su calidad no debe ser afectada por mayores volmenes de datos o por ruido en los datos. En este sentido, los algoritmos de descubrimiento de informacin deben ser altamente robustos.
En la siguiente gura se ilustra la jerarqua que existe en una base de datos entre datos, informacin y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarqua. El rea interna dentro del tringulo representa los objetivos que se han propuesto. La separacin del tringulo representa la estrecha unin entre dato e informacin, no as entre la informacin y el conocimiento.
Jerarqua del Conocimiento.
1.3 PRINCIPALES HERRAMIENTAS DE LA INTELIGENCIA DE NEGOCIOS. Herramientas Esenciales Una solucin de BI incluye la implementacin de una serie de herramientas y tcnicas orientadas a gestionar, explotar, distribuir y estructurar informacin. Entre ellas, destacan las siguientes: Query&Report Las herramientas de Query (consulta) y Report (reporte) son quiz las ms conocidas en este mbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la informacin presente en los almacenes de datos y Data Marts. Data Warehouse Un Data Warehouse (DW) o almacn de datos es una coleccin de datos que es extrada desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones. Data Mart Aunque para algunos se trata casi de un sinnimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un rea especfica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacn de datos ms restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organizacin. Herramientas OLAP OLAP (On Line AnalyticalProcessing) son un conjunto de herramientas capaces de responder rpida y gilmente a las solicitudes de informacin de los usuarios y que deben reflejar cualquier lgica de negocio por las que se consulte. En contraste con los sistemas transaccionales, OLTP (On Line TransactionProcessing), las herramientas OLAP presentan informacin multidimensional, es decir, desde mltiples perspectivas. Del mismo modo, los sistemas analticos, al igual que los datos del Data Warehouse, estn orientados a temas, y no slo operan con datos actuales, sino tambin con datos histricos. Una de las principales cualidades de las herramientas de OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, as como tambin permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar informacin, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar. Data Mining El Data Mining (DM) o minera de datos es una tcnica orientada a extraer informacin desde grandes volmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (KnowledgeDiscovery in Databases; Descubrimiento de Conocimiento en Bases de Datos) que consta de tres fases: preparacin de los datos, extraccin de informacin e interpretacin de los resultados. Normalmente, el DM se realiza con las llamadas tcnicas de verificacin -en donde se prueba una hiptesis del usuario- y los mtodos de descubrimiento -bsqueda de patrones (incluyendo las tcnicas de prediccin)-. Lo anterior se traduce en anlisis exploratorios, los cuales se apoyan en herramientas de visualizacin de datos y construccin de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con informacin del pasado.