You are on page 1of 18

NDICE GENERAL

1. UNIDAD1: INTRODUCCIN A LA INTELIGENCIA DE NEGOCIOS.


1.1 Tipos de sistemas de informacin.
1.1.1 Sistemas OLTP.
1.1.2 Sistemas OLAP.
1.2 Inteligencia de Negocios.
1.2.1 Definicin.
1.2.2 Importancia.
1.2.3 Componentes de la inteligencia de negocios.
1.2.3.1 Aplicaciones Analticas.
1.2.3.2 Sistemas de reportes.
1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse.
1.2.3.4 Data Mining.
1.2.3.5 Administracin del Conocimiento.
1.3 Principales herramientas de la Inteligencia de Negocios.














Captulo 1.
Unidad1: Introduccin a la Inteligencia de Negocios.
Competencia especfica a desarrollar
Identificar los conceptos bsicos, herramientas y componentes de la inteligencia de
negocios.
La Inteligencia de Negocios (Business Intelligence) se ha visto marcada por una clara
evolucin que lo destaca como un mercado maduro en los ltimos aos.
La inteligencia de negocios es la habilidad para transformar los datos en informacin, y la
informacin en conocimiento, de forma que se pueda optimizar el proceso de toma de
decisiones en los negocios.
Se ha producido un fortalecimiento mediante la compra de empresas pequeas por
parte de los principales agentes del mercado (SAP, IBM, Microsoft).
Se ha enriquecido con soluciones open source que cubren la gama de necesidades
de una organizacin para la explotacin de la informacin.
Han aparecido nuevas empresas enfocadas en la innovacin cubriendo nuevos
nichos en el mercado de la inteligencia de negocio como la visualizacin, y el anlisis
predictivo.

1.1TIPOS DE SISTEMAS DE INFORMACIN.
La introduccin de los sistemas de informacin (SI), en las empresas a contribuido al
proceso de toma de decisiones, facilitan el logro de ventajas competitivas y automatizan los
procesos operativos de las empresas.
Para poder entender que es un sistema de informacin, primeramente se definen algunos
conceptos relacionados al tema como son:
Sistema: Conjunto de elementos que interactan para realizar un conjunto de
funciones especficas.
Datos: Representacin formal de hechos, conceptos o instrucciones adecuada para
su comunicacin, interpretacin y procesamiento por seres humanos o medios
automticos.
Informacin: El significado que un ser humano le asigna a los datos.
Existen varios tipos de Sistemas de Informacin, desde el punto de vista administrativo
stos se pueden clasificar como se muestra en la siguiente imagen.

Nivel operativo
Apoyan a los gerentes operativos en el seguimiento de las actividades y transacciones
elementales de la organizacin como ventas, ingresos, depsitos en efectivo, nomina,
decisiones de crdito y flujo de materiales en una fbrica.
Ejemplo: Un sistema para registrar los depsitos realizados en un cajero automtico o uno
que lleve el registro del nmero de horas trabajadas cada da por los empleados de una
fbrica.
Sistema de Procesamiento de Transacciones (TPS)
Recolectan, almacenan, modifican y recuperan la informacin generada por las
transacciones producidas en una organizacin. Si durante una transaccin se produce un
error, el TPS debe ser capaz de deshacer las operaciones realizadas hasta ese momento.
Es muy til para el procesamiento de transacciones on-line.
Nivel de conocimiento
Se utilizan para el mejoramiento de la calidad de los servicios de la organizacin y aporte
de nuevos conocimientos, adems de incrementar la productividad de los usuarios del
sistema.
Sistemas de Conocimiento (KWS) (Knowledgeworksystem) (Sistemas del
trabajo del conocimiento)
Auxilian a los trabajadores en la creacin e integracin de nuevo conocimiento en la
organizacin. Estn diseados para aumentar la productividad de los trabajadores.
Ejemplo: aplicaciones como Photoshop con la que diseadores pueden crear arte
publicitario.

Sistemas de Automatizacin de Oficina (OAS)
Aplicaciones destinadas a ayudar al trabajo diario del administrativo de una organizacin,
forman parte de este tipo de software los procesadores de textos, las hojas de clculo, los
editores de presentaciones, los clientes de correo electrnico, etc.
Ejemplo: Microsoft Office.
Nivel administrativo
Son utilizados por los administradores de nivel medio en la toma de decisiones. Tratan y
comparan resultados notables para la compaa, y estudian sus trayectorias.
Sistemas de Informacin Gerencial (MIS)
Son el resultado de interaccin participativa entre personas, tecnologas y procedimientos.
Apoyan a nivel administrativo entregando informacin til para el planteamiento, control y
toma de decisiones.
Ejemplo: sistema que rena informacin de sistemas de informacin de nivel productivo
sobre los productos (pedidos, costos y gastos) y genere reportes para la toma de
decisiones. La mayora de los informes para control administrativo estn basados en
resmenes de las transacciones.
Sistemas de Apoyo a la Toma de Decisiones (DSS)
Herramienta para realizar el anlisis de las diferentes variables de un negocio con la
finalidad de apoyar el proceso de toma de decisiones. Su principal caracterstica es la
capacidad de anlisis multidimensional (OLAP)(Procesamiento Analtico en Lnea) que
permite profundizar en la informacin hasta llegar a un alto nivel de detalle, analizar datos
desde diferentes perspectivas, realizar proyecciones de informacin para pronosticar lo que
puede ocurrir en el futuro, anlisis de tendencias, anlisis prospectivo, etc.
Ejemplo: el sistema implantado por la New York State Office of General Services que
permite que los ejecutivos verifiquen el estado por programa, comparando presupuestos y
gastos y mostrando el gasto estimado hasta el final del ao fiscal.
Nivel estratgico
Estn basados en los resultados estratgicos a largo plazo de la compaa, son tiles para
poder hacer frente a los impactos producidos por cambios en los negocios.
Sistemas de Soporte Gerencial (SSG)
Trabajan con informacin interna y externa a la organizacin y estn diseados para
abordar la toma de decisiones que requieren juicio, evaluacin y comprensin.
Ejemplo: un ejecutivo puede utilizar el sistema para conocer las ventas por pas, lnea de
producto y, adems, obtener el crecimiento esperado del segmento para los prximos 5
aos en bases de datos externos.
Sistemas Expertos (SE)
Es una aplicacin informtica capaz de solucionar un conjunto de problemas que exigen un
gran conocimiento sobre un determinado tema. Imitan el comportamiento de un experto en
un dominio concreto y en ocasiones son usados por stos. Con los sistemas expertos se
busca una mejor calidad y rapidez en las respuestas dando as lugar a una mejora de la
productividad del experto.
Ejemplo: un sistema MRP (ManufacturingResourePlanning; Fabricacin y Planificacin de
Recursos) diseado para reducir el desperdicio en el proceso productivo.
Los Sistemas de Planificacin de Recursos Empresariales (ERP)
Los ERP son sistemas que integran y manejan todo lo asociado con las operaciones de
produccin y aspectos de distribucin y que son necesarios para el funcionamiento de los
procesos de negocio de una organizacin, es decir, permiten la disponibilidad de toda la
informacin para todo el mundo todo el tiempo. Son tambin llamados back office ya que
no se involucra directamente a clientes y pblico general.
1.1.1 Sistemas OLTP

OLTP es la sigla en ingls de Procesamiento de Transacciones En Lnea
(OnLineTransactionProcessing) es un tipo de procesamiento que facilita y administra
aplicaciones transaccionales, usualmente para entrada de datos y recuperacin y
procesamiento de transacciones (gestor transaccional).
Los Sistemas de tipo OLTP lo conforman todos los sistemas de informacin que ejecutan
datos operacionales del da a da y aumentar la capacidad de procesamiento de
transacciones.
Estos sistemas realizan principalmente 3 tipos de acciones sobre una Base de Datos, las
cuales son: INSERT, DELETE y UPDATE que se manejan a nivel de transacciones
Entre algunos ejemplos de sistemas OLTP de tienen los siguientes:

SAP Business One de la compaa SAP
SAP R3 de la compaa SAP
E-Business Suite de la compaa Oracle
JD Edwards Enterprise One de la compaa Oracle
PeopleSoft ERP de la compaa Oracle
ERP O7/Solution

Estos tipos de sistema consisten principalmente de transacciones de tipo DML (Data
ManipulationLanguage(Lenguaje de Manipulacin de Datos), sentencias de tipo insert,
update o delete para el manejo de datos) dentro de la Base de Datos.

En la imagen de abajo se puede observar el flujo principal dentro de un sistema OLTP




Algunas de las caractersticas ms comunes de este tipo de transacciones podran ser:
Altas/Bajas/Modificaciones
Consultas rpidas, escuetas y predecibles
Poco volumen de informacin e informacin disgregada
Transacciones rpidas
Gran nivel de concurrencia
Modo de actualizacin on-line
Baja redundancia de datos


Algunos ejemplos de este tipo de aplicaciones son:
Compras
Ventas
Inventario
Sueldos
La tecnologa OLTP se utiliza en innumerables aplicaciones, como en banca electrnica,
procesamiento de pedidos, comercio electrnico, supermercados o industria.
Requisitos.
El proceso de transacciones en lnea cada vez necesita ms recursos para las
transacciones que se transmiten por una red y que pueden integrar a ms de una empresa.
Por esta razn, el software actual para sistemas OLTP utiliza procesamiento cliente-
servidor y software de intermediacin (middleware) que permite a las transacciones correr
en diferentes plataformas en una red.
Middleware: Es un software que asiste a una aplicacin para interactuar o comunicarse con
otras aplicaciones, software, redes, hardware y/o sistemas operativos.
En grandes aplicaciones, la eficiencia del OLTP puede depender de lo perfeccionado que
sea el software de gestin de transacciones (como CICS en plataformas IBM) o de que
tcticas de optimizacin se utilizan para facilitar la gran cantidad de actualizaciones
concurrentes que se pueden producir en una base de datos orientada a OLTP.
En los sistemas de bases de datos descentralizados ms exigentes, los programas de
intermediacin OLTP distribuyen el procesamiento de transacciones entre varios
ordenadores en una red. A menudo OLTP se integra en una arquitectura orientada a
servicios o en un servicio Web.
El OLTP emplea una estrategia de consignacin o recuperacin para asegurar que cada
transaccin sea procesada de manera correcta. Esta estrategia es esencial, porque las
transacciones requieren una secuencia de pasos, y cada paso debe de llevarse a cabo de
manera correcta para que se concluya la transaccin.
Funcin de la Consignacin o Recuperacin
Se explica por medio del siguiente ejemplo:
Si una persona retira efectivo de un cajero automtico, la computadora del banco verifica
que su cuenta contenga fondos suficientes antes de deducir el retiro de su cuenta y permitir
que el cajero entregue el efectivo. Sin embargo, si el cajero no tiene efectivo, la transaccin
no procede, y el retiro no se deduce de su cuenta. Un TPS (sistema de procesamiento de
transacciones) manda (consigna) una transaccin y actualiza de manera permanente los
registros de una base de datos solo si cada paso de la transaccin se procesa de manera
satisfactoria. Si falla un paso, fracasa toda la transaccin y una recuperacin devuelve los
registros a su estado original.
En la siguiente imagen se muestran los procesos que ocurren en un TPS



Un sistema de procesamiento de transacciones (TPS) se caracteriza por su capacidad para:
Recopilar, exhibir y modificar transacciones.
Guardar transacciones.
Enlistar transacciones.
Limitaciones de un TPS
Su capacidad para generar informes es limitada.
Solo genera informes de detalles que ofrecen solo un registro bsico de las
transacciones concluidas.

1.1.2 Sistemas OLAP
OLAP es la sigla en ingls de Procesamiento Analtico en Lnea (On-Line
AnalyticalProcess).
Son aplicaciones que se encargan de analizar datos del negocio para generar informacin
tctica y estratgica que sirve de soporte para la toma de decisiones. Mientras que las
transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP
logra su mxima eficiencia y flexibilidad operando sobre Bases de datos
Multidimensionales.
Podemos nombrar las siguientes caractersticas como las ms sobresalientes de estas
aplicaciones:
Estructura de datos transparente al usuario.
Solo Consulta, trabajan sobre la informacin operacional generada por los sistemas
OLTP.
Consultas sobre grandes volmenes de datos no predecibles.
Informacin histrica.
Modo de actualizacin Batch.
Alta redundancia de datos para facilitar la generacin de consultas y obtener buenos
tiempos de respuesta.
Poderoso Back-end analtico para mltiples aplicaciones de usuarios.
Trabaja con resmenes de miles de registros condensados en una sola respuesta.

Su objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza
estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes
Bases de Datos (un data warehouse, por ejemplo).
Estos tipos de sistemas analticos buscan facilitar la creatividad, centrndose en la
estrategia a largo plazo y la ventaja competitiva dentro del negocio de una empresa.

Diferencias entre sistemas OLTP y OLAP

Sistemas OLTP Sistemas OLAP
Datos Valores actuales Datos histricos y/o
calculados
Organizacin Por aplicacin Por reas de la empresa
Acceso Muy frecuente
(lectura/escritura)
Baja frecuencia
Actualizaciones Actualizaciones de campo No se actualiza se
manipula
Tiempo de respuesta Medido por el tiempo de la
transaccin (del orden de
segundos)
Medido por el tiempo de la
consulta (del orden de
minutos)
Tamao de la BD 100 MB GB 100 GB TB
Usuarios Miles Cientos
Unidad de Trabajo Transacciones Consultas complejas

Ventajas de OLAP
Es un poderoso paradigma de visualizacin.
Proporciona tiempos de respuesta rpidos.
Permite realizar consultas de manera interactiva.
Es bueno para analizar grupos de datos organizados por series de tiempo.
Permite identificar semejanzas y diferencias en la data.
Permite realizar Pivot.
Permite realizar Slice&Dice.
Permite realizar Drill&Down.


1.2 INTELIGENCIA DE NEGOCIOS

1.2.1 Definicin
Se entiende por inteligencia de negocios (Business Intelligence) al conjunto de
metodologas, aplicaciones, prcticas y capacidades enfocadas a la creacin y
administracin de informacin que permite tomar mejores decisiones a los usuarios de una
organizacin.




Algunas de las tecnologas que forman parte de la inteligencia de negocios
son:
Data warehouse:Es una coleccin de datos que es extrada desde diferentes fuentes
de informacin a lo largo de la empresa
Reporting:Herramientas para la elaboracin de informes y listados, tanto en detalle
como sobre informacin agregada
Anlisis OLAP (On-Line AnalyticalProcessing):Herramientas que manejan
cuestiones complejas de bases de datos relacionales, proporcionando un acceso
multidimensional a los datos
Anlisis visual: Permite comunicar complejos datos de negocios de forma
rpida e intuitiva.
Anlisis predictivo:Es el proceso de seleccionar, explorar, y modelar grandes
volmenes de datos que develen informacin previamente desconocida para
beneficio del negocio.
Cuadro de mando: Es un conjunto de indicadores que aportan informacin
sumarizada e inteligente al usuario.
Cuadro de mando integral: Es un instrumento o metodologa de gestin que facilita
la implantacin de la estrategia de la empresa de una forma eficiente
Minera de datos:Es una tcnica orientada a extraer informacin desde grandes
volmenes de datos.
Gestin del rendimiento: Describe la metodologa, las mtricas, los procesos y
sistemas empleados para supervisar y gestionar el rendimiento de una compaa

Reglas de negocio: Son un componente clave en cmo se toman las decisiones en
una empresa.
Dashboards: Son resmenes visuales de informacin del negocio, que muestran de
una mirada la comprensin del global de las condiciones del negocio mediante
mtricas eIndicadores Clave de Desempeo (KPIs).
Integracin de datos (que incluye ETL,Extraccion, Transformacion y
Carga):Permiten operar con fuentes de datos de cualquier tipo (integrando los datos
en una base de datos nica (Datamart, Datawarehouse, etc.).
1.2.2 Importancia
Un sistema de inteligencia de negocios es de gran importancia para las empresas en la
actualidad ya que con su implantacin proporciona diversos beneficios entre los que
podemos destacar:
Crear un circulo integro de la informacin, esto se lograra con la transformacin de
los datos en informacin y esta genera un conocimiento que le permite a la empresa
tomar mejores decisiones que se traducen en mejores resultados y que generan
nuevos datos.
Permitir una visin nica, conformada, histrica, persistente y de calidad de toda la
informacin.
Crear, manejar y mantener mtricas, indicadores claves de rendimiento (KPI, Key
Performance Indicador) e indicadores claves de metas (KGI, Key GoalIndicator)
fundamentales para la empresa.
Aportar informacin actualizada tanto a nivel agregado como en detalle.
Reducir las diferencias de enfoque de negocio entre el departamento de TI y la
organizacin.
Mejorar la comprensin y documentacin de los sistemas de informacin en el
contexto de una organizacin.
Mejora de la competitividad de la organizacin como resultado de ser capaces de:
Diferenciar lo relevante sobre lo innecesario.
Acceder ms rpido a la informacin.
Tener mayor agilidad en la toma de decisiones.
Los beneficios de la inteligencia de negocios pueden clasificarse en tres categoras
principales, las cuales son:
Reduccin de costos.
Incremento de ingresos.
Mejoramiento de la satisfaccin de los clientes.
Y esta lista no es exhaustiva ni detallada, pues los usuarios continan encontrando formas
nuevas de implementar inteligencia de negocios


1.2.3 Componentes de la Inteligencia de Negocios.

Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los
siguientes componentes:

Multidimensionalidad: La informacin multidimensional se puede encontrar en
hojas de clculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de
reunir informacin dispersa en toda la empresa e incluso en diferentes fuentes para
as proporcionar a los departamentos la accesibilidad, poder y flexibilidad que
necesitan para analizar la informacin. Por ejemplo, un pronstico de ventas de un
nuevo producto en varias regiones no est completo si no se toma en cuenta
tambin el comportamiento histrico de las ventas de cada regin y la forma en que
la introduccin de nuevos productos se ha desarrollado en cada regin en cuestin.

Data Mining (minera de datos): Las empresas suelen generar grandes
cantidades de informacin sobre sus procesos productivos, desempeo
operacional, mercados y clientes. Pero el xito de los negocios depende por lo
general de la habilidad para ver nuevas tendencias o cambios en las tendencias.
Las aplicaciones de data mining pueden identificar tendencias y comportamientos,
no slo para extraer informacin, sino tambin para descubrir las relaciones en
bases de datos que pueden identificar comportamientos que no muy evidentes.

Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a
un nivel muy bsico sin necesidad de intervencin humana.
Por ejemplo: un agente pueden realizar tares un poco complejas, como elaborar
documentos, establecer diagramas de flujo, etc.

Data Warehouse (almacn de datos): Es la respuesta de la tecnologa de
informacin a la descentralizacin en la toma de decisiones. Coloca informacin de
todas las reas funcionales de la organizacin en manos de quien toma las
decisiones. Tambin proporciona herramientas para bsqueda y anlisis.


1.2.3.1 Aplicaciones Analticas.
Data Mining, herramientas para minera de datos.
OLAP, herramientas de procesamiento analtico de datos.

Herramientas de consulta y reporte de datos.

Herramientas de produccin de reportes personalizados.
ELT, herramientas de extraccin, traduccin y carga de datos.

Herramientas de administracin de sistemas.

Portales de informacin empresarial.

Sistemas de base de datos.

Sistemas de administracin del conocimiento.

Simulacin y prediccin. Son aplicaciones para simular escenarios y predecir
tendencias en el futuro. Si el precio de la materia prima crece un 5% a lo largo del
ao y en tres meses el dlar sube 10%, cmo afecta a nuestra venta al final del
ao? Si invertimos 10% ms en esta lnea de productos, cmo cambia nuestra
productividad y ROI?

Activity-BasedCosting (actividad basada en costos). La determinacin de los
costes basados en actividades descubre los costes reales de los productos,
servicios o clientes ms all de la contabilidad tradicional y desvela que por ejemplo
dos clientes aparentemente igual de rentables segn sus compras, en realidad
causan costes muy diferentes, o que 25% de la actividad de la empresa causa80%
de los costes.

Minera de Datos. Sistemas basados en algoritmos matemticos para descubrir
tendencias escondidas entre grandes volmenes de datos. Aplicada desde la
deteccin de fraude hasta el anlisis de cesta de compra.

BalancedScorecard/Cuadro de Mando Integral. Un concepto de gestin de la
estratgica empresarial desarrollado por Norton y Kaplan. Permite ver la empresa
no slo bajo la perspectiva financiera, sino tambin bajo otras como clientes,
procesos o potenciales. Los objetivos estratgicos de las empresas se definen y su
alcance se mide constantemente con datos reales.

Gestin de riesgo. Especialmente las entidades financieras y las aseguradoras,
pero tambin otras empresas, necesitan calcular riesgos y simular escenarios. Las
aplicaciones BI proporcionan todo el proceso.

Alertas y vigilancia. Ya no es necesario leer cada maana muchas pginas de
informes o mirar cada hora una pantalla para detectar si existe una situacin crtica
en algn lugar de la empresa. Se pueden vigilar automticamente los indicadores
de la actividad empresarial y generar avisos por email o SMS si un indicador est
fuera de su rango normal, a cualquier ritmo y hora del da.

Fidelizacin de Clientes. Las aplicaciones ayudan a identificar que son los mejores
o ms rentables clientes y porque clientes abandonan la empresa. Proporcionan los
datos para campaas y evalan las respuestas y el impacto.

Consolidacin. Automatizacin de consolidaciones contables entre empresas de
un mismo grupo oentre sucursales. Tambin se aplican en fusiones de empresas y
adquisiciones.










1.2.3.2 Sistemas de Reportes.

Consultas y reportes

Se usa con propsito analtico
Manipular los datos
Realiza un pedido de datos
Realiza la carga de los datos
Darle formato a los datos
Presentar los datos

QueryTool (herramienta de consultas): Un tipo especfico de herramientas de acceso a
datos por usuarios finales que invita al usuario a formas sus propias consultas manipulando
directamente las tablas relacionales y sus uniones.
Se disean Reportes de todo tipo incluyendo grficos y parmetros de ingreso dejndolos
en una librera para ser accedidos, mediante permisos, por los usuarios que correspondan.

1.2.3.3 Base de Datos Multidimensionales y Data Warehouse.

Base de datos multidimensionales
Modelos Multidimensionales
Tcnica de diseo lgico para diseo de Data Warehouses.
Proporcionan los mejores resultados.
Diseos de acuerdo a un estndar que es intuitivo y fcil de entender.
Permite accesos de alto rendimiento.
Formado por una tabla cuya clave es compuesta, TableFact (tabla de hechos) y un
conjunto de tablas ms pequeas denominadas Tablas de Dimensin.
Su apariencia hace que se les denomine diagramas STAR.

Data Warehouse
Un Data Warehouse (DW) o almacn de datos es una coleccin de datos que es extrada
desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos
departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la
realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones.
Un sistema de DW apunta a disponer de una visin nica de los clientes y proveer la mayor
cantidad posible de informacin a los usuarios de la empresa, facilitndose el monitoreo del
negocio.
Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que
estn orientados a temas, diferencindose as de los sistemas transaccionales que
estructuran los datos en procesos funcionales.
Por otro lado, se trata de datos integrados, es decir, estn consolidados, lo cual supone un
proceso previo de depuracin y homogeneizacin, etapa que puede ser una de las ms
complejas al implementar un DW. Por ltimo, los datos son historiados, ya que mantienen
el registro histrico de sus valores, lo cual redunda en que, a diferencia de los sistemas
transaccionales, no sean voltiles.

1.2.3.4 Data Mining (minera de datos).

Las tcnicas de Data Mining son el resultado de un largo proceso de investigacin y
desarrollo de productos. Esta evolucin comenz cuando los datos de negocios fueron
almacenados por primera vez en computadoras, y continu con mejoras en el acceso a los
datos, y ms recientemente con tecnologas generadas para permitir a los usuarios navegar
a travs de los datos en tiempo real. Data Mining toma este proceso de evolucin ms all
del acceso y navegacin retrospectiva de los datos, hacia la entrega de informacin
prospectiva y proactiva. Data Mining est lista para su aplicacin en la comunidad de
negocios porque est soportado por tres tecnologas que ya estn suficientemente
maduras:

Recoleccin masiva de datos.
Potentes computadoras con multiprocesadores.
Algoritmos de Data Mining.

Principales caractersticas y objetivos de la Minera de Datos

Explorar los datos que se encuentran en las profundidades de las bases de datos,
como los almacenes de datos, que algunas veces contienen informacin
almacenada durante varios aos.
En algunos casos, los datos se consolidan en un almacn de datos y en mercados
de datos; en otros, se mantienen en servidores de Internet e Intranet.
El entorno de la minera de datos suele tener una arquitectura cliente servidor.
Las herramientas de la minera de datos ayudan a extraer el mineral de la
informacin enterrado en archivos corporativos o en registros pblicos, archivados.
El minero es, muchas veces un usuario final con poca o ninguna habilidad de
programacin, facultado por barrenadoras de datos y otras poderosas herramientas
indagatorias para efectuar preguntas ad-hoc y obtener rpidamente respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e
inesperados.
Las herramientas de la minera de datos se combinan fcilmente y pueden
analizarse y procesarse rpidamente.
Debido a la gran cantidad de datos, algunas veces resulta necesario usar
procesamiento en paralelo para la minera de datos.


La minera de datos produce cinco tipos de informacin:
Asociaciones.
Secuencias.
Clasicaciones.
Agrupamientos.
Pronsticos.
Los mineros de datos usan varias herramientas y tcnicas.


1.2.3.5 Administracin del Conocimiento.

De forma general, los datos son la materia prima bruta. En el momento que el usuario les
atribuye algn significado especial pasan a convertirse en informacin. Cuando los
especialistas elaboran o encuentran un modelo, haciendo que la interpretacin de la
informacin y ese modelo representen un valor agregado, entonces nos referimos al
conocimiento.

El objetivo fundamental del KDD es encontrar conocimiento til, vlido, relevante y nuevo
sobre un fenmeno o actividad mediante algoritmos ecientes, dadas las crecientes
rdenes de magnitud en los datos. Al mismo tiempo hay un profundo inters por presentar
los resultados de manera visual o al menos de manera que su interpretacin sea muy clara.
Otro aspecto es que la interaccin humano-mquina deber ser exible, dinmica y
colaboradora.
El resultado de la exploracin deber ser interesante y su calidad no debe ser afectada por
mayores volmenes de datos o por ruido en los datos. En este sentido, los algoritmos de
descubrimiento de informacin deben ser altamente robustos.

En la siguiente gura se ilustra la jerarqua que existe en una base de datos entre datos,
informacin y conocimiento. Se observa igualmente el volumen que presenta en cada nivel
y el valor que los responsables de las decisiones le dan en esa jerarqua. El rea interna
dentro del tringulo representa los objetivos que se han propuesto. La separacin del
tringulo representa la estrecha unin entre dato e informacin, no as entre la informacin
y el conocimiento.




Jerarqua del Conocimiento.



1.3 PRINCIPALES HERRAMIENTAS DE LA INTELIGENCIA DE NEGOCIOS.
Herramientas Esenciales
Una solucin de BI incluye la implementacin de una serie de herramientas y tcnicas
orientadas a gestionar, explotar, distribuir y estructurar informacin. Entre ellas, destacan
las siguientes:
Query&Report
Las herramientas de Query (consulta) y Report (reporte) son quiz las ms conocidas en
este mbito, ya que son fundamentales para el desarrollo y manejo de listados e informes
basados en la informacin presente en los almacenes de datos y Data Marts.
Data Warehouse
Un Data Warehouse (DW) o almacn de datos es una coleccin de datos que es extrada
desde diferentes fuentes de informacin a lo largo de la empresa (bases de datos
departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la
realizacin de consultas y anlisis, fundamentalmente, para ayudar a la toma de decisiones.
Data Mart
Aunque para algunos se trata casi de un sinnimo de Data Warehouse, un Data Mart o
cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se
orienta a un rea especfica del negocio, como recursos humanos, ventas o marketing, por
ejemplo. En otras palabras, un Data Mart corresponde a un almacn de datos ms
restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de
la organizacin.
Herramientas OLAP
OLAP (On Line AnalyticalProcessing) son un conjunto de herramientas capaces de
responder rpida y gilmente a las solicitudes de informacin de los usuarios y que deben
reflejar cualquier lgica de negocio por las que se consulte.
En contraste con los sistemas transaccionales, OLTP (On Line TransactionProcessing), las
herramientas OLAP presentan informacin multidimensional, es decir, desde mltiples
perspectivas. Del mismo modo, los sistemas analticos, al igual que los datos del Data
Warehouse, estn orientados a temas, y no slo operan con datos actuales, sino tambin
con datos histricos.
Una de las principales cualidades de las herramientas de OLAP es identificar tendencias,
es decir, permiten apoyar la toma decisiones considerando diversas variables, as como
tambin permiten identificar cambios en las preferencias de los clientes. Sin embargo,
aunque pueden responder consultas complejas y ratificar informacin, lo hacen siempre
dependiendo del usuario, que es quien define las relaciones a considerar.
Data Mining
El Data Mining (DM) o minera de datos es una tcnica orientada a extraer informacin
desde grandes volmenes de datos y corresponde a una de las claves de la inteligencia de
negocios. El DM es un proceso conocido como KDD (KnowledgeDiscovery in Databases;
Descubrimiento de Conocimiento en Bases de Datos) que consta de tres fases: preparacin
de los datos, extraccin de informacin e interpretacin de los resultados.
Normalmente, el DM se realiza con las llamadas tcnicas de verificacin -en donde se
prueba una hiptesis del usuario- y los mtodos de descubrimiento -bsqueda de
patrones (incluyendo las tcnicas de prediccin)-. Lo anterior se traduce en anlisis
exploratorios, los cuales se apoyan en herramientas de visualizacin de datos y
construccin de modelos, con el objetivo de realizar predicciones utilizando los patrones
detectados en los datos conocidos con informacin del pasado.

You might also like