Professional Documents
Culture Documents
Integrantes:
Alvarez, Carlos C.I. 15.758.516
Diaz, Angel C.I. 10.007.835
Flores, Emely C.I. 15.403.257
Flores, Jusmila C.I. 12.470.467
Hernndez, Hazel C.I. 10.799.550
Simn, Giovana C.I. 22.906.025
CONTENIDO PAG
Introduccin 3
Data Warehouse 4
Minera de Datos 28
Datamart 45
Cuadro de Manejo Integral 52
Sistemas de Soporte a la Decisin (DSS) 65
Sistemas de Informacin para Ejecutivos 74
Conclusiones 84
Herramientas Bibliogrficas 86
INTRODUCCIN
Data WareHouse
3
Es un repositorio de datos de muy fcil acceso, alimentado de numerosas
fuentes, transformadas en grupos de informacin sobre temas especficos de
negocios, para permitir nuevas consultas, anlisis, reporteador y decisiones.
Los objetivos fundamentales de un Data WareHouse son:
Hace que la informacin de la organizacin sea accesible: los
contenidos del Data WareHouse son entendibles y navegables, y el
acceso a ellos son caracterizado por el rpido desempeo. Estos
requerimientos no tienen fronteras y tampoco limites fijos. Cuando
hablamos de entendible significa, que los niveles de la informacin
sean correctos y obvios. Y Navegables significa el reconocer el destino
en la pantalla y llegar a donde queramos con solo un clic. Rpido
desempeo significa, cero tiempo de espera. Todo lo dems es un
compromiso y por consiguiente algo que queremos mejorar.
Hacer que la informacin de la organizacin sea consistente: la
informacin de una parte de la organizacin puede hacerse coincidir
con la informacin de la otra parte de la organizacin. Si dos medidas
de la organizacin tienen el mismo nombre, entonces deben significar
la misma cosa. Y a la inversa, si dos medidas no significan la misma
cosa, entonces son etiquetados diferentes. Informacin consistente
significa, informacin de alta calidad. Significa que toda la informacin
es contabilizada y completada. Todo lo dems es un compromiso y por
consiguiente algo que queremos mejorar.
Es informacin adaptable y elstica: el Data WareHouse esta diseado
para cambios continuos. Cuando se le hacen nuevas preguntas al
Data WareHouse, los datos existentes y las tecnologas no cambian ni
se corrompen. Cuando se agregan datos nuevos al Data WareHouse,
los datos existentes y las tecnologas tampoco cambian ni se
3
corrompen. El diseo de Data Marts separados que hacen al Data
WareHouse, deben ser distribuidos e incrementados. Todo lo dems
es un compromiso y por consiguiente algo que queremos mejorar.
Es un seguro baluarte que protege los valores de la informacin: el
Data WareHouse no solamente controla el acceso efectivo a los datos,
si no que da a los dueos de la informacin gran visibilidad en el uso y
abusos de los datos, an despus de haber dejado el Data
WareHouse. Todo lo dems es un compromiso y por consiguiente algo
que queremos mejorar.
Es la fundacin de la toma de decisiones: el Data WareHouse tiene
los datos correctos para soportar la toma de decisiones. Solo hay
una salida verdadera del Data WareHouse: las decisiones que son
hechas despus de que el Data WareHouse haya presentado las
evidencias. La original etiqueta que preside el Data WareHouse sigue
siendo la mejor descripcin de lo que queremos construir: un sistema
de soporte a las decisiones.
3
formas:
Los sistemas operacionales de registros
Y el Data Warehouse
Crudamente hablando, los sistema operacionales de registros es donde los
datos son depositados y el Data WareHouse es de donde se extraen eso
datos.
Un Data Warehouse o Depsito de Datos es una coleccin de datos
orientado a temas, integrado, no voltil, de tiempo variante, que se usa para
el soporte del proceso de toma de decisiones gerenciales.
Se puede caracterizar un data warehouse haciendo un contraste de cmo
los datos de un negocio almacenados en un data warehouse, difieren de los
datos operacionales usados por las aplicaciones de produccin.
3
En la Figura N 1 se muestra el contraste entre los dos tipos de
orientaciones.
El ambiente operacional se disea alrededor de las aplicaciones y funciones
tales como prstamos, ahorros, tarjeta bancaria y depsitos para una
institucin financiera. Por ejemplo, una aplicacin de ingreso de rdenes
puede acceder a los datos sobre clientes, productos y cuentas. La base de
datos combina estos elementos en una estructura que acomoda las
necesidades de la aplicacin.
En el ambiente data warehousing se organiza alrededor de sujetos tales
como cliente, vendedor, producto y actividad. Por ejemplo, para un
fabricante, stos pueden ser clientes, productos, proveedores y vendedores.
Para una universidad pueden ser estudiantes, clases y profesores. Para un
hospital pueden ser pacientes, personal mdico, medicamentos, etc.
La alineacin alrededor de las reas de los temas afecta el diseo y la
implementacin de los datos encontrados en el data warehouse. Las
principales reas de los temas influyen en la parte ms importante de la
estructura clave.
3
escala detallada. En el data warehouse se excluye la informacin que no
ser usada por el proceso de sistemas de soporte de decisiones, mientras
que la informacin de las orientadas a las aplicaciones, contiene datos para
satisfacer de inmediato los requerimientos funcionales y de proceso, que
pueden ser usados o no por el analista de soporte de decisiones.
Otra diferencia importante est en la interrelacin de la informacin. Los
datos operacionales mantienen una relacin continua entre dos o ms tablas
basadas en una regla comercial que est vigente. Las del data warehouse
miden un espectro de tiempo y las relaciones encontradas en el data
warehouse son muchas. Muchas de las reglas comerciales (y sus
correspondientes relaciones de datos) se representan en el data warehouse,
entre dos o ms tablas.
Integracin
El aspecto ms importante del ambiente data warehousing es que la
informacin encontrada al interior est siempre integrada.
La integracin de datos se muestra de muchas maneras: en convenciones
de nombres consistentes, en la medida uniforme de variables, en la
codificacin de estructuras consistentes, en atributos fsicos de los datos
consistentes, fuentes mltiples y otros.
El contraste de la integracin encontrada en el data warehouse con la
carencia de integracin del ambiente de aplicaciones, se muestran en la
Figura N 2, con diferencias bien marcadas.
A travs de los aos, los diseadores de las diferentes aplicaciones han
tomado sus propias decisiones sobre cmo se debera construir una
aplicacin. Los estilos y diseos personalizados se muestran de muchas
maneras.
3
Se diferencian en la codificacin, en las estructuras claves, en sus
caractersticas fsicas, en las convenciones de nombramiento y otros. La
capacidad colectiva de muchos de los diseadores de aplicaciones, para
crear aplicaciones inconsistentes, es fabulosa. La Figura N 2 mencionada,
muestra algunas de las diferencias ms importantes en las formas en que se
disean las aplicaciones.
3
Cualquiera que sea la fuente, cuando la informacin de la tubera llegue al
data warehouse necesitar ser medida de la misma manera.
3
De Tiempo Variante
Toda la informacin del data warehouse es requerida en algn momento.
Esta caracterstica bsica de los datos en un depsito, es muy diferente de la
informacin encontrada en el ambiente operacional. En stos, la informacin
se requiere al momento de acceder. En otras palabras, en el ambiente
operacional, cuando usted accede a una unidad de informacin, usted
espera que los valores requeridos se obtengan a partir del momento de
acceso.
Como la informacin en el data warehouse es solicitada en cualquier
momento (es decir, no "ahora mismo"), los datos encontrados en el depsito
se llaman de "tiempo variante".
Los datos histricos son de poco uso en el procesamiento operacional. La
informacin del depsito por el contraste, debe incluir los datos histricos
para usarse en la identificacin y evaluacin de tendencias.
3
El tiempo variante se muestra de varias maneras:
1. La ms simple es que la informacin representa los datos sobre un
horizonte largo de tiempo - desde cinco a diez aos. El horizonte de tiempo
representado para el ambiente operacional es mucho ms corto desde
valores actuales hasta sesenta a noventa das.
Las aplicaciones que tienen un buen rendimiento y estn disponibles para
el procesamiento de transacciones, deben llevar una cantidad mnima de
datos si tienen cualquier grado de flexibilidad. Por ello, las aplicaciones
operacionales tienen un corto horizonte de tiempo, debido al diseo de
aplicaciones rgidas.
2. La segunda manera en la que se muestra el tiempo variante en el data
warehouse est en la estructura clave. Cada estructura clave en el data
warehouse contiene, implcita o explcitamente, un elemento de tiempo como
da, semana, mes, etc.
3
El elemento de tiempo est casi siempre al pie de la clave concatenada,
encontrada en el data warehouse. En ocasiones, el elemento de tiempo
existir implcitamente, como el caso en que un archivo completo se duplica
al final del mes, o al cuarto.
3. La tercera manera en que aparece el tiempo variante es cuando la
informacin del data warehouse, una vez registrada correctamente, no puede
ser actualizada. La informacin del data warehouse es, para todos los
propsitos prcticos, una serie larga de "snapshots" (vistas instantneas).
Por supuesto, si los snapshots de los datos se han tomado
incorrectamente, entonces pueden ser cambiados. Asumiendo que los
snapshots se han tomado adecuadamente, ellos no son alterados una vez
hechos. En algunos casos puede ser no tico, e incluso ilegal, alterar los
snapshots en el data warehouse. Los datos operacionales, siendo requeridos
a partir del momento de acceso, pueden actualizarse de acuerdo a la
necesidad.
No Voltil
La informacin es til slo cuando es estable. Los datos operacionales
cambian sobre una base momento a momento. La perspectiva ms grande,
esencial para el anlisis y la toma de decisiones, requiere una base de datos
estable.
En la Figura N 4 se muestra que la actualizacin (insertar, borrar y
modificar), se hace regularmente en el ambiente operacional sobre una base
de registro por registro. Pero la manipulacin bsica de los datos que ocurre
en el data warehouse es mucho ms simple. Hay dos nicos tipos de
operaciones: la carga inicial de datos y el acceso a los mismos. No hay
actualizacin de datos (en el sentido general de actualizacin) en el depsito,
como una parte normal de procesamiento.
3
Hay algunas consecuencias muy importantes de esta diferencia bsica,
entre el procesamiento operacional y del data warehouse. En el nivel de
diseo, la necesidad de ser precavido para actualizar las anomalas no es un
factor en el data warehouse, ya que no se hace la actualizacin de datos.
Esto significa que en el nivel fsico de diseo, se pueden tomar libertades
para optimizar el acceso a los datos, particularmente al usar la normalizacin
y desnormalizacin fsica.
Otra consecuencia de la simplicidad de la operacin del data warehouse
est en la tecnologa subyacente, utilizada para correr los datos en el
depsito. Teniendo que soportar la actualizacin de registro por registro en
modo on-line (como es frecuente en el caso del procesamiento operacional)
requiere que la tecnologa tenga un fundamento muy complejo debajo de una
fachada de simplicidad.
3
operacional y el ambiente de data warehouse. Dicho razonamiento es
superficial y demuestra una carencia de entendimiento con respecto a qu
ocurre en el data warehouse. De hecho, hay una mnima redundancia de
datos entre ambos ambientes. Se debe considerar lo siguiente:
Los datos se filtran cuando pasan desde el ambiente operacional al de
depsito. Existe mucha data que nunca sale del ambiente operacional. Slo
los datos que realmente se necesitan ingresarn al ambiente de data
warehouse. El horizonte de tiempo de los datos es muy diferente de un
ambiente al otro. La informacin en el ambiente operacional es ms reciente
con respecto a la del data warehouse. Desde la perspectiva de los horizontes
de tiempo nicos, hay poca superposicin entre los ambientes operacional y
de data warehouse.
El data warehouse contiene un resumen de la informacin que no se
encuentra en el ambiente operacional.
Los datos experimentan una transformacin fundamental cuando pasa al
data warehouse. La mayor parte de los datos se alteran significativamente al
ser seleccionados y movidos al data warehouse. Dicho de otra manera, la
mayora de los datos se alteran fsica y radicalmente cuando se mueven al
depsito. No es la integracin.
En vista de estos factores, la redundancia de datos entre los dos ambientes
es una ocurrencia rara, que resulta en menos de 1%.
3
Detalle de datos actuales. En gran parte, el inters ms importante radica
en el detalle de los datos actuales, debido a que:
Refleja las ocurrencias ms recientes, las cuales son de gran inters
Es voluminoso, ya que se almacena al ms bajo nivel de granularidad.
Casi siempre se almacena en disco, el cual es de fcil acceso, aunque
su administracin sea costosa y compleja.
3
A veces se encuentra en el ambiente de data warehouse y en otros, fuera
del lmite de la tecnologa que ampara al data warehouse. (De todos modos,
los datos
3
A fin de recordar los diferentes niveles de los datos encontrados en el data
warehouse, considere el ejemplo mostrado en la Figura N 6. El detalle de
ventas antiguas son las que se encuentran antes de 1992. Todos los detalles
de ventas desde 1982 (o cuando el diseador inici la coleccin de los
archivos) son almacenados en el nivel de detalle de datos ms antiguo.
El detalle actual contiene informacin desde 1992 a 1993 (suponiendo que
1993 es el ao actual). En general, el detalle de ventas no se ubica en el
nivel de detalle actual hasta que haya pasado, por lo menos, veinticuatro
horas desde que la informacin de ventas llegue a estar disponible en el
ambiente operacional.
3
Los algoritmos usados para la esquematizacin
La trazabilidad desde el ambiente operacional al data warehouse
3
Transformacin de Datos
Uno de los desafos de cualquier implementacin de data warehouse, es el
problema de transformar los datos. La transformacin se encarga de las
inconsistencias en los formatos de datos y la codificacin, que pueden existir
dentro de una base de datos nica y que casi siempre existen cuando
mltiples bases de datos contribuyen al data warehouse.
En la Figura N 9 se ilustra una forma de inconsistencia, en la cual el
gnero se codifica de manera diferente en tres bases de datos diferentes.
Los procesos de transformacin de datos se desarrollan para direccionar
estas inconsistencias.
La transformacin de datos tambin se encarga de las inconsistencias en el
contenido de datos. Una vez que se toma la decisin sobre que reglas de
transformacin sern establecidas, deben crearse e incluirse las definiciones
en las rutinas de transformacin.
3
Se requiere una planificacin cuidadosa y detallada para transformar datos
inconsistentes en conjuntos de datos conciliables y consistentes para
cargarlos en el data warehouse.
Diseo de la Arquitectura
Arquitectura del Depsito
El desarrollo del data warehouse comienza con la estructura lgica y fsica
de la base de datos del depsito ms los servicios requeridos para operar y
mantenerlo.
Esta eleccin conduce a la seleccin de otros dos tems fundamentales: el
servidor de hardware y el DBMS.
La plataforma fsica puede centralizarse en una sola ubicacin o
distribuirse regional, nacional o internacionalmente. A continuacin se dan las
siguientes alternativas de arquitectura:
Un plan para almacenar los datos de su compaa, que podra
obtenerse desde fuentes mltiples internas y externas, es consolidar
la base de datos en un data warehouse integrado. El enfoque
3
consolidado proporciona eficiencia tanto en la potencia de
procesamiento como en los costos de soporte.
La arquitectura global distribuye informacin por funcin, con datos
financieros sobre un servidor en un sitio, los datos de comercializacin
en tro y los datos de fabricacin en un tercer lugar.
Una arquitectura por niveles almacena datos altamente resumidos
sobre una estacin de trabajo del usuario, con resmenes ms
detallados en un segundo servidor y la informacin ms detallada en
un tercero.
La estacin de trabajo del primer nivel maneja la mayora de los pedidos
para los datos, con pocos pedidos que pasan sucesivamente a los niveles 2
y 3 para la resolucin. Las computadoras en el primer nivel pueden
optimizarse para usuarios de carga pesada y volumen bajo de datos,
mientras que los servidores de los otros niveles son ms adecuados para
procesar los volmenes pesados de datos, pero cargas ms livianas de
usuario.
3
ofrecen limitada potencia de procesamiento y escalabilidad. Adems, un
servidor slo presenta un nico punto de falla, limitando la disponibilidad
garantizada del depsito.
Se puede ampliar un solo servidor de redes mediante arquitecturas
distribuidas que hacen uso de subproductos, tales como Ambientes de
Computacin Distribuida (Distributed Computing Environment - DCE) o
Arquitectura Broker de Objeto Comn (Common Objects Request Broker
Architecture - CORBA), para distribuir el trfico a travs de servidores
mltiples.
Estas arquitecturas aumentan tambin la disponibilidad, debido a que las
operaciones pueden cambiarse al servidor de copia de seguridad si un
servidor falla, pero la gestin de sistemas es ms compleja.
2 Multiprocesamiento simtrico
Las mquinas de multiprocesamiento simtrico (Symmetric MultiProcessing
SMP) aumentan mediante la adicin de procesadores que comparten la
memoria interna de los servidores y los dispositivos de almacenamiento de
disco.
Se puede adquirir la mayora de SMP en configuraciones mnimas (es
decir, con dos procesadores) y levantar cuando es necesario, justificando el
crecimiento con las necesidades de procesamiento. La escalabilidad de una
mquina SMP alcanza su lmite en el nmero mximo de procesadores
soportados por los mecanismos de conexin (es decir, el backplane y bus
compartido).
3 Procesamiento en paralelo masivo
Una mquina de procesamiento en paralelo masivo (Massively Parallel
Processing - MPP), conecta un conjunto de procesadores por medio de un
enlace de banda ancha y de alta velocidad. Cada nodo es un servidor,
completo con su propio procesador (posiblemente SMP) y memoria interna.
3
Para optimizar una arquitectura MPP, las aplicaciones deben ser
"paralelizadas" es decir, diseadas para operar por separado, en partes
paralelas.
Esta arquitectura es ideal para la bsqueda de grandes bases de datos.
Sin embargo, el DBMS que se selecciona debe ser uno que ofrezca una
versin paralela. Y an entonces, se requiere un diseo y afinamiento
esenciales para
obtener una ptima distribucin de los datos y prevenir "hot spots" o "data
skew" (donde una cantidad desproporcionada del procesamiento es
cambiada a un nodo de procesamiento, debido a la particin de los datos
bajo su control).
4 Acceso de memoria no uniforme
La dificultad de mover aplicaciones y los DBMS a agrupaciones o
ambientes realmente paralelos ha conducido a nuevas y recientes
arquitecturas, tales como el acceso de memoria no uniforme (Non Uniform
Memory Access NUMA). NUMA crea una sola gran mquina SMP al
conectar mltiples nodos SMP en un solo (aunque fsicamente distribuida)
banco de memoria y un ejemplo nico de OS. NUMA facilita el enfoque SMP
para obtener los beneficios de performance de las grandes mquinas MPP
(con 32 o ms procesadores), mientras se mantiene las ventajas de gestin y
simplicidad de un ambiente SMP estndar.
Lo ms importante de todo, es que existen DBMS y aplicaciones que
pueden moverse desde un solo procesador o plataforma SMP a NUMA, sin
modificaciones.
3
Elementos constituyentes de una Arquitectura Data Warehouse
Una Arquitectura Data Warehouse (Data Warehouse Architecture - DWA) es
una forma de representar la estructura total de datos, comunicacin,
procesamiento y presentacin, que existe para los usuarios finales que
disponen de una computadora dentro de la empresa.
La arquitectura se constituye de un nmero de partes interconectadas:
Base de datos operacional / Nivel de base de datos externo
Nivel de acceso a la informacin
Nivel de acceso a los datos
Nivel de directorio de datos (Metadata)
Nivel de gestin de proceso
Nivel de mensaje de la aplicacin
Nivel de data warehouse
3
Nivel de organizacin de datos
3
Facilita la aplicacin de tcnicas estadsticas de anlisis y
modelizacin para encontrar relaciones ocultas entre los datos del
almacn; obteniendo un valor aadido para el negocio de dicha
informacin.
Minera de Datos
3
informacin era previamente desconocida y podr resultar til para algn
proceso. En otras palabras, la minera de datos prepara, sondea y explora
los datos para sacar la informacin oculta en ellos.
Bajo el nombre de minera de datos se engloba todo un conjunto de
tcnicas encaminadas a la extraccin de conocimiento procesable, implcito
en las bases de datos. Est fuertemente ligado con la supervisin de
procesos industriales ya que resulta muy til para aprovechar los datos
almacenados en las bases de datos.
Las bases de la minera de datos se encuentran en la inteligencia artificial y
en el anlisis estadstico. Mediante los modelos extrados utilizando tcnicas
de minera de datos se aborda la solucin a problemas de prediccin,
clasificacin y segmentacin.
3
Proceso de Minera de Datos
Un proceso tpico de minera de datos consta de los siguientes pasos
generales:
1. Seleccin del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las
variables dependientes (las que sirven para hacer el clculo o proceso),
como posiblemente al muestreo de los registros disponibles.
2. Anlisis de las propiedades de los datos, en especial los histogramas,
diagramas de dispersin, presencia de valores atpicos y ausencia de datos
(valores nulos).
3. Transformacin del conjunto de datos de entrada, se realizar de diversas
formas en funcin del anlisis previo, con el objetivo de prepararlo para
aplicar la tcnica de minera de datos que mejor se adapte a los datos y al
problema, a este paso tambin se le conoce como pre procesamiento de los
datos.
4. Seleccionar y aplicar la tcnica de minera de datos, se construye el
modelo predictivo, de clasificacin o segmentacin.
5. Extraccin de conocimiento, mediante una tcnica de minera de datos, se
obtiene un modelo de conocimiento, que representa patrones de
comportamiento observados en los valores de las variables del problema o
relaciones de asociacin entre dichas variables. Tambin pueden usarse
varias tcnicas a la vez para generar distintos modelos, aunque
generalmente cada tcnica obliga a un pre procesado diferente de los datos.
6. Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe
proceder a su validacin comprobando que las conclusiones que arroja son
vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los
3
modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de
los modelos alcanza los resultados esperados, debe alterarse alguno de los
pasos anteriores para generar nuevos modelos.
3
hundidos. Con estos modelos en mano sale a buscar el tesoro donde el
modelo indica que en el pasado hubo ms probabilidad de darse una
situacin similar. Con un poco de esperanza, si tiene un buen modelo,
probablemente encontrar el tesoro.
Este acto de construccin de un modelo es algo que la gente ha estado
haciendo desde hace mucho tiempo, seguramente desde antes del auge de
las computadoras y de la tecnologa de Data Mining. Lo que ocurre en las
computadoras, no es muy diferente de la manera en que la gente construye
modelos. Las computadoras son cargadas con mucha informacin acerca de
una variedad de situaciones donde una respuesta es conocida y luego el
software de Data Mining en la computadora debe correr a travs de los datos
y distinguir las caractersticas de los datos que llevarn al modelo. Una vez
que el modelo se construy, puede ser usado en situaciones similares donde
usted no conoce la respuesta.
Si alguien le dice que tiene un modelo que puede predecir el uso de los
clientes, Cmo puede saber si es realmente un buen modelo? La primera
cosa que puede probar es pedirle que aplique el modelo a su base de
clientes - donde usted ya conoce la respuesta. Con Data Mining, la mejor
manera para realizar esto es dejando de lado ciertos datos para aislarlos del
proceso de Data Mining. Una vez que el proceso est completo, los
resultados pueden ser testeados contra los datos excluidos para confirmar la
validez del modelo. Si el modelo funciona, las observaciones deben
mantenerse para los datos excluidos.
3
En algunos casos, los datos se consolidan en un almacn de datos y
en mercados de datos; en otros, se mantienen en servidores de
Internet e Intranet.
El entorno de la minera de datos suele tener una arquitectura cliente
servidor.
Las herramientas de la minera de datos ayudan a extraer el mineral
de la informacin enterrado en archivos corporativos o en registros
pblicos, archivados.
El minero es, muchas veces un usuario final con poca o ninguna
habilidad de programacin, facultado por barrenadoras de datos y
otras poderosas herramientas indagatorias para efectuar preguntas
adhoc y obtener rpidamente respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados
valiosos e inesperados.
Las herramientas de la minera de datos se combinan fcilmente y
pueden analizarse y procesarse rpidamente.
Debido a la gran cantidad de datos, algunas veces resulta necesario
usar procesamiento en paralelo para la minera de datos.
La minera de datos produce cinco tipos de informacin:
Asociaciones
Secuencias
Clasificaciones
Agrupamientos
Pronsticos.
Los mineros de datos usan varias herramientas y tcnicas.
La minera de datos es un proceso que invierte la dinmica del mtodo
cientfico en el siguiente sentido:
3
En el mtodo cientfico, primero se formula la hiptesis y luego se disea el
experimento para coleccionar los datos que confirmen o refuten la hiptesis.
Si esto se hace con la formalidad adecuada (cuidando cules son las
variables controladas y cules experimentales), se obtiene un nuevo
conocimiento.
En la minera de datos, se coleccionan los datos y se espera que de ellos
emerjan hiptesis. Se busca que los datos describan o indiquen por qu son
como son. Luego entonces, se valida esa hiptesis inspirada por los datos en
los datos mismos, ser numricamente significativa, pero experimentalmente
invlida. De ah que la minera de datos debe presentar un enfoque
exploratorio, y no confirmador. Usar la minera de datos para confirmar las
hiptesis formuladas puede ser peligroso, pues se est haciendo una
inferencia poco vlida.
La minera de datos es una tecnologa compuesta por etapas que integra
varias reas y que no se debe confundir con un gran software. Durante el
desarrollo de un proyecto de este tipo se usan diferentes aplicaciones
software en cada etapa que pueden ser estadsticas, de visualizacin de
datos o de inteligencia artificial, principalmente. Actualmente existen
aplicaciones o herramientas comerciales de minera de datos muy poderosas
que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto.
Sin embargo, casi siempre acaban complementndose con otra herramienta.
3
* Redes neuronales.- Son un paradigma de aprendizaje y procesamiento
automtico inspirado en la forma en que funciona el sistema nervioso de los
animales. Se trata de un sistema de interconexin de neuronas en una red
que colabora para producir un estmulo de salida. Algunos ejemplos de red
neuronal son:
El Perceptrn.
El Perceptrn multicapa.
Los Mapas Autoorganizados, tambin conocidos como redes de
Kohonen.
3
que tengan caractersticas comunes. Ejemplos:
Algoritmo K-means.
Algoritmo K-medoids.
Segn el objetivo del anlisis de los datos, los algoritmos utilizados se
clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):
* Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de
ellos) desconocido a priori, a partir de otros conocidos.
Algoritmos no supervisados (o del descubrimiento del conocimiento):
se descubren patrones y tendencias en los datos.
Ejemplos de uso de la minera de datos
Negocios
La minera de datos puede contribuir significativamente en las aplicaciones
de administracin empresarial basada en la relacin con el cliente. En lugar
de contactar con el cliente de forma indiscriminada a travs de un centro de
llamadas o enviando cartas, slo se contactar con aquellos que se perciba
que tienen una mayor probabilidad de responder positivamente a una
determinada oferta o promocin.
Por lo general, las empresas que emplean minera de datos ven
rpidamente el retorno de la inversin, pero tambin reconocen que el
nmero de modelos predictivos desarrollados puede crecer muy
rpidamente.
En lugar de crear modelos para predecir qu clientes pueden cambiar, la
empresa podra construir modelos separados para cada regin y/o para cada
tipo de cliente. Tambin puede querer determinar qu clientes van a ser
rentables durante una ventana de tiempo (una quincena, un mes, ...) y slo
enviar las ofertas a las personas que es probable que sean rentables. Para
mantener esta cantidad de modelos, es necesario gestionar las versiones de
cada modelo y pasar a una minera de datos lo ms automatizada posible.
3
Hbitos de compra en supermercados
El ejemplo clsico de aplicacin de la minera de datos tiene que ver con la
deteccin de hbitos de compra en supermercados. Un estudio muy citado
detect que los viernes haba una cantidad inusualmente elevada de clientes
que adquiran a la vez paales y cerveza. Se detect que se deba a que
dicho da solan acudir al supermercado padres jvenes cuya perspectiva
para el fin de semana consista en quedarse en casa cuidando de su hijo y
viendo la televisin con una cerveza en la mano. El supermercado pudo
incrementar sus ventas de cerveza colocndolas prximas a los paales para
fomentar las ventas compulsivas.
Patrones de fuga
Un ejemplo ms habitual es el de la deteccin de patrones de fuga. En
muchas industrias como la banca, las telecomunicaciones, etc. existe un
comprensible inters en detectar cuanto antes aquellos clientes que puedan
estar pensando en rescindir sus contratos para, posiblemente, pasarse a la
competencia. A estos clientes y en funcin de su valor se les podran
hacer ofertas personalizadas, ofrecer promociones especiales, etc., con el
objetivo ltimo de retenerlos. La minera de datos ayuda a determinar qu
clientes son los ms proclives a darse de baja estudiando sus patrones de
comportamiento y comparndolos con muestras de clientes que,
efectivamente, se dieron de baja en el pasado.
Fraudes
Un caso anlogo es el de la deteccin de transacciones de blanqueo de
dinero o de fraude en el uso de tarjetas de crdito o de servicios de telefona
mvil e, incluso, en la relacin de los contribuyentes con el fisco.
3
Generalmente, estas operaciones fraudulentas o ilegales suelen seguir
patrones caractersticos que permiten, con cierto grado de probabilidad,
distinguirlas de las legtimas y desarrollar as mecanismos para tomar
medidas rpidas frente a ellas.
Recursos humanos
La minera de datos tambin puede ser til para los departamentos de
recursos humanos en la identificacin de las caractersticas de sus
empleados de mayor xito. La informacin obtenida puede ayudar a la
contratacin de personal, centrndose en los esfuerzos de sus empleados y
los resultados obtenidos por stos. Adems, la ayuda ofrecida por las
aplicaciones para Direccin estratgica en una empresa se traducen en la
obtencin de ventajas a nivel corporativo, tales como mejorar el margen de
beneficios o compartir objetivos; y en la mejora de las decisiones operativas,
tales como desarrollo de planes de produccin o gestin de mano de obra.
Comportamiento en Internet
Tambin es un rea en boga el del anlisis del comportamiento de los
visitantes sobre todo, cuando son clientes potenciales en una pgina de
Internet. O la utilizacin de la informacin obtenida por medios ms o
menos legtimos sobre ellos para ofrecerles propaganda adaptada
especficamente a su perfil. O para, una vez que adquieren un determinado
producto, saber inmediatamente qu otro ofrecerle teniendo en cuenta la
informacin histrica disponible acerca de los clientes que han comprado el
primero.
Terrorismo
La minera de datos ha sido citada como el mtodo por el cual la unidad Able
3
Danger del Ejrcito de los EE.UU. haba identificado al lder de los atentados
del 11 de septiembre de 2001, Mohammed Atta, y a otros tres secuestradores
del "11-S" como posibles miembros de una clula de Al Qaeda que operan en
los EE.UU. ms de un ao antes del ataque. Se ha sugerido que tanto la
Agencia Central de Inteligencia y sus homloga canadiense, Servicio de
Inteligencia y Seguridad Canadiense, tambin han empleado este mtodo.[1]
Juegos
Desde comienzos de la dcada de 1960, con la disponibilidad de orculos
para determinados juegos combinacionales, tambin llamados finales de
juego de tablero (por ejemplo, para las tres en raya o en finales de ajedrez)
con cualquier configuracin de inicio, se ha abierto una nueva rea en la
minera de datos que consiste en la extraccin de estrategias utilizadas por
personas para estos orculos. Los planteamientos actuales sobre
reconocimiento de patrones, no parecen poder aplicarse con xito al
funcionamiento de estos orculos. En su lugar, la produccin de patrones
perspicaces se basa en una amplia experimentacin con bases de datos
sobre esos finales de juego, combinado con un estudio intensivo de los
propios finales de juego en problemas bien diseados y con conocimiento de
la tcnica (datos previos sobre el final del juego). Ejemplos notables de
investigadores que trabajan en este campo son Berlekamp en el juego de
puntos-y-cajas (o Timbiriche) y John Nunn en finales de ajedrez.
Ciencia e Ingeniera
En los ltimos aos la minera de datos se est utilizando ampliamente en
diversas reas relacionadas con la ciencia y la ingeniera. Algunos ejemplos
de aplicacin en estos campos son:
Gentica
3
En el estudio de la gentica humana, el objetivo principal es entender la
relacin cartogrfica entre las partes y la variacin individual en las
secuencias del ADN humano y la variabilidad en la susceptibilidad a las
enfermedades. En trminos ms llanos, se trata de saber cmo los cambios
en la secuencia de ADN de un individuo afectan al riesgo de desarrollar
enfermedades comunes (como por ejemplo el cncer). Esto es muy
importante para ayudar a mejorar el diagnstico, prevencin y tratamiento de
las enfermedades. La tcnica de minera de datos que se utiliza para realizar
esta tarea se conoce como "reduccin de dimensionalidad multifactorial".[2]
Ingeniera elctrica
En el mbito de la ingeniera elctrica, las tcnicas minera de datos han sido
ampliamente utilizadas para monitorizar las condiciones de las instalaciones
de alta tensin. La finalidad de esta monitorizacin es obtener informacin
valiosa sobre el estado del aislamiento de los equipos. Para la vigilancia de
las vibraciones o el anlisis de los cambios de carga en transformadores se
utilizan ciertas tcnicas para agrupacin de datos (clustering) tales como los
Mapas Auto-Organizativos (SOM, Self-organizing map). Estos mapas sirven
para detectar condiciones anormales y para estimar la naturaleza de dichas
anomalas.[3]
Anlisis de gases
Tambin se han aplicado tcnicas de minera de datos para el anlisis de
gases disueltos (DGA, Dissolved gas analysis) en transformadores elctricos.
El anlisis de gases disueltos se conoce desde hace mucho tiempo como
herramienta para diagnosticar transformadores. Los Mapas Auto-
Organizativos (SOM) se utilizan para analizar datos y determinar tendencias
que podran pasarse por alto utilizando las tcnicas clsicas DGA.
3
Herramientas de software
Existen muchas herramientas de software para el desarrollo de modelos de
minera de datos tanto libres como comerciales como, por ejemplo:
R
KNIME
SPSS Clementine (software)
SAS Enterprise Miner
STATISTICA Data Miner
RapidMiner
Weka
KXEN
Orange
3
datos que permite el desarrollo de modelos en un entorno visual. Est
construido bajo la plataforma Eclipse.
3
y mantiene.
StatSoft naci en 1984 de un acuerdo entre un grupo de profesores
universitarios y cientficos. Sus primeros productos fueron los programas
PsychoStat-2 y PsychoStat-3. Despus desarroll Statistical Supplement for
Lotus 1-2-3, un complemento para las hojas de clculo de Lotus. Finalmente,
en 1991, lanz al mercado la primera versin de STATISTICA para MS-DOS.
Actualmente compite con otros paquetes estadsticos tanto propietarios,
como SPSS, SAS, Matlab o Stata, como libres, como R.
3
Orange: es un programa informtico para realizar minera de datos y anlisis
predictivo desarrollado en la facultad de informtica de la Universidad de
Ljubljana. Consta de una serie de componentes desarrollados en C++ que
implementan algoritmos de minera de datos, as como operaciones de
preprocesamiento y representacin grfica de datos.
Los componentes de Orange pueden ser manipulados desde programas
desarrollados en Python o a travs de un entorno grfico.
Se distribuye bajo licencia GPL.
Datamart
3
Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se
caracteriza por disponer la estructura ptima de datos para analizar la
informacin al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento. Un datamart puede ser alimentado
desde los datos de un datawarehouse, o integrar por si mismo un compendio
de distintas fuentes de informacin.
3
De esta forma se pueden plantear dos tipos de datamarts:
3
lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que
tienen que soportar las BD de bancos o hipermercados diariamente).
3
aos.
Facilidad de creacin.
Dependencia de un Datamart
3
Seguridad: Para separar un subconjunto de datos de forma selectiva a
los que queremos permitir o restringir el acceso.
3
HERRAMIENTAS:
Vertica Data Mart:
Es un software muy poderoso y popular que es utilizado por miles de
compaas alrededor del mundo para procesar la informacin y crear
mercados de datos de la informacin encontrada en los almacenes de
datos. Vertica se utiliza para analizar la informacin de las empresas
de telecomunicaciones, los fabricantes de juegos de azar, consultores
financieros, los trabajadores sanitarios, e incluso en el comercio
minorista. Vertica incluso le permite crear una red e interactuar con
otros usuarios a travs de protocolos de abonado. Vertica lista de
caractersticas incluye una arquitectura escalable, compresin de
datos, sintonizacin automtica, la capacidad de operar en mltiples
sistemas, y le permite crear bases de datos basadas en columnas
basadas en sus necesidades y requerimientos especficos.
3
DataMartPC:
Se basa en situaciones del mundo real y experiencias y est
diseado para darle lo que necesita sin tener que lidiar con las
caractersticas adicionales que acaba de ponerse en el camino.
DataMartPC est disponible para su descarga gratuita en un ensayo
de demostracin basado en que incluye cinco ejemplos de soluciones.
Las cinco soluciones de muestra se incluyen las ventas de la tienda,
Departamento de Presupuestos, Control de Calidad, Gestin de
Proyectos y gestin de cuotas. Al utilizar y experimentar con estas
soluciones de la muestra, usted puede conseguir una comprensin de
cmo funciona DataMartPC y si el software es el adecuado para
usted. El software no es ms clase que la rodea, pero se desempea
bien incluso sin todas las campanas y silbatos que ofrecen otros
programas.
3
El concepto de cuadro de mando integral CMI (Balanced Scorecard
BSC) fue presentado en el nmero de Enero/febrero de 1992 de la revista
Harvard Business Review, con base en un trabajo realizado para una
empresa de semiconductores (La empresa en cuestin sera Analog Devices
Inc.). Sus autores, Robert Kaplan y David Norton, plantean que el CMI es un
sistema de administracin o sistema administrativo (Management system),
que va ms all de la perspectiva financiera con la que los gerentes
acostumbran evaluar la marcha de una empresa. Es un mtodo para medir
las actividades de una compaa en trminos de su visin y estrategia.
Proporciona a los administradores una mirada global de las prestaciones del
negocio.
3
internos de negocios y aprendizaje y crecimiento- para alinear iniciativas
individuales, organizacionales y trans-departamentales e identifica procesos
enteramente nuevos para cumplir con objetivos del cliente y accionistas. El
BSC es un robusto sistema de aprendizaje para probar, obtener
realimentacin y actualizar la estrategia de la organizacin. Provee el
sistema gerencial para que las compaas inviertan en el largo plazo -en
clientes, empleados, desarrollo de nuevos productos y sistemas ms bien
que en gerenciar la ltima lnea para bombear utilidades de corto plazo.
Cambia la manera en que se mide y gerencia un negocio".
3
de esta metodologa son que utilizan tanto indicadores financieros como no
financieros, y que los objetivos estratgicos se organizan en cuatro reas o
perspectivas: financiera, cliente, interna y aprendizaje/crecimiento.
Perspectiva Financiera
La necesidad de los objetivos financieros es indiscutible y primaria en toda
actividad comercial.
3
Perspectiva interna.
Este enfoque se refiere a los procesos de negocios internos. Los objetivos y
las mtricas basadas en esta perspectiva permiten a los ejecutivos saber
como est funcionando su negocio, y si sus productos o servicios estn
cumpliendo con los requerimientos del cliente.
3
reflejen adecuadamente cada una de las perspectivas mencionadas y cuyo
conjunto constituir el Cuadro de Mando Integral.
3
La fuerza de explicitar un modelo de negocio y traducirlo en
indicadores facilita el consenso en toda la empresa, no slo de la
direccin, sino tambin de cmo alcanzarlo.
Una vez el CMI est en marcha, se puede utilizar para comunicar los
planes de la empresa, aunar los esfuerzos en una sola direccin y
evitar la dispersin. En este caso, el CMI acta como un sistema de
control por excepcin.
3
Existe el riesgo de que lo mejor sea enemigo de lo bueno, de que el
CMI sea perfecto, pero desfasado e intil.
3
80, es cuando el Cuadro de Mando pasa a ser, adems de un concepto
prctico, una idea acadmica, ya que hasta entonces el entorno empresarial
no sufra grandes variaciones, la tendencia del mismo era estable, las
decisiones que se tomaban carecan de un alto nivel de riesgo. Para
entonces, los principios bsicos sobre los que se sostena el Cuadro de
Mando ya estaban estructurados, es decir, se fijaban unos fines en la
entidad, cada uno de stos eran llevados a cabo mediante la definicin de
unas variables clave, y el control era realizado a travs de indicadores.
3
A la hora de disponer una relacin de Cuadros de Mando, muchos son
los criterios que se pueden entremezclar, siendo los que a continuacin
se describen, algunos de los ms indicativos, para clasificar tales
herramientas de apoyo a la toma de decisiones.
El horizonte temporal.
Los niveles de responsabilidad y/o delegacin.
Las reas o departamentos especficos.
Otras clasificaciones:
La situacin econmica.
Los sectores econmicos.
Otros sistemas de informacin.
3
Ejemplo 1 Cmo planificar una nueva estrategia sobre venta de financieros
Situacin
Una entidad bancaria deseaba embarcarse en una estrategia con la que
lograr un aumento geomtrico de sus beneficios a travs de la venta de sus
productos financieros.
Este banco se enfrentaba a dos problemas:
- Una dependencia excesiva de un nico producto (depsito);
- Una estructura de coste que haca no rentable el trabajar con el 80% de sus
clientes a las tasas de inters imperantes.
Para resolverlos, el banco determin dos lneas de actuacin:
1. Crecimiento de los ingresos: ampliar las fuentes de ingresos con productos
adicionales para los clientes existentes.
2. Productividad: mejorar la eficiencia operativa para reciclar clientes no
rentables a otros canales con ms beneficios.
3
Estas dos lneas de actuacin, tomadas como estrategias, fueron
traducidas en objetivos e indicadores de las cuatro perspectivas desde el
desarrollo de un
3
limitaban prcticamente a insertar publicidad corporativa en los medios. Se
descubri que el personal slo pasaba el 10% de su tiempo de trabajo con
los
clientes. Haba que formarlos para que desarrollaran una capacidad de
atencin al cliente y de asesoramiento sobre los nuevos productos. Dos
indicadores de este nuevo procesos de ventas fue incluido en el Cuadro de
Mando: el nmero de productos vendidos a un hogar y las horas dedicadas a
los clientes.
Los objetivos internos condujeron de forma natural a un conjunto final de
factores sobre la mejora de la eficacia de los empleados que revel la
necesidad de aumentar su formacin. Tambin se tuvieron que agilizar el
acceso a la informacin sobre los nuevos productos y la operatividad del
proceso de adquisicin de productos.
Por ltimo, se vincularon los incentivos de los empleados al cumplimiento
de
estos nuevos objetivos y as fomentar la nueva conducta de ventas. En
cuanto a indicadores, estos se tradujeron en objetivos como el promedio de
ventas por vendedor; las actitudes de la plantilla segn una encuesta de
satisfaccin del empleado; el aumento de la habilidad del empleado segn
encuestas internas tras los cursos de formacin y, al tiempo, segn
entrevistas al propio personal y de acuerdo al sistema de 360; el acceso y la
disponibilidad de las herramientas y datos de la tecnologa de la informacin;
y, por ltimo, el porcentaje de objetivos personales alcanzados.
Nuevamente, cada objetivo cifrado en sus respectivos indicadores, llev a
la
identificacin de nuevas necesidades tales como el modo de formar a los
empleados y a quienes seleccionar para cualificar ante las nuevas
exigencias.
3
En el caso de esta entidad bancaria, haba que redisear la operativa del
departamento de recursos humanos. La empresa no estaba preparada para
decidir cules seran las capacidades que haba que potenciar y a quienes
haba que hacerlo.
Para ello, se entrevistaron a los empleados y se determinaron los perfiles
competenciales de cada trabajador. Tambin se fijaron las necesidades
formativas de cada uno y se dise el plan y programa de formacin de
acuerdo a la situacin de cada persona.
En cuanto al rediseo de este proceso de desarrollo del personal, se fijaron
una serie de indicadores de causa y de efecto que cubrieran la efectividad de
los objetivos estratgicos necesarios para cumplir con la estrategia definida
al
principio de toda la elaboracin del Cuadro de Mando Integral.
3
principio, puede parecer que el anlisis de datos es un proceso sencillo, y
fcil de conseguir mediante una aplicacin hecha a medida o un ERP
sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de
una serie de informes predefinidos en los que presentan la informacin de
manera esttica, pero no permiten profundizar en los datos, navegar entre
ellos, manejarlos desde distintas perspectivas... etc.
3
futuro, anlisis de tendencias, anlisis prospectivo, etc. Un DSS da soporte a
las personas que tienen que tomar decisiones en cualquier nivel de gestin,
ya sean individuos o grupos, tanto en situaciones semiestructuradas como en
no estructuradas, a travs de la combinacin del juicio humano e informacin
objetiva:
3
Systems), tambien llamados Sistemas de Informacin Administrativa
(AIS) dan soporte a un espectro ms amplio de tareas
organizacionales, encontrndose a medio camino entre un DSS
tradicional y una aplicacin CRM/ERP implantada en la misma
compaa.
3
Diferencia con otras herramientas de Business Intelligence:
3
distingue entre:
3
enfatizan el acceso y la manipulacin de series temporales de datos
internos de la empresa y, a veces, tambin de datos externos.
DSS dirigidos por documentos.- Gestionan, recuperan y manipulan
informacin no estructurada en una variedad de formatos electrnicos.
DSS dirigidos por conocimiento.- Proporcionan experiencia acumulada
en forma de hechos, normas, procedimientos, o en estructuras
similares especializados para la resolucin de problemas.
3.- Utilizando el mbito como criterio, Power sugiere esta otra clasificacin:
3
bsqueda-objetivo).
El Sistema Gestor y Generador de Dilogos.- Se trata de la interfaz de
usuario; es, por supuesto, el componente que permite a un usuario
interactuar con el sistema.
La interfaz de usuario.
La base de datos.
Las herramientas analticas y de modelado.
La red y arquitectura del DSS.
3
El sistema gestor de datos.
El sistema gestor de modelos.
El motor de conocimiento.
La interfaz de usuario.
Los usuarios.
3
El Enfoque de Desarrollo.- El enfoque basado en el desarrollo de un
DSS deber ser muy iterativo. Esto permitir que la aplicacin sea
cambiada y rediseada en diversos intervalos. El problema inicial se
utiliza para disear el sistema y a continuacin, ste es probado y
revisado para garantizar que se alcanza el resultado deseado.
Caractersticas de un EIS:
Un buen sistema de informacin para ejecutivos presenta informacin en
forma de grficos, columnas y textos.
La capacidad para hacer grficos se necesita para facilitar en el anlisis
rpido de las condiciones y tendencias corrientes; las tablas presentan mayor
detalle y permiten el anlisis de variaciones; la informacin de textos aade
3
interpretaciones y detalles de los datos.
3
Se supone que los EIS estn hechos a la medida para ser usados por
ejecutivos de alto nivel; sin embargo, pocos son los que los usan.
3
los usuarios y generalmente giran en torno de estructuras basadas en los
hechos.
Para que un EIS tenga xito es necesario que cumpla con los siguientes
factores:
1. Que se vea bien.
2. Que sea relevante.
3. Que sea rpido.
4. Que la informacin est disponible y actualizada.
3
b) Falta de compromiso de los usuarios.
c) Falta de claridad del propsito del EIS en el ejecutivo patrocinador.
d) No proveer los medios a los ejecutivos parta comunicar ideas.
e) Usuarios no capaces de comunicar decisiones.
f) Resistencia organizacional.
Beneficios de un EIS:
Los sistemas de Informacin para Ejecutivos tienen un sin fin de beneficios
que a la larga ayudan a la organizacin, los siguientes son los principales:
1. Informacin a tiempo: acceso ms rpido, informacin ms exacta,
relevante y concisa
2. Sensibilidad al medio: Mejor acceso a la informacin, an de datos
externos, mejor sensibilidad al medio, y ms informacin competitiva
3. Efectividad de ejecutivos: Mejora en la comunicacin, desempeo
mejorado, ahorro en tiempo de ejecucin, mejor presentacin de los
datos
4. Cumplimiento de objetivos estratgicos: Aumento en radio de control,
planeacin mejorada, mejor toma de decisiones, mejor entendimiento
de problemas, mejor desarrollo de alternativas
5. Economa: Ahorro en costos, menos papeleo, mayor respuesta al
cambio en las necesidades del cliente, apoyo de reduccin en la
organizacin
3
tradicionales Sistemas Transaccionales no necesariamente funcionan en un
100% de manera similar durante el desarrollo de un EIS.
Es importante tomar en cuenta los tres pasos a planificar para construir un
sistema EIS, los cuales son:
Adquisicin de datos :
1. Modelizacin
2. Presentacin
3
Impacto del EIS en el proceso de planeacin y control de la
organizacin:
Los sistemas de informacin ejecutivos (EIS) han provisto generalmente un
nivel ms alto de consolidacin y una visin multidimensional de los datos,
dado que los ejecutivos de alto nivel necesitan ms de la habilidad de hacer
fetas y dados de esos datos que de perforar hacia abajo para ver los detalles
de los datos.
Los EIS contribuyen en forma importante a redisear y reestructurar los
procesos de planeacin y control de una organizacin.
Las principales mejoras que pueden lograrse al utilizar este tipo de
sistemas son, entre otras mejora en los sistemas actuales de reportes
corporativos o divisionales, a travs de:
a) Cambios en el mtodo de recoleccin de informacin, lo cual permite que
la Direccin General no se involucre en la obtencin de los datos en forma
especfica, sino que dirija ms su atencin al anlisis de la informacin.
b)Mejoras en la integridad de los datos.
c)Acelerar el proceso de obtencin la informacin.
d)Cambios en la forma de presentar la informacin, utilizando tcnica nuevas
de presentacin como grficas, histogramas, dibujos y animaciones.
e)Rediseo de los sistemas actuales de reportes, a travs de los cuales se
pone atencin en los factores crticos para mejorar el negocio.
3
gerentes de una empresa. Esto es lamentable porque el proceso de la
administracin estratgica debe ser un proceso de todos para que tenga
xito.
Por tanto, el software para la planificacin estratgica debe ser sencillo y
simple. La sencillez permite la amplia participacin de todos los
administradores de una empresa y la participacin en esencial para la buena
aplicacin de la estrategia.
En la siguiente tabla se muestra una lista de los principales productos y de
sus vendedores:
3
de la computacin de hoy es el desarrollo de las aplicaciones Intranet.
Tendencias futuras:
En el pasado, la falta de aplicaciones adecuadas para apoyar el concepto
era otra de las grandes limitantes, pero actualmente las soluciones presentes
en el mercado tienen la capacidad de integrarse fcilmente con otras
aplicaciones. Existen sistemas que pueden manejar informacin tanto interna
como externa a la organizacin.
Las nuevas soluciones son ms flexibles a las necesidades de los usuarios
y generalmente giran en torno de estructuras basadas en los hechos y no
solamente basada en los libros contables. Debido a que estos sistemas
financieros dependen del poder de la computacin para manejar los
elementos individuales de la informacin y procesar las transacciones,
permiten que los ejecutivos desempeen un rol ms estratgico en la
organizacin.
La tecnologa de los EIS est evolucionando muy rpido, y es muy
probable que en el futuro los sistemas sean diferentes de los que se usan
actualmente. Algunos puntos que pueden anticiparse son:
1. Una mejor integracin con otras aplicaciones.
2. Mejor software comercial para el desarrollo de EIS.
3. Mejores interfases sistema-ejecutivo.
Puede decirse que los EIS, adems de tablas y grficas, incluirn voz,
video e imgenes, es decir, integrarn la tecnologa de multimedia en sus
desarrollo.
Durante la toma de decisiones y solucin de problemas a veces no se
reconoce que tambin interviene el punto de vista de la persona que ha
detectado el problema, por lo tanto hay situaciones en las que hay que
decidir o resolver algo, siempre y cuando a la persona le "importen " y por lo
cual hace juicios sobre esta.
3
CONCLUSIONES
3
los sistemas de soporte de decisin convencionales. Ms que simplemente
proveer datos a los usuarios finales a travs de software de consultas y
reportes, el server de Anlisis Avanzado aplica los modelos de negocios del
usuario directamente al warehouse y devuelve un anlisis proactivo de la
informacin ms relevante. Estos resultados mejoran los metadatos en el
server OLAP proveyendo una estrato de metadatos que representa una vista
fraccionada de los datos. Generadores de reportes, visualizadores y otras
herramientas de anlisis pueden ser aplicadas para planificar futuras
acciones y confirmar el impacto de esos planes.
3
Executive Information System o EIS: Aplicaciones de alto nivel que
pretenden, mediante el acceso a las diferentes bases de datos de una
empresa, ofrecer a sus directivos los elementos clave para que puedan
tomar decisiones sobre la marcha de sus negocios. Generalmente el
directivo accede a pantallas grficas en las que se resumen los elementos
ms importantes que debe tener en cuenta.
REFERENCIAS BIBLIOGRAFICAS
http://www.gestiopolis.com/recursos2/documentos/fulldocs/ger/sisinfoe
j.htm
www.sinnexus.com/business.../datamart.asp
http://www.sinnexus.com/business_intelligence/sistemas_soporte_deci
siones.aspx
www.sinnexus.com/business.../olap_vs_oltp.aspx -
www.sinnexus.com/.../cuadro_mando_integral.aspx -
3
es.wikipedia.org/wiki/Data_mart -
http://es.wikipedia.org/wiki/Sistemas_de_soporte_a_decisiones
es.wikipedia.org/wiki/Cuadro_de_mando_integral