You are on page 1of 84

Repblica Bolivariana de Venezuela

Ministerio del Poder Popular para la Educacin Superior


Universidad Nacional Experimental Simn Rodrguez
Carrera: Administracin Mencin: Informtica
Seccin: E
Materia: Sistemas de Informacin Gerencial
Facilitador: Daniel Carneiro.

HERRAMIENTAS UTILIZADAS AL MANEJO DE ALMACENAMIENTO DE


DATOS PARA MEJORAR EL DESARROLLO DE LOS
SISTEMAS DE INFORMACION GERENCIAL

Integrantes:
Alvarez, Carlos C.I. 15.758.516
Diaz, Angel C.I. 10.007.835
Flores, Emely C.I. 15.403.257
Flores, Jusmila C.I. 12.470.467
Hernndez, Hazel C.I. 10.799.550
Simn, Giovana C.I. 22.906.025

Caracas, Mayo de 2010


INDICE

CONTENIDO PAG

Introduccin 3
Data Warehouse 4
Minera de Datos 28
Datamart 45
Cuadro de Manejo Integral 52
Sistemas de Soporte a la Decisin (DSS) 65
Sistemas de Informacin para Ejecutivos 74
Conclusiones 84
Herramientas Bibliogrficas 86
INTRODUCCIN

Las Herramientas de Ayuda al Desarrollo de Sistemas de Informacin,


surgieron para intentar dar solucin a los problemas inherentes a los
proyectos de generacin de aplicaciones informticas: plazos y presupuestos
incumplidos, insatisfaccin del usuario, escasa productividad y baja calidad
de los desarrollos.
Algunas de estas herramientas se dirigen principalmente a mejorar la
calidad, como es el caso de las siguientes herramientas :
1. Datawarehouse
2. Datamining
3. Datamart
4. Cuadro de Manejo Integral
5. Sistema de Soporte a la Decisin (DSS)
6. Sistema de Informacin para Ejecutivos ( EIS)
En el presente trabajo se describen las principales herramientas de ayuda
al desarrollo de Sistemas de Informacin, existentes en la actualidad,
Tambin se describe su funcionalidad y las caractersticas ms relevantes,
con la finalidad de ayudar en la eleccin de la herramienta adecuada a cada
caso.

Data WareHouse

3
Es un repositorio de datos de muy fcil acceso, alimentado de numerosas
fuentes, transformadas en grupos de informacin sobre temas especficos de
negocios, para permitir nuevas consultas, anlisis, reporteador y decisiones.
Los objetivos fundamentales de un Data WareHouse son:
Hace que la informacin de la organizacin sea accesible: los
contenidos del Data WareHouse son entendibles y navegables, y el
acceso a ellos son caracterizado por el rpido desempeo. Estos
requerimientos no tienen fronteras y tampoco limites fijos. Cuando
hablamos de entendible significa, que los niveles de la informacin
sean correctos y obvios. Y Navegables significa el reconocer el destino
en la pantalla y llegar a donde queramos con solo un clic. Rpido
desempeo significa, cero tiempo de espera. Todo lo dems es un
compromiso y por consiguiente algo que queremos mejorar.
Hacer que la informacin de la organizacin sea consistente: la
informacin de una parte de la organizacin puede hacerse coincidir
con la informacin de la otra parte de la organizacin. Si dos medidas
de la organizacin tienen el mismo nombre, entonces deben significar
la misma cosa. Y a la inversa, si dos medidas no significan la misma
cosa, entonces son etiquetados diferentes. Informacin consistente
significa, informacin de alta calidad. Significa que toda la informacin
es contabilizada y completada. Todo lo dems es un compromiso y por
consiguiente algo que queremos mejorar.
Es informacin adaptable y elstica: el Data WareHouse esta diseado
para cambios continuos. Cuando se le hacen nuevas preguntas al
Data WareHouse, los datos existentes y las tecnologas no cambian ni
se corrompen. Cuando se agregan datos nuevos al Data WareHouse,
los datos existentes y las tecnologas tampoco cambian ni se

3
corrompen. El diseo de Data Marts separados que hacen al Data
WareHouse, deben ser distribuidos e incrementados. Todo lo dems
es un compromiso y por consiguiente algo que queremos mejorar.
Es un seguro baluarte que protege los valores de la informacin: el
Data WareHouse no solamente controla el acceso efectivo a los datos,
si no que da a los dueos de la informacin gran visibilidad en el uso y
abusos de los datos, an despus de haber dejado el Data
WareHouse. Todo lo dems es un compromiso y por consiguiente algo
que queremos mejorar.
Es la fundacin de la toma de decisiones: el Data WareHouse tiene
los datos correctos para soportar la toma de decisiones. Solo hay
una salida verdadera del Data WareHouse: las decisiones que son
hechas despus de que el Data WareHouse haya presentado las
evidencias. La original etiqueta que preside el Data WareHouse sigue
siendo la mejor descripcin de lo que queremos construir: un sistema
de soporte a las decisiones.

Que es lo que le preocupa a los ejecutivos?


Se tienen montaas de datos en la compaa, pero no podemos llegar a
ellos adecuadamente. Nada enloquece ms a los ejecutivos que dos
personas presentando el mismo resultado de operacin pero con diferentes
nmeros y los ejecutivos lo que buscan es ver la informacin pero desde
diferentes ngulos, mostrando nicamente lo que es importante para tomar
una decisin en la empresa, finalmente los ejecutivos saben que hay datos
que nunca sern confiables, por lo que prefieren que se eviten en los
reportes ejecutivos.
Uno de los valores ms importantes de una organizacin es la informacin.
Estos valores normalmente son guardados por la organizacin de dos

3
formas:
Los sistemas operacionales de registros
Y el Data Warehouse
Crudamente hablando, los sistema operacionales de registros es donde los
datos son depositados y el Data WareHouse es de donde se extraen eso
datos.
Un Data Warehouse o Depsito de Datos es una coleccin de datos
orientado a temas, integrado, no voltil, de tiempo variante, que se usa para
el soporte del proceso de toma de decisiones gerenciales.
Se puede caracterizar un data warehouse haciendo un contraste de cmo
los datos de un negocio almacenados en un data warehouse, difieren de los
datos operacionales usados por las aplicaciones de produccin.

Caractersticas de un Data Warehouse


Entre las principales se tiene:
Orientado a Temas
Una primera caracterstica del data warehouse es que la informacin se
clasifica en base a los aspectos que son de inters para la empresa. Siendo
as, los datos tomados estn en contraste con los clsicos procesos
orientados a las aplicaciones.

3
En la Figura N 1 se muestra el contraste entre los dos tipos de
orientaciones.
El ambiente operacional se disea alrededor de las aplicaciones y funciones
tales como prstamos, ahorros, tarjeta bancaria y depsitos para una
institucin financiera. Por ejemplo, una aplicacin de ingreso de rdenes
puede acceder a los datos sobre clientes, productos y cuentas. La base de
datos combina estos elementos en una estructura que acomoda las
necesidades de la aplicacin.
En el ambiente data warehousing se organiza alrededor de sujetos tales
como cliente, vendedor, producto y actividad. Por ejemplo, para un
fabricante, stos pueden ser clientes, productos, proveedores y vendedores.
Para una universidad pueden ser estudiantes, clases y profesores. Para un
hospital pueden ser pacientes, personal mdico, medicamentos, etc.
La alineacin alrededor de las reas de los temas afecta el diseo y la
implementacin de los datos encontrados en el data warehouse. Las
principales reas de los temas influyen en la parte ms importante de la
estructura clave.

Las aplicaciones estn relacionadas con el diseo de la base de datos y


del proceso. En data warehousing se enfoca el modelamiento de datos y el
diseo de la base de datos. El diseo del proceso (en su forma clsica) no es
separado de este ambiente.
Las diferencias entre la orientacin de procesos y funciones de las
aplicaciones y la orientacin a temas, radican en el contenido de la data a

3
escala detallada. En el data warehouse se excluye la informacin que no
ser usada por el proceso de sistemas de soporte de decisiones, mientras
que la informacin de las orientadas a las aplicaciones, contiene datos para
satisfacer de inmediato los requerimientos funcionales y de proceso, que
pueden ser usados o no por el analista de soporte de decisiones.
Otra diferencia importante est en la interrelacin de la informacin. Los
datos operacionales mantienen una relacin continua entre dos o ms tablas
basadas en una regla comercial que est vigente. Las del data warehouse
miden un espectro de tiempo y las relaciones encontradas en el data
warehouse son muchas. Muchas de las reglas comerciales (y sus
correspondientes relaciones de datos) se representan en el data warehouse,
entre dos o ms tablas.

Integracin
El aspecto ms importante del ambiente data warehousing es que la
informacin encontrada al interior est siempre integrada.
La integracin de datos se muestra de muchas maneras: en convenciones
de nombres consistentes, en la medida uniforme de variables, en la
codificacin de estructuras consistentes, en atributos fsicos de los datos
consistentes, fuentes mltiples y otros.
El contraste de la integracin encontrada en el data warehouse con la
carencia de integracin del ambiente de aplicaciones, se muestran en la
Figura N 2, con diferencias bien marcadas.
A travs de los aos, los diseadores de las diferentes aplicaciones han
tomado sus propias decisiones sobre cmo se debera construir una
aplicacin. Los estilos y diseos personalizados se muestran de muchas
maneras.

3
Se diferencian en la codificacin, en las estructuras claves, en sus
caractersticas fsicas, en las convenciones de nombramiento y otros. La
capacidad colectiva de muchos de los diseadores de aplicaciones, para
crear aplicaciones inconsistentes, es fabulosa. La Figura N 2 mencionada,
muestra algunas de las diferencias ms importantes en las formas en que se
disean las aplicaciones.

Codificacin. Los diseadores de aplicaciones codifican el campo GENERO


en varias formas. Un diseador representa GENERO como una "M" y una
"F", otros como un "1" y un "0", otros como una "X" y una "Y" e inclusive,
como "masculino" y "femenino".
No importa mucho cmo el GENERO llega al data warehouse.
Probablemente "M" y "F" sean tan buenas como cualquier otra
representacin. Lo importante es que sea de cualquier fuente de donde
venga, el GENERO debe llegar al data warehouse en un estado integrado
uniforme.
Por lo tanto, cuando el GENERO se carga en el data warehouse desde una
aplicacin, donde ha sido representado en formato "M" y "F", los datos deben
convertirse al formato del data warehouse.

Medida de atributos. Los diseadores de aplicaciones miden las unidades


de medida de las tuberas en una variedad de formas. Un diseador
almacena los datos de tuberas en centmetros, otros en pulgadas, otros en
millones de pies cbicos por segundo y otros en yardas.
Al dar medidas a los atributos, la transformacin traduce las diversas
unidades de medida usadas en las diferentes bases de datos para
transformarlas en una medida estndar comn.

3
Cualquiera que sea la fuente, cuando la informacin de la tubera llegue al
data warehouse necesitar ser medida de la misma manera.

Convenciones de Nombramiento. El mismo elemento es frecuentemente


referido por nombres diferentes en las diversas aplicaciones. El proceso de
transformacin asegura que se use preferentemente el nombre de usuario.

Fuentes Mltiples. El mismo elemento puede derivarse desde fuentes


mltiples. En este caso, el proceso de transformacin debe asegurar que la
fuente apropiada sea usada, documentada y movida al depsito.
Tal como se muestra en la figura, los puntos de integracin afectan casi
todos los aspectos de diseo - las caractersticas fsicas de los datos, la
disyuntiva de tener ms de una de fuente de datos, el problema de
estndares de denominacin inconsistentes, formatos de fecha
inconsistentes y otros.
Cualquiera que sea la forma del diseo, el resultado es el mismo - la
informacin necesita ser almacenada en el data warehouse en un modelo
globalmente aceptable y singular, aun cuando los sistemas operacionales
subyacentes almacenen los datos de manera diferente.
Cuando el analista de sistema de soporte de decisiones observe el data
warehouse, su enfoque deber estar en el uso de los datos que se encuentre
en el depsito, antes que preguntarse sobre la confiabilidad o consistencia
de los datos.

3
De Tiempo Variante
Toda la informacin del data warehouse es requerida en algn momento.
Esta caracterstica bsica de los datos en un depsito, es muy diferente de la
informacin encontrada en el ambiente operacional. En stos, la informacin
se requiere al momento de acceder. En otras palabras, en el ambiente
operacional, cuando usted accede a una unidad de informacin, usted
espera que los valores requeridos se obtengan a partir del momento de
acceso.
Como la informacin en el data warehouse es solicitada en cualquier
momento (es decir, no "ahora mismo"), los datos encontrados en el depsito
se llaman de "tiempo variante".
Los datos histricos son de poco uso en el procesamiento operacional. La
informacin del depsito por el contraste, debe incluir los datos histricos
para usarse en la identificacin y evaluacin de tendencias.

3
El tiempo variante se muestra de varias maneras:
1. La ms simple es que la informacin representa los datos sobre un
horizonte largo de tiempo - desde cinco a diez aos. El horizonte de tiempo
representado para el ambiente operacional es mucho ms corto desde
valores actuales hasta sesenta a noventa das.
Las aplicaciones que tienen un buen rendimiento y estn disponibles para
el procesamiento de transacciones, deben llevar una cantidad mnima de
datos si tienen cualquier grado de flexibilidad. Por ello, las aplicaciones
operacionales tienen un corto horizonte de tiempo, debido al diseo de
aplicaciones rgidas.
2. La segunda manera en la que se muestra el tiempo variante en el data
warehouse est en la estructura clave. Cada estructura clave en el data
warehouse contiene, implcita o explcitamente, un elemento de tiempo como
da, semana, mes, etc.

3
El elemento de tiempo est casi siempre al pie de la clave concatenada,
encontrada en el data warehouse. En ocasiones, el elemento de tiempo
existir implcitamente, como el caso en que un archivo completo se duplica
al final del mes, o al cuarto.
3. La tercera manera en que aparece el tiempo variante es cuando la
informacin del data warehouse, una vez registrada correctamente, no puede
ser actualizada. La informacin del data warehouse es, para todos los
propsitos prcticos, una serie larga de "snapshots" (vistas instantneas).
Por supuesto, si los snapshots de los datos se han tomado
incorrectamente, entonces pueden ser cambiados. Asumiendo que los
snapshots se han tomado adecuadamente, ellos no son alterados una vez
hechos. En algunos casos puede ser no tico, e incluso ilegal, alterar los
snapshots en el data warehouse. Los datos operacionales, siendo requeridos
a partir del momento de acceso, pueden actualizarse de acuerdo a la
necesidad.

No Voltil
La informacin es til slo cuando es estable. Los datos operacionales
cambian sobre una base momento a momento. La perspectiva ms grande,
esencial para el anlisis y la toma de decisiones, requiere una base de datos
estable.
En la Figura N 4 se muestra que la actualizacin (insertar, borrar y
modificar), se hace regularmente en el ambiente operacional sobre una base
de registro por registro. Pero la manipulacin bsica de los datos que ocurre
en el data warehouse es mucho ms simple. Hay dos nicos tipos de
operaciones: la carga inicial de datos y el acceso a los mismos. No hay
actualizacin de datos (en el sentido general de actualizacin) en el depsito,
como una parte normal de procesamiento.

3
Hay algunas consecuencias muy importantes de esta diferencia bsica,
entre el procesamiento operacional y del data warehouse. En el nivel de
diseo, la necesidad de ser precavido para actualizar las anomalas no es un
factor en el data warehouse, ya que no se hace la actualizacin de datos.
Esto significa que en el nivel fsico de diseo, se pueden tomar libertades
para optimizar el acceso a los datos, particularmente al usar la normalizacin
y desnormalizacin fsica.
Otra consecuencia de la simplicidad de la operacin del data warehouse
est en la tecnologa subyacente, utilizada para correr los datos en el
depsito. Teniendo que soportar la actualizacin de registro por registro en
modo on-line (como es frecuente en el caso del procesamiento operacional)
requiere que la tecnologa tenga un fundamento muy complejo debajo de una
fachada de simplicidad.

La tecnologa permite realizar copias de seguridad y recuperacin,


transacciones e integridad de los datos y la deteccin y solucin al
estancamiento que es ms complejo. En el data warehouse no es necesario
el procesamiento.
La fuente de casi toda la informacin del data warehouse es el ambiente
operacional. A simple vista, se puede pensar que hay redundancia masiva de
datos entre los dos ambientes. Desde luego, la primera impresin de muchas
personas se centra en la gran redundancia de datos, entre el ambiente

3
operacional y el ambiente de data warehouse. Dicho razonamiento es
superficial y demuestra una carencia de entendimiento con respecto a qu
ocurre en el data warehouse. De hecho, hay una mnima redundancia de
datos entre ambos ambientes. Se debe considerar lo siguiente:
Los datos se filtran cuando pasan desde el ambiente operacional al de
depsito. Existe mucha data que nunca sale del ambiente operacional. Slo
los datos que realmente se necesitan ingresarn al ambiente de data
warehouse. El horizonte de tiempo de los datos es muy diferente de un
ambiente al otro. La informacin en el ambiente operacional es ms reciente
con respecto a la del data warehouse. Desde la perspectiva de los horizontes
de tiempo nicos, hay poca superposicin entre los ambientes operacional y
de data warehouse.
El data warehouse contiene un resumen de la informacin que no se
encuentra en el ambiente operacional.
Los datos experimentan una transformacin fundamental cuando pasa al
data warehouse. La mayor parte de los datos se alteran significativamente al
ser seleccionados y movidos al data warehouse. Dicho de otra manera, la
mayora de los datos se alteran fsica y radicalmente cuando se mueven al
depsito. No es la integracin.
En vista de estos factores, la redundancia de datos entre los dos ambientes
es una ocurrencia rara, que resulta en menos de 1%.

Estructura del Data Warehouse


Los data warehouses tienen una estructura distinta. Hay niveles diferentes
de esquematizacin y detalle que delimitan el data warehouse. La estructura
de un data warehouse se muestra en la Figura N 5.
En la figura, se muestran los diferentes componentes del data warehouse y
son:

3
Detalle de datos actuales. En gran parte, el inters ms importante radica
en el detalle de los datos actuales, debido a que:
Refleja las ocurrencias ms recientes, las cuales son de gran inters
Es voluminoso, ya que se almacena al ms bajo nivel de granularidad.
Casi siempre se almacena en disco, el cual es de fcil acceso, aunque
su administracin sea costosa y compleja.

Detalle de datos antiguos. La data antigua es aquella que se almacena


sobre alguna forma de almacenamiento masivo. No es frecuentemente su
acceso y se almacena a un nivel de detalle, consistente con los datos
detallados actuales.
Mientras no sea prioritario el almacenamiento en un medio de almacenaje
alterno, a causa del gran volumen de datos unido al acceso no frecuente de
los mismos, es poco usual utilizar el disco como medio de almacenamiento.

Datos ligeramente resumidos. La data ligeramente resumida es aquella


que proviene desde un bajo nivel de detalle encontrado al nivel de detalle
actual. Este nivel del data warehouse casi siempre se almacena en disco.
Los puntos en los que se basa el diseador para construirlo son:
Que la unidad de tiempo se encuentre sobre la esquematizacin
hecha.
Qu contenidos (atributos) tendr la data ligeramente resumida.

Datos completamente resumidos. El siguiente nivel de datos encontrado


en el data warehouse es el de los datos completamente resumidos. Estos
datos son compactos y fcilmente accesibles.

3
A veces se encuentra en el ambiente de data warehouse y en otros, fuera
del lmite de la tecnologa que ampara al data warehouse. (De todos modos,
los datos

Metadata. El componente final del data warehouse es el de la metadata. De


muchas maneras la metadata se sita en una dimensin diferente al de otros
datos del data warehouse, debido a que su contenido no es tomado
directamente desde el ambiente operacional.
La metadata juega un rol especial y muy importante en el data warehouse y
es usada como:
Un directorio para ayudar al analista a ubicar los contenidos del data
warehouse.
Una gua para la trazabilidad de los datos, de cmo se transforma, del
ambiente operacional al de data warehouse.
Una gua de los algoritmos usados para la esquematizacin entre el
detalle de datos actual, con los datos ligeramente resumidos y stos,
con los datos completamente resumidos, etc.
La metadata juega un papel mucho ms importante en un ambiente data
warehousing que en un operacional clsico.

3
A fin de recordar los diferentes niveles de los datos encontrados en el data
warehouse, considere el ejemplo mostrado en la Figura N 6. El detalle de
ventas antiguas son las que se encuentran antes de 1992. Todos los detalles
de ventas desde 1982 (o cuando el diseador inici la coleccin de los
archivos) son almacenados en el nivel de detalle de datos ms antiguo.
El detalle actual contiene informacin desde 1992 a 1993 (suponiendo que
1993 es el ao actual). En general, el detalle de ventas no se ubica en el
nivel de detalle actual hasta que haya pasado, por lo menos, veinticuatro
horas desde que la informacin de ventas llegue a estar disponible en el
ambiente operacional.

En otras palabras, habra un retraso de tiempo de por lo menos veinticuatro


horas, entre el tiempo en que en el ambiente operacional se haya hecho un
nuevo ingreso de la venta y el momento cuando la informacin de la venta
haya ingresado al data warehouse.
El detalle de las ventas son resumidas semanalmente por lnea de
subproducto y por regin, para producir un almacenamiento de datos
ligeramente resumidos.
El detalle de ventas semanal es adicionalmente resumido en forma
mensual, segn una gama de lneas, para producir los datos completamente
resumidos.
La metadata contiene (al menos):
La estructura de los datos

3
Los algoritmos usados para la esquematizacin
La trazabilidad desde el ambiente operacional al data warehouse

La informacin adicional que no se esquematiza es almacenada en el data


warehouse. En muchas ocasiones, all se har el anlisis y se producir un
tipo u otro de resumen. El nico tipo de esquematizacin que se almacena
permanentemente en el data warehouse, es el de los datos que son usados
frecuentemente. En otras palabras, si un analista produce un resumen que
tiene una probabilidad muy baja de ser usado nuevamente, entonces la
esquematizacin no es almacenada en el data warehouse.
Los procesos bsicos del Data WareHouse (ETL)
Extraccin: este es el primer paso de obtener la informacin hacia el
ambiente del Data WareHouse.
Transformacin: una vez que la informacin es extrada hacia el rea
de trafico de datos, hay posibles paso de transformacin como;
limpieza de la informacin, tirar la basura que no nos sirve,
seleccionar nicamente los campos necesarios para el Data
WareHouse, combinar fuentes de datos, hacindolas coincidir por los
valores de las llaves, creando nuevas llaves para cada registro de una
dimensin.
Carga: al final del proceso de transformacin, los datos estn en forma
para ser cargados.

3
Transformacin de Datos
Uno de los desafos de cualquier implementacin de data warehouse, es el
problema de transformar los datos. La transformacin se encarga de las
inconsistencias en los formatos de datos y la codificacin, que pueden existir
dentro de una base de datos nica y que casi siempre existen cuando
mltiples bases de datos contribuyen al data warehouse.
En la Figura N 9 se ilustra una forma de inconsistencia, en la cual el
gnero se codifica de manera diferente en tres bases de datos diferentes.
Los procesos de transformacin de datos se desarrollan para direccionar
estas inconsistencias.
La transformacin de datos tambin se encarga de las inconsistencias en el
contenido de datos. Una vez que se toma la decisin sobre que reglas de
transformacin sern establecidas, deben crearse e incluirse las definiciones
en las rutinas de transformacin.

3
Se requiere una planificacin cuidadosa y detallada para transformar datos
inconsistentes en conjuntos de datos conciliables y consistentes para
cargarlos en el data warehouse.

Diseo de la Arquitectura
Arquitectura del Depsito
El desarrollo del data warehouse comienza con la estructura lgica y fsica
de la base de datos del depsito ms los servicios requeridos para operar y
mantenerlo.
Esta eleccin conduce a la seleccin de otros dos tems fundamentales: el
servidor de hardware y el DBMS.
La plataforma fsica puede centralizarse en una sola ubicacin o
distribuirse regional, nacional o internacionalmente. A continuacin se dan las
siguientes alternativas de arquitectura:
Un plan para almacenar los datos de su compaa, que podra
obtenerse desde fuentes mltiples internas y externas, es consolidar
la base de datos en un data warehouse integrado. El enfoque

3
consolidado proporciona eficiencia tanto en la potencia de
procesamiento como en los costos de soporte.
La arquitectura global distribuye informacin por funcin, con datos
financieros sobre un servidor en un sitio, los datos de comercializacin
en tro y los datos de fabricacin en un tercer lugar.
Una arquitectura por niveles almacena datos altamente resumidos
sobre una estacin de trabajo del usuario, con resmenes ms
detallados en un segundo servidor y la informacin ms detallada en
un tercero.
La estacin de trabajo del primer nivel maneja la mayora de los pedidos
para los datos, con pocos pedidos que pasan sucesivamente a los niveles 2
y 3 para la resolucin. Las computadoras en el primer nivel pueden
optimizarse para usuarios de carga pesada y volumen bajo de datos,
mientras que los servidores de los otros niveles son ms adecuados para
procesar los volmenes pesados de datos, pero cargas ms livianas de
usuario.

Arquitectura del servidor


Al decidir sobre una estructura de depsito distribuida o centralizada,
tambin se necesita considerar los servidores que retendrn y entregarn los
datos. El tamao de su implementacin (y las necesidades de su empresa
para escalabilidad, disponibilidad y gestin de sistemas) influir en la
eleccin de la arquitectura del servidor.
1 Servidores de un solo procesador
Los servidores de un slo procesador son los ms fciles de administrar,
pero

3
ofrecen limitada potencia de procesamiento y escalabilidad. Adems, un
servidor slo presenta un nico punto de falla, limitando la disponibilidad
garantizada del depsito.
Se puede ampliar un solo servidor de redes mediante arquitecturas
distribuidas que hacen uso de subproductos, tales como Ambientes de
Computacin Distribuida (Distributed Computing Environment - DCE) o
Arquitectura Broker de Objeto Comn (Common Objects Request Broker
Architecture - CORBA), para distribuir el trfico a travs de servidores
mltiples.
Estas arquitecturas aumentan tambin la disponibilidad, debido a que las
operaciones pueden cambiarse al servidor de copia de seguridad si un
servidor falla, pero la gestin de sistemas es ms compleja.
2 Multiprocesamiento simtrico
Las mquinas de multiprocesamiento simtrico (Symmetric MultiProcessing
SMP) aumentan mediante la adicin de procesadores que comparten la
memoria interna de los servidores y los dispositivos de almacenamiento de
disco.
Se puede adquirir la mayora de SMP en configuraciones mnimas (es
decir, con dos procesadores) y levantar cuando es necesario, justificando el
crecimiento con las necesidades de procesamiento. La escalabilidad de una
mquina SMP alcanza su lmite en el nmero mximo de procesadores
soportados por los mecanismos de conexin (es decir, el backplane y bus
compartido).
3 Procesamiento en paralelo masivo
Una mquina de procesamiento en paralelo masivo (Massively Parallel
Processing - MPP), conecta un conjunto de procesadores por medio de un
enlace de banda ancha y de alta velocidad. Cada nodo es un servidor,
completo con su propio procesador (posiblemente SMP) y memoria interna.

3
Para optimizar una arquitectura MPP, las aplicaciones deben ser
"paralelizadas" es decir, diseadas para operar por separado, en partes
paralelas.
Esta arquitectura es ideal para la bsqueda de grandes bases de datos.
Sin embargo, el DBMS que se selecciona debe ser uno que ofrezca una
versin paralela. Y an entonces, se requiere un diseo y afinamiento
esenciales para
obtener una ptima distribucin de los datos y prevenir "hot spots" o "data
skew" (donde una cantidad desproporcionada del procesamiento es
cambiada a un nodo de procesamiento, debido a la particin de los datos
bajo su control).
4 Acceso de memoria no uniforme
La dificultad de mover aplicaciones y los DBMS a agrupaciones o
ambientes realmente paralelos ha conducido a nuevas y recientes
arquitecturas, tales como el acceso de memoria no uniforme (Non Uniform
Memory Access NUMA). NUMA crea una sola gran mquina SMP al
conectar mltiples nodos SMP en un solo (aunque fsicamente distribuida)
banco de memoria y un ejemplo nico de OS. NUMA facilita el enfoque SMP
para obtener los beneficios de performance de las grandes mquinas MPP
(con 32 o ms procesadores), mientras se mantiene las ventajas de gestin y
simplicidad de un ambiente SMP estndar.
Lo ms importante de todo, es que existen DBMS y aplicaciones que
pueden moverse desde un solo procesador o plataforma SMP a NUMA, sin
modificaciones.

3
Elementos constituyentes de una Arquitectura Data Warehouse
Una Arquitectura Data Warehouse (Data Warehouse Architecture - DWA) es
una forma de representar la estructura total de datos, comunicacin,
procesamiento y presentacin, que existe para los usuarios finales que
disponen de una computadora dentro de la empresa.
La arquitectura se constituye de un nmero de partes interconectadas:
Base de datos operacional / Nivel de base de datos externo
Nivel de acceso a la informacin
Nivel de acceso a los datos
Nivel de directorio de datos (Metadata)
Nivel de gestin de proceso
Nivel de mensaje de la aplicacin
Nivel de data warehouse

3
Nivel de organizacin de datos

Plataforma del data warehouse


La plataforma para el data warehouse es casi siempre un servidor de base
de datos relacional. Cuando se manipulan volmenes muy grandes de datos
puede requerirse una configuracin en bloque de servidores UNIX con
multiprocesador simtrico (SMP) o un servidor con procesador paralelo
masivo (MPP) especializado.
Los extractos de la data integrada/transformada se cargan en el data
warehouse. Uno de los ms populares RDBMSs disponibles para data
warehousing sobre la plataforma UNIX (SMP y MPP) generalmente es
Teradata. La eleccin de la plataforma es crtica. El depsito crecer y hay
que comprender los requerimientos despus de 3 o 5 aos.
Muchas de las organizaciones quieran o no escogen una plataforma por
diversas razones: el Sistema X es nuestro sistema elegido o el Sistema Y
est ya disponible sobre un sistema UNIX que nosotros ya tenemos. Uno de
los errores ms grandes que las organizaciones cometen al seleccionar la
plataforma, es que ellos presumen que el sistema (hardware y/o DBMS)
escalar con los datos.
El sistema de depsito ejecuta las consultas que se pasa a los datos por el
software de acceso a los datos del usuario. Aunque un usuario visualiza las
consultas desde el punto de vista de un GUI, las consultas tpicamente se
formulan como pedidos SQL, porque SQL es un lenguaje universal y el
estndar de hecho para el acceso a datos.

Principales aportaciones de un datawarehouse

3
Facilita la aplicacin de tcnicas estadsticas de anlisis y
modelizacin para encontrar relaciones ocultas entre los datos del
almacn; obteniendo un valor aadido para el negocio de dicha
informacin.

Proporciona una herramienta para la toma de decisiones en cualquier


rea funcional, basndose en informacin integrada y global del
negocio.

Proporciona la capacidad de aprender de los datos del pasado y de


predecir situaciones futuras en diversos escenarios.

Simplifica dentro de la empresa la implantacin de sistemas de


gestin integral de la relacin con el cliente.

Supone una optimizacin tecnolgica y econmica en entornos de


Centro de Informacin, estadstica o de generacin de informes con
retornos de la inversin espectaculares hacer este informe no afecta a
otros reportes que pueden solicitarse es decir, todos ellos son
independientes y caros, desde el punto de vista de recursos y
productividad.

Minera de Datos

La minera de datos (DM, Data Mining) consiste en la extraccin no trivial


de informacin que reside de manera implcita en los datos. Dicha

3
informacin era previamente desconocida y podr resultar til para algn
proceso. En otras palabras, la minera de datos prepara, sondea y explora
los datos para sacar la informacin oculta en ellos.
Bajo el nombre de minera de datos se engloba todo un conjunto de
tcnicas encaminadas a la extraccin de conocimiento procesable, implcito
en las bases de datos. Est fuertemente ligado con la supervisin de
procesos industriales ya que resulta muy til para aprovechar los datos
almacenados en las bases de datos.
Las bases de la minera de datos se encuentran en la inteligencia artificial y
en el anlisis estadstico. Mediante los modelos extrados utilizando tcnicas
de minera de datos se aborda la solucin a problemas de prediccin,
clasificacin y segmentacin.

Los Fundamentos del Data Mining


Las tcnicas de Data Mining son el resultado de un largo proceso de
investigacin y desarrollo de productos. Esta evolucin comenz cuando los
datos de negocios fueron almacenados por primera vez en computadoras, y
continu con mejoras en el acceso a los datos, y ms recientemente con
tecnologas generadas para permitir a los usuarios navegar a travs de los
datos en tiempo real. Data Mining toma este proceso de evolucin ms all
del acceso y navegacin retrospectiva de los datos, hacia la entrega de
informacin prospectiva y proactiva. Data Mining est listo para su aplicacin
en la comunidad de negocios porque est soportado por tres tecnologas que
ya estn suficientemente maduras:

1. Recoleccin masiva de datos


2. Potentes computadoras con multiprocesadores
3. Algoritmos de Data Mining

3
Proceso de Minera de Datos
Un proceso tpico de minera de datos consta de los siguientes pasos
generales:
1. Seleccin del conjunto de datos, tanto en lo que se refiere a las variables
objetivo (aquellas que se quiere predecir, calcular o inferir), como a las
variables dependientes (las que sirven para hacer el clculo o proceso),
como posiblemente al muestreo de los registros disponibles.
2. Anlisis de las propiedades de los datos, en especial los histogramas,
diagramas de dispersin, presencia de valores atpicos y ausencia de datos
(valores nulos).
3. Transformacin del conjunto de datos de entrada, se realizar de diversas
formas en funcin del anlisis previo, con el objetivo de prepararlo para
aplicar la tcnica de minera de datos que mejor se adapte a los datos y al
problema, a este paso tambin se le conoce como pre procesamiento de los
datos.
4. Seleccionar y aplicar la tcnica de minera de datos, se construye el
modelo predictivo, de clasificacin o segmentacin.
5. Extraccin de conocimiento, mediante una tcnica de minera de datos, se
obtiene un modelo de conocimiento, que representa patrones de
comportamiento observados en los valores de las variables del problema o
relaciones de asociacin entre dichas variables. Tambin pueden usarse
varias tcnicas a la vez para generar distintos modelos, aunque
generalmente cada tcnica obliga a un pre procesado diferente de los datos.
6. Interpretacin y evaluacin de datos, una vez obtenido el modelo, se debe
proceder a su validacin comprobando que las conclusiones que arroja son
vlidas y suficientemente satisfactorias. En el caso de haber obtenido varios
modelos mediante el uso de distintas tcnicas, se deben comparar los

3
modelos en busca de aquel que se ajuste mejor al problema. Si ninguno de
los modelos alcanza los resultados esperados, debe alterarse alguno de los
pasos anteriores para generar nuevos modelos.

Cmo Trabaja el Data Mining?


Cun exactamente es capaz Data Mining de decirle cosas importantes
que usted desconoce o que van a pasar? La tcnica usada para realizar
estas hazaas en Data Mining se llama Modelado. Modelado es simplemente
el acto de construir un modelo en una situacin donde usted conoce la
respuesta y luego la aplica en otra situacin de la cual desconoce la
respuesta. Por ejemplo, si busca un barco hundido en los mares lo primero
que podra hacer es investigar otros tesoros que ya fueron encontrados en el
pasado. Notara que esos barcos frecuentemente fueron encontrados fuera
de las costas de Bermuda y que hay ciertas caractersticas respecto de las
corrientes ocenicas y ciertas rutas que probablemente tomara el capitn del
barco en esa poca. Usted nota esas similitudes y arma un modelo que
incluye las caractersticas comunes a todos los sitios de estos tesoros

3
hundidos. Con estos modelos en mano sale a buscar el tesoro donde el
modelo indica que en el pasado hubo ms probabilidad de darse una
situacin similar. Con un poco de esperanza, si tiene un buen modelo,
probablemente encontrar el tesoro.
Este acto de construccin de un modelo es algo que la gente ha estado
haciendo desde hace mucho tiempo, seguramente desde antes del auge de
las computadoras y de la tecnologa de Data Mining. Lo que ocurre en las
computadoras, no es muy diferente de la manera en que la gente construye
modelos. Las computadoras son cargadas con mucha informacin acerca de
una variedad de situaciones donde una respuesta es conocida y luego el
software de Data Mining en la computadora debe correr a travs de los datos
y distinguir las caractersticas de los datos que llevarn al modelo. Una vez
que el modelo se construy, puede ser usado en situaciones similares donde
usted no conoce la respuesta.
Si alguien le dice que tiene un modelo que puede predecir el uso de los
clientes, Cmo puede saber si es realmente un buen modelo? La primera
cosa que puede probar es pedirle que aplique el modelo a su base de
clientes - donde usted ya conoce la respuesta. Con Data Mining, la mejor
manera para realizar esto es dejando de lado ciertos datos para aislarlos del
proceso de Data Mining. Una vez que el proceso est completo, los
resultados pueden ser testeados contra los datos excluidos para confirmar la
validez del modelo. Si el modelo funciona, las observaciones deben
mantenerse para los datos excluidos.

Principales caractersticas y objetivos de la Minera de Datos


Explorar los datos se encuentran en las profundidades de las bases
de datos, como los almacenes de datos, que algunas veces contienen
informacin almacenada durante varios aos

3
En algunos casos, los datos se consolidan en un almacn de datos y
en mercados de datos; en otros, se mantienen en servidores de
Internet e Intranet.
El entorno de la minera de datos suele tener una arquitectura cliente
servidor.
Las herramientas de la minera de datos ayudan a extraer el mineral
de la informacin enterrado en archivos corporativos o en registros
pblicos, archivados.
El minero es, muchas veces un usuario final con poca o ninguna
habilidad de programacin, facultado por barrenadoras de datos y
otras poderosas herramientas indagatorias para efectuar preguntas
adhoc y obtener rpidamente respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados
valiosos e inesperados.
Las herramientas de la minera de datos se combinan fcilmente y
pueden analizarse y procesarse rpidamente.
Debido a la gran cantidad de datos, algunas veces resulta necesario
usar procesamiento en paralelo para la minera de datos.
La minera de datos produce cinco tipos de informacin:
Asociaciones
Secuencias
Clasificaciones
Agrupamientos
Pronsticos.
Los mineros de datos usan varias herramientas y tcnicas.
La minera de datos es un proceso que invierte la dinmica del mtodo
cientfico en el siguiente sentido:

3
En el mtodo cientfico, primero se formula la hiptesis y luego se disea el
experimento para coleccionar los datos que confirmen o refuten la hiptesis.
Si esto se hace con la formalidad adecuada (cuidando cules son las
variables controladas y cules experimentales), se obtiene un nuevo
conocimiento.
En la minera de datos, se coleccionan los datos y se espera que de ellos
emerjan hiptesis. Se busca que los datos describan o indiquen por qu son
como son. Luego entonces, se valida esa hiptesis inspirada por los datos en
los datos mismos, ser numricamente significativa, pero experimentalmente
invlida. De ah que la minera de datos debe presentar un enfoque
exploratorio, y no confirmador. Usar la minera de datos para confirmar las
hiptesis formuladas puede ser peligroso, pues se est haciendo una
inferencia poco vlida.
La minera de datos es una tecnologa compuesta por etapas que integra
varias reas y que no se debe confundir con un gran software. Durante el
desarrollo de un proyecto de este tipo se usan diferentes aplicaciones
software en cada etapa que pueden ser estadsticas, de visualizacin de
datos o de inteligencia artificial, principalmente. Actualmente existen
aplicaciones o herramientas comerciales de minera de datos muy poderosas
que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto.
Sin embargo, casi siempre acaban complementndose con otra herramienta.

Tcnicas de Minera de Datos


Como ya se ha comentado, las tcnicas de la minera de datos provienen de
la Inteligencia artificial y de la estadstica, dichas tcnicas, no son ms que
algoritmos, ms o menos sofisticados que se aplican sobre un conjunto de
datos para obtener unos resultados.
Las tcnicas ms representativas son:

3
* Redes neuronales.- Son un paradigma de aprendizaje y procesamiento
automtico inspirado en la forma en que funciona el sistema nervioso de los
animales. Se trata de un sistema de interconexin de neuronas en una red
que colabora para producir un estmulo de salida. Algunos ejemplos de red
neuronal son:
El Perceptrn.
El Perceptrn multicapa.
Los Mapas Autoorganizados, tambin conocidos como redes de
Kohonen.

* Regresin lineal.- Es la ms utilizada para formar relaciones entre datos.


Rpida y eficaz pero insuficiente en espacios multidimensionales donde
puedan relacionarse ms de 2 variables.
* rboles de decisin.- Un rbol de decisin es un modelo de prediccin
utilizado en el mbito de la inteligencia artificial, dada una base de datos se
construyen estos diagramas de construcciones lgicas, muy similares a los
sistemas de prediccin basados en reglas, que sirven para representar y
categorizar una serie de condiciones que suceden de forma sucesiva, para la
resolucin de un problema. Ejemplos:
1. Algoritmo ID3.
2. Algoritmo C4.5.
* Modelos estadsticos.- Es una expresin simblica en forma de igualdad o
ecuacin que se emplea en todos los diseos experimentales y en la
regresin para indicar los diferentes factores que modifican la variable de
respuesta.
* Agrupamiento o Clustering.- Es un procedimiento de agrupacin de una
serie de vectores segn criterios habitualmente de distancia; se tratar de
disponer los vectores de entrada de forma que estn ms cercanos aquellos

3
que tengan caractersticas comunes. Ejemplos:
Algoritmo K-means.
Algoritmo K-medoids.
Segn el objetivo del anlisis de los datos, los algoritmos utilizados se
clasifican en supervisados y no supervisados (Weiss y Indurkhya, 1998):
* Algoritmos supervisados (o predictivos): predicen un dato (o un conjunto de
ellos) desconocido a priori, a partir de otros conocidos.
Algoritmos no supervisados (o del descubrimiento del conocimiento):
se descubren patrones y tendencias en los datos.
Ejemplos de uso de la minera de datos
Negocios
La minera de datos puede contribuir significativamente en las aplicaciones
de administracin empresarial basada en la relacin con el cliente. En lugar
de contactar con el cliente de forma indiscriminada a travs de un centro de
llamadas o enviando cartas, slo se contactar con aquellos que se perciba
que tienen una mayor probabilidad de responder positivamente a una
determinada oferta o promocin.
Por lo general, las empresas que emplean minera de datos ven
rpidamente el retorno de la inversin, pero tambin reconocen que el
nmero de modelos predictivos desarrollados puede crecer muy
rpidamente.
En lugar de crear modelos para predecir qu clientes pueden cambiar, la
empresa podra construir modelos separados para cada regin y/o para cada
tipo de cliente. Tambin puede querer determinar qu clientes van a ser
rentables durante una ventana de tiempo (una quincena, un mes, ...) y slo
enviar las ofertas a las personas que es probable que sean rentables. Para
mantener esta cantidad de modelos, es necesario gestionar las versiones de
cada modelo y pasar a una minera de datos lo ms automatizada posible.

3
Hbitos de compra en supermercados
El ejemplo clsico de aplicacin de la minera de datos tiene que ver con la
deteccin de hbitos de compra en supermercados. Un estudio muy citado
detect que los viernes haba una cantidad inusualmente elevada de clientes
que adquiran a la vez paales y cerveza. Se detect que se deba a que
dicho da solan acudir al supermercado padres jvenes cuya perspectiva
para el fin de semana consista en quedarse en casa cuidando de su hijo y
viendo la televisin con una cerveza en la mano. El supermercado pudo
incrementar sus ventas de cerveza colocndolas prximas a los paales para
fomentar las ventas compulsivas.

Patrones de fuga
Un ejemplo ms habitual es el de la deteccin de patrones de fuga. En
muchas industrias como la banca, las telecomunicaciones, etc. existe un
comprensible inters en detectar cuanto antes aquellos clientes que puedan
estar pensando en rescindir sus contratos para, posiblemente, pasarse a la
competencia. A estos clientes y en funcin de su valor se les podran
hacer ofertas personalizadas, ofrecer promociones especiales, etc., con el
objetivo ltimo de retenerlos. La minera de datos ayuda a determinar qu
clientes son los ms proclives a darse de baja estudiando sus patrones de
comportamiento y comparndolos con muestras de clientes que,
efectivamente, se dieron de baja en el pasado.

Fraudes
Un caso anlogo es el de la deteccin de transacciones de blanqueo de
dinero o de fraude en el uso de tarjetas de crdito o de servicios de telefona
mvil e, incluso, en la relacin de los contribuyentes con el fisco.

3
Generalmente, estas operaciones fraudulentas o ilegales suelen seguir
patrones caractersticos que permiten, con cierto grado de probabilidad,
distinguirlas de las legtimas y desarrollar as mecanismos para tomar
medidas rpidas frente a ellas.

Recursos humanos
La minera de datos tambin puede ser til para los departamentos de
recursos humanos en la identificacin de las caractersticas de sus
empleados de mayor xito. La informacin obtenida puede ayudar a la
contratacin de personal, centrndose en los esfuerzos de sus empleados y
los resultados obtenidos por stos. Adems, la ayuda ofrecida por las
aplicaciones para Direccin estratgica en una empresa se traducen en la
obtencin de ventajas a nivel corporativo, tales como mejorar el margen de
beneficios o compartir objetivos; y en la mejora de las decisiones operativas,
tales como desarrollo de planes de produccin o gestin de mano de obra.

Comportamiento en Internet
Tambin es un rea en boga el del anlisis del comportamiento de los
visitantes sobre todo, cuando son clientes potenciales en una pgina de
Internet. O la utilizacin de la informacin obtenida por medios ms o
menos legtimos sobre ellos para ofrecerles propaganda adaptada
especficamente a su perfil. O para, una vez que adquieren un determinado
producto, saber inmediatamente qu otro ofrecerle teniendo en cuenta la
informacin histrica disponible acerca de los clientes que han comprado el
primero.

Terrorismo
La minera de datos ha sido citada como el mtodo por el cual la unidad Able

3
Danger del Ejrcito de los EE.UU. haba identificado al lder de los atentados
del 11 de septiembre de 2001, Mohammed Atta, y a otros tres secuestradores
del "11-S" como posibles miembros de una clula de Al Qaeda que operan en
los EE.UU. ms de un ao antes del ataque. Se ha sugerido que tanto la
Agencia Central de Inteligencia y sus homloga canadiense, Servicio de
Inteligencia y Seguridad Canadiense, tambin han empleado este mtodo.[1]
Juegos
Desde comienzos de la dcada de 1960, con la disponibilidad de orculos
para determinados juegos combinacionales, tambin llamados finales de
juego de tablero (por ejemplo, para las tres en raya o en finales de ajedrez)
con cualquier configuracin de inicio, se ha abierto una nueva rea en la
minera de datos que consiste en la extraccin de estrategias utilizadas por
personas para estos orculos. Los planteamientos actuales sobre
reconocimiento de patrones, no parecen poder aplicarse con xito al
funcionamiento de estos orculos. En su lugar, la produccin de patrones
perspicaces se basa en una amplia experimentacin con bases de datos
sobre esos finales de juego, combinado con un estudio intensivo de los
propios finales de juego en problemas bien diseados y con conocimiento de
la tcnica (datos previos sobre el final del juego). Ejemplos notables de
investigadores que trabajan en este campo son Berlekamp en el juego de
puntos-y-cajas (o Timbiriche) y John Nunn en finales de ajedrez.

Ciencia e Ingeniera
En los ltimos aos la minera de datos se est utilizando ampliamente en
diversas reas relacionadas con la ciencia y la ingeniera. Algunos ejemplos
de aplicacin en estos campos son:

Gentica

3
En el estudio de la gentica humana, el objetivo principal es entender la
relacin cartogrfica entre las partes y la variacin individual en las
secuencias del ADN humano y la variabilidad en la susceptibilidad a las
enfermedades. En trminos ms llanos, se trata de saber cmo los cambios
en la secuencia de ADN de un individuo afectan al riesgo de desarrollar
enfermedades comunes (como por ejemplo el cncer). Esto es muy
importante para ayudar a mejorar el diagnstico, prevencin y tratamiento de
las enfermedades. La tcnica de minera de datos que se utiliza para realizar
esta tarea se conoce como "reduccin de dimensionalidad multifactorial".[2]

Ingeniera elctrica
En el mbito de la ingeniera elctrica, las tcnicas minera de datos han sido
ampliamente utilizadas para monitorizar las condiciones de las instalaciones
de alta tensin. La finalidad de esta monitorizacin es obtener informacin
valiosa sobre el estado del aislamiento de los equipos. Para la vigilancia de
las vibraciones o el anlisis de los cambios de carga en transformadores se
utilizan ciertas tcnicas para agrupacin de datos (clustering) tales como los
Mapas Auto-Organizativos (SOM, Self-organizing map). Estos mapas sirven
para detectar condiciones anormales y para estimar la naturaleza de dichas
anomalas.[3]

Anlisis de gases
Tambin se han aplicado tcnicas de minera de datos para el anlisis de
gases disueltos (DGA, Dissolved gas analysis) en transformadores elctricos.
El anlisis de gases disueltos se conoce desde hace mucho tiempo como
herramienta para diagnosticar transformadores. Los Mapas Auto-
Organizativos (SOM) se utilizan para analizar datos y determinar tendencias
que podran pasarse por alto utilizando las tcnicas clsicas DGA.

3
Herramientas de software
Existen muchas herramientas de software para el desarrollo de modelos de
minera de datos tanto libres como comerciales como, por ejemplo:
R
KNIME
SPSS Clementine (software)
SAS Enterprise Miner
STATISTICA Data Miner
RapidMiner
Weka
KXEN
Orange

Lenguaje de programacin R: R es un lenguaje y entorno de programacin


para anlisis estadstico y grfico.
Se trata de un proyecto de software libre, resultado de la implementacin
GNU del premiado lenguaje S. R y S-Plus -versin comercial de S- son,
probablemente, los dos lenguajes ms utilizados en investigacin por la
comunidad estadstica, siendo adems muy populares en el campo de la
investigacin biomdica, la bioinformtica y las matemticas financieras. A
esto contribuye la posibilidad de cargar diferentes libreras o paquetes con
finalidades especficas de clculo o grfico.
R se distribuye bajo la licencia GNU GPL y est disponible para los sistemas
operativos Windows, Macintosh, Unix y GNU/Linux.

KNIME (o Konstanz Information Miner): Es una plataforma de minera de

3
datos que permite el desarrollo de modelos en un entorno visual. Est
construido bajo la plataforma Eclipse.

SAS: es un lenguaje de programacin desarrollado por SAS Institute a


finales de los aos sesenta. Existen dos intrpretes de dicho lenguaje: uno
desarrollado por SAS Institute y otro por la empresa World Programming.

SPSS: Statistical Package for the Social Sciences (SPSS) es un programa


estadstico informtico muy usado en las ciencias sociales y las empresas de
investigacin de mercado. En la actualidad, la sigla se usa tanto para
designar el programa estadstico como la empresa que lo produce.
Originalmente SPSS fue creado como el acrnimo de Statistical Package for
the Social Sciences ya que se est popularizando la idea de traducir el
acrnimo como "Statistical Product and Service Solutions". Sin embargo,
aunque realizando bsquedas por internet estas pueden llevar a la pgina
web de la empresa, dentro de la pgina misma de la empresa no se
encuentra dicha denominacin.
Como programa estadstico es muy popular su uso debido a la capacidad
de trabajar con bases de datos de gran tamao. En la versin 12 es de 2
millones de registros y 250.000 variables. Adems, de permitir la
recodificacin de las variables y registros segn las necesidades del usuario.
El programa consiste en un mdulo base y mdulos anexos que se han ido
actualizando constantemente con nuevos procedimientos estadsticos. Cada
uno de estos mdulos se compra por separado.

Statistica (aunque la marca est registrada como STATISTICA, en


maysculas) es un paquete estadstico usado en investigacin, minera de
datos y en el mbito empresarial. Lo cre StatSoft, empresa que lo desarrolla

3
y mantiene.
StatSoft naci en 1984 de un acuerdo entre un grupo de profesores
universitarios y cientficos. Sus primeros productos fueron los programas
PsychoStat-2 y PsychoStat-3. Despus desarroll Statistical Supplement for
Lotus 1-2-3, un complemento para las hojas de clculo de Lotus. Finalmente,
en 1991, lanz al mercado la primera versin de STATISTICA para MS-DOS.
Actualmente compite con otros paquetes estadsticos tanto propietarios,
como SPSS, SAS, Matlab o Stata, como libres, como R.

RapidMiner (anteriormente, YALE, Yet Another Learning Environment) es un


programa informtico para el anlisis y minera de datos. Permite el
desarrollo de procesos de anlisis de datos mediante el encadenamiento de
operadores a travs de un entorno grfico. Se usa en investigacin y en
aplicaciones empresariales.
La versin inicial fue desarrollada por el departamento de inteligencia
artificial de la Universidad de Dortmund en 2001. Se distribuye bajo licencia
GPL y est hospedado en SourceForge desde el 2004.
RapidMiner proporciona ms de 500 operadores orientados al anlisis de
datos, incluyendo los necesarios para realizar operaciones de entrada y
salida, preprocesamiento de datos y visualizacin. Tambin permite utilizar
los algoritmos incluidos en Weka.

Weka (Waikato Environment for Knowledge Analysis - Entorno para Anlisis


del Conocimiento de la Universidad de Waikato) es un conocido software
para aprendizaje automtico y minera de datos escrito en Java y
desarrollado en la Universidad de Waikato. WEKA es un software libre
distribuido bajo licencia GNU-GPL.

3
Orange: es un programa informtico para realizar minera de datos y anlisis
predictivo desarrollado en la facultad de informtica de la Universidad de
Ljubljana. Consta de una serie de componentes desarrollados en C++ que
implementan algoritmos de minera de datos, as como operaciones de
preprocesamiento y representacin grfica de datos.
Los componentes de Orange pueden ser manipulados desde programas
desarrollados en Python o a travs de un entorno grfico.
Se distribuye bajo licencia GPL.

Datamart

3
Un Datamart es una base de datos departamental, especializada en el
almacenamiento de los datos de un rea de negocio especfica. Se
caracteriza por disponer la estructura ptima de datos para analizar la
informacin al detalle desde todas las perspectivas que afecten a los
procesos de dicho departamento. Un datamart puede ser alimentado
desde los datos de un datawarehouse, o integrar por si mismo un compendio
de distintas fuentes de informacin.

Por tanto, para crear el datamart de un rea funcional de la empresa es


preciso encontrar la estructura ptima para el anlisis de su informacin,
estructura que puede estar montada sobre una base de datos OLTP, como el
propio datawarehouse, o sobre una base de datos OLAP. La designacin de
una u otra depender de los datos, los requisitos y las caractersticas
especficas de cada departamento.

3
De esta forma se pueden plantear dos tipos de datamarts:

Datamart OLAP: El Data mart es un sistema orientado a la consulta, en el


que se producen procesos batch de carga de datos (altas) con una
frecuencia baja y conocida. Es consultado mediante herramientas OLAP (On
line Analytical Processing - Procesamiento Analtico en Lnea) que ofrecen
una visin multidimensional de la informacin. Se basan en los populares
cubos OLAP, que se construyen agregando, segn los requisitos de cada
rea o departamento, las dimensiones y los indicadores necesarios de cada
cubo relacional. El modo de creacin, explotacin y mantenimiento de los
cubos OLAP es muy heterogneo, en funcin de la herramienta final que se
utilice.

El acceso a los datos est optimizado para tareas frecuentes de

3
lectura y escritura. (Por ejemplo, la enorme cantidad de transacciones que
tienen que soportar las BD de bancos o hipermercados diariamente).

Los datos se estructuran segn el nivel aplicacin (programa de


gestin a medida, ERP o CRM implantado, sistema de informacin
departamental).

Los formatos de los datos no son necesariamente uniformes en los


diferentes departamentos (es comn la falta de compatibilidad y la
existencia de islas de datos).

El historial de datos suele limitarse a los datos actuales o recientes.

Datamart OLTP: On-Line Transactional Processing pueden basarse en un


simple extracto del datawarehouse, no obstante, lo comn es introducir
mejoras en su rendimiento (las agregaciones y los filtrados suelen ser las
operaciones ms usuales) aprovechando las caractersticas particulares de
cada rea de la empresa. Las estructuras ms comunes en este sentido son
las tablas report, que vienen a ser fact-tables reducidas (que agregan las
dimensiones oportunas), y las vistas materializadas, que se construyen con
la misma estructura que las anteriores, pero con el objetivo de explotar la
reescritura de queries (aunque slo es posibles en algunos SGBD
avanzados, como Oracle).

El acceso a los datos suele ser de slo lectura. La accin ms comn


es la consulta, con muy pocas inserciones, actualizaciones o eliminaciones.

Los datos se estructuran segn las reas de negocio, y los formatos


de los datos estn integrados de manera uniforme en toda la
organizacin.

El historial de datos es a largo plazo, normalmente de dos a cinco

3
aos.

Las bases de datos OLAP se suelen alimentar de informacin


procedente de los sistemas operacionales existentes, mediante un
proceso de extraccin xtraccin, transformacin y carga (ETL).

Razones para crear un Datamart

Fcil acceso a los datos que se necesitan frecuentemente.

Crea vista colectiva para grupo de usuarios.

Mejora el tiempo de respuesta del usuario final.

Facilidad de creacin.

Costo inferior al de la aplicacin de un completo almacn de datos.

Los usuarios potenciales son ms claramente identificables que en un


almacn de datos completo...

Dependencia de un Datamart

Segn la tendencia marcada por Inmon sobre los data warehouse, un


data mart dependiente es un subconjunto lgico (vista) o un subconjunto
fsico (extracto) de un almacn de datos ms grande, que se ha aislado por
alguna de las siguientes razones:

Se necesita para un esquema o modelo de datos espacial (por


ejemplo, para reestructurar los datos para alguna herramienta OLAP).

Prestaciones: Para descargar el data mart a un ordenador


independiente para mejorar la eficiencia o para obviar las necesidades
de gestionar todo el volumen del data warehouse centralizado.

3
Seguridad: Para separar un subconjunto de datos de forma selectiva a
los que queremos permitir o restringir el acceso.

Conveniencia: la de poder pasar por alto las autorizaciones y


requerimientos necesarios para poder incorporar una nueva aplicacin
en el Data Warehouse principal de la Empresa.

Demostracin sobre el terreno: para demostrar la viabilidad y el


potencial de una aplicacin antes de migrarla al Data Warehouse de la
Empresa.

Poltica: Cuando se decide una estrategia para las TI (Tecnologas de


la informacin) en situaciones en las que un grupo de usuarios tiene
ms influencia, para determinar si se financia dicha estrategia o
descubrir si sta no sera buena para el almacn de datos
centralizado.

Poltica: Estrategia para los consumidores de los datos en situaciones


en las que un equipo de almacn de datos no est en condiciones de
crear un almacn de datos utilizable.

Segn la escuela Inmon de data warehouse, entre las prdidas inherentes


al uso de data marts estn la escalabilidad limitada, la duplicacin de datos,
la inconsistencia de los datos con respecto a otros almacenes de informacin
y la incapacidad para aprovechar las fuentes de datos de la empresa. As y
todo estas herramientas son de gran importancia.

3
HERRAMIENTAS:
Vertica Data Mart:
Es un software muy poderoso y popular que es utilizado por miles de
compaas alrededor del mundo para procesar la informacin y crear
mercados de datos de la informacin encontrada en los almacenes de
datos. Vertica se utiliza para analizar la informacin de las empresas
de telecomunicaciones, los fabricantes de juegos de azar, consultores
financieros, los trabajadores sanitarios, e incluso en el comercio
minorista. Vertica incluso le permite crear una red e interactuar con
otros usuarios a travs de protocolos de abonado. Vertica lista de
caractersticas incluye una arquitectura escalable, compresin de
datos, sintonizacin automtica, la capacidad de operar en mltiples
sistemas, y le permite crear bases de datos basadas en columnas
basadas en sus necesidades y requerimientos especficos.

3
DataMartPC:
Se basa en situaciones del mundo real y experiencias y est
diseado para darle lo que necesita sin tener que lidiar con las
caractersticas adicionales que acaba de ponerse en el camino.
DataMartPC est disponible para su descarga gratuita en un ensayo
de demostracin basado en que incluye cinco ejemplos de soluciones.
Las cinco soluciones de muestra se incluyen las ventas de la tienda,
Departamento de Presupuestos, Control de Calidad, Gestin de
Proyectos y gestin de cuotas. Al utilizar y experimentar con estas
soluciones de la muestra, usted puede conseguir una comprensin de
cmo funciona DataMartPC y si el software es el adecuado para
usted. El software no es ms clase que la rodea, pero se desempea
bien incluso sin todas las campanas y silbatos que ofrecen otros
programas.

Oracle DataMart Builder:


Es en realidad un subsistema del Oracle Warehouse Builder, un
software que est diseado principalmente para ETL (extraccin,
transformacin, carga) los propsitos sino que viene con muchas
caractersticas adicionales que le ayudan a crear su propio almacn
de datos o data mart. El software cuenta con las herramientas que se
centran en la migracin de datos, as como el modelado de datos,
auditora de datos, elaboracin de perfiles de datos, limpieza de datos
y metadatos. El Oracle Warehouse Builder con el respaldo de la base
de datos Oracle y se esfuerza por superar a sus competidores en el
mercado de gestin de datos del ciclo de vida.
CUADRO DE MANEJO INTEGRAL

3
El concepto de cuadro de mando integral CMI (Balanced Scorecard
BSC) fue presentado en el nmero de Enero/febrero de 1992 de la revista
Harvard Business Review, con base en un trabajo realizado para una
empresa de semiconductores (La empresa en cuestin sera Analog Devices
Inc.). Sus autores, Robert Kaplan y David Norton, plantean que el CMI es un
sistema de administracin o sistema administrativo (Management system),
que va ms all de la perspectiva financiera con la que los gerentes
acostumbran evaluar la marcha de una empresa. Es un mtodo para medir
las actividades de una compaa en trminos de su visin y estrategia.
Proporciona a los administradores una mirada global de las prestaciones del
negocio.

Es una herramienta de administracin de empresas que muestra


continuamente cundo una compaa y sus empleados alcanzan los
resultados definidos por el plan estratgico. Tambin es una herramienta que
ayuda a la compaa a expresar los objetivos e iniciativas necesarias para
cumplir con la estrategia.

Segn el libro "The Balanced ScoreCard: Translating Strategy into Action",


Harvard Business School Press, Boston, 1996:

"el BSC es una herramienta revolucionaria para movilizar a la gente hacia el


pleno cumplimiento de la misin, a travs de canalizar las energas,
habilidades y conocimientos especficos de la gente en la organizacin hacia
el logro de metas estratgicas de largo plazo. Permite tanto guiar el
desempeo actual como apuntar el desempeo futuro. Usa medidas en
cuatro categoras -desempeo financiero, conocimiento del cliente, procesos

3
internos de negocios y aprendizaje y crecimiento- para alinear iniciativas
individuales, organizacionales y trans-departamentales e identifica procesos
enteramente nuevos para cumplir con objetivos del cliente y accionistas. El
BSC es un robusto sistema de aprendizaje para probar, obtener
realimentacin y actualizar la estrategia de la organizacin. Provee el
sistema gerencial para que las compaas inviertan en el largo plazo -en
clientes, empleados, desarrollo de nuevos productos y sistemas ms bien
que en gerenciar la ltima lnea para bombear utilidades de corto plazo.
Cambia la manera en que se mide y gerencia un negocio".

El CMI sugiere que veamos a la organizacin desde cuatro perspectivas,


cada una de las cuales debe responder a una pregunta determinada:

Tipos de Cuadros de Mando


El Cuadro de Mando Operativo (CMO), es una herramienta de control
enfocada al seguimiento de variables operativas, es decir, variables
pertenecientes a reas o departamentos especficos de la empresa. La
periodicidad de los CMO puede ser diaria, semanal o mensual, y est
centrada en indicadores que generalmente representan procesos, por lo que
su implantacin y puesta en marcha es ms sencilla y rpida. Un CMO
debera estar siempre ligado a un DSS (Sistema de Soporte a Decisiones)
para indagar en profundidad sobre los datos.

El Cuadro de Mando Integral (CMI), por el contrario, representa la


ejecucin de la estrategia de una compaa desde el punto de vista de la
Direccin General (lo que hace que sta deba estar plenamente involucrada
en todas sus fases, desde la definicin a la implantacin). Existen diferentes
tipos de cuadros de mando integral, si bien los ms utilizados son los que se
basan en la metodologa de Kaplan & Norton. La principales caractersticas

3
de esta metodologa son que utilizan tanto indicadores financieros como no
financieros, y que los objetivos estratgicos se organizan en cuatro reas o
perspectivas: financiera, cliente, interna y aprendizaje/crecimiento.

Desarrollo y Aprendizaje (Learning and Growth): Podemos continuar


mejorando y creando valor?

Interna del Negocio (Internal Business): En qu debemos sobresalir?

Del cliente (Customer): Cmo nos ven los clientes?

Financiera (Financial): Cmo nos vemos a los ojos de los


accionistas?

La idea del CMI es sencilla y transparente, como toda buena idea.


Reconoce que la finalidad la actividad empresarial, conseguir beneficios, es
el resultado de una cadena de causas y efectos que suceden en cuatro
mbitos: financiero, marketing (comercializacin), procesos internos;
preparacin y desarrollo del personal.

Los 4 ejes de la estrategia empresarial

Perspectiva Financiera
La necesidad de los objetivos financieros es indiscutible y primaria en toda
actividad comercial.

Perspectiva del cliente.


El punto ms frecuente en los enfoques modernos de la gestin es la
importancia de la orientacin al cliente y la satisfaccin de sus
requerimientos (concepto central del marketing)

3
Perspectiva interna.
Este enfoque se refiere a los procesos de negocios internos. Los objetivos y
las mtricas basadas en esta perspectiva permiten a los ejecutivos saber
como est funcionando su negocio, y si sus productos o servicios estn
cumpliendo con los requerimientos del cliente.

Perspectiva del aprendizaje y el crecimiento.


Esta perspectiva incluye la capacitacin laboral y el desarrollo de una cultura
organizacional fuertemente orientada al mejoramiento individual y
corporativo. En una organizacin basada en el conocimiento, la gente,
depositaria bsica del conocimiento, es un recurso fundamental en el actual
ambiente de rpidos cambios tecnolgicos, y en el que se ha hecho
prioritario que los trabajadores del conocimiento se concentren en el
aprendizaje continuo.

En pocas palabras, el CMI permite a la organizacin medir los resultados


financieros, satisfaccin del cliente, operaciones y la capacidad de la
organizacin para producir y ser competitiva. Los resultados financieros se
basan en la disponibilidad de una cartera de clientes rentables y fieles. Esta
fidelidad slo se consigue mediante un funcionamiento correcto de los
procesos internos de la empresa, lo que, requiere de un equipo de
empleados motivados y capaces de llevar a cabo eficientemente las tareas
asignadas.

El reconocimiento explcito de esta cadena causativa, tan simple en s


misma, y la fijacin de una serie de objetivos para cada uno de los niveles es
lo que da lugar a una estrategia empresarial definida. A partir de aqu, Kaplan
y Norton, proponen la eleccin de una serie de indicadores numricos, que

3
reflejen adecuadamente cada una de las perspectivas mencionadas y cuyo
conjunto constituir el Cuadro de Mando Integral.

La diferencia entre un CMI y uno convencional es la relacin causa-efecto


entre los indicadores que lo componen, ya que est orientada al beneficio,
nico criterio de xito empresarial.

El CMI es por lo tanto un sistema de gestin estratgica de la empresa, que


consiste en:

Formular una estrategia consistente y transparente.

Comunicar la estrategia a travs de la organizacin.

Coordinar los objetivos de las diversas unidades organizativas.

Conectar los objetivos con la planificacin financiera y presupuestaria.

Identificar y coordinar las iniciativas estratgicas.

Beneficios de la implantacin de un Cuadro de Mando Integral

3
La fuerza de explicitar un modelo de negocio y traducirlo en
indicadores facilita el consenso en toda la empresa, no slo de la
direccin, sino tambin de cmo alcanzarlo.

Clarifica cmo las acciones del da a da afectan no slo al corto


plazo, sino tambin al largo plazo.

Una vez el CMI est en marcha, se puede utilizar para comunicar los
planes de la empresa, aunar los esfuerzos en una sola direccin y
evitar la dispersin. En este caso, el CMI acta como un sistema de
control por excepcin.

Permita detectar de forma automtica desviaciones en el plan


estratgico u operativo, e incluso indagar en los datos operativos de la
compaa hasta descubrir la causa original que di lugar a esas
desviaciones.

Riesgos de la implantacin de un Cuadro de Mando Integral

Un modelo poco elaborado y sin la colaboracin de la direccin es


papel mojado, y el esfuerzo ser en vano.

Si los indicadores no se escogen con cuidado, el CMI pierde una


buena parte de sus virtudes, porque no comunica el mensaje que se
quiere transmitir.

Cuando la estrategia de la empresa est todava en evolucin, es


contraproducente que el CMI se utilice como un sistema de control
clsico y por excepcin, en lugar de usarlo como una herramienta de
aprendizaje.

3
Existe el riesgo de que lo mejor sea enemigo de lo bueno, de que el
CMI sea perfecto, pero desfasado e intil.

Caractersticas del Cuadro de Mando : En la actualidad -debido a las


turbulencias del entorno empresarial, influenciado en la mayora de los casos
por una gran presin competitiva, as como por un auge de la tecnologa- es
cuando comienza a tener una amplia trascendencia.

El concepto de Cuadro de Mando deriva del concepto denominado "tableau


de bord" en Francia, que traducido de manera literal, vendra a significar algo
as como tablero de mandos, o cuadro de instrumentos. A partir de los aos

3
80, es cuando el Cuadro de Mando pasa a ser, adems de un concepto
prctico, una idea acadmica, ya que hasta entonces el entorno empresarial
no sufra grandes variaciones, la tendencia del mismo era estable, las
decisiones que se tomaban carecan de un alto nivel de riesgo. Para
entonces, los principios bsicos sobre los que se sostena el Cuadro de
Mando ya estaban estructurados, es decir, se fijaban unos fines en la
entidad, cada uno de stos eran llevados a cabo mediante la definicin de
unas variables clave, y el control era realizado a travs de indicadores.

Bsicamente, y de manera resumida, podemos destacar tres


caractersticas fundamentales de los Cuadros de Mando:

1. La naturaleza de las informaciones recogidas en l, dando cierto


privilegio a las secciones operativas, (ventas, etc.) para poder informar
a las secciones de carcter financiero, siendo stas ltimas el
producto resultante de las dems.

2. La rapidez de ascenso de la informacin entre los distintos niveles de


responsabilidad.

3. La seleccin de los indicadores necesarios para la toma de


decisiones, sobre todo en el menor nmero posible.

En definitiva, lo importante es establecer un sistema de seales en forma de


Cuadro de Mando que nos indique la variacin de las magnitudes
verdaderamente importantes que debemos vigilar para someter a control la
gestin.

3
A la hora de disponer una relacin de Cuadros de Mando, muchos son
los criterios que se pueden entremezclar, siendo los que a continuacin
se describen, algunos de los ms indicativos, para clasificar tales
herramientas de apoyo a la toma de decisiones.

El horizonte temporal.
Los niveles de responsabilidad y/o delegacin.
Las reas o departamentos especficos.

Otras clasificaciones:

La situacin econmica.
Los sectores econmicos.
Otros sistemas de informacin.

En la actualidad, no todos los Cuadros de Mando estn basados en los


principios de Kaplan y Norton, aunque s influenciados en alguna medida por
ellos. Por este motivo, se suele emplear con cierta frecuencia el trmino
Dashboard, que relaja algunas caractersticas tericas del Cuadro de
Mando. De forma genrica, un Dashboard engloba a varias herramientas que
muestran informacin relevante para la empresa a travs de una serie de
indicadores de rendimiento, tambin denominados KPIs (Key Performance
Indicators). Con una frecuencia mucho menor se utiliza el concepto de
Cuadro de Mando Operativo, que es una utilidad de control enfocada a la
monitorizacin de variables operativas, es decir, indicadores rutinarios
ligados a reas o departamentos especficos de la empresa. Su puesta en
funcionamiento es ms barata y sencilla, por lo que suele ser un buen punto
de partida para aquellas compaas que intentan evaluar la implantacin de
un Cuadro de Mando Integral.

3
Ejemplo 1 Cmo planificar una nueva estrategia sobre venta de financieros
Situacin
Una entidad bancaria deseaba embarcarse en una estrategia con la que
lograr un aumento geomtrico de sus beneficios a travs de la venta de sus
productos financieros.
Este banco se enfrentaba a dos problemas:
- Una dependencia excesiva de un nico producto (depsito);
- Una estructura de coste que haca no rentable el trabajar con el 80% de sus
clientes a las tasas de inters imperantes.
Para resolverlos, el banco determin dos lneas de actuacin:
1. Crecimiento de los ingresos: ampliar las fuentes de ingresos con productos
adicionales para los clientes existentes.
2. Productividad: mejorar la eficiencia operativa para reciclar clientes no
rentables a otros canales con ms beneficios.

3
Estas dos lneas de actuacin, tomadas como estrategias, fueron
traducidas en objetivos e indicadores de las cuatro perspectivas desde el
desarrollo de un

Cuadro de Mando Integral.


Desarrollo del Cuadro de Mando Integral
Para la definicin de los objetivos de estas dos estrategias se determin, en
primer lugar, el aumento de los productos para lograr mayores ingresos. Esto
quera decir que se debera aprovechar la actual base de clientes y que se
deberan identificar a aquellos que pudieran ser candidatos como receptores
de una gama ms amplia de servicios referidos a asesoramiento y
adquisicin de productos financieros. Sin embargo, cuando se analizaron las
necesidades de los clientes, se descubri que stos no conceban a este
banco como un lugar donde realizar este tipo de operaciones, sino donde
realizar simples transacciones como cheques o depsitos. Entonces, el
banco determin que otro objetivo sera el de cambiar la percepcin del
cliente.
Con estos dos objetivos ya marcados, la entidad bancaria se centr en el
proceso de diseo del Cuadro de Mando Integral:
Por un lado, se identificaron tres procesos cruzados: Comprender a los
clientes; Desarrollar nuevos productos y servicios; La venta cruzada de
mltiples servicios y productos.
Por otro lado, se estudi el enfoque de los actuales procesos internos para
adaptarlos a la nueva situacin que se pretenda crear. Cada proceso deba
ser rediseado para responder a los cambios.
Por ejemplo, la entidad bancaria no tena cultura de ventas. Sus acciones
se

3
limitaban prcticamente a insertar publicidad corporativa en los medios. Se
descubri que el personal slo pasaba el 10% de su tiempo de trabajo con
los
clientes. Haba que formarlos para que desarrollaran una capacidad de
atencin al cliente y de asesoramiento sobre los nuevos productos. Dos
indicadores de este nuevo procesos de ventas fue incluido en el Cuadro de
Mando: el nmero de productos vendidos a un hogar y las horas dedicadas a
los clientes.
Los objetivos internos condujeron de forma natural a un conjunto final de
factores sobre la mejora de la eficacia de los empleados que revel la
necesidad de aumentar su formacin. Tambin se tuvieron que agilizar el
acceso a la informacin sobre los nuevos productos y la operatividad del
proceso de adquisicin de productos.
Por ltimo, se vincularon los incentivos de los empleados al cumplimiento
de
estos nuevos objetivos y as fomentar la nueva conducta de ventas. En
cuanto a indicadores, estos se tradujeron en objetivos como el promedio de
ventas por vendedor; las actitudes de la plantilla segn una encuesta de
satisfaccin del empleado; el aumento de la habilidad del empleado segn
encuestas internas tras los cursos de formacin y, al tiempo, segn
entrevistas al propio personal y de acuerdo al sistema de 360; el acceso y la
disponibilidad de las herramientas y datos de la tecnologa de la informacin;
y, por ltimo, el porcentaje de objetivos personales alcanzados.
Nuevamente, cada objetivo cifrado en sus respectivos indicadores, llev a
la
identificacin de nuevas necesidades tales como el modo de formar a los
empleados y a quienes seleccionar para cualificar ante las nuevas
exigencias.

3
En el caso de esta entidad bancaria, haba que redisear la operativa del
departamento de recursos humanos. La empresa no estaba preparada para
decidir cules seran las capacidades que haba que potenciar y a quienes
haba que hacerlo.
Para ello, se entrevistaron a los empleados y se determinaron los perfiles
competenciales de cada trabajador. Tambin se fijaron las necesidades
formativas de cada uno y se dise el plan y programa de formacin de
acuerdo a la situacin de cada persona.
En cuanto al rediseo de este proceso de desarrollo del personal, se fijaron
una serie de indicadores de causa y de efecto que cubrieran la efectividad de
los objetivos estratgicos necesarios para cumplir con la estrategia definida
al
principio de toda la elaboracin del Cuadro de Mando Integral.

SISTEMAS DE SOPORTE A LA DECISIN (DSS)

Un Sistema de Soporte a la Decisin (DSS) es una herramienta de


Business Intelligence enfocada al anlisis de los datos de una organizacin.
El trmino DSS es el acrnimo de "Decision Support System", es decir, se
refiere a los sistemas para el apoyo a la toma de decisiones. Se trata de un
trmino que se populariz a mediados de los 90 pero que sin embargo ha
cado en desuso con la misma facilidad con la que se populariz. En

3
principio, puede parecer que el anlisis de datos es un proceso sencillo, y
fcil de conseguir mediante una aplicacin hecha a medida o un ERP
sofisticado. Sin embargo, no es as: estas aplicaciones suelen disponer de
una serie de informes predefinidos en los que presentan la informacin de
manera esttica, pero no permiten profundizar en los datos, navegar entre
ellos, manejarlos desde distintas perspectivas... etc.

El DSS es una de las herramientas ms emblemticas del Business


Intelligence ya que, entre otras propiedades, permiten resolver gran parte de
las limitaciones de los programas de gestin.

Funcin y Caractersticas: Los DSS son herramientas de mucha utilidad


en Inteligencia empresarial (Business Intelligence), permiten realizar el
anlisis de las diferentes variables de negocio para apoyar el proceso de
toma de decisiones de los directivos:

Permite extraer y manipular informacin de una manera flexible.


Ayuda en decisiones no estructuradas.
Permite al usuario definir interactivamente qu informacin necesita y
cmo combinarla.
Suele incluir herramientas de simulacin, modelizacin, etc.
Puede combinar informacin de los sistemas transaccionales internos
de la empresa con los de otra empresa externa.

Su principal caracterstica es la capacidad de anlisis multidimensional


(OLAP) que permite profundizar en la informacin hasta llegar a un alto nivel
de detalle, analizar datos desde diferentes perspectivas, realizar
proyecciones de informacin para pronosticar lo que puede ocurrir en el

3
futuro, anlisis de tendencias, anlisis prospectivo, etc. Un DSS da soporte a
las personas que tienen que tomar decisiones en cualquier nivel de gestin,
ya sean individuos o grupos, tanto en situaciones semiestructuradas como en
no estructuradas, a travs de la combinacin del juicio humano e informacin
objetiva:

Soporta varias decisiones interdependientes o secuenciales.


Ofrece ayuda en todas las fases del proceso de toma de decisiones
inteligencia, diseo, seleccin, e implementacin- as como tambin
en una variedad de procesos y estilos de toma de decisiones.
Es adaptable por el usuario en el tiempo para lidiar con condiciones
cambiantes.
Genera aprendizaje, dando como resultado nuevas demandas y
refinamiento de la aplicacin, que a su vez da como resultado un
aprendizaje adicional.
Generalmente utiliza modelos cuantitativos (estndar o hechos a la
medida).
Los DSS avanzados estn equipados con un componente de
administracin del conocimiento que permite una solucin eficaz y
eficiente de problemas muy complejos.
Puede ser implantado para su uso en Web, en entornos de escritorio o
en dispositivos mviles (PDA).
Permite la ejecucin fcil de los anlisis de sensibilidad.

Tipos de Sistemas de Soporte a Decisiones

Sistemas de informacin gerencial (MIS)


Los sistemas de informacin gerencial (MIS, Management Information

3
Systems), tambien llamados Sistemas de Informacin Administrativa
(AIS) dan soporte a un espectro ms amplio de tareas
organizacionales, encontrndose a medio camino entre un DSS
tradicional y una aplicacin CRM/ERP implantada en la misma
compaa.

Sistemas de informacin ejecutiva (EIS)


Los sistemas de informacin ejecutiva (EIS, Executive Information
System) son el tipo de DSS que ms se suele emplear en Business
Intelligence, ya que proveen a los gerentes de un acceso sencillo a
informacin interna y externa de su compaa, y que es relevante para
sus factores clave de xito.

Sistemas expertos basados en inteligencia artificial (SSEE)


Los sistemas expertos, tambin llamados sistemas basados en
conocimiento, utilizan redes neuronales para simular el conocimiento
de un experto y utilizarlo de forma efectiva para resolver un problema
concreto. Este concepto est muy relacionado con el datamining.

Sistemas de apoyo a decisiones de grupo (GDSS)


Un sistema de apoyo a decisiones en grupos (GDSS, Group Decision
Support Systems) es "un sistema basado en computadoras que apoya
a grupos de personas que tienen una tarea (u objetivo) comn, y que
sirve como interfaz con un entorno compartido". El supuesto en que se
basa el GDSS es que si se mejoran las comunicaciones se pueden
mejorar las decisiones.

3
Diferencia con otras herramientas de Business Intelligence:

El principal objetivo de los Sistemas de Soporte a Decisiones es, a


diferencia de otras herramientas como los Cuadros de Mando (CMI) o
los Sistemas de Informacin Ejecutiva (EIS), explotar al mximo la
informacin residente en una base de datos corporativa
(datawarehouse o datamart), mostrando informes muy dinmicos y
con gran potencial de navegacin, pero siempre con una interfaz
grfica amigable, vistosa y sencilla.

Otra diferencia fundamental radica en los usuarios a los que estn


destinadas las plataformas DSS: cualquier nivel gerencial dentro de
una organizacin, tanto para situaciones estructuradas como no
estructuradas. (En este sentido, por ejemplo, los CMI estn ms
orientados a la alta direccin).

Por ltimo, destacar que los DSS suelen requerir (aunque no es


imprescindible) un motor OLAP subyacente, que facilite el anlisis casi
ilimitado de los datos para hallar las causas raices de los
problemas/pormenores de la compaa.

Taxonoma: Al igual que ocurre con la definicin, no existe una taxonoma


universalmente aceptada para los DSS. Diferentes autores proponen
diferentes clasificaciones.

1.- Utilizando la relacin con el usuario como criterio, Haettenschwiler

3
distingue entre:

DSS pasivo.- Es un sistema de ayudas para el proceso de toma de


decisiones, pero que no puede llevar a cabo una decisin explcita
sugerencias o soluciones.
DSS activo.- Puede llevar a cabo dicha decisin sugerencias o
soluciones.
DSS cooperativo.- Permite al encargado de la toma de decisiones (o a
sus asesores) modificar, completar o perfeccionar las sugerencias de
decisin proporcionadas por el sistema, antes de enviar de vuelta al
sistema para su validacin. El nuevo sistema mejora, completa y
precisa las sugerencias del tomador de la decisin y las enva de
vuelta a su para su validacin. Entonces, todo el proceso comienza de
nuevo, hasta que se genera una solucin consolidada.

2.- Utilizando el modo de asistencia como criterio, Power[] distingue entre:

DSS dirigidos por modelos.- Se hace hincapi en el acceso y


manipulacin de un modelo estadstico, financiero, de optimizacin o
de simulacin. Utiliza datos y parmetros proporcionados por los
usuarios para ayudar a los encargados de adoptar decisiones en el
anlisis de una situacin, que no son necesariamente los datos
intensivos. Dicodess es un ejemplo de un DSS de cdigo abierto
basado en modelos.
DSS dirigidos por comunicacin.- Disponen de soporte para varias
personas que trabajan en una misma tarea compartida. Ejemplos
incluyen herramientas integradas como Microsoft NetMeeting o
Microsoft Groove.
DSS dirigidos por datos.- Tambin llamados orientados por datos,

3
enfatizan el acceso y la manipulacin de series temporales de datos
internos de la empresa y, a veces, tambin de datos externos.
DSS dirigidos por documentos.- Gestionan, recuperan y manipulan
informacin no estructurada en una variedad de formatos electrnicos.
DSS dirigidos por conocimiento.- Proporcionan experiencia acumulada
en forma de hechos, normas, procedimientos, o en estructuras
similares especializados para la resolucin de problemas.

3.- Utilizando el mbito como criterio, Power sugiere esta otra clasificacin:

DSS para la gran empresa.- Este DSS estar enlazado con un


almacn de datos de gran tamao y dar servicio a muchos gerentes,
directores y/o ejecutivos de la compaa.
DSS de escritorio.- Es un sistema pequeo que puede correr en el
ordenador personal de un gerente al que da servicio (un solo usuario).

Arquitecturas: Una vez ms, diferentes autores identifican diferentes


componentes para un DSS.

1.- Sprague y Carlson[] identifican tres componentes bsicos que son


explicados con ms detalles por Haag y otros:

El Sistema de Gestin de Base de Datos.- Almacena informacin de


diversos orgenes, puede proceder de los repositorios de datos de una
organizacin tradicional, de fuentes externas (como Internet), o del
personal (de ideas y experiencias de los usuarios individuales).
El Sistema Gestor de Modelos.- Se ocupa de las representaciones de
los acontecimientos, hechos o situaciones utilizando varios tipos de
modelos (dos ejemplos seran modelos de optimizacin y modelos de

3
bsqueda-objetivo).
El Sistema Gestor y Generador de Dilogos.- Se trata de la interfaz de
usuario; es, por supuesto, el componente que permite a un usuario
interactuar con el sistema.

2.- Segn Power un DSS tiene cuatro componentes fundamentales:

La interfaz de usuario.
La base de datos.
Las herramientas analticas y de modelado.
La red y arquitectura del DSS.

3.- Httenschwiler identifica cinco componentes en un DSS:

Usuarios.- Con diferentes roles o funciones en el proceso de toma de


decisiones (tomador de decisiones, asesores, expertos del dominio,
expertos del sistema, recolectores de datos).
Contexto de Decisin.- Debe ser especfico y definible.
Sistema de Destino.- ste describe la mayora de las preferencias.
Bases de Conocimiento.- Compuestas de fuentes de datos externas,
bases de datos de Conocimiento, bases de datos de trabajo,
almacenes de datos y meta-bases de datos, modelos matemticos y
mtodos, procedimientos, inferencia y los motores de bsqueda,
programas administrativos, y los sistemas de informes.
Entorno de Trabajo.- Para la preparacin, anlisis y documentacin de
decisin alternativas.

4.- Arakas propone una arquitectura generalizada compuesta de de cinco


partes distintas:

3
El sistema gestor de datos.
El sistema gestor de modelos.
El motor de conocimiento.
La interfaz de usuario.
Los usuarios.

Entornos de Desarrollo :Los sistemas DSS no son totalmente diferente de


otros sistemas y requieren un enfoque estructurado. Sprague y
Watson (1993) proporcionaron un entorno de tres niveles principales:

Los niveles de Tecnologa.- Se propone una divisin en 3 niveles de


hardware y software para los DSS:
1. DSS Especfico.- Aplicacin real que ser utilizada por el usuario.
sta es la parte de la aplicacin que permite la toma decisiones en un
problema particular. El usuario podr actuar sobre este problema en
particular.
2. Generador de DSS.- Este nivel contiene hardware y software de
entorno que permite a las personas desarrollar fcilmente aplicaciones
especficas de DSS. Este nivel hace uso de herramientas case.
Tambin incluye lenguajes de programacin especiales, bibliotecas de
funciones y mdulos enlazados.
3. Herramientas de DSS.- Contiene hardware y software de bajo nivel.

Las personas que participan.- Para el ciclo de desarrollo de un DSS,


se sugieren 5 tipos de usuarios o participantes:
1. Usuario final
2. Intermediario
3. Desarrollador
4. Soporte tcnico
5. Experto de sistemas

3
El Enfoque de Desarrollo.- El enfoque basado en el desarrollo de un
DSS deber ser muy iterativo. Esto permitir que la aplicacin sea
cambiada y rediseada en diversos intervalos. El problema inicial se
utiliza para disear el sistema y a continuacin, ste es probado y
revisado para garantizar que se alcanza el resultado deseado.

SISTEMAS DE INFORMACIN PARA EJECUTIVOS


(EXECUTIVE INFORMATION SYSTEM, EIS)

Un SIE (EIS por sus siglas en ingles) es un sistema de informacin para


directivos que permite automatizar la labor de obtener los datos ms
importantes de una organizacin, resumirlos y presentarlos de la forma ms
comprensible posible, provee al ejecutivo acceso fcil a informacin interna
y externa al negocio con el fin de dar seguimiento a los factores crticos del
xito.
Los SIE (EIS) se enfocan primordialmente a proporcionar informacin de la
situacin actual de la compaa y dejan en un plano secundario la
visualizacin o proyeccin de esta informacin en escenarios futuros.

Caractersticas de un EIS:
Un buen sistema de informacin para ejecutivos presenta informacin en
forma de grficos, columnas y textos.
La capacidad para hacer grficos se necesita para facilitar en el anlisis
rpido de las condiciones y tendencias corrientes; las tablas presentan mayor
detalle y permiten el anlisis de variaciones; la informacin de textos aade

3
interpretaciones y detalles de los datos.

Las principales caractersticas de los sistemas de informacin


para ejecutivos (EIS) son las siguientes:
Estn diseados para cubrir las necesidades especficas y particulares
de la alta administracin de la empresa.
Extraen, filtran, comprimen y dan seguimiento a informacin crtica del
negocio.
Implica que los ejecutivos puedan interactuar en forma directa con el
sistema sin el apoyo o auxilio de intermediarios.
Es un sistema desarrollado con altos estndares en sus interfases
hombre-maquina, caracterizado por grficas de alta calidad,
informacin tabular y en forma de texto.
Pueden acceder a informacin que se encuentra en lnea,
extrayndose en forma directa de las bases de datos de la
organizacin.
El sistema est soportado por elementos especializados de hardware,
tales como monitores o videos de alta resolucin y sensibles al tacto,
ratn e impresoras con tecnologa avanzada.
Existe una serie de productos de software al alcance de todos para la
planificacin estratgica, diseados para capacitar y ayudar a los
administradores con la planificacin estratgica.

Factores del xito de un EIS:


Hablar de la implantacin de un EIS, la mayora de las veces, significa
hablar de un largo proceso contra barreras del tipo tecnolgicas,
organizacionales, psicolgicas, educacionales, etc. Aunado a esto,
muchas veces se presenta una sola oportunidad de xito o fracaso.

3
Se supone que los EIS estn hechos a la medida para ser usados por
ejecutivos de alto nivel; sin embargo, pocos son los que los usan.

Usualmente los sistemas que apoyan decisiones son difciles de


justificar usando mtodos econmicos estndar de evaluacin.
Un EIS es comnmente desarrollado con altas expectativas de xito, sin
embargo terminan fracasando, y las razones principales son, segn algunos
investigadores basados en los siguientes criterios de evaluacin:
a) Acceso. Es obvio que si un sistema se encuentra disponible significa que
los usuarios tendrn acceso a l, de una manera no complicada y desde
puntos clave. Si esto no sucede, el sistema no servir de nada.
b) Uso. Un indicador importante es su frecuencia de uso. Si un sistema no es
usado, o simplemente, los usuarios potenciales no lo emplean, esto se
reflejar en el xito del sistema.
c) Satisfaccin. Si el sistema no puede satisfacer a sus usuarios, stos no
usarn el sistema.
d) Impacto Positivo. Un sistema es exitoso si tiene un impacto benfico en
los ejecutivos y la organizacin, al hacer los primeros, mejores decisiones la
organizacin recibe mas beneficios.
e) Difusin. Otro punto que indica el xito es la propagacin del sistema. El
numero de personas que usa el sistema aumenta despus de que los
usuarios iniciales lo han probado.

En el pasado, la falta de aplicaciones adecuadas para apoyar el concepto


era otra de las grandes limitantes, pero actualmente las soluciones presentes
en el mercado tienen la capacidad de integrarse fcilmente con otras
aplicaciones. Las nuevas soluciones son ms flexibles a las necesidades de

3
los usuarios y generalmente giran en torno de estructuras basadas en los
hechos.

Para que un EIS tenga xito es necesario que cumpla con los siguientes
factores:
1. Que se vea bien.
2. Que sea relevante.
3. Que sea rpido.
4. Que la informacin est disponible y actualizada.

Factores de fracaso de un EIS:


Los siguientes son los factores considerados como factores de fracaso en
los sistemas de Informacin para Ejecutivos:

Tecnolgicos: El EIS no es mejor que el sistema original. La


tecnologa no es adecuada o es inapropiada. Las interfaces son
complicadas o los mens son extensos.
Soporte: Los requerimientos de informacin de los usuarios fueron
ignorados. Los cambios en las necesidades de informacin de los
usuarios no fueron llevados a cabo. No hay mejoras en los reportes
electrnicos. Inadecuado conocimiento del negocio entre los
miembros del equipo de soporte. No ataca los problemas significativos
de la empresa.
Falta de disponibilidad de los datos. Entrega tarda de datos
operativos.

Relacionados con el Usuario:


a) Limitante de enfoque del EIS a un usuario.

3
b) Falta de compromiso de los usuarios.
c) Falta de claridad del propsito del EIS en el ejecutivo patrocinador.
d) No proveer los medios a los ejecutivos parta comunicar ideas.
e) Usuarios no capaces de comunicar decisiones.
f) Resistencia organizacional.

Beneficios de un EIS:
Los sistemas de Informacin para Ejecutivos tienen un sin fin de beneficios
que a la larga ayudan a la organizacin, los siguientes son los principales:
1. Informacin a tiempo: acceso ms rpido, informacin ms exacta,
relevante y concisa
2. Sensibilidad al medio: Mejor acceso a la informacin, an de datos
externos, mejor sensibilidad al medio, y ms informacin competitiva
3. Efectividad de ejecutivos: Mejora en la comunicacin, desempeo
mejorado, ahorro en tiempo de ejecucin, mejor presentacin de los
datos
4. Cumplimiento de objetivos estratgicos: Aumento en radio de control,
planeacin mejorada, mejor toma de decisiones, mejor entendimiento
de problemas, mejor desarrollo de alternativas
5. Economa: Ahorro en costos, menos papeleo, mayor respuesta al
cambio en las necesidades del cliente, apoyo de reduccin en la
organizacin

El proceso de desarrollo de un EIS:


El proceso de desarrollo de un EIS tiene caractersticas que lo hacen nico.
En primera instancia, por que es el primer sistema que se desarrolla en la
empresa dirigido al ejecutivo; quien es el usuario de este sistema.
En segundo lugar, las tcnicas utilizadas para el anlisis y desarrollo de los

3
tradicionales Sistemas Transaccionales no necesariamente funcionan en un
100% de manera similar durante el desarrollo de un EIS.
Es importante tomar en cuenta los tres pasos a planificar para construir un
sistema EIS, los cuales son:

Adquisicin de datos :
1. Modelizacin
2. Presentacin

Implantacin exitosa de un EIS:


La persona que vaya a tomar una decisin debe tener y desarrollar las
siguientes competencias:
1. Capacidad de visualizar y declarar problemticas;
2. Capacidad de generar soluciones o abrir nuevas posibilidades; y
3. Capacidad de decisin.
As mismo, para que un ejecutivo utilice un EIS, debe implantarse
considerando los siguientes factores importantes para asegurar una

Implantacin con xito del EIS:


1. Ejecutivo comprometido e informado con el proyecto.
2. Socio operativo.
3. Personal idneo en el departamento de informtica.
4. Tecnologa apropiada.
5. Administracin de los datos.
6. Relacin clara con los objetivos del negocio.
7. Manejo de la resistencia al cambio.
8. Administracin adecuada de la evolucin y expansin del sistema.

3
Impacto del EIS en el proceso de planeacin y control de la
organizacin:
Los sistemas de informacin ejecutivos (EIS) han provisto generalmente un
nivel ms alto de consolidacin y una visin multidimensional de los datos,
dado que los ejecutivos de alto nivel necesitan ms de la habilidad de hacer
fetas y dados de esos datos que de perforar hacia abajo para ver los detalles
de los datos.
Los EIS contribuyen en forma importante a redisear y reestructurar los
procesos de planeacin y control de una organizacin.
Las principales mejoras que pueden lograrse al utilizar este tipo de
sistemas son, entre otras mejora en los sistemas actuales de reportes
corporativos o divisionales, a travs de:
a) Cambios en el mtodo de recoleccin de informacin, lo cual permite que
la Direccin General no se involucre en la obtencin de los datos en forma
especfica, sino que dirija ms su atencin al anlisis de la informacin.
b)Mejoras en la integridad de los datos.
c)Acelerar el proceso de obtencin la informacin.
d)Cambios en la forma de presentar la informacin, utilizando tcnica nuevas
de presentacin como grficas, histogramas, dibujos y animaciones.
e)Rediseo de los sistemas actuales de reportes, a travs de los cuales se
pone atencin en los factores crticos para mejorar el negocio.

Software comercial para el desarrollo de EIS:


Existe una serie de productos de software al alcance de todos para la
planificacin estratgica, diseados para capacitar y ayudar a los
administradores con la planificacin estratgica. Sin embargo, algunos
sistemas de apoyo para las decisiones estratgicas son demasiado
complicados, caros o limitados como para ser usados con facilidad por los

3
gerentes de una empresa. Esto es lamentable porque el proceso de la
administracin estratgica debe ser un proceso de todos para que tenga
xito.
Por tanto, el software para la planificacin estratgica debe ser sencillo y
simple. La sencillez permite la amplia participacin de todos los
administradores de una empresa y la participacin en esencial para la buena
aplicacin de la estrategia.
En la siguiente tabla se muestra una lista de los principales productos y de
sus vendedores:

Producto de software Vendedor


Commander EIS Comshare
Command Center Pilot
Executive Decisions IBM
Executive Edge EXECUCOM

Los sistemas operativos de server, como Windows NT y Unix han trado


la estabilidad crtica y caractersticas poderosas al ambiente de la
computacin distribuida.
El software de sistema operativo se ha tornado rico en capacidades y
poderoso mientras su precio ha ido cayendo sin pausa.
Con esta combinacin, estn ahora disponibles en plataformas operativas
baratas conceptos sofisticados de sistema operativo como memoria virtual,
multitarea y multiprocesamiento simtrico. El desarrollo ms importante en
computacin desde el surgimiento de la PC es la explosin de Internet y las
aplicaciones basadas en la Web.
Apenas ocurrido el hecho, la comunidad de negocios rpidamente salt
para ponerse a la cabeza. Uno de los campos ms excitantes en la industria

3
de la computacin de hoy es el desarrollo de las aplicaciones Intranet.
Tendencias futuras:
En el pasado, la falta de aplicaciones adecuadas para apoyar el concepto
era otra de las grandes limitantes, pero actualmente las soluciones presentes
en el mercado tienen la capacidad de integrarse fcilmente con otras
aplicaciones. Existen sistemas que pueden manejar informacin tanto interna
como externa a la organizacin.
Las nuevas soluciones son ms flexibles a las necesidades de los usuarios
y generalmente giran en torno de estructuras basadas en los hechos y no
solamente basada en los libros contables. Debido a que estos sistemas
financieros dependen del poder de la computacin para manejar los
elementos individuales de la informacin y procesar las transacciones,
permiten que los ejecutivos desempeen un rol ms estratgico en la
organizacin.
La tecnologa de los EIS est evolucionando muy rpido, y es muy
probable que en el futuro los sistemas sean diferentes de los que se usan
actualmente. Algunos puntos que pueden anticiparse son:
1. Una mejor integracin con otras aplicaciones.
2. Mejor software comercial para el desarrollo de EIS.
3. Mejores interfases sistema-ejecutivo.
Puede decirse que los EIS, adems de tablas y grficas, incluirn voz,
video e imgenes, es decir, integrarn la tecnologa de multimedia en sus
desarrollo.
Durante la toma de decisiones y solucin de problemas a veces no se
reconoce que tambin interviene el punto de vista de la persona que ha
detectado el problema, por lo tanto hay situaciones en las que hay que
decidir o resolver algo, siempre y cuando a la persona le "importen " y por lo
cual hace juicios sobre esta.

3
CONCLUSIONES

Para culminar este trabajo se llego a la conclusin que las de manejo de


satos para el desarrollo de los sistemas de informacin Gerencial
proporcionan lo siguiente :
Datawarehause :Los almacenes de datos hacen ms fcil el acceso a una
gran variedad de datos a los usuarios finales. Facilitan el funcionamiento de
las aplicaciones de los sistemas de apoyo a la decisin tales como informes
de tendencia

Datamining: Este diseo representa una transferencia fundamental desde

3
los sistemas de soporte de decisin convencionales. Ms que simplemente
proveer datos a los usuarios finales a travs de software de consultas y
reportes, el server de Anlisis Avanzado aplica los modelos de negocios del
usuario directamente al warehouse y devuelve un anlisis proactivo de la
informacin ms relevante. Estos resultados mejoran los metadatos en el
server OLAP proveyendo una estrato de metadatos que representa una vista
fraccionada de los datos. Generadores de reportes, visualizadores y otras
herramientas de anlisis pueden ser aplicadas para planificar futuras
acciones y confirmar el impacto de esos planes.

Datamart: es un subconjunto de una bodega de datos para un propsito


especfico . Su funcin es apoyar a otros sistemas para la toma de
decisiones debe de permitir muchas formas usando herramientas OLAP.
Para el proceso de construccin de bodegas de datos existen dos enfoques .
Construir primero un ncleo de la bodega de datos y luego hacer varios
datamarts

Cuadro de Manejo Integral : El CMI es un instrumento muy til para la


direccin de las empresas en el corto y largo plazo, ya que combina
indicadores financieros y no financieros y ofrece un mtodo estructurado
para seleccionar los indicadores guas que implica a la direccin de la
empresa.

Decision Support Systems o DSS :Un sistema de soporte de decisiones, es


una clase de sistema de informacin basado en computadoras, que incluye
sistemas basados en el conocimiento, que soportan toma de decisiones.
Uno de estos sistemas analiza diferentes variables para apoyar en las
decisiones, especialmente decisiones empresariales.

3
Executive Information System o EIS: Aplicaciones de alto nivel que
pretenden, mediante el acceso a las diferentes bases de datos de una
empresa, ofrecer a sus directivos los elementos clave para que puedan
tomar decisiones sobre la marcha de sus negocios. Generalmente el
directivo accede a pantallas grficas en las que se resumen los elementos
ms importantes que debe tener en cuenta.

El contenido esta basado en las herramientas mas comunes .

REFERENCIAS BIBLIOGRAFICAS

http://www.gestiopolis.com/recursos2/documentos/fulldocs/ger/sisinfoe
j.htm

www.sinnexus.com/business.../datamart.asp

http://www.sinnexus.com/business_intelligence/sistemas_soporte_deci
siones.aspx

www.sinnexus.com/business.../olap_vs_oltp.aspx -

www.sinnexus.com/.../cuadro_mando_integral.aspx -

3
es.wikipedia.org/wiki/Data_mart -

http://es.wikipedia.org/wiki/Sistemas_de_soporte_a_decisiones

es.wikipedia.org/wiki/Cuadro_de_mando_integral

You might also like