Professional Documents
Culture Documents
SURCO LIMA
6 de Agosto de 2012
Inteligencia de Negocios
NDICE
1. 1.1. 1.2. 1.3. 1.3.1. 1.4. 1.5. 2. 2.1. 2.2. 2.2.1. 2.2.2. 2.3. 2.3.1. 2.3.2. 2.4. 2.5. 2.6. 3. 4.
SITUACIN PROBLEMTICA........................................................................................... 3 Empresa y rea Especfica a Analizar ............................................................................ 3 Situacin Problemtica ..................................................................................................... 3 Identificacin de las Necesidades de Informacin y Fuentes para Obtenerla ........... 4 Origen de Datos y Tablas ................................................................................................. 5 Usuarios de la Informacin ............................................................................................ 12 Definicin de Antigedad de Datos y Periodos de Actualizacin .............................. 13 SOLUCIN PROPUESTA ................................................................................................ 14 Caractersticas Generales de la Solucin Propuesta .................................................. 14 Beneficios a obtener al Implementar la Solucin ........................................................ 14 Beneficios Tangibles ...................................................................................................... 14 Beneficios Intangibles .................................................................................................... 15 Anlisis Dimensional ...................................................................................................... 16 Tablas Dimensionales ..................................................................................................... 16 Modelo Lgico ................................................................................................................. 21 Estimacin de la Cantidad de Datos y Tamao de BD ................................................ 22 Reportes y Consultas a Generar .................................................................................... 22 Identificacin de la infraestructura necesaria para el proyecto HW y SW ................ 23 Desarrollo de la solucin ................................................................................................ 24 Administracin del Proyecto .......................................................................................... 44 CONCLUSIONES .................................................................................................................... 45 BIBLIOGRAFIA ....................................................................................................................... 46 GLOSARIO .............................................................................................................................. 47 SIGLARIO ................................................................................................................................ 48 ANEXOS .................................................................................................................................. 49
Inteligencia de Negocios
1.
SITUACIN PROBLEMTICA
1.1.
La empresa objeto de estudio del presente trabajo es Per Pima S.A. Es una empresa peruana del rubro textil, fundada el ao 1992. Su giro de negocio es la fabricacin de productos textiles y su comercializacin. Posee toda la cadena de produccin textil que consta de: Hilandera Tejedura Tintorera y acabado de telas Estampado Confecciones
Su Gerente General es el Sr. Daniel Varn Kappari y nmero de RUC 20122742114. Posee dos plantas de produccin ubicadas en:
Av. Argentina 2747, Lima Zona Industrial. Av. Argentina 5138, Carmen de la Legua-Reynoso, Callao.
Tiene 83 empleados y 509 obreros. Las reas especficas, cuya informacin ser motivo de estudio para la implementacin de la solucin BI del presente trabajo, son: el rea Comercial, Produccin (solo almacenes) y Finanzas. El sitio web de la empresa es: www.perupima.com
1.2.
Situacin Problemtica
En un pas de vas de desarrollo, la principal fuente de crecimiento econmico es el incremento de la productividad. De ah resulta imperiosa la necesidad para la empresa Per Pima S.A. de estimular su crecimiento en el mercado globalizado, as como tambin, una respuesta ms efectiva a sus distintas operaciones.
En tal sentido, considerando el anlisis del rea Comercial y de la Gerencia Financiera que son materia de estudio del presente proyecto, existen factores tanto internos como externos que afectan dichas operaciones. El rea Comercial ha sido determinada en primera instancia por la Gerencia General como una de las ms crticas por diferentes deficiencias encontradas en los distintos procesos, tanto en la gestin de las ventas, as como tambin, por el control y seguimientos de las cuentas por cobrar ya que no pueden contar con informacin analtica que les permita tomar mejores decisiones.
Inteligencia de Negocios
El presente estudio surge ante la necesidad de la empresa de encontrar alternativas y mtodos que permitan un mejoramiento continuo para el rea Comercial, ya que los ltimos aos su crecimiento ha sido acelerado.
Objetivo General Contar con una herramienta DSS de Sistema de Soporte de Decisiones con sus siglas en ingls (DSS) que permita visualizar la situacin de las operaciones comerciales, y en particular de las ventas de la compaa, y de esta manera le permita a los directivos y jefaturas de rango medio tomar decisiones a favor de la organizacin utilizando dicha informacin.
Objetivos Especficos Determinar la informacin importante para el anlisis de ventas y cuentas por cobrar. Determinar los indicadores necesarios para satisfaces los requerimientos de informacin.
1.3.
La Gerencia General y la Gerencia de Ventas, as como el Directorio, desde hace algunos aos atrs requieren analizar el movimiento comercial de la empresa, y contar con informacin til para la toma de decisiones cruciales en el manejo de la organizacin. Ellos necesitan informacin de las ventas de productos terminados de la empresa, mostrndola segn clasificaciones del tipo regional, de clientes, por familias de productos, y tambin, comparndola con los costos de produccin unitarios, todo esto expresado en diversas jerarquas de tiempo. Todo eso sera muy til para ver el seguimiento de la facturacin a travs de diferentes estructuras (familias de productos, zonas geogrficas, tipos de clientes, etc.) y asimismo, los mrgenes de utilidad bruta por producto (mostrado en unidades de tiempo, familias de productos, tipos de clientes, etc.)
El rea de TI ha estado abocada al desarrollo de la plataforma transaccional bsica, y debido a carencias tcnicas y de personal, no ha podido construir un mdulo de informacin gerencial. Hoy en da, gracias a las herramientas de Business Intelligence es posible construir aplicativos que permitan satisfacer esos requerimientos de las gerencias mencionadas, en tiempos relativamente cortos, y contando con herramientas que permitan que el usuario moldee su propia informacin, construya sus propias consultas todo esto a travs de la presentacin de informacin tanto grfica como tabular.
Asimismo, la Direccin de la empresa tiene la necesidad de analizar la informacin de las Cuentas por Cobrar pero en forma estratificada. Es decir, en la actualidad el Sistema Integrado de la empresa, brinda un lote de reportes tabulares, pero no son verstiles en el sentido de brindar ventajas ms all que la informacin esttica e impresa. La direccin de la empresa, requiere 4
Inteligencia de Negocios
acceder a dicha informacin en un contexto que permita visualizarla a travs de las estructuras y clasificaciones que se manejan en la Gerencia Financiera y en el rea Comercial.
Los reportes estticos son antiguos, ofrecen solamente informacin bsica pero til, y ha quedado relegada a reportar montos globales por cliente, pero, no se puede satisfacer consultas ms avanzadas. Estas consultas permitirn saber los niveles de morosidad por cliente, regin, por tipo de cliente, saber cmo se estn comportando las cuentas por cobrar de clientes minoristas en el tiempo, el monto total por cobrar de clientes de un pas, etc.
La fuente nica de donde se obtendr la informacin ser el sistema administrativo de la empresa llamado Sistema Integrado. En dicho sistema se maneja toda la gestin administrativa y algunos mdulos usados en el rea de produccin, implementados hace 10 aos para lograr un EEI a favor de la empresa. Para la gestin administrativa el sistema cuenta con los siguientes mdulos:
Inventarios Ventas Cuentas por Cobrar Compras Cuentas por Pagar Caja y Bancos Activos Fijos Recursos Humanos Costos de Produccin Contabilidad
Hilandera Tejedura
1.3.1.
El
Sistema Integrado de Per Pima S.A. se basa en el ODS llamado UniData Relational
Database; soporta ANSI SQL y su propio lenguaje de programacin, UniBasic. Est construido con la herramienta de desarrollo 4GL llamada SystemBuilder . Ambos productos pertenecen a la empresa norteamericana Rocket Software Inc., URL http://www.rocketsoftware.com. El anexo 01 contiene imgenes de captura de algunas pantallas de dicho sistema.
Inteligencia de Negocios
Los archivos de datos de dicho sistema y que son el origen de datos para nuestra solucin, son los siguientes:
Archivo: FAREGISTRO Contiene: Movimiento de Facturacin cabecera - Contiene los documentos de facturacin (facturas y boletas). Es archivo cabecera, contiene los datos bsicos de la facturacin.
Nombre_campo Id_doc_venta Tipo A Longitud Descripcin corta
Cd_tipo_doc
A A D A N A D A
3 Nmero de serie del documento de ventas 7 Nmero de correlativo del documento 10 Fecha de emisin 6 Cdigo de cliente 7 Nmero de pedido de ventas 5 Cdigo de vendedor 10 Fecha de vencimiento 3 Cdigo de condicin de pago Cdigo de transaccin de inventarios asociada a la 13 venta 1 Estado del documento A 8,4 12,2 12,2 12,2 12,2 12,2 12,2 12,2 Cdigo de la moneda de facturacin Importe del tipo de cambio Porcentaje de descuento Porcentaje del IVA Importe neto de venta Monto del impuesto a las ventas Monto total previo al descuento Importe del descuento Monto total de la venta
Id_transaccion_inv Estado Cd_moneda Tipo_cambio Pct_descuento Pct_iva Importe_neto Valor_iva Monto_nominal Importe_descuento Monto_venta
A A A N N N N N N N N
Inteligencia de Negocios
Archivo: FAREGISTRODET Contiene: Movimiento de Facturacin detalle - Contiene los tems de inventario facturados y contenido documentos de facturacin (facturas y boletas). Es archivo detalle, contiene los datos de los productos facturados como precio unitario, cantidad, etc.
Nombre_campo Id_doc_venta Tipo Longitud A 15 Descripcin corta Identificacin del documento Nmero consecutivo de producto dentro del documento Cdigo del tem de inventario Cantidad a facturar Precio unitario Importe unitario
N A N N N
A A A
2 15 160
Cdigo de tipo de documento identificatorio Nmero de documento identificatorio Direccin del cliente Cdigo de ubicacin del cliente (Cdigo de distrito) Telfono 1 Telfono 2 Nombre del contacto Cdigo de pas
A A A A A
7 12 12 40 3
Inteligencia de Negocios
Desc_tipo_cliente
40
Archivo: FACONDICION Contiene: Tabla de las condiciones de pago de los comprobantes emitidos a los clientes.
Nombre_campo Tipo Longitud Descripcin corta Cdigo identificatorio de la condicin de pago del documento de venta Descripcin de la condicin de pago Nmero de das de plazo
A A N
3 40 3
Archivo: FAARTICULOS Contiene: Tabla maestra de los tems de inventarios (productos). Contiene la informacin de los productos que se mueven en los almacenes.
Nombre_campo Tipo Longitud Descripcin corta
Cd_item Descripcion_item
A A
8 120
Cdigo identificatorio del tem de inventario Descripcin del tem de inventario Cdigo identificatorio de la familia de inventarios Estado del tem de inventario Precio unitario de venta (sin IGV) Cdigo de articulo textil
A A N A
2 1 12,2 16
Inteligencia de Negocios
A A A A A A A
6 5 5 3 2 1 4
Cdigo de proceso textil Nmero de diseo (estampado) Cdigo de color Cdigo de combinacin Cdigo de ancho Cdigo de calidad Cdigo de unidad de medida
Archivo: INFAMILIA Contiene: Tabla maestra de familias de inventarios (TE=Telas CO=Confecciones, etc.)
Nombre_campo Tipo Longitud Descripcin corta Cdigo identificatorio de la familia de inventarios
FE=Felpas
Cd_familia
Desc_familia
60
Archivo: INART.BASE Contiene: Tabla maestra de artculos de productos (Cdigo de que es un atributo de la tabla de tems de inventario). Los registros de esta tabla NO mueven inventarios.
Nombre_campo Tipo Longitud Descripcin corta Cdigo identificatorio (conforma el tem) de articulo base
Cd_articulo
15
A A N N
60 1 6 6
Descripcin del articulo base de inventarios Cdigo de estado Nro hilos trama Nro hilos urdimbre
Archivo: PR.DISENO Contiene: Tabla maestra de Diseos textiles (diseo es la figura que se estampa en la tela. Usualmente un diseo est compuesto por varios colores diferentes)
Nombre_campo Nro_diseno Desc_diseno Nro_laminas Tipo Longitud A A N 5 60 3 Descripcin corta Nmero identificatorio de diseo Descripcin del diseo Nmero de lminas del diseo
Inteligencia de Negocios
Archivo: PR.COLOR Contiene: Tabla maestra de colores (cuando se trata de Teido de las telas, aplicacin de color entero)
Nombre_campo Cd_color Desc_color Tipo Longitud Descripcin corta A A 5 80 Cdigo identificatorio de Color Descripcin del color
Archivo: PR.COMB Contiene: Tabla maestra de combinaciones. Solo es til para los tems que son estampados (tienen Nro. de Diseo asignado)
Nombre_campo
Tipo Longitud
Descripcin corta
Cd_combinacion Desc_combinacion
A A
4 80
Cd_ancho Desc_ancho
A A
2 60
Long_ancho
12,2
2=Segunda / 3=Tercera)
Cd_unidad
10
Inteligencia de Negocios
Desc_unidad
30
S-Nuevos Soles)
Archivo: FATIPO_DOC_ID Contiene: Tabla maestra de tipos de documento de identidad de personas (01-DNI CARNET DE EXTRANJERIA / etc.)
Nombre_campo Tipo Longitud Descripcin corta Cdigo de identificacin tipo de documento de
02-
Cd_tipo_doc_id
Nombre_doc
40
Archivo: FATIPO_DOCUMENTO Contiene: Tabla maestra de tipos de documentos que el sistema emite.
Nombre_campo Tipo Longitud Descripcin corta Cdigo de operacin tipo de documento de
Cd_tipo_documento
Desc_tipo_documento
40
Archivo: FAESTADO_DOC Contiene: Tabla maestra de Estados de los documentos emitidos / a emitir
Nombre_campo Cd_estado_doc Desc_estado_doc Tipo Longitud A A 1 60 Descripcin corta Cdigo de estado Descripcin del estado
11
Inteligencia de Negocios
Desc_estado
60
1.4.
Usuarios de la Informacin
Puesto rea Funciones Mximo ejecutivo de la organizacin, que dirige los
Gerente General
Gerencia General
destinos de la empresa. Administra la organizacin a travs de las gerencias de reas y es el representante legal de la misma. Responsabilidad mxima en todas las actividades
Gerente Comercial
Gerencia Comercial
relacionadas con los clientes: ventas, marketing, canales de distribucin. Mxima autoridad dentro de la organizacin en los
Gerente de Finanzas
Gerencia Financiera
asuntos relativos a las finanzas; administracin del dinero. Dirige las actividades de planificacin financiera, contabilidad, tesorera y cobranzas. Gestionar y efectuar el cobro de las cuentas por cobrar,
producto de las ventas a clientes. Administrar la cartera de clientes para garantizar la captacin de recursos. Analizar y otorgar crditos a clientes. Responsabilidad sobre el funcionamiento el rea
Gerente de Produccin
Gerencia de Produccin
productiva de la empresa, optimizar los recursos productivos y organizar y hacer seguimiento de todos los trabajos dentro del ciclo de produccin.
12
Inteligencia de Negocios
Responsable de Marketing
Encargado de los planes de mercadotecnia, estudios de Gerencia Comercial mercado, imagen corporativa, promociones y estudios de nuevos canales de ventas. Miembro de la organizacin dedicado a colocar los productos terminados de la empresa en el mercado.
Vendedor
Gerencia Comercial
Negocia con los clientes la obtencin de pedidos, hace seguimiento a los mismos, coordina los despachos por venta y entre sus responsabilidades est la de ampliar la cartera de clientes. Miembro de la organizacin dedicado a realizar la
Contador de Costos
Contabilidad
determinacin de los costos de produccin de los productos terminados e intermedios, as como la valorizacin de los inventarios de la empresa.
1.5.
Para efectos de este trabajo acadmico, la data a capturar comprender desde el 1ro de Enero de 2008 al 31 de diciembre de 2011. Los procesos de carga y transformacin que sern implementados, estarn diseados para que la informacin sea actualizada diariamente.
13
Inteligencia de Negocios
2.
2.1.
2.2.
La Gerencia de Ventas y la Gerencia General se vern muy beneficiadas por poder contar con una herramienta de inteligencia de negocios a travs de la cual van a poder visualizar y explotar la informacin comercial de la empresa desde diferentes ngulos. En el pasado, estaban limitados a visualizar la informacin en estructuras estticas que le ofreca el legacy (sistema transaccional que tiene 10 aos de funcionamiento). Con esta herramienta, la Direccion de la empresa podr sacar provecho de los diferentes enfoques de datos ofrecidos, pudiendo el mismo usuario construir nuevas consultas, y obtener informacin pertinente y til para su gestin.
Los beneficios son, evidentemente, mucho. Ya no va a depender del rea IT para solicitarle nuevos reportes estticos, ni estar limitado a la capacidad de atencin de dicha rea. La herramienta de BI empoderar al usuario del rea comercial y podr apreciar la informacin acorde a sus necesidades de consolidacin, seleccin de columnas a mostrar, seleccin de valores y rubros del movimiento comercial, reas regionales, agentes comerciales, clientes, condiciones de pago, etc., con lo cual se podr mejorar la gestin de venta de los productos, atencin a los clientes, reducir, eliminar o fortalecer determinadas familias de productos vendibles, etc.
Adems, se podr apreciar tendencias, y falencias en la gestin de ventas. Por ejemplo, comparar productividad entre los vendedores.
El usuario ser real dueo de su informacin, y se ver aun ms satisfecho con la posibilidad que sea visto por web, generar grficos e impresiones de impacto y poder manipular dicha informacin, usando todo el potencial de funcionalidades que proporcionan el potente DW Pentaho.
2.2.1.
Beneficios Tangibles
Informacin histrica que permita analizar la situacin de la empresa en el rea de ventas. Reportes generados en el tiempo requerido por cada proceso del periodo. 14
Inteligencia de Negocios
Cuadros de informacin consolidada en grficos que permitan tomar decisiones a nivel gerencial. Optimizar el uso de sus recursos vendedores de acuerdo a las decisiones que pueda
determinarse de la informacin analizada en ventas. Incrementar las ventas en un 20% de acuerdo la evaluacin de los productos por sus distintos tipos de presentaciones.
2.2.2.
Beneficios Intangibles
Satisfaccin del gerente del rea quien tendr informacin de vital importancia para evaluar el rea a cargo.
Entrega de informacin a tiempo para sus evaluaciones propias como para la entrega de informes a nivel gerencial.
Ahorro de tiempo en analizar datos centralizados en los cuadros que ofrecen una informacin ms clara y precisa.
15
Inteligencia de Negocios
2.3.
2.3.1.
Table Name
Table Type View Name Display Name Description Used in schemas
DIM_CLIENTE
Dimensin DIM_CLIENTE DIM_CLIENTE Tabla dimensional que contiene los datos de los clientes. Ventas Target Source
Precision Key? FK To NULL? Default Value Example Values 3245 C07999 TEXTIL REAL SAC CLIENTE NACIONAL DNI 09752620 N A N varchar 30 N varchar varchar 15 N Lima PERU SCD Type Source System Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Source Schema N/A N/A FACLIENTES Cd_Cliente A(6) Source Table Source Field Name Source Datatype ETL Rules Autogenerar en el insert Comments
Column Name
Display Name
Description
Datatype
Size
ID_Cliente Cod_Cliente
ID Cliente Cod_Cliente
Int varchar
11 6
PK
N N
Razon_Social Desc_Tipo_Cliente
Razon_Social Desc_tipo_cliente
Razn social Tipo de cliente natural o jurdico Descripcin del tipo documento identificatorio Nmero de documento identificatorio Estado del registro Descripcin del pas del cliente ID de la dimensin Ubicacin Geogrfica, jerarqua Departamento ID de la dimensin Ubicacin Geogrfica, jerarqua Provincia ID de la dimensin Ubicacin Geogrfica, jerarqua Distrito
80 30 20 15 1
N N N N
Ubicacin_Dept
Ubicacin_Dept
N/A
FAUBICACION FAUBICACION
Ubicacin_Dept
A(15)
Ubicacin_Prov
Ubicacin_Prov
20
Lima
N/A
Ubicacin_Prov
A(20)
Ubicacin_Dist
Ubicacin_Dist
varchar
30
San Miguel
N/A
FAUBICACION
Ubicacin_Dist
A(30)
16
Inteligencia de Negocios
Table Name
Table Type View Name Display Name Description Used in schemas
Column Name
Display Name
Description Identificador de condicin de pago Cdigo de la condicin de pago del documento Descripcin de la condicin de pago Nmero de das de plazo
Datatype
Size
11 11 52 11
PK
DIM_VENDEDOR DIM_VENDEDOR
Tabla dimensional que contiene los Vendedores de la empresa Ventas Target Source
Precision Key? FK To NULL? Default Value Example Values SCD Type Source System Source Schema Source Table Source Field Name Source Datatype ETL Rules Autogenerar en el insert V0014 DANIEL PAREJA Sistema Integrado Sistema Integrado Sistema Integrado N/A N/A FAVENDEDOR FAVENDEDOR Cod_vendedor Nombre_vendedor A(3) A(70) Comments
Column Name
Display Name
Datatype
Size
11 4 70
PK
Estado_Vendedor
Estado_Vendedor
varchar
Activo
N/A
FAVENDEDOR
Estado_vendedor
A(1)
17
Inteligencia de Negocios
Table Name
Table Type View Name Display Name Description Used in schemas
DIM_ITEM_INVENTARIO
Dimensin
DIM_ITEM_INVENTARIO DIM_ITEM_INVENTARIO
Tabla dimensional que contiene los tems de inventario Ventas Target Source
Precision Key? FK To NULL? Default Value Example Values SCD Type Source System Source Schema Source Table Source Field Name Source Datatype ETL Rules Autogenerar en el insert V0014 Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado N/A N/A N/A N/A N/A FAARTICULOS FAARTICULOS INFAMILIA ADESTADO FAARTICULOS Cd_item Descripcin_item Desc_familia Desc_estado Precio_Unitario A(8) A(120) A(60) A(60) N(12,2) Comments
Column Name
Display Name
Description ID de la dimensin tem de inventario Cdigo identificatorio del tem de inventario Descripcin del tem de inventario Descripcin de la familia de inventarios Estado del tem de inventario
Datatype
Size
11 8 120 60 1 12,2
PK
Precio unitario de venta (sin Decimal IGV) Cdigo de articulo base textil Descripcin del artculo base textil Nro de diseo (estampado) varchar Cdigo de color varchar Descripcin del color varchar Cdigo de calidad varchar varchar varchar varchar
16 70 5 5 80 1
Desc_Calidad Unidad_Medida
Desc_Calidad Unidad_Medida
20 30
N/A N/A
PR.CALIDAD FAARTICULOS
Desc_Calidad Unidad_Medida
A(20) A(4)
18
Inteligencia de Negocios
DIM_TIEMPO DIM_TIEMPO
Tabla dimensional que contiene los parmetros o intervalos de tiempos Ventas Target Source
Precision Key? FK To NULL? Default Value Example Values SCD Type Source System N/A Source Schema N/A Source Table Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Hoja de clculo en Excel Source Field Name Source Datatype ETL Rules Comments
Column Name
Display Name
Description
Datatype
Size
ID_Tiempo
ID_Tiempo
Identificador de tiempo
int
11
PK
16458
Fecha
Fecha
Fecha
date
10
7 FEB 2012
N/A
N/A
Anyo
Anyo
Nmero de ao
int
11
23
N/A
N/A
Nro_Mes
Nro_Mes
int
11
N/A
N/A
Mes
Mes
varchar
10
Junio
N/A
N/A
Nro_Semana_Anual Nro_Semana_Anual
int
11
N/A
N/A
Bimestre
Bimestre
int
11
N/A
N/A
Trimestre
Trimestre
Nmero de trimestre
int
11
N/A
N/A
Semestre
Semestre
Nmero de semestre
int
11
19
Inteligencia de Negocios
HECHO_VENTA
Fact
HECHO_VENTA HECHO_VENTA
Tabla de hechos que contiene informacin del movimiento de ventas
Target
Column Name Display Name Description
Clave nica para los registros de ventas Identificador de la tabla dimensional tiempo Identificador de la tabla dimensional cliente Identificador de la tabla dimensional condicin de pago Identificador de la tabla dimensional vendedor Identificador de la tabla dimensional tem de inventario Descripcin del tipo de documento de operacin Serie y nmero del documento de ventas Cantidad Vendida Venta neta moneda local (nuevos soles) Venta neta dlares Monto impuestos a las ventas en moneda local (nuevos soles) Monto impuestos a las ventas en dlares Venta total en moneda local (nuevos soles) decimal VentaTotal_MonDolar VentaTotal_MonDolar Venta total en moneda dlares 12,2 1,620.00 decimal 12,2 decimal 12,2 decimal VentaTotal_MonLocal VentaTotal_MonLocal 12,2 6,300.00 320.00 1,300.00
Source
Key? FK To NULL ?
N
Datatype
Size
Preci sion
Default Value
Example Values
985654
Source System BBDD MySql Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado
Source Schema NA N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A N/A
Source Table
Source Datatype
Extraction/Transformation Rules
Comments
Asignado por el auto generador de la base de datos Asignado por el sistema transaccional Asignado por el sistema transaccional Asignado por el sistema transaccional Asignado por el sistema transaccional Asignado por el sistema transaccional
Key_venta
Key_Ventas
Int
11
ID_Tiempo ID_Cliente
ID_Tiempo ID_Cliente
Int Int
11 11
FK FK
iD_Condicin_Pago
iD_Condicin_Pago
Int
11
FK
ID_Vendedor
ID_Vendedor
Int
11
FK
ID_Item_inventario
ID_Item_inventario
Int
11
FK
10 12 12,3 0011234567 5
Desc_Tipo_Doc Nro_Documento Cantidad (calculado por el ETL) (calculado por el ETL) (calculado por el ETL) (calculado por el ETL) (calculado por el ETL) (calculado por el ETL)
A (40) Ar(15) N(12,3) FAREGISTRO.Imp_Unit_MN * (1 + FAREGISTRODET.Pct_iva) FAREGISTRO.Imp_Unit_ME * (1 + FAREGISTRODET.Pct_iva) VentaNeta_MonLocal * FAREGISTRODET.Pct_iva VentaNeta_MonDolar * FAREGISTRODET.Pct_iva VentaNeta_MonLocal + Iva_MonLocal VentaNeta_MonDolar + Iva_MonDolar Nro_serie + '-' + Nro_correlativo
VentaNeta_MonLocal
VentaNeta_MonLocal
decimal decimal
12,2
FAREGISTRODET FAREGISTRO, FAREGISTRODET FAREGISTRO, FAREGISTRODET FAREGISTRO, FAREGISTRODET FAREGISTRODET, INV.STK.CICLICO FAREGISTRODET, INV.STK.CICLICO
money
VentaNeta_MonDolar
VentaNeta_MonDolar
12,2
Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado Sistema Integrado
money
Iva_MonLocal
Iva_MonLocal
money
Iva_MonDolar
Iva_MonDolar
money
money
N/A
money
20
Inteligencia de Negocios
2.3.2.
Modelo Lgico
dim_cliente ID_cliente Cod_cliente Razon_Social Desc_Tipo_Cliente Desc_Tipo_Documento Nro_documento_id Estado Direccion Pais Ubicacin_Dept Ubicacin_Prov Ubicacin_Dist
dim_item_inventario ID_Item_Inventario Cod_Item Descripcion_Item Familia Estado_Item Precio_Unitario Cod_Artculo Desc_Articulo Nro_Diseno Cod_Color Desc_Color Cod_Calidad Desc_Calidad Unidad_Medida
hecho_venta ID_Tiempo (FK) ID_Cliente (FK) ID_Condicin_Pago (FK) ID_Vendedor (FK) ID_Item_Inventario (FK) Desc_Tipo_Doc Nro_Documento Cantidad_Venta VentaNeta_MonLocal VentaNeta_MonDolar Iva_MonLocal Iva_MonDolar VentaTotal_MonLocal VentaTotal_MonDolar
dim_tiempo ID_Tiempo Fecha Anyo Nro_Mes Mes Nro_Semana_Anual Bimestre Trimestre Semestre
Fuente: propia
21
Inteligencia de Negocios
2.4.
Tablas Dimensionales Tamao del registro en bytes 86 258 97 85 440 Nro registros (Aprox.) 20 4501 3600 40 7000
Nombre de archivo
Total bytes
MBytes
Hecho_ventas
34425,600
28.33
Resumen del clculo: Tablas dimensionales: 1.4 Mb. Tabla de hechos: 28.33 Mb.
2.5.
Para Anlisis de Ventas Reporte de cantidad productos vendidos por pas por periodo de tiempo Reporte de las montos de venta total por moneda local por perodo de tiempo Reporte de las montos de venta total por moneda en dlares por perodo de tiempo Reporte de Cantidad de Ventas por Vendedor por periodo de tiempo y por pas Reporte del IGV a pagar en moneda local por perodo de tiempo Reporte del IGV a cobrar en moneda dlares por perodo de tiempo Reporte de Venta Neta en moneda local por perodo de tiempo Reporte de Venta Neta en moneda local por perodo de tiempo. Reporte utilidad operativa por familias de productos y productos
22
Inteligencia de Negocios
Reporte de margen de utilidad por familia de productos y calidad Reporte de monto de ventas por diseo textil y combinacin Reporte de monto de ventas por color Reporte de monto de ventas por proceso textil Reporte de monto de ventas por ancho Reporte de monto de ventas por vendedor y moneda Reporte del movimiento en un periodo de tiempo de las ventas totales en moneda local Reporte del movimiento en un periodo de tiempo de las ventas totales en moneda dlares Indicadores estadstico del desempeo de un vendedor con respecto a la cantidad vendida por perodo de tiempo. Reporte de anlisis del movimiento de la familia de un producto en el tiempo. Reporte de anlisis de la cantidad vendida en el tiempo. Reporte de anlisis de la cantidad vendida por ubicaciones en el tiempo. Reporte de anlisis de la cantidad vendida por cliente y tipo de cliente en el tiempo. Reporte de Anlisis de Ventas por perodo y por Vendedores Reporte de Anlisis de Ventas por clientes y por el producto A Reporte de Anlisis de Ventas por clientes y por el producto B
2.6.
Hardware
Servidor: Se requiere 2 servidores con las siguientes caractersticas: (1 en spare) Procesador Memoria RAM Disco Duro Raid Procesador Intel Xeon Quad Core 8 Gb 3 de 500 Gb. 5
23
Inteligencia de Negocios
Terminal: Procesador Memoria RAM (mnimo) Disco Duro (mnimo) Procesador Intel Corei3 2 Gb 100 Gb
Software
Servidor: Sistema Operativo Microsoft Windows Server 2008 Standard Edition Servidor de Base de Datos Tipo de Licencia SQL Server 2008 Enterprise Edition Enterprise
SW Adicional Requerido:
Pentaho Data Integration (Kettle ETL) Pentaho Open BI Suite Mondrian Java 6 Development Kit (JDK)
3.
Desarrollo de la solucin
PENTAHO BI SERVER
La plataforma de BI de Pentaho consiste en una aplicacin de inteligencia de negocios J2EE que incluye elementos como Pentaho Reporting y Pentaho Analysis. Pentaho es un framework, el cual, crea, publica, almacena, comparte y gestin a travs del Suite BI de Pentaho.
Para el presente proyecto se trabajar con la base de datos MySql, para lo cual, deber estar instalado previamente, asimismo, dicha BD ser direccionado para acceso desde las herramientas de pentaho.
24
Inteligencia de Negocios
1. Primeramente, deber descargarse e instalarse JDK (versin 1.5 en adelante), el cual, se puede efectuar ingresando a la pgina de Oracle. 2. Luego, proceder a descarga la herramienta Pentaho BI Server desde la siguiente direccin: http://community.pentaho.com/projects/bi_platform/
3. En seguida, proceder a desempaquetar el archivo .zip dentro de una carpeta, ejemplo: c:\pentaho. Mostrar las siguientes carpetas: Administration-console: Para administracin de usuario y base de datos BIServer-ce: Para la gestin de reportes y anlisis de datos.
4. Proceder a configurar el puerto de acceso a la pgina de pentaho del servidor Tomcat, para ello editar el archivo web.xlm desde: tomcat\ webapps\ pentaho\ WEB-INF\ web.xml Por defecto el puerto es 8080 para el aplicativo de pentaho y se puede proceder a modificar ubicando el siguiente tag: <param-value>http://localhost:8080/pentaho/</param-value>
5. Ahora, procedemos a iniciar el servicio del servidor, ingresando a la carpeta BI-server y ejecutando el archivo: start-pentaho.bat
25
Inteligencia de Negocios
6. Mostrar la siguiente ventana, el cual, se proceder a cargar el servidor Tomcat, si el servicio se levanta correctamente mostrar el mensaje de servidor iniciado:
7. Finalmente, procedemos a ingresar a la siguiente direccin para iniciar la consola de administracin de pentaho: http://localhost:8080/pentaho El usuario y contrasea de pentaho es joe y password por defecto.
26
Inteligencia de Negocios
Herramienta ETL Spoon es el diseador grfico de transformaciones y trabajos del sistema de ETL de Pentaho Data Integration (PDI), tambin conocido como Kettle (acrnimo recursivo: "Kettle Extraction, Transformation, Transportation, and Load Environment "). Est diseado para ayudar en los procesos ETL, que incluyen la Extraccin, Transformacin, Transporte y Carga de datos, facilitando as el mantenimiento de un Data Warehouses. Pan es un motor de transformacin de datos que realiza muchas funciones tales como lectura, manipulacin, y escritura de datos hacia y desde varias fuentes de datos. Para iniciar Kettle proceder con lo siguiente: 1. Descargar la herramienta desde la siguiente direccin: http://kettle.pentaho.com/ 2. Descomprimir el archivo recientemente descargado, en un directorio de su eleccin. Por ejemplo: "c:\pentaho". 3. En seguida, ingresar a la carpeta C:\pentaho\data-integration y ejecutar el archivo Spoon.bat
27
Inteligencia de Negocios
1. Haciendo clic en el botn de la barra de herramientas y seleccionar la opcin Transformacin. 2. Seleccionando en el men principal la opcin: Fichero -> Nuevo -> Transformacin 3. Presionando las teclas CTRL-N Cualquiera de estas acciones abre una pestaa nueva para comenzar a disear una Transformacin. Luego, se proceder a configurar la conexin a la base de datos de MySQL, para el caso prctico del proyecto se mostrar la extraccin de datos de archivo .csv y como destino una base de datos en MySQL:
Para crear una nueva conexin seleccionar en el panel izquierdo "Arbol Principal", hacer clic derecho en "Conexiones a bases de datos" y seleccionar "Nuevo" o "Asistente Nueva Conexin". Tambin se puede hacer doble clic en "Conexiones a bases de datos", o presionar F3.
28
Inteligencia de Negocios
En la ventana siguiente proceder a llenar informacin bsica de conexin como nombre de la conexin, tipo, mtodo de acceso, nombre del servidor y acceso al mismo.
La herramienta ofrece una serie de opciones que permite adecuar y mejorar el performance de la extraccin y transformacin de los datos uno de ellos es que Spoon utiliza una cach de base de datos. Cuando los datos de la cach ya no coinciden con la base de datos en cuestin, hacer clic derecho sobre la conexin en el rbol Principal y seleccionar la opcin 'Vaciar cach de Base de Datos'. Este comando se usa generalmente cuando las tablas de las bases de datos han sido cambiadas, creadas o eliminadas. En seguida se procede a agrega pasos de transformacin, para lo cual, haciendo uso de las herramientas se arrastrarn al rea de transformacin los siguientes elementos:
Para transformar los datos de entrada en salidas de acuerdo al formato de los campos del archivo de salida.
29
Inteligencia de Negocios
Para configurar los datos proceder a editar los pasos de transformacin de cada uno de los elementos asignando clic botn derecho y seleccionando la opcin Edit step.
Para el elemento de entrada se registra el nombre del archivo que contiene el origen de datos.
30
Inteligencia de Negocios
Para el elemento de salida se selecciona la base de datos y tabla donde se cargarn los datos.
Y el elemento de Select Values para seleccionar y definir la transformacin de los campos entre la entrada de datos y la salida del mismo.
31
Inteligencia de Negocios
), y en la ventana de Execute
32
Inteligencia de Negocios
Herramienta Mondrian Lo siguiente es para mostrar la construccin de un cubo utilizando el editor de cubos de pentaho llamado Schema Workbench. Para iniciar Schema Workbench proceder con lo siguiente: 1. Descargar la herramienta desde la siguiente direccin: http://mondrian.pentaho.com/ 2. Descomprimir el archivo recientemente descargado, en un directorio de su eleccin. Por ejemplo: "c:\pentaho". 3. En seguida, ingresar a la carpeta C:\pentaho\schema-workbench y ejecutar el archivo workbench.bat
En primer lugar, proceder a establecer la conexin con la base de datos, para ello seleccionar la opcin Database connection desde el men Options. Y se procede a configuracin la conexin a la base de datos con el que se trabajar la creacin del cubo, por ejemplo: Conexin al servidor MySQL y base de datos DW_Perupima:
33
Inteligencia de Negocios
En seguida se procede a crear el cubo: 1. Seleccionar la opcin File\New\Schema para crear un nuevo esquema. 2. En seguida se procede a asignar el nombre al esquema, luego se procede a agregar 3. un cubo asignando clic derecho sobre Schema, tal como se muestra a continuacin:
34
Inteligencia de Negocios
4. Asimismo, se van agregando las tablas que hacen referencia a los datos, las dimensiones, adems, de campos calculados, en la siguiente ventana nuestra el cubo para el anlisis de ventas por periodo de los vendedores:
5. Luego, se procede a publica el cubo para visualizar a travs del servidor de pentaho, para ello ingresa a la opcin Publish dentro del men File:
35
Inteligencia de Negocios
Se debe verificar la URL donde se encuentra instalado pentaho, para las credenciales de Pentaho utilizar el usuario por defecto joe y la clave password, para establecer la clave de publicacin ingresar a la carpeta biserver-ce\pentaho-solutions\system y editar el archivo Publisher_config.xml y agregar la contrasea dentro del tag Publisher-config:
36
Inteligencia de Negocios
Luego, clic en la OK y si la conexin al repositorio es correcto muestra la siguiente pantalla:
Dentro de la ventana se registra: La locacin del esquema en este caso se va alojar en la nueva carpeta beperupima Y para la configuracin de publicacin Publish Settings se indica el nombre de la conexin a la base de datos que se encuentra configurado en el servidor pentaho y se activa la opcin Register XMLA Data Source para que el sistema cree un archivo adicional XML que contendr la configuracin para la conexin de datos y la estructura del cubo dimensional.
Pentaho Bi Server cuenta con funciones web para gestionar el sistema, as como tambin, incluye una solucin que integra reportes, anlisis, dashboards y componente de Datamining. En seguida, se muestra el uso de la herramienta para analizar datos de un cubo. 1. Para iniciar pentaho Server BI se procede de la siguiente forma: Primero, ingresar a la carpeta ..\pentaho\ biserver-ce y ejecutar el archivo startpentaho.bat.
37
Inteligencia de Negocios
3. Luego, dentro de la ventana seleccionar el esquema y el cubo a analizar los datos, clic OK
38
Inteligencia de Negocios
Se podr hacer uso de las distintas opciones de la barra de la vista de anlisis para filtrar datos, efectuar consultas MDX, ordenar, cambiar la perspectiva de los datos entre horizontal / vertical, exportar a Excel, imprimir o incluso agregar un . Por ejemplo, clic en el botn Chart Config y mostrar las siguiente opciones desde donde podr elegir las caractersticas del grfico:
Elegir para el tipo de grfica Pie Charts by Row y clic en OK, y se mostrar lo siguiente:
39
Inteligencia de Negocios
40
Inteligencia de Negocios
Reportes realizados:
Se puede apreciar el reporte por ao en este caso 2011 por mes y por condicin de pago para cada vendedor, donde podemos sacar indicadores de que vendedor es ms productivo, bajo que condicin de pago es el ms usado por el vendedor
41
Inteligencia de Negocios
Reporte de Anlisis de Ventas por clientes y por el producto A
En este reporte podemos analizar las ventas por clientes por tipo de productos y por periodo de tiempo de manera que podemos ver el comportamiento de un cliente en el tiempo, podemos ver que productos son los ms vendidos en determinados perodos de tiempo.
42
Inteligencia de Negocios
Reporte de Anlisis de Ventas por clientes y por el producto B
En este reporte tambin podemos observar las ventas por clientes y por tiempo de un determinado producto y poder analizar el comportamiento de este producto en el tiempo y que tipo de clientes lo prefieren.
43
Inteligencia de Negocios
4.
44
Inteligencia de Negocios
CONCLUSIONES
Las necesidades de informacin de la Direccin de la organizacin deben ser analizadas para realizar un modelamiento dimensional preparado para necesidades y crecimiento futuro de los SI de la empresa. Al disear el Datamart se debe pensar en que ser parte de un Data Warehousing para la empresa.
La tendencia actual es orientar las soluciones de Inteligencia de Negocios al nivel de estrategias de la empresa. Por lo tanto, el equipo de proyecto de TI debe retroalimentar las necesidades de la gerencia de Per Pima S.A. para ayudar en las actividades de la planificacin estratgica.
Si bien es cierto que el proyecto se inicia con una solucin BI para el rea Comercial y de Finanzas, es interesante colocar informacin que permita contrastar y generar indicadores claves para dichas reas como el comportamiento de las ventas de un determinado producto en un periodo de tiempo o el comportamiento de un producto especfico por tipo de cliente en un periodo de tiempo. Hemos dirigido el modelamiento dimensional en funcin a una visin macro. Un ejemplo de ello es el diseo de la tabla de hechos de Ventas que incluye la utilidad y margen porcentual de utilidad por producto; siendo esta informacin til a la Contabilidad de Costos.
Un aporte efectivo en cuanto a requerimientos de informacin por parte de los usuarios permitir valor agregado en la solucin BI del proyecto.
Es muy importante conocer las estructuras transaccionales y las necesidades de los usuarios con respecto a la solucin BI a implementar, para poder hacer un adecuado modelamiento dimensional para implementar correctamente dicha solucin.
En proyectos BI usualmente el usuario decide cuanto tiempo atrs abarcar la data histrica. Para nuestro proyecto estimamos que 6 aos es una cantidad de tiempo adecuada para mostrar consistencia en la informacin a mostrar en las consultas.
Es importante utilizar una metodologa para los procesos del desarrollo del proyecto y que sirva como gua en cada una de las etapas de la implementacin del Datamart para garantizar el xito del mismo.
45
Inteligencia de Negocios
BIBLIOGRAFIA
CURTO DIAZ, Josep Y CONESA I CARALT, Jordi 2010 Introduccin al Business Intelligence. Editorial UOC, 2010. Ramba del Poblenou 156, 08018. Barcelona.ISBN: 978-84-9788-886-8
SABHERWAL, Raijiv y BECERRA-FERNANDEZ, Irma 2007 Business Intelligence. Practices, Technologies and Management. ISBN: 978-0-470-46170-9
KROENKE, David M. 2003 Procesamiento de bases de datos, 8va Edicion. Pearson Educacin, Mxico. 2003 ISBN 970-26-0325-0
INMON, W.H. 2005 Building the Data Warehouse, 4th Edition. Hoboken: John Wiley & Sons.
46
Inteligencia de Negocios
GLOSARIO
OLAP: Es el acrnimo en ingls de On-Line Analytical Processing. Es un modelo de solucin informtica cuyo objetivo es visualizar y trabajar en forma gil con grandes cantidades de informacin. Para lograr ello trabaja con estructuras multidimensionales que contienen datos resumidos extrados de las bases de datos transaccionales. Schema: palabra en ingls que literalmente significa esquema. Relacionado con la teora de BI, significa modelo lgico de definicin de las estructuras de datos y sus relaciones dentro de una solucin de Datawarehouse.
47
Inteligencia de Negocios
SIGLARIO
BI: Business Intelligent DSS: Decision Support Systems EEI: Enterprise Information Integration KPI: Key Performance Indicator ODS: Operational Data Store OLAP: On-Line Analytical Processing SI: Sistemas de Informacion SQL: Structured Query Language TI: Tecnologas de la Informacion URL: Uniform Resource Locator
48
Inteligencia de Negocios
ANEXOS
Pantalla
de
registro
de
documentos
de
facturacin.
Archivos
FAREGISTRO
FAREGISTRODET.
49
Inteligencia de Negocios
Tabla maestra de tems de Inventario. Archivo FAARTICULOS.
Sub-ventana del mantenimiento de tems de Inventario donde se aprecia los atributos de los productos terminados:
50