You are on page 1of 45

UNIVERSIDAD GALILEO HERBERT PATZAN CARRILLO

TECNOLOGIA DE NEGOCIOS ELECTRONICOS BASES DE DATOS

CONCEPTO

Es un conjunto de información no redundante en datos estructurados y organizados independientemente de su utilización y su implementación, accesibles en tiempo real y compatibles con usuarios concurrentes con necesidad de información de diferente tipo y en diferente momento

CONCEPTO

En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta. En la actualidad, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos tienen formato electrónico, que ofrece un amplio rango de soluciones al problema de almacenar datos.

COMPONENTES

En informática existen los sistemas gestores de bases de datos (SGBD), que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada.

son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición de datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta

COMPONENTES  Entre los SGBD mas conocidos están:  Libres  MySQL  PostgreSQL  Firebird  Apache Derby  Gratuitos  Microsoft SQL Server Compact Edition  Sybase Express Edition para Linux .

COMPONENTES  Comerciales  IBM DB2  IBM Informix  Microsoft Access  Microsoft SQL Server  Oracle  Sybase IQ .

VENTAJAS DE LAS BD´s         Independencia de datos y tratamiento Coherencia de resultados Mayor disponibilidad de datos Cumplimiento de normas Facilidad de manejo Seguridad de la información No hay duplicidad de datos Integridad referencial .

DESVENTAJAS DE LAS BD´s    Los costos de actualización de hardware y software pueden ser elevados. Los registros muy grandes pueden ser difíciles de leer en pantalla. . El costo o remuneración para un administrador de base de datos puede ser muy grande.

JERARQUIA DE DATOS     Carácter  Unidad de construcción básica de información representada por un byte Campo  Grupo de caracteres Registro  Conjunto de campos relacionados Archivo  Grupo de registros relacionados .

entonces. para los cuales se recopilan. el conjunto de valores posibles que puede tomar un atributo dado de un conjunto de entidades. . lugares o cosas (objetos). Atributo  Los atributos. almacenan y mantienen datos. El dominio es.JERARQUIA DE DATOS    Base de Datos  Conjunto de archivos integrado y relacionados. tanto de entidades como de relaciones. toman sus valores posibles de un conjunto llamado dominio. Entidad  Tipos generalizados de personas.

CLAVE PRIMARIA  Campo o grupo de campos que identifica exclusivamente el registro. .JERARQUIA DE DATOS    ALMACENAMIENTO DE DATO  Valor especifico de un atributo. CLAVE  Campo o grupo de campos en un registro que se usa para identificar a este ultimo.

Tras ser postulados sus fundamentos en 1970 por Edgar Frank Codd. Esto es pensando en cada relación como si fuese una tabla que está compuesta por registros (las filas de una tabla). . y campos (las columnas de una tabla). que representarían las tuplas. Estas relaciones podrían considerarse en forma lógica como conjuntos de datos llamados "tuplas".MODELO RELACIONAL   Éste es el modelo más utilizado en la actualidad para modelar problemas reales y administrar datos dinámicamente. no tardó en consolidarse como un nuevo paradigma en los modelos de base de datos. de los laboratorios IBM en San José (California). Su idea fundamental es el uso de "relaciones".

Structured Query Language o Lenguaje Estructurado de Consultas.MODELO RELACIONAL  El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL. un estándar implementado por los principales motores o sistemas de gestión de bases de datos relacionales. Durante la elaboración de una base de datos relacional pasa por un proceso de normalización .

MODELO RELACIONAL  Ente las ventajas del modelo relacional están:  Garantizar herramientas para evitar la duplicidad de registros.  Favorece la normalización por ser más comprensible y aplicable. . a través de campos claves o llaves.  Garantiza la integridad referencial: Así al eliminar un registro elimina todos los registros relacionados dependientes.

MODELO RELACIONAL  El proceso de normalización de bases de datos consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional. Las bases de datos relacionales se normalizan para:    Evitar la redundancia de los datos. Proteger la integridad de los datos. . Evitar problemas de actualización de los datos en las tablas.

 Primera Forma Normal (1NF): No hay campos múltiples (todo los campos son atómicos). .MODELO RELACIONAL  Las relaciones que describe Codd al definir su modelo relacional. Las Formas Normales buscan optimizar estas estructuras eliminando básicamente la redundancia utilizando como medio principal las dependencias funcionales. Todas las filas deben tener el mismo numero de columnas. Las Formas Normales son un pequeño numero de reglas que de cumplirse hacen que las estructuras posean la menor cantidad de redundancia posible. son transformadas en tablas al momento de trabajar con una base de datos.

MODELO RELACIONAL     Segunda Forma Normal (2NF): Todo campo que no sea clave debe depender por completo de toda la clave. Cuarta Forma Normal (4NF): Una fila no debe contener dos o más campos multi-valorados (aquellos que pueden contener más de un valor simultáneamente) sobre una entidad. . Tercera Forma Normal (3NF): No hay dependencias transitivas. Un campo debe depender de la clave y no de otro campo. Forma Normal de Boyce-Codd (BCNF): Todos los determinantes de la tabla son clave candidata.

MODELO RELACIONAL  Quinta Forma Normal (5NF): Una tabla puede almacenar atributos dependientes a la clave sólo por unión. .

Cuando se integra las características de una base de datos con las de un lenguaje de programación orientado a objetos. el resultado es un sistema gestor de base de datos orientada a objetos (ODBMS. Un ODBMS hace que los objetos de la base de datos aparezcan como objetos de un lenguaje de programación en uno o más lenguajes de programación a los que dé soporte. Object Database Management System). . la información se representa mediante objetos como los presentes en la programación orientada a objetos.ORIENTADAS A OBJETOS  En una base de datos orientada a objetos.

C#. Los ODBMS usan exactamente el mismo modelo que estos lenguajes de programación. Visual Basic. recuperación de datos.NET y C++. control de concurrencia. Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos como Java. consultas asociativas y otras capacidades. .ORIENTADAS A OBJETOS   Un ODBMS extiende los lenguajes con datos persistentes de forma transparente.

ORIENTADAS A OBJETOS  Herencia  Las clases en un sistema orientado a objetos se representan en forma jerárquica. así que las propiedades o características del elemento persona las contendrán (heredaran) los elementos alumno y maestro. Se puede decir que tanto la entidad Alumno y maestro son subclases de la clase persona .

se debe de cuidar los elementos que se han heredado de esa clase a otras y reestructurar la jerarquía. Eliminación de una clase: Se requiere la realización de varias operaciones. la nueva clase debe colocarse en la jerarquía de clase o subclase cuidando las variables o métodos de herencia correspondientes.ORIENTADAS A OBJETOS  En base de datos orientados a objetos pueden existir los siguientes cambios:   Adición de una nueva clase: Para realizar este proceso. .

.MULTIDIMENCIONALES  Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y se puede decir que son bases de datos de una sola tabla. su peculiaridad es que por cada dimensión tienen un campo y otro campo por cada métrica o hecho es decir tienen n-tuplas de campos.

Máquinas Baratas) Hecho Fact (Ventas. Ventas.Productos) Jerarquía (Año->Semestre->Mes->Semana).(Categoría->Línea>Marca) Elementos(2006. Defectos.2007 Ó Máquinas caras.MULTIDIMENCIONALES       EJEMPLO: Dimensión (Tiempo. Devoluciones) Métrica (PD:=Devoluciones/Ventas. Cantidad de Defectos) tabla tiempo productos ventas 1000 inventario 200 defectos devoluciones devolucion es ventas 5% 2006 todos 10 1--100 . Inventario.

El server de Data Mining debe estar integrado con el data warehouse y el server OLAP para insertar el análisis de negocios directamente en esta infraestructura. . u otras perspectivas claves para su negocio.MULTIDIMENCIONALES  Las estructuras multidimensionales permiten que el usuario analice los datos de acuerdo a como quiera mirar el negocio. resumido por línea de producto.

DATA WAREHOUSING  En el contexto de la informática. procesamiento analítico en línea). almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficientes de datos (especialmente OLAP. sobre todo.  Se trata. . de un expediente de una empresa más allá de la información transaccional y operacional. un almacén de datos (data warehouse) es una colección de datos orientados a un dominio. integrado y variable que ayuda a la toma de decisiones de la empresa u organización.

Organiza y almacena los datos que se necesitan para el procesamiento analítico.DATA WAREHOUSING  Data warehousing es el centro de la arquitectura para los sistemas de información en la década de los '90. informático sobre una amplia perspectiva de tiempo. Facilita la integración de sistemas de aplicación no integrados. una plataforma sólida. a partir de los datos históricos para hacer el análisis. . Soporta el procesamiento informático al proveer.

DATA WAREHOUSING Base de Datos Operacional Datos Operacionales Orientado a la aplicación Actual Detallada Data Warehouse Datos del negocio para Información Orientado al sujeto Actual + histórico Detallada + más resumida Cambia continuamente Estable .

diseñados para soportar las actividades de coordinación y manejo de documentación y definidos para facilitar consultas sobre información almacenada en el sistema y asi proporcionar informes. orientados a soportar la toma de decisiones.DATA WAREHOUSING Sistemas Estratégicos. Sistemas Técnico-Operativos. Sistemas Tácticos. que cubren el núcleo de operaciones tradicionales de captura masiva de datos y servicios básicos de tratamiento de datos .

es consecuencia del desarrollo organizacional orientado a un mercado de carácter global.DATA WAREHOUSING  Sistemas Interinstitucionales. el cual obliga a pensar e implementar estructuras de comunicación más estrechas entre la organización y el mercado . este último nivel de sistemas de información recién está surgiendo.

El almacén de datos da respuesta a las necesidades de usuarios conocedores.DATA WAREHOUSE    En un almacén de datos lo que se quiere es contener datos que son necesarios o útiles para las empresas. Un almacén de datos debe entregar la información correcta a la gente indicada en el momento adecuado en el formato correcto. . utilizando Sistemas de Soporte de Decisiones (DSS) El ambiente de un Data Warehouse queda definido por la suma de los diferentes DataMarts integrados. no sólo a nivel físico sino también a nivel lógico.

DATA WAREHOUSE  CARACTERISTICAS:  Orientado al tema  Integrado  De tiempo variante  No volátil .

DATA WAREHOUSE .

DATA MINING  Bajo el nombre de minería de datos se engloban un conjunto de técnicas encaminadas a la extracción de "conocimiento" procesable implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de predicción. clasificación y segmentación .

Un estudio muy citado detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a la vez pañales y cerveza.  El ejemplo clásico de la minería de datos tiene que ver con la detección de hábitos de compra en supermercados.DATA MINING  Un proceso típico de minería de datos parte de la selección del conjunto de datos. como posiblemente al muestreo de los registros disponibles. . tanto en lo que se refiere a las variables dependientes. como a las variables objetivo.

. El supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas compulsivas.DATA MINING  Se detectó que se debía a que dicho día solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión con una cerveza en la mano.

 Regresión: define la relación entre una o más variables. .DATA MINING  LA MINERIA DE DATOS SE BASA EN LA ESTADISTICA Y TOMA LA SIGUIENTE INFORMACION:  Análisis de la Varianza: mediante el cual se contrasta la existencia de diferencias significativas entre las medidas de una o más variables continuas en grupo de población distintos.

 Análisis discriminante: permite la clasificación de individuos en grupos que previamente se han establecido.DATA MINING  Análisis cluster: permite la clasificación de una población en un número determinado de grupos. y por tanto una mejor identificación. permite encontrar la regla de clasificación de los elementos de estos grupos. en base a semejanzas y desemejanzas de perfiles existentes. .

de estrategias de marketing. la extensión de los modelos de compra en línea.DATA MINING  TENDENCIAS  La Minería de Datos ha sufrido transformaciones en los últimos años de acuerdo con cambios tecnológicos. páginas de Internet.)  La necesidad de integrar los algoritmos y resultados obtenidos en sistemas operacionales. portales de Internet. Los más importantes de ellos son:  La importancia que han cobrado los datos no estructurados (texto. etc. etc. . etc.

) o para su análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio. depurar y transformar datos de los sistemas transaccionales e información desestructurada (interna y externa a la compañía) en información estructurada. aplicaciones y tecnologías que permiten reunir. para su explotación directa (análisis OLAP.BUSINESS INTELLIGENCE  Business Intelligence suele definirse como la transformación de los datos de la compañía en conocimiento para obtener una ventaja competitiva.  . Business Intelligence puede ser el conjunto de metodologías.

y de dónde proceden esos datos y cuál es la disponibilidad y periodicidad requerida. se deben contestar a tres preguntas básicas: cuál es la información requerida para gestionar y tomar decisiones.BUSINESS INTELLIGENCE  COMPONENTES DE BI  Diseño conceptual de los sistemas. cuál debe ser el formato y composición de los datos a utilizar. Para resolver el diseño de un modelo BI. .

en ocasiones.BUSINESS INTELLIGENCE  Herramientas información:  de explotación de la es el área donde más avances se han producido en los últimos años. Sin embargo. tanto en detalle sobre información agregada.  Query & reporting:  herramientas para la elaboración de informes y listados. la proliferación de soluciones y su aplicación coyuntural para solucionar aspectos puntuales ha llevado. a una situación de desánimo en la organización respecto a los beneficios de una solución BI. a partir de la información de los datawarehouses .

Permiten a los usuarios trocear sus datos planteando queries sobre diferentes atributos o ejes. capacidades intensivas de cálculo y técnicas de indexación especializadas.BUSINESS INTELLIGENCE  OLAP (on-line analytical processing):  herramientas que manejan interrogaciones complejas de bases de datos relacionales. . proporcionando un acceso multidimensional a los datos.

compartida por toda la organización. obviamente. menores tiempos de respuesta en su obtención. del incremento de la eficiencia en el proceso de toma de decisiones: mayor información. los beneficios se derivan. de mejor calidad. mejora de la comunicación en la empresa y creación de un lenguaje homogéneo. más fiable.BUSINESS INTELLIGENCE  BENEFICIOS:  Cualitativamente. .