Professional Documents
Culture Documents
Presentado Por : Luis Alberto Velez Tascon; Alejandro Grajales;An dres Alzate; Santiago Fuentes
Qu es un DataWarehouse?
Coleccin de datos con las siguientes caractersticas (B. Immnon 1996) : Orientado a materias o temas Integrado No voltil Variante en el tiempo Sirve de soporte a consultas de ayuda a la decisin Cual es su uso?
Los almacenes de datos hacen ms fcil el acceso a una gran variedad de datos a los usuarios finales Facilitan el funcionamiento de las aplicaciones de los sistemas de apoyo a la decisin tales como informes de tendencia', por ejemplo: obtener los tems con la mayora de las ventas en un rea en particular dentro de los ltimos dos aos; informes de excepcin, informes que muestran los resultados reales frente a los objetivos planteados a priori. Los almacenes de datos pueden trabajar en conjunto y, por lo tanto, aumentar el valor operacional de las aplicaciones empresariales, en especial la gestin de relaciones con clientes.
Qu es minera de datos?
y y Extraccin no trivial de informacin implcita, previamente desconocida y potencialmente til a partir de datos Exploracin y anlisis, por medios automticos o semiautomticos, de grandes cantidades de datos con el fin de descubrir patrones significativos
Que no es minera de datos y Look up phone number in phone directory y Query a Web search engine for information about Amazon
Cul es su Motivacin?
Web de datos, e-commerce Las compras en el departamento / tiendas de abarrotes Transacciones de Banco / Tarjeta de Crdito Las computadoras se han convertido en baratas y ms potentes La presin competitiva es fuerte Brindar mejores servicios a medida para una ventaja (por ejemplo, en Customer Relationship Management) A menudo hay informacin "oculta" en los datos que no es muy evidente. Los analistas de informacin puede llevar semanas para descubrir informacin til. Muchos de los datos no se analizan del todo Orgenes de la minera de datos Dibuja las ideas de aprendizaje de mquina / IA, el reconocimiento de patrones, las estadsticas y los sistemas de base de datos Tcnicas tradicionales pueden ser inadecuados debido a la: enormidad de datos alta dimensionalidad de los datos La naturaleza heterognea, distribuida de datos Tareas de minera de datos Mtodos de prediccin y Uso de algunas variables para predecir los valores futuros desconocidos o de otras variables.
Tipos de minera de Datos y Clasificacin [Predictiva] y Clustering [Descriptiva] y Descubrimiento de reglas de asociacin [Descriptiva] y Descubrimiento de patrones secuenciales [Descriptiva] y Deteccin de anomalas [Predictiva]
Clasificacin: Definicin Dada una coleccin de registros (conjunto de entrenamiento) y y Cada registro contiene un conjunto de atributos, uno de los atributos es la clase. Buscar un modelo de atributo de la clase en funcin de los valores de otros atributos.
Agrupacin: Definicin Dado un conjunto de puntos de datos, cada uno con un conjunto de atributos, y una medida de similitud entre ellos, encontrar grupos de tal manera que y y Los datos puntos en un grupo son ms similares entre s. Los datos puntos en grupos separados son menos similares entre s.
Descubrimiento de reglas de asociacin: Definicin Dado un conjunto de registros de cada uno de los cuales contienen un cierto nmero de elementos de una coleccin determinada; Elaborar reglas de dependencia que prediga la ocurrencia de un elemento basado en las ocurrencias de otros artculos. Descubrimiento de patrones secuenciales: Definicin Dado un conjunto de objetos, donde cada objeto asociado con su propia lnea de tiempo de los acontecimientos, encontrar las reglas que predicen una fuerte dependencia secuencial de los diferentes eventos. Las reglas se forman en primer lugar, para descubrir patrones. Ocurrencias de eventos en los patrones se rigen por las limitaciones de tiempo. Desviacin / Deteccin de anomalas Detectar desviaciones significativas de la conducta normal Aplicaciones: Deteccin de Fraude en Tarjeta de Crdito
Bibliografa
Valle, U. d. (10 de 1 de 2011). Descubrimiento de Conocimiento en Bases de Datos (2008). Recuperado el 20 de 1 de 2011, de http://eisc.univalle.edu.co/materias/KDD: http://eisc.univalle.edu.co/materias/KDD/download/Clase2kdd-08.pdf Valle, U. d. (20 de 01 de 2011). Universidad Del Valle Mineria de Datos. Recuperado el 20 de 1 de 2011, de http://eisc.univalle.edu.co/materias/KDD/download/dmintroduccion.pdf wikipedia.com. (20 de 1 de 2011). wikipedia.com, almacenes de datos. Recuperado el 20 de 1 de 2011, de http://es.wikipedia.org/wiki/Almac%C3%A9n_de_datos wikipedia.com. (20 de 1 de 2011). wkipedia.com, mineria de datos. Recuperado el 1 de 20 de 2011, de http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos