Um Ambiente de DW

Prof: Jailton Cardoso da Cruz Instituto Federal de Alagoas

Agenda


 

Conceitos Processo de DW Apresentando ferramenta OLAP Perguntas

Conceitos

Data Warehouse

Armazém de dados. Pode ser definido como um banco de dados, destinado a sistemas de apoio à decisão e cujos dados foram armazenados em estruturas lógicas dimensionais, possibilitando o seu processamento analítico por ferramentas especiais (OLAP e Mining). Um data warehouse é um conjunto de dados baseado em assuntos, integrado, não-volátil, e variável em relação ao tempo, de apoio às decisões gerencias.[Inmon 96]

Conceitos

Data Warehouse - objetivos
   

 

O data warehouse fornece acesso a dados corporativos ou organizacionais Os dados do data warehouse são consistentes Os dados do DW podem ser separados e combinados usando-se qualquer medição possível do negócio O DW não consiste apenas dos dados, mas também de um conjunto de ferramentas para configurar, consultar, analisar, e apresentar as informações O DW é o local em que publicamos dados confiáveis A qualidade dos dados do DW impulsiona e reengenharia de negócios

Conceitos  Data Warehousing – coleção de tecnologias de suporte à decisão voltada para quem trabalha com conhecimento e não apenas com informação. Permite aos gerentes de empresas obter e integrar informações de fontes heterogêneas e consultar grandes bases de dados eficientemente .

também denominado “Star Squema” é composto por uma tabela central.O Modelo DF (Dimensional Fact)  O modelo dimensional. chamada de tabela de fatos. onde:     Fatos . e um conjunto de tabelas relacionadas chamadas de dimensões.é o foco de interesse de um empresa (negócio) Dimensões – determina a granularidade adotada para representar fatos Atributos – propriedades do fato Hierarquias– determina como os atributos das dimensões devem ser arranjados de forma que mantenham um relacionamento 1-N .

Definindo Fato     Um fato expressa um relacionamento um-para-muito através das dimensões As tabelas de fatos servem para armazenar medidas numéricas associadas a eventos de negócio Cada combinação de valores das dimensões define uma instância do fato (fact instance) Instância do fato é a informação elementar representada no DW. que constituem os valores objeto de análise dimensional . cada fato pode armazenar uma ou mais medidas numéricas.

Definindo Dimensão    Dimensão determina como cada instância do fato pode ser agregada significantemente para o processo de tomada de decisão As tabelas de dimensão representam entidades de negócios. As tabelas de dimensão possuem relacionamento 1:N com a tabela de fato A escolha das dimensões é crucial para determinar a granularidade das instâncias do fato .

average. são chamados de métricas. pois normalmente são somados e trabalhados nas diversas dimensões . max) . somatórios. mínimo e máximo obtidas através das funções agregadas SQL (count. etc Estes valores que estarão na intercessão das dimensões. min.Definindo Atributos do fato   Atributos do fato são basicamente contadores de ocorrências. médias. sum.

Definindo Hierarquias  Ao longo das dimensões os atributos devem ser arranjados de forma que mantenham um relacionamento 1-para-n entre os atributos da dimensão possibilitando análise através de vários níveis de agregação Departamento Categoria Sub-categoria Marca Produto .

Resumo – Passos para Modelagem Dimensional  Definir a área de negócio     Definir processo(s) dentro da área de negócio Definir a granularidade desejada para os dados do processo Definir os atributos e hierarquias das dimensões  Prioridades de negócios. percepção mercado. comportamento de clientes de  Definir as métricas da tabela de fato Considerar hierarquias múltiplas .

O Processo DW  Consiste de quatro fases     Extração de dados de fontes operacionais diversas Organização e integração dos dados de forma consistente no DW Gerenciamento do DW Acessar os dados de uma maneira eficiente e flexível .

O Processo DW .

.

O Processo DW  Primeira fase .Extração de dados de fontes operacionais diversas   Requer conhecimento do(s) ambiente(s) transacional(is) de onde serão extraídos os dados baseado no modelo dimensional definido Abrange casos típicos de serviços de informação heterogêneo tais como:    Estruturas de dados incompatíveis Dados inconsistentes Granularidade diversificada .

.

.

1999 TABELAS .

O Processo DW  Segunda fase  Requer projeto completamente diferente do adotado para sistemas operativos (transacionais)   Dados dentro do DW são organizados de acordo com o modelo dimensional Projeto é baseado em um modelo de negócio da empresa .

.

.

69 DIMENSÕES .

24 DATA MARTS (FATOS) .

.

Datas de 23/03/0001 a 31/05/5007 .

.

.

O Processo DW  Terceira fase  Monitoramento/gerenciamento das atividades do DW     Que dados estão em uso Quem está utilizando o data warehouse Qual o tempo de resposta  Otimização de queryes complexas Qual o planejamento do agendadamento dos processos de ETL .

.

.

.

.

.

O Processo DW  Terceira fase    Requer capacidade de navegação em agregados Uma interface visual amigável para ser utilizada por OLAP (On Line Analytical Processing) Mineração de dados .

Interfaces de apoio à Decisão  Requisitos  Manipular dados corporativos   Diferentes níveis de agregação Diferentes critérios de agregação  Critério => Dimensão negócio  Emitir séries temporais  Conhecer o passado para prever o futuro   Alertar no caso de dados anômalos Ajudar o executivo a descobrir a(s) causa(s) de exceções .

.

.

Inmon Gerenciando DataWarehouse – W. H.microstrategy. Inmon .com.br Data Warehouse Toolkit – Técnicas para Construir Data Warehouses Dimensionais Ralph Kimball.    www. 1998 Como Construir Data Warehouse – W. H.

Perguntas ? .

Perguntas OBRIGADO .