You are on page 1of 21

SAD – Sistemas de Apoio à Decisão

Modelagem Dimensional de Dados Conceitos Avançados Profa.: Ellen Souza

UFRPE

1 Universidade Federal Rural de Pernambuco Unidade Acadêmica de Serra Talhada

Modelagem Dimensional
Alguns refinamentos podem ser realizados na modelagem dimensional e casos especiais podem surgir, tais como:
Conformidade de Dimensões Combinação de Dimensões Dimensões Especiais Dinâmica das Dimensões Dimensões Degeneradas Dimensões Lixo (junk) Campos chaves de Dimensões e Fatos Tabela fatos sem dados ou métricas Tabelas fatos com classificação ou subtipos Relacionamentos M:N entre Fatos e Dimensões Agregados
2/41

1

Conformidade de Dimensões
Representa a coerência de definições entre dimensões estabelecidas em momentos diferentes do projeto de DW/DM As dimensões devem sempre ter o mesmo sentido semântico, para que os diversos esquemas dimensionais de diferentes DM possam ser “cruzados”, a fim de produzir informações compatíveis
Principal dificuldade dos DMs evolutivos!! No planejamento, as principais dimensões devem ser identificadas
3/41

Conformidade de Dimensões
Regra básica: sempre definir as dimensões com o maior grau de granularidade (mais detalhada) possível Para dimensões clássicas como a de TEMPO, que é compartilhada por todos os DMs:
Definir a menor unidade desejada (dia ou hora, dependendo da necessidade do negócio) Definir hierarquias completas: Ano Semestre Trimestre Mês Dia

4/41

2

poderá ter as hierarquias: Categoria Fabricante Produto Produto Ambas hierarquias podem ser definidas na mesma dimensão. A dimensão PRODUTO. mas a Semana pertence somente a um Mês??? Não! Logo. juntamente com outros dados 5/41 Conformidade de Dimensões Algumas considerações dimensão TEMPO: Suponha a hierarquia: Ano Semana Dia especiais Trimestre sobre Mês a Cada Trimestre pertence a somente um Ano Cada Mês pertence a somente um Trimestre Cada Mês possui várias Semanas (4 ou 5). por exemplo. Semana não faz roll-up com Mês Uma hierarquia como Ano Trimestre Mês Dia permite roll-up nos seus diferentes níveis 6/41 3 .Conformidade de Dimensões Existem casos em que as dimensões serão acessadas por usuários diferentes através de hierarquias diferentes.

Conformidade de Dimensões Exemplo de roll-up na dimensão TEMPO com hierarquia incompatível 7/41 Conformidade de Dimensões Em alguns casos. pode-se estabelecer uma grande área chamada “Staging” onde as dimensões seriam armazenadas antes de serem levadas aos DMs Nesse BD. não é possível construir dimensões com total conformidade Para tentar resolver ou atenuar os impactos dessas dimensões. as dimensões e suas instâncias estariam bem definidas. permitindo um certo controle e gerência sobre as dimensões dos diferentes DM 8/41 4 . com os seus relacionamentos e documentados.

. CLIENTE. que poderia elevar o número de instâncias da dimensão 9/41 Dimensões Especiais Algumas dimensões são consideradas clássicas e estão presentes em quase todos os projetos de DW/DM.. ARMAZÉM.Combinações de Dimensões Em alguns casos.. maior será a possibilidade de análises complexas!! 10/41 5 . ou seja. ESTADO. essa abordagem é usada quando existe uma forte coesão entre as duas dimensões. OBJETO Voltada para o objetivo do negócio. Quanto mais rica for a definição das dimensões.. Isso pode sugerir uma combinação de dimensões.. gerado pelo produto cartesiano. CIDADE. as dimensões podem ser combinadas numa única Entidade (ou Tabela). PESSOAS.. TEMPO Projetos de DW/DM focam muito na evolução histórica ESPAÇO O comportamento dos fenômenos variam com o local (LOJA. desde que observado o aspecto de proliferação. ÓRGÃO. se somente certos PRODUTOS são vendidos em certas LOJAS. PRODUTO. e para determinados subconjuntos de valores combinados Por exemplo. elas acontecem (quase sempre) juntas.) associadas a hierarquia geográfica: PAÍS.

último dia do mês 11/41 Dimensões Especiais Dimensão Tempo Tags permitem análises interessantes sobre acontecimentos Controle de audiência. Vendas no Feriado Deverá ser planejada com a sua perspectiva de uso (2. já que as suas informações são conhecidas e independentes de tabela Fato 12/41 6 . podemos ter os seguintes atributos: Data-Completa: 01-01-2009 Dia-Semana: Sexta-Feira Número-Mês: 01 Número-Dia-Ano: (1 a 365) Número-Semana-Mês: ( 1 a 4 ou 5) Número-Semana: (1 a 52) Mês-Ano: (Janeiro a Dezembro) Número-Mês: ( 1 a 12) Trimestre: (1 a 4) Tag para: Final de semana. 8 anos) Deverá ser carregada em sua totalidade. feriado. no início do projeto.Dimensões Especiais Dimensão Tempo Se a granularidade definida for Dia. 4.

Subdepartamento.. Telefones e etc Quem conhece melhor o seu cliente. principalmente com o crescimento dos CRMs (Customer Relationship Management) Alguns campos importantes são: Saudação (Dr. maior chance terá de manter a sua fidelização. Prenome-Nome-Meio. Sufixo. E-mail. Departamento. Endereço.). Dra.Dimensões Especiais Dimensão Cliente Importante em qualquer sistema de vendas. Gênero. ou de buscar novos negócios através desses relacionamentos! 13/41 Dinâmica das Dimensões Está relacionada com as estratégias de manutenção das informações quando ocorrerem processos de atualização Significa definir uma abordagem para quando houver: Atualização de endereço do cliente Mudança na descrição do produto É fundamental o registro desses valores em função do tempo para sistemas de DW/DM 14/41 7 . Classificação. Profissão. Web-Site. Organização.. Sobrenome.

bem como flag indicando o perfil corrente 15/41 Dinâmica das Dimensões No caso de projetos de dimensões com alto volume e alta volatilidade. a estratégia recomendada é a divisão dos dados 16/41 8 .Dinâmica das Dimensões Três estratégias para controle de alteração podem ser utilizadas Para a opção B. são necessários atributos que indiquem a data de validade do perfil.

NF. linha de NF. PS) estará tabela para desempenhar o papel alinhavador dos itens daquele documento na do na de 17/41 Dimensões Degeneradas Exemplo para itens de uma Ordem de Compra 18/41 9 . o número documento maior (OC. Nota Fiscal ou Pedido (Ordem) de Serviço Essas entidades são compostas por Itens (item de OC. como Ordem de Compra. item do PS) Quando tabela Fato está definida granularidade de Item.Dimensões Degeneradas Está relacionada com objetos do tipo evento.

Solteiro ou Divorciado) Contribuinte (Sim ou Não) Apesar de não terem muita relação com o Fato. Sexo (F ou M) Estado Civil (Casado. manutenção especial e transporte especial 20/41 10 . com pequena como por exemplo definição de com certas como tags. são definidas 3 tags sobre condições de armazenamento: climatizada. cardinalidade. é interessante mantê-los para serem utilizados como filtros 19/41 Dimensões Lixo (junk) No exemplo.Dimensões Lixo (Junk) Está relacionada com a dimensões para campos características diferenciadas valores binárias.

campos sem qualquer valor semântico embutido Normalmente.Dimensões Lixo (Junk) Exemplo para controle de redundância de texto 21/41 Campos Chaves de Dimensões e Fatos Uma regra básica e bastante recomendável nos projeto DW/DM é a utilização de chaves surrogates ou artificiais Significa definir como campo chave de Dimensões (consequentemente de Fatos). são campos sequenciais do SGBD 22/41 11 .

.. falhas operacionais podem ocorrer e as tabelas necessitam ser re-processadas Impedem que tabelas Fato sejam processadas diretamente.) poderá apresentar os seguintes problemas: Unicidade: A chave de um cliente pode mudar após uma fusão ou venda de uma empresa Ausência: Algumas entidades podem não ter chaves naturais E a manutenção das dimensões??? Melhor capacidade de implementação de chaves artificiais.Campos Chaves de Dimensões e Fatos O uso de chaves naturais (matrícula. normalmente com 4 bytes Ajudam na criação de índices Alcançam até 2 bilhões de ocorrências São transparentes para os usuários 23/41 Campos Chaves de Dimensões e Fatos Alguns problemas com as chaves artificiais Por serem produzidas automaticamente. Qualquer pesquisa passará pelas tabelas Dimensão 24/41 12 . uma vez que a Fato só conterá chaves artificiais e métricas. cpf.

Usar uma tabela para armazenar dados comuns a todos os tipos e outras para armazenar informações específicas de cada tipo 26/41 13 . mas pode acontecer. uma para cada linha de produto oferecido naquele ambiente A estratégia é a mesma do modelo ER. O objetivo é relacionar as várias tabelas Dimensão envolvidas no modelo 25/41 Tabelas Fatos com Classificação ou Subtipos Existem casos onde o modelo de negócio poderá demandar vários tipos de tabela Fato.Tabelas Fatos sem Dados ou Métricas Não é muito comum.

Tabelas Fatos com Classificação ou Subtipos Exemplo Modelo E/R com Tipo e Subtipo 27/41 Tabelas Fatos com Classificação ou Subtipos Exemplo de Modelo Dimensional tratamento de Multi-fatos – Tabela Base para 28/41 14 .

Quesito. Jurado para 30/41 15 .Tabelas Fatos com Classificação ou Subtipos Exemplo de Modelo Dimensional para tratamento de Multi-fatos – Tabelas Especializadas 29/41 Tabelas Fatos com Classificação ou Subtipos Exemplo de Modelo Dimensional tratamento de relacionamentos M x N A Nota e Classificação estão relacionadas com vários jurados A Dimensão Corpo Jurado substitui as tabelas Nota.

trabalhadas e sumarizadas em várias dimensões corretas Facilitam os acessos aos dados e agilizam os processos decisórios Agilizam em até 1000 vezes o tempo de processamento Problemas Criam redundâncias e conseqüentemente.Agregados Valores agregados (resumo pré-armazenado) representam uma solução e algum problemas Solução Criação de tabelas prontas. gastam mais espaço para armazenar dados já processados que foram derivados do DW/DM 31/41 Critérios para Definição de Agregados Passa pela análise dos principais tipos de informação necessários e pela dificuldade de obtê-los diretamente das tabelas granulares Suponha o DW/DM descrito abaixo em SQL 32/41 16 .

temos 34 combinações possíveis de agregados para analisar e selecionar as que oferecem maior disponibilidade de informações Se as colunas escolhidas tiverem muitos valores diferentes. se comparado com tabelas granulares 34/41 17 .Critérios para Definição de Agregados Os valores em negrito seguintes hierarquias: representam as Região Loja: hierarquia com dois níveis Categoria Produto: hierarquia com dois níveis Ano Mês Dia: hierarquia com três níveis O número de tabelas de agregados está relacionado com as combinações ternárias. e poderão não otimizar o processamento em termos de performance. binárias e unárias das hierarquias O volume está diretamente associado às ocorrências de cada nível combinado 33/41 Critérios para Definição de Agregados Por exemplo. podemos combinar: Ternária região + categoria + ano ou região + categoria + mês (2 x 2 x 3 = 12 opções) Binária região + categoria ou ano + loja (2 x 2 + 2 x 2 + 2 x 3 = 16 opções) Unária loja ou categoria ou mês ( 2 + 2 + 3 = 7 opções) No total. os registros agregados serão em grande número.

deve-se observar as métricas que nem sempre são aditivas em todas as dimensões Precisão Os valores aditivos deverão ser maiores que os usados nos respectivos valores das tabelas granulares Não é recomendado armazenar os valores de Fatos granulares e agregados na mesma tabela 35/41 Entendendo e Produzindo Agregados Uma forma de se entender melhor o uso de agregado é através dos comandos SQL 36/41 18 .Alguns Cuidados na Definição de Agregados Valores Aditivos Na construção dos agregados.

Entendendo e Produzindo Agregados Agregadas deverão compor um modelo separado 37/41 Entendendo e Produzindo Agregados Uma definição importante no projeto operacional dos Agregados é a estratégia de carga total versus a sua atualização incremental Essa decisão leva em conta: Tempo de Processamento Recarga total dos agregados Complexidade de Programas atualização incremental 38/41 19 .

Metadados Importante documentação das aplicação DW/DM 39/41 Exercício Construir os modelos dimensionais propostos no capítulo 6 do livro texto Utilizar ferramenta para modelagem de dados. como DBDesign. ERWin três dimensões. tabela fato com x linhas 40/41 20 .

Barbieri.Referências Leitura Obrigatória Capítulo 5 . Ralph. Carlos. Data Warehouse Toolkit – Técnicas para construção de Data Warehouses Dimensionais. Axcel Books. Makron Books. Leitura Sugerida Kimball. 1998. 41/41 21 . 2001. BI – Business Intelligence.