You are on page 1of 178

Business Intelligence

Flávio Ceci

Créditos
Universidade do Sul de Santa Catarina | Campus UnisulVirtual | Educação Superior a Distância
Avenida dos Lagos, 41 – Cidade Universitária Pedra Branca | Palhoça – SC | 88137-900 | Fone/fax: (48) 3279-1242 e 3279-1271 | E-mail: cursovirtual@unisul.br | Site: www.unisul.br/unisulvirtual
Reitor Coordenadores Graduação Marilene de Fátima Capeleto Patrícia de Souza Amorim Karine Augusta Zanoni
Ailton Nazareno Soares Aloísio José Rodrigues Patricia A. Pereira de Carvalho Poliana Simao Marcia Luz de Oliveira
Ana Luísa Mülbert Paulo Lisboa Cordeiro Schenon Souza Preto Mayara Pereira Rosa
Vice-Reitor Ana Paula R.Pacheco Paulo Mauricio Silveira Bubalo Luciana Tomadão Borguetti
Sebastião Salésio Heerdt Artur Beck Neto Rosângela Mara Siegel Gerência de Desenho e
Bernardino José da Silva Simone Torres de Oliveira Desenvolvimento de Materiais Assuntos Jurídicos
Chefe de Gabinete da Reitoria Charles Odair Cesconetto da Silva Vanessa Pereira Santos Metzker Didáticos Bruno Lucion Roso
Willian Corrêa Máximo Dilsa Mondardo Vanilda Liordina Heerdt Márcia Loch (Gerente) Sheila Cristina Martins
Diva Marília Flemming Marketing Estratégico
Pró-Reitor de Ensino e Horácio Dutra Mello Gestão Documental Desenho Educacional
Lamuniê Souza (Coord.) Cristina Klipp de Oliveira (Coord. Grad./DAD) Rafael Bavaresco Bongiolo
Pró-Reitor de Pesquisa, Itamar Pedro Bevilaqua
Pós-Graduação e Inovação Jairo Afonso Henkes Clair Maria Cardoso Roseli A. Rocha Moterle (Coord. Pós/Ext.) Portal e Comunicação
Daniel Lucas de Medeiros Aline Cassol Daga Catia Melissa Silveira Rodrigues
Mauri Luiz Heerdt Janaína Baeta Neves
Aline Pimentel
Jorge Alexandre Nogared Cardoso Jaliza Thizon de Bona Andreia Drewes
Pró-Reitora de Administração José Carlos da Silva Junior Guilherme Henrique Koerich Carmelita Schulze Luiz Felipe Buchmann Figueiredo
Acadêmica José Gabriel da Silva Josiane Leal Daniela Siqueira de Menezes Rafael Pessi
Marília Locks Fernandes Delma Cristiane Morari
Miriam de Fátima Bora Rosa José Humberto Dias de Toledo
Eliete de Oliveira Costa
Joseane Borges de Miranda Gerência de Produção
Pró-Reitor de Desenvolvimento Luiz G. Buchmann Figueiredo Gerência Administrativa e Eloísa Machado Seemann Arthur Emmanuel F. Silveira (Gerente)
e Inovação Institucional Marciel Evangelista Catâneo Financeira Flavia Lumi Matuzawa Francini Ferreira Dias
Renato André Luz (Gerente) Geovania Japiassu Martins
Valter Alves Schmitz Neto Maria Cristina Schweitzer Veit
Ana Luise Wehrle Isabel Zoldan da Veiga Rambo Design Visual
Maria da Graça Poyer
Diretora do Campus Mauro Faccioni Filho Anderson Zandré Prudêncio João Marcos de Souza Alves Pedro Paulo Alves Teixeira (Coord.)
Universitário de Tubarão Moacir Fogaça Daniel Contessa Lisboa Leandro Romanó Bamberg Alberto Regis Elias
Milene Pacheco Kindermann Nélio Herzmann Naiara Jeremias da Rocha Lygia Pereira Alex Sandro Xavier
Onei Tadeu Dutra Rafael Bourdot Back Lis Airê Fogolari Anne Cristyne Pereira
Diretor do Campus Universitário Patrícia Fontanella Thais Helena Bonetti Luiz Henrique Milani Queriquelli Cristiano Neri Gonçalves Ribeiro
da Grande Florianópolis Roberto Iunskovski Valmir Venício Inácio Marcelo Tavares de Souza Campos Daiana Ferreira Cassanego
Hércules Nunes de Araújo Rose Clér Estivalete Beche Mariana Aparecida dos Santos Davi Pieper
Gerência de Ensino, Pesquisa e Marina Melhado Gomes da Silva Diogo Rafael da Silva
Secretária-Geral de Ensino Vice-Coordenadores Graduação Extensão Marina Cabeda Egger Moellwald Edison Rodrigo Valim
Adriana Santos Rammê Janaína Baeta Neves (Gerente) Mirian Elizabet Hahmeyer Collares Elpo Fernanda Fernandes
Solange Antunes de Souza Aracelli Araldi Pâmella Rocha Flores da Silva
Bernardino José da Silva Frederico Trilha
Diretora do Campus Catia Melissa Silveira Rodrigues Rafael da Cunha Lara Jordana Paula Schulka
Elaboração de Projeto Roberta de Fátima Martins Marcelo Neri da Silva
Universitário UnisulVirtual Horácio Dutra Mello Carolina Hoeller da Silva Boing
Jucimara Roesler Jardel Mendes Vieira Roseli Aparecida Rocha Moterle Nelson Rosa
Vanderlei Brasil Sabrina Bleicher Noemia Souza Mesquita
Joel Irineu Lohn Francielle Arruda Rampelotte
Equipe UnisulVirtual José Carlos Noronha de Oliveira Verônica Ribas Cúrcio Oberdan Porto Leal Piantino
José Gabriel da Silva Reconhecimento de Curso
José Humberto Dias de Toledo Acessibilidade Multimídia
Diretor Adjunto Maria de Fátima Martins Vanessa de Andrade Manoel (Coord.) Sérgio Giron (Coord.)
Moacir Heerdt Luciana Manfroi
Rogério Santos da Costa Extensão Letícia Regiane Da Silva Tobal Dandara Lemos Reynaldo
Secretaria Executiva e Cerimonial Rosa Beatriz Madruga Pinheiro Maria Cristina Veit (Coord.) Mariella Gloria Rodrigues Cleber Magri
Jackson Schuelter Wiggers (Coord.) Sergio Sell Vanesa Montagna Fernando Gustav Soares Lima
Marcelo Fraiberg Machado Pesquisa Josué Lange
Tatiana Lee Marques Daniela E. M. Will (Coord. PUIP, PUIC, PIBIC) Avaliação da aprendizagem
Tenille Catarina Valnei Carlos Denardin Claudia Gabriela Dreher Conferência (e-OLA)
Mauro Faccioni Filho (Coord. Nuvem)
Assessoria de Assuntos Sâmia Mônica Fortunato (Adjunta) Jaqueline Cardozo Polla Carla Fabiana Feltrin Raimundo (Coord.)
Internacionais Pós-Graduação Nágila Cristina Hinckel Bruno Augusto Zunino
Coordenadores Pós-Graduação Anelise Leal Vieira Cubas (Coord.) Sabrina Paula Soares Scaranto
Murilo Matos Mendonça Aloísio José Rodrigues Gabriel Barbosa
Anelise Leal Vieira Cubas Thayanny Aparecida B. da Conceição
Assessoria de Relação com Poder Biblioteca Produção Industrial
Público e Forças Armadas Bernardino José da Silva Salete Cecília e Souza (Coord.) Gerência de Logística Marcelo Bittencourt (Coord.)
Adenir Siqueira Viana Carmen Maria Cipriani Pandini Paula Sanhudo da Silva Jeferson Cassiano A. da Costa (Gerente)
Walter Félix Cardoso Junior Daniela Ernani Monteiro Will Marília Ignacio de Espíndola Gerência Serviço de Atenção
Giovani de Paula Renan Felipe Cascaes Logísitca de Materiais Integral ao Acadêmico
Assessoria DAD - Disciplinas a Karla Leonora Dayse Nunes Carlos Eduardo D. da Silva (Coord.) Maria Isabel Aragon (Gerente)
Distância Letícia Cristina Bizarro Barbosa Gestão Docente e Discente Abraao do Nascimento Germano Ana Paula Batista Detóni
Patrícia da Silva Meneghel (Coord.) Luiz Otávio Botelho Lento Enzo de Oliveira Moreira (Coord.) Bruna Maciel André Luiz Portes
Carlos Alberto Areias Roberto Iunskovski Fernando Sardão da Silva Carolina Dias Damasceno
Cláudia Berh V. da Silva Rodrigo Nunes Lunardelli Capacitação e Assessoria ao Fylippy Margino dos Santos Cleide Inácio Goulart Seeman
Conceição Aparecida Kindermann Rogério Santos da Costa Docente Guilherme Lentz Denise Fernandes
Luiz Fernando Meneghel Thiago Coelho Soares Alessandra de Oliveira (Assessoria) Marlon Eliseu Pereira Francielle Fernandes
Renata Souza de A. Subtil Vera Rejane Niedersberg Schuhmacher Adriana Silveira Pablo Varela da Silveira Holdrin Milet Brandão
Alexandre Wagner da Rocha Rubens Amorim
Assessoria de Inovação e Jenniffer Camargo
Gerência Administração Elaine Cristiane Surian (Capacitação) Yslann David Melo Cordeiro Jessica da Silva Bruchado
Qualidade de EAD Acadêmica Elizete De Marco
Denia Falcão de Bittencourt (Coord.) Jonatas Collaço de Souza
Angelita Marçal Flores (Gerente) Fabiana Pereira Avaliações Presenciais
Andrea Ouriques Balbinot Juliana Cardoso da Silva
Fernanda Farias Iris de Souza Barros Graciele M. Lindenmayr (Coord.)
Carmen Maria Cipriani Pandini Juliana Elen Tizian
Juliana Cardoso Esmeraldino Ana Paula de Andrade
Secretaria de Ensino a Distância Kamilla Rosa
Maria Lina Moratelli Prado Angelica Cristina Gollo
Assessoria de Tecnologia Samara Josten Flores (Secretária de Ensino) Simone Zigunovas
Mariana Souza
Osmar de Oliveira Braz Júnior (Coord.) Cristilaine Medeiros Marilene Fátima Capeleto
Giane dos Passos (Secretária Acadêmica) Daiana Cristina Bortolotti
Felipe Fernandes Adenir Soares Júnior Tutoria e Suporte Maurício dos Santos Augusto
Felipe Jacson de Freitas Delano Pinheiro Gomes Maycon de Sousa Candido
Alessandro Alves da Silva Anderson da Silveira (Núcleo Comunicação) Edson Martins Rosa Junior
Jefferson Amorin Oliveira Andréa Luci Mandira Claudia N. Nascimento (Núcleo Norte- Monique Napoli Ribeiro
Phelipe Luiz Winter da Silva Fernando Steimbach Priscilla Geovana Pagani
Cristina Mara Schauffert Nordeste)
Fernando Oliveira Santos
Priscila da Silva Djeime Sammer Bortolotti Maria Eugênia F. Celeghin (Núcleo Pólos) Sabrina Mari Kawano Gonçalves
Rodrigo Battistotti Pimpão Lisdeise Nunes Felipe Scheila Cristina Martins
Douglas Silveira Andreza Talles Cascais Marcelo Ramos
Tamara Bruna Ferreira da Silva Evilym Melo Livramento Daniela Cassol Peres Taize Muller
Marcio Ventura Tatiane Crestani Trentin
Fabiano Silva Michels Débora Cristina Silveira Osni Jose Seidler Junior
Coordenação Cursos Fabricio Botelho Espíndola Ednéia Araujo Alberto (Núcleo Sudeste) Thais Bortolotti
Coordenadores de UNA Felipe Wronski Henrique Francine Cardoso da Silva
Diva Marília Flemming Gisele Terezinha Cardoso Ferreira Janaina Conceição (Núcleo Sul) Gerência de Marketing
Marciel Evangelista Catâneo Indyanara Ramos Joice de Castro Peres Eliza B. Dallanhol Locks (Gerente)
Roberto Iunskovski Janaina Conceição Karla F. Wisniewski Desengrini
Jorge Luiz Vilhar Malaquias Kelin Buss Relacionamento com o Mercado
Auxiliares de Coordenação Juliana Broering Martins Liana Ferreira Alvaro José Souto
Ana Denise Goularte de Souza Luana Borges da Silva Luiz Antônio Pires
Camile Martinelli Silveira Luana Tarsila Hellmann Maria Aparecida Teixeira Relacionamento com Polos
Fabiana Lange Patricio Luíza Koing  Zumblick Mayara de Oliveira Bastos Presenciais
Tânia Regina Goularte Waltemann Maria José Rossetti Michael Mattar Alex Fabiano Wehrle (Coord.)
Jeferson Pandolfo

Universidade do Sul de Santa Catarina

Business Intelligence
Livro Digital

Palhoça
UnisulVirtual
2012

Flávio Business intelligence : livro digital / Flávio Ceci .74 C38 Ceci. Copyright © UnisulVirtual 2012 Nenhuma parte desta publicação pode ser reproduzida por qualquer meio sem a prévia autorização desta instituição. Inclui bibliografia. Ficha catalográfica elaborada pela Biblioteca Universitária da Unisul . Tecnologia da informação. Inteligência em negócios. : il. II. João Marcos de Souza. design instrucional Silvana Souza da Cruz Clasen . Sistema de informação gerencial. Alves. Projeto Gráfico e Capa Equipe Design Visual Diagramação Daiana Ferreira Cassanego Revisão Diane Dal Mago ISBN 978-85-7817-465-1 005. Título. 2012. 4. – Palhoça : UnisulVirtual. 28 cm. João Marcos de Souza Alves. 176 p. Edição – Livro Digital Professor Conteudista Flávio Ceci Coordenação de Curso Vera Rejane Niedersberg Schuhmacher Design Instrucional Silvana Souza da Cruz Clasen João Marcos de Souza Alves (2ª edição rev. 3. ISBN 978-85-7817-465-1 1. e atual). . I. 2. Banco de dados.

Flávio Ceci Business Intelligence Livro Digital Designer instrucional João Marcos de Souza Alves 2ª edição revista e atualizada Palhoça UnisulVirtual 2012 .

.

Sumário

5 Sumário

7 Apresentação

9 Palavras do Professor

11 Plano de estudo

15 Unidade 1
O poder da informação e do conhecimento nas organizações

45 Unidade 2
Colocando inteligência nos negócios

63 Unidade 3
Data Warehouse

95 Unidade 4
Descobrindo o conhecimento

131 Unidade 5
Processo OLAP

159 Para concluir os estudos
161 Minicurrículo

163 Respostas e comentários das atividades
de autoaprendizagem e colaborativas

169 Referências

Apresentação

Caro/a estudante,

O livro digital desta disciplina foi organizado didaticamente, de modo a oferecer a
você, em um único arquivo pdf, elementos essenciais para o desenvolvimento dos
seus estudos.

Constituem o livro digital:
•• Palavras do professor (texto de abertura);
•• Plano de estudo (com ementa, objetivos e conteúdo programático
da disciplina);
•• Objetivos, Introdução, Síntese e Saiba mais de cada unidade;
•• Leituras de autoria do professor conteudista;
•• Atividades de autoaprendizagem e gabaritos;
•• Enunciados das atividades colaborativas;
•• Para concluir estudos (texto de encerramento);
•• Minicurrículo do professor conteudista; e
•• Referências.

Lembramos, no entanto, que o livro digital não constitui a totalidade do material
didático da disciplina. Dessa forma, integram o conjunto de materiais de estudo:
webaulas, objetos multimídia, leituras complementares (selecionadas pelo
professor conteudista) e atividades de avaliação (obrigatórias e complementares),
que você acessa pelo Espaço UnisulVirtual de Aprendizagem.

Tais materiais didáticos foram construídos especialmente para este curso, levando
em consideração as necessidades da sua formação e aperfeiçoamento profissional.

Atenciosamente,

Equipe UnisulVirtual

.

sistemas de apoio à decisão. Na unidade 4 são abordadas as fases do BI. sistemas de informação e. Por fim. são apresentados os conceitos relacionados com OLAP e como podem ser consumidas as informações e os conhecimentos explicitados pela ferramenta em questão. que geralmente é utilizando como repositório de dados para as aplicações de BI. bem como suas características e usos. qual o papel de cada um desses itens e como eles podem auxiliar na gestão de uma organização. banco de dados. são vistos os conceitos de sistema e depois. na verdade. também será estudada a modelagem de dados dimensional e como ela pode trazer benefícios a sistemas de apoio à decisão. mas também pode ser utilizado em outros contextos organizacionais. além de dar foco a algumas outras áreas envolvidas. de maneira mais específica. Palavras do Professor Bem-vindo caro aluno! Na disciplina de Business Intelligence você terá a oportunidade de navegar por vários conceitos das áreas de administração. sistemas de informação. especializando mais ainda. como por exemplo: descoberta de conhecimento e banco de dados e descoberta de conhecimento em textos. são tratados os conceitos relacionados com dado. A unidade 3 traz o tema Data Warehouse. Inicialmente. Nesta unidade. sistemas de apoio à decisão. inteligência artificial e gestão de TI. Posteriormente. Percebe-se que as aplicações de business intelligence (BI) são. informação e conhecimento. Ótimos estudos! Flávio Ceci . Na unidade 2 são tratados com mais detalhes os conceitos relacionados com BI.

.

Plano de estudo

O plano de estudos visa a orientá-lo/a no desenvolvimento da disciplina. Possui
elementos que o/a ajudarão a conhecer o contexto da disciplina e a organizar o
seu tempo de estudos.

O processo de ensino e aprendizagem na UnisulVirtual leva em conta instrumentos que
se articulam e se complementam, portanto a construção de competências se dá sobre a
articulação de metodologias e por meio das diversas formas de ação/mediação.

São elementos desse processo:
•• o livro digital;
•• o Espaço UnisulVirtual de Aprendizagem (EVA);
•• as atividades de avaliação (a distância, presenciais e de autoaprendizagem);
•• o Sistema Tutorial.

Objetivo geral
As empresas devem tomar decisões em todos os níveis organizacionais e em
todas suas áreas de atuação. Ter informação precisa e de qualidade pode ser
a diferença entre tomar decisões certas ou não. Nesse sentido, a qualidade
da informação é um diferencial competitivo nas empresas. Apenas armazenar
dados sobre clientes, fornecedores, vendas, compras e colaboradores, não é o
suficiente. As organizações buscam a qualidade dos dados e sua transformação
em informações que gerem conhecimento dentro da empresa, apoiando o
processo de tomada de decisão. O objetivo da disciplina é trazer para o aluno
conhecimento sobre conceitos, arquitetura e componentes dos sistemas de
BI (Business Inteligence). Os sistemas de BI fornecem uma arquitetura com a
visão do analista de negócios, permitindo às organizações a transformação e a
extração dos dados coletados em seus sistemas de informação, em informação e
conhecimento, para auxílio ao processo decisório das organizações.

Ementa
Informação e decisão nas organizações. Dados, informação e conhecimento.
Sistemas de Informação nas organizações: sistemas transacionais e de apoio à
decisão. Arquitetura e componentes de uma solução de BI-Business Intelligence.
Data Warehouse: motivação, conceitos, definição e características.
Modelo Dimensional: fatos, dimensões, medidas e granularidade. Sistemas ETL:
extração limpeza, transformação e carga de um modelo dimensional. Área de
apresentação: características das técnicas analíticas (OLAP) como ferramentas de
apresentação e extração de informação.

Conteúdo programático/objetivos
A seguir, as unidades que compõem o livro digital desta disciplina e os seus
respectivos objetivos. Estes se referem aos resultados que você deverá alcançar
ao final de uma etapa de estudo. Os objetivos de cada unidade definem o
conjunto de conhecimentos que você deverá possuir para o desenvolvimento de
habilidades e competências necessárias a este nível de estudo.

Unidades de estudo: 5

Unidade 1 – O poder da informação e do conhecimento nas
organizações

Nesta unidade, é apresentada uma visão geral entre dado, informação e
conhecimento, quais as suas fronteiras e sua aplicabilidade. Após é visto o que são
sistemas de informação, qual a sua utilidade e como se pode classificá-los. Por fim,
é apresentada uma visão geral sobre os sistemas de apoio à decisão e como eles
podem agregar valor à camada gerencial das organizações.

Unidade 2 – Colocando inteligência nos negócios

Verifica-se que os sistemas de informação trazem muitos benefícios para uma
organização. Para a camada tomadora de decisão, a utilização de aplicações
de Business Intelligence tem sido cada vez mais comum. Nesta unidade, são
apresentados conceitos introdutórios sobre Business Intelligence e de que forma
eles auxiliam nas decisões estratégicas para uma organização.

Pós-graduação

Unidade 3 – Data Warehouse

Esta unidade é focada no estudo dos conceitos relacionados com os Data
Warehouse (DW), qual a sua participação numa aplicação de Business Intelligence
e como a modelagem de dados dimensional pode auxiliar na construção desse
tipo de repositório.

Unidade 4 – Fases do Business Intelligence

Na unidade 4, são apresentadas as fases do Business Intelligence, a diferença
do processo Knowledge Discovery in Database (KDD) e Knowledge Discovery
Text (KDT), e como esses processos podem auxiliar na etapa de tomada de decisão.

Unidade 5 – Processo OLAP

Na nossa unidade final é ilustrado o processo On-line Analytical Processing (OLAP),
que está focado no consumo das informações armazenadas e na apresentação
para os usuários do sistema de apoio à decisão.

Carga horária: 45 horas

Business Intelligence

.

•• Diferenciar sistemas de informação dentro de um ambiente organizacional. desenvolveu‑se um subtipo específico de sistemas de informação. uma quantidade enorme de dados estruturados (em banco de dados). gera‑se. Unidade 1 O poder da informação e do conhecimento nas organizações Objetivos de Aprendizagem •• Compreender o papel da informação e do conhecimento como facilitadores para a tomada de decisões e planejamento em organizações. de maneira isolada. artigos. Com o uso indiscriminado dos computadores. •• Entender em que âmbito a tecnologia contribui no processo de tomada de decisões. tendo em vista essas carências. logs. não trazem vantagens para o gerenciamento das operações e tomada de decisão. por exemplo: relatórios. mas servem como matéria‑prima para a geração de informações. semiestruturados (e‑mails. Os sistemas de informação tradicionais são focados no apoio das operações de uma organização. chamados de sistemas de apoio à decisão. entregar informações organizacionais a partir dos dados armazenados. manuais. Esses dados. Os sistemas de informação vêm com esse propósito. diariamente. entre outros). não trazendo vantagens diretas à camada tomadora de decisão. . Introdução Não é novidade que as organizações estão cada vez mais utilizando recursos computacionais para auxiliar nas suas operações. entre outros) e não estruturados (texto livre como.

há bastante tempo as organizações utilizam seus dados operacionais para gerar informação que os ajudem na etapa de tomada de decisão. participando de redes sociais. informação e conhecimento Flávio Ceci A cada dia mais e mais as pessoas estão produzindo dados de maneira involuntária. o autor apresenta sua trajetória no mundo da análise de dados virtuais. escutando músicas on‑line. por exemplo. Esses dados de maneira bruta não revelam segredos. Bill Tancer é um especialista em análise de dados do mundo virtual. navegando pela internet. Williams. como por exemplo. seja efetuando compras. lançado em 2006. A partir das consultas feitas em sites de busca. (2006). Percebe‑se que o processamento do dado bruto gera a informação. Tancer demonstra como os dados gerados pelas buscas estão diretamente relacionados com eventos atuais e como esses dados cruzados de maneira correta podem apresentar tendências e indicadores. Yahoo e Bing. fala sobre como a colaboração pode auxiliar e muito as organizações. Para Fialho et al. para identificar a opinião de um grupo sobre um dos seus produtos ou serviços. em seu livro Click. a camada de dados é responsável pela existência dos sistemas transacionais. e escrito em parceria com seu colega de trabalho Anthony D. que tem como função apoiar as operações da organização. dados são representações simbólicas para descrições de atributos de qualquer nível. Segundo Ceci (2010). Don Tapscott considerado por muitos como gênio das estratégias empresariais em seu best‑seller Wikinomics. apenas apresentam trajetórias e dados provenientes de operações. Esses dados disponíveis na web combinados com os internos da organização geram informações ainda mais relevantes e estratégicas para a etapa da tomada de decisão. lançado no Brasil no ano de 2009 pela editora Globo. como o twitter. mas a partir do seu processamento pode‑se chegar a valiosas informações. Tendo esse cenário como atual. muitas empresas estão utilizando não apenas os seus dados operacionais (dados provenientes de operações como. Nesse livro é apresentado um caso em que uma organização tinha um problema que não conseguia encontrar uma solução Pós-graduação . Segundo Pinheiro (2008). mas também os disponíveis na web.16 Dado. entre outras atividades. O surgimento de uma série de dispositivos que mantém cada vez mais as pessoas conectadas proporciona uma verdadeira avalanche de novos dados por segundo. uma venda ou compra de um determinado produto) e transacionais (dados em nível de transação). fazendo buscas em sites como Google. Mas nunca se produziu tantos dados no ambiente virtual como nos dias de hoje. textos publicados em microblogs.

17

efetiva pelos seus engenheiros e pesquisadores, a alternativa encontrada foi abrir
os dados na internet e ofertar um prêmio para o pesquisador que conseguisse
resolvê‑lo, ou seja, processar o dado bruto, para gerar informação e conhecimento.

Segundo Fialho et al. (2006), informação é um conjunto de dados que são
processados corretamente e tornam‑se compreensíveis, ou seja, apresentem um
significado, criando padrões e acionando significados na mente dos indivíduos.

Percebe‑se que os dados estão relacionados diretamente com as operações de
uma organização ou de um indivíduo e estão armazenados na forma de bases
de dados transacionais. O processamento sobre eles gera as informações, como
por exemplo, no contexto de um sistema de controle de estoque, saber que
existe 10 unidades de um produto no depósito é um dado, agora, saber que se
a quantidade deste produto for inferior a 3 unidades, significa que está com o
estoque em baixa, é uma informação.

Segundo Fialho (2006), para que os dados se transformem em informação,
é necessário que as correlações entre os muitos fatos e suas implicações para
os indivíduos e para as organizações sejam evidenciados, ou seja, explicitados.
A Figura 1 ilustra a afirmação feita pelo autor:

Figura 1 - Transformando dados em informação

Fatos X Indivíduos X Organização

Processamento
Dados Informação

Fonte: Fialho, 2006.

Vemos que a informação por si só não é apenas fato, instrução ou número de uma
tabela, informação é o significado expresso pelo ser humano, trazendo benefícios
à etapa de tomada de decisão (GOUVEIA; RANITO, 2004).

As análises dos dados nos levam até a informação, tecnologicamente, os sistemas
de informação fazem essa ponte, entregando para o usuário final informações
relevantes permitindo uma economia de tempo. O cenário a seguir apresenta uma
situação para ilustrar essas afirmações:

A UnisulVirtual é o campus da Universidade do Sul de Santa Catarina responsável por
todos os projetos e programas de ensino a distancia da UNISUL, contando com mais
de 12 mil alunos espalhados por todo o Brasil.

O poder da informação e do conhecimento nas organizações

18

Imagina‑se que todas as notas dos alunos estão armazenadas numa mesma tabela,
no banco de dados, como apresentado abaixo:

Tabela 1 - Tabela de relacionamento entre aluno e disciplina
codAluno codDisciplina prova1 prova2 prova3 Media
98413 2009412 10 9 9,5 9,5
87536 2007324 7 4 3 4,7
96784 2009413 6 8 7 7
... ... ... ... ... ...
Fonte: Elaboração do autor, 2012.

O campo codAluno equivale ao código de identificação do aluno numa tabela onde
são mantidos os dados relacionados com os alunos, como por exemplo, o seu nome,
seu telefone, nome dos seus pais, endereço, entre outras informações. O campo
codDisciplina representa o código identificador da disciplina numa tabela que
armazena as informações relacionadas com as disciplinas, outras informações
relevantes para essa tabela são: nome da disciplina, nome do curso que a contém,
qual semestre ela foi ministrada, entre outras informações.

Os campos prova1, prova2 e prova3 representam as três notas de provas feitas
pelos alunos da disciplina, o último campo representa a média aritmética das três
notas registradas.

Suponha‑se que a secretária do curso de Ciência da Computação gostaria de premiar
todos os alunos que possuem média superior a 9, se não existir um sistema de
informação, seria necessário que algum funcionário da secretaria identificasse quais
são as disciplinas que fazem parte do curso em questão e depois verificar todos os
registros da tabela aluno_disciplina que possuem o campo codDisciplina, equivalente
a um código de disciplina do curso e depois se a média apresentada é superior a 9.

Dessa maneira, o funcionário da secretaria está interagindo diretamente com os
dados da tabela. Agora, se a secretaria dispor de um sistema de informação que
possua um ambiente onde possa fazer cruzamento de informações e aplicar filtros,
facilmente será retornado um relatório com a informação solicitada.

Percebe‑se que a informação traz mais benefícios que os dados para a camada
tomadora de decisão de uma organização. Segundo Primak (2008), a informação
faz parte da base da construção do conhecimento. Para Fialho et al. (2006),
pode‑se definir conhecimento como um conjunto completo de informações,
dados e relações que auxiliam os indivíduos na tomada de decisão, à realização de
tarefas e a geração de novas informações e conhecimentos. Outra definição para

Pós-graduação

19

conhecimento, dada pelo autor é um conjunto de informações contextualizadas e
dotadas de semântica inerentes ao agente que o detém, e seu conteúdo semântico
se dará em função do conjunto de informações que o compõem, de suas ligações
com outras unidades de conhecimento e do processo de contextualização.

Para transformar informação em conhecimento não basta apenas a aplicação
de uma etapa de processamento (como no caso dos dados para a informação),
é necessário um processo de síntese por parte de quem está consumindo a
informação. Segundo Ghisi, Ceci e Sell (2011), a visualização de informação
participa diretamente do processo de aquisição (quando se acessa um
conhecimento já existente) e criação (que é permitido a partir da interpretação
das informações por parte do indivíduo). A Figura 2 apresenta essa transformação.

Figura 2 - Da informação ao conhecimento
Síntese
Processamento

Dados Informação Conhecimento

Fonte: Ghisi, Ceci e Sell, 2011.

Cada vez mais a informação e o conhecimento vêm desempenhando um papel
importante para as organizações. Atualmente, com a grande quantidade de
documentos digitais, e‑mails e dados em base de dados há uma fonte gigantesca
para a geração de informação e, posteriormente, para a descoberta e extração
de conhecimento.

As organizações que possuem atividades intensivas em conhecimento e que se
caracterizam por ter o conhecimento como fator de produção são chamadas
de organizações do conhecimento. Para Fialho (2006), pode‑se caracterizar
uma organização como do conhecimento quando ela é de base tecnológica
e de serviços que apresentam proporções ativas intangíveis, acima do seu
valor contábil. Segundo Ceci (2010), um problema bastante recorrente, nas
organizações ditas “organizações do conhecimento”, para trabalhar com o
conhecimento é como encontrá‑lo, recuperá‑lo, armazená‑lo e compartilhá‑lo
entre os seus membros.

A área da gestão do conhecimento nasce com a missão de auxiliar as organizações
a gerenciarem melhor o seu conhecimento, já que esse está, em grande maioria,
na cabeça dos funcionários. Cada baixa de funcionário é uma perda considerável
para o capital intelectual da organização, dessa forma, a gestão do conhecimento

O poder da informação e do conhecimento nas organizações

Pós-graduação . Práticas adotadas pela gestão do conhecimento vão da criação de comunidades de prática.20 pensa em mecanismos para adquirir o conhecimento da cabeça dos funcionários de modo que ele seja compartilhado e armazenado. mas sabe‑se que muito dos conhecimentos da organização estão implícitos em documentos textuais não estruturados. Todas essas práticas são diretamente aplicadas sobre os seus funcionários. que adotava o “paradigma de transporte”. BENJAMINS. •• quanto ao contexto: não tinha a visão do contexto onde o problema estava inserido (tarefa modelada). estímulo aos funcionários para a utilização de wikis internas a organização. ou seja. •• quanto ao desenvolvimento: a prototipação rápida tornava o sistema gerado de difícil manutenção. esses sistemas eram baseados em regras lógicas extraídas da cabeça de um especialista em um determinado domínio. Para esses casos. que estava focada em transpor o conhecimento da cabeça de um especialista para compor um conjunto de regras que fazem parte de um sistema especialista de um domínio (STUDER. a gestão do conhecimento conta com a área da Engenharia do Conhecimento. que tinha como foco a criação de sistemas especialistas. adoção de programas de lições aprendidas. A área da Engenharia do Conhecimento nasceu como subárea da Inteligência Artificial. Essa era a característica da chamada engenharia do conhecimento clássica. A engenharia do conhecimento clássica adota o paradigma de transporte e apresenta alguns problemas: •• quanto à escala: havia a reinvenção da roda em cada projeto. •• quanto à modelagem: o paradigma de transporte era moldado à expectativa de funcionamento do aplicativo (regras em shell) e não à natureza do contexto da tarefa intensiva em conhecimento. FENSEL. 1998).

de modo que tanto um indivíduo quanto um computador podem interagir com o conhecimento modelado. Para Souza (2003). as ontologias são usadas como uma forma de representação e integração do conhecimento pela sua capacidade de reuso e interoperabilidade. A Figura 3 apresenta um exemplo de ontologia: O poder da informação e do conhecimento nas organizações . Depois de extrair o conhecimento implícito nas bases de documentos e de dados da organização. Benjamins e Fensel (1998). •• Processamento de linguagem natural. a sua socialização entre os membros da organização. como as apresentadas a seguir: •• Reconhecimento de entidades nomeadas. Uma outra utilização que se pode levantar é o fato de serem empregadas como uma linguagem comum entre agentes de softwares e humanos. •• Raciocínio baseado em casos. nasce a chamada Nova Engenharia do Conhecimento. Para a computação pode‑se definir como uma representação formal de um conhecimento de domínio. de modo que o mesmo possa ser reaproveitado em outros sistemas baseados em conhecimento. para isso são utilizadas as ontologias. 21 Tendo em vista esses problemas. assim. permitindo. •• Algoritmos de clusterização (agrupamentos). Esse nome é dado pois essa abordagem está focada na modelagem do conhecimento. As ontologias nasceram da área da filosofia onde eram conceituadas como uma definição de mundo. a engenharia do conhecimento utiliza‑se de técnicas da inteligência artificial. permitindo. a socialização do conhecimento. assim. que faz uso do “paradigma de modelagem”. Para a explicitação do conhecimento existente em bases de dados e documentos textuais não estruturados. Segundo Studer. é necessário representá‑lo formalmente de maneira que ele possa ser corretamente armazenado e reutilizado. •• Algoritmos genéticos •• Redes neurais artificiais. uma ontologia é uma especificação explícita e formal de conceitos e relações que existem em um domínio.

de modo que os indivíduos e os sistemas possam inferir sobre elas. mas o método que a gerou não conseguiu classificá‑la. ou seja.Exemplo de uma ontologia de domínio Fonte: Ceci. Como se pode observar todas as classes Pessoa. As ontologias utilizam conceitos similares aos do paradigma de desenvolvimento de software orientado a objetos. sendo parte fundamental dos sistemas baseados em conhecimento.22 Figura 3 . As ontologias são formas para representar conhecimento. Os quadrados em lilás são as instâncias das classes em questão. onde são apresentadas cinco classes. Na Figura 3 apresenta‑se a representação de uma ontologia bastante simples. propriedades e domínio. Organização. Lugar e Outra são filhas de uma classe Thing (em português “coisa”). relações. por meio de quadrados amarelos. ferramenta indispensável para as organizações do conhecimento. verifica‑se que Administração foi classificada com uma instância da ontologia. sendo compostas por classes. facilmente podemos visualizar que Santa Catarina é uma lugar. 2010. instâncias. Pós-graduação . Área_do_conhecimento. todas as cinco são “coisas” do domínio modelado.

2006. SELL. STUDER. 2011. 2008..br/wp‑content/uploads/2011/04/ Fl%C3%A1vio_Ceci. Denilson. Rio de Janeiro: Editora Ciência Moderna. Dieter. FENSEL.I. 2009. São Paulo. 2008. WILLIAMS. Sistemas de informação de apoio à gestão.. João. 2010. Francisco Antônio Pereira et al. TANCER. Editora Globo S. 2010. TAPSCOTT. Gestão do conhecimento e aprendizagem: as estratégias competitivas da sociedade pós‑industrial. Rio de Janeiro: Ciência Moderna. Inteligência analítica: mineração de dados e descoberta de conhecimento. Knowledge engineering: principles and methods. GOUVEIA. Luís B. CECI. 23 Referências CECI. Richard.A. Rudi. Um modelo semiautomático para a construção e manutenção de ontologias a partir de bases de documentos não estruturados. Wikinomics: Como a colaboração em massa pode mudar o seu negócio. 1998. PRIMAK. GHISI. Dissertação (Mestrado em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina. Carlos André Reis. Bill. O poder da informação e do conhecimento nas organizações .pdf>. Acesso em: 10 de dez. Florianópolis: Visualbooks. Fernando B.ufsc. Aspectos relacionados com a eficácia do processo de aquisição de conhecimento a partir de apresentação de informações numéricas: sumários textuais podem ser mais adequados que representações gráficas? 5º CIDI – Congresso Internacional de Design da Informação. V. 2006. Florianópolis. 2004. Decisões com B. FIALHO. Don. Flávio. IEEE Transactions on Data and Knowledge Engineering. 2011. PINHEIRO. Disponível em: <http://btd.egc. Rio de Janeiro. BENJAMINS. RANITO. Porto. Florianópolis. Click: O que milhões de pessoas estão fazendo on‑line e por que isso é importante. Flávio. Fábio Vinícius. Anthony D. Portugal: Sociedade Portuguesa de Inovação. Editora Nova Fronteira.

RANITO. Percebe‑se que os sistemas de informação são um meio para acessar as informações de maneira mais efetiva. entidades etc. informação e conhecimento.24 Sistemas de informação Gláucio Adriano Fontana e Flávio Ceci Na leitura anterior sobre dado. Verificando as características de um sistema. facilmente entendemos o porquê de chamarmos o fluxo dentro do aparelho digestivo de “sistema digestivo”. que são executadas com base num conjunto de procedimentos manuais e automáticos. visando a auxiliar na tomada de decisão. mas antes de apresentar mais conceitos relacionados com SI. processamento e saída. substituição e morte do sistema. 2004). •• Comportamento: é determinado pelos processos desenvolvidos para. logo. reparação. Cruzando os conceitos de sistemas com elementos da teoria da complexidade. no sistema. Axelrod e Cohen (1999) apresentam o conceito de sistemas adaptativos complexos (SAC). Um sistema possui algumas características. podemos simplificar a ideia de um sistema como algo que possui: entrada. envelhecimento. as organizações podem ser facilmente Pós-graduação . •• Ciclo de vida: ocorre em qualquer sistema e inclui alguns fenômenos: evolução. segundo Gouveia e Ranito (2004). desgaste. Segundo Gouveia e Ranito (2004). alcançar os resultados esperados.) ou populações que procuram se adaptar por meio da interação. e que interagindo chegam a um objetivo comum (GOUVEIA. •• Estrutura: relações entre componentes cuja função é a definição das fronteiras (limite) do sistema e o meio que está envolvido. as quais. que podem ser conceituados como os que contêm agentes (pessoas. esse pode ter mais de um objetivo. os sistemas de informação (SI) possuem diversas funções relacionadas com a manipulação de dados e de informação. desadequação. pode‑se definir sistema como um conjunto de componentes (e subsistemas) que formam um todo. Para Ceci (2010). as organizações são sistemas sociais. é importante entender o que é um sistema. Abordou‑se também como o uso de informações e conhecimento podem auxiliar a camada tomadora de decisão de uma organização. •• Componentes: são partes dos sistemas que funcionam juntas para atender os objetivos. são: •• Objetivo: é a proposta que justifica o sistema. Basicamente. foram apresentados detalhes e conceitos sobre esses temas. bem como as suas principais diferenças.

Os departamentos da empresa contribuem para a própria organização. estratégicos e operacionais. e cada uma dessas exige informações em diferentes níveis de responsabilidade. é possível definir objetivos táticos. •• Ciclo de vida: a organização passa por várias fases ao longo da sua vida. essas pessoas são agrupadas por função e atividade. 2010. Lembrando que as estruturas definem as fronteiras. •• Componentes: as organizações envolvem uma série de pessoas. •• Estrutura: é definida pela forma como a responsabilidade é distribuída pelos indivíduos. a Figura 1 apresenta um exemplo desta afirmação: Figura 1 . para cumprir as metas organizacionais ou do seu setor. Gouveia e Ranito (2004) constroem uma justificativa a partir de cada característica anteriormente apresentada: •• Objetivo: dependendo do nível de responsabilidade. Ainda caracterizando uma organização como um sistema. Percebe‑se que a organização como um todo é um sistema composto por uma série de outros subsistemas que interagem.Organização vista como um sistema adaptativo complexo Organização (Sistema adaptativo complexo) Qualidade Compras Compras Fabricação Qualidade Fabricação Gerenciamento Qualidade Empacotamento Compras Tesoureiro Tesoureiro Recebimento Remessa Pessoal Remessa Marketing Marketing Pessoal Vendas Vendas Recepção Recebimento Fonte: Ceci. •• Comportamento: definido pelos processos organizacionais. Os processos são sequências específicas de atividades para realizar os objetivos. Exige uma revisão periódica dos objetivos para assegurar a sua sobrevivência. 25 caracterizadas como sistemas adaptativos complexos. O poder da informação e do conhecimento nas organizações .

os concorrentes e outros atores do ambiente interno e externo estão querendo dizer. a pensar inclusive pelo ambiente dinâmico em que estão inseridos. desejos e anseios desses mercados. suportando rápidas e repetidas pesquisas de dados. bem como utilizar informações sobre as melhores práticas de outras empresas. a tecnologia da informação ganha valor fundamental para as estratégias de administração. precisam conhecer as tendências. por meio dos dados. no tempo desejado. facilitam o acesso aos dados em um único local. possibilitando‑lhes adotar medidas efetivas para melhorar seus produtos e processos. permitindo também recuperar informações de múltiplos locais quase sempre instantaneamente. para conquistar mercados e obter vantagens. armazenar e distribuir informações com a finalidade de facilitar o planejamento. trabalhando juntos para coletar. Os sistemas de informação computadorizados. o controle. Percebe‑se a importância do item Pós-graduação . processar. das tecnologias de informação (hardware e software). bem como coletar e transmiti‑las de grandes distâncias. diferentes SI são necessários. sobre o que realmente os clientes. recuperar. mesmo que de forma indireta. ou ainda semiestruturadas. 2006). das estruturas da organização. GORDON. um padrão de desempenho de alto nível para essa empresa (GORDON. Os sistemas de arquivamento manual podem satisfazer muitas necessidades para organizar e recuperar informações. Decisões podem ser estruturadas quando possuem procedimentos bem definidos e documentados. não estruturadas. estabelecendo. Dessa maneira. As organizações que almejam diferenciais competitivos. 2001). mas por meio desses torna‑se lenta e difícil a tarefa de recuperar grandes quantidades de informação. quanto em tecnologia. auxilia os gestores a monitorar o desempenho da empresa. pode‑se afirmar que um sistema de informação é um subsistema tecnológico. assim. LAUDON. a coordenação. por sua vez. a análise e o processo decisório em empresas. quando híbridas em relação aos tipos referidos. Com a crescente competitividade entre as organizações. dos procedimentos e métodos que deveriam permitir à empresa dispor. quando há bastante subjetividade de julgamento e avaliação. os sistemas de informação consistem no conjunto de componentes inter‑relacionados. A interpretação. Os sistemas de informação têm evoluído tanto em importância para as organizações. o que somente poderá ser realizado por meio de um eficiente sistema de informação (LAUDON. Mañas (1999) define o sistema de informação como o conjunto interdependente das pessoas. leia‑se mercado que exige respostas rápidas em função de suas necessidades e mudanças. das informações de que necessita (ou necessitará) para seu funcionamento atual e para sua evolução.26 Vendo a organização como um sistema.

1996). 2001). •• distribuição da informação: assegurar o fluxo de dados e de informações no sistema. LAUDON. em muitos casos. o componente humano. De maneira geral. as funções dos sistemas de informação: •• coleta de informação: garantir a entrada dos dados do sistema. •• representação da informação: permitir uma percepção com qualidade dos dados e informação disponível no sistema. tanto como trabalhadores de informação e conhecimento como usuários desses. a médio e longo prazo. ou seja. •• processamento da informação: prover resposta às exigências de dados e informação para suporte do sistema. Segundo Gouveia e Ranito (2004). tempo e custo. reformar tarefas e fluxos de trabalho e até mesmo mudar profundamente a maneira de conduzir negócios (LAUDON. podem ajudar as empresas a ampliar seu alcance a mercados distantes. sua aplicação em problemas que se relacionam à vantagem competitiva de uma empresa. 27 pessoas. •• armazenamento da informação: assegurar o registro dos dados necessários ao sistema. Esse é o principal papel para os sistemas de informação. em seu trabalho. o objetivo de um sistema de informação é orientar a tomada de decisão. portanto. Os autores Gouveia e Ranito (2004) apresentam. o estabelecimento de novas relações com clientes e fornecedores. além de tecnologias e um ambiente (organização). quanto a sua sobrevivência. Os sistemas de informação influenciam diretamente o modo como os gestores decidem. abrangendo. planejam e. Eles têm importância estratégica. (BIO. determinam como e quais produtos e serviços são produzidos. Atualmente. de maneira rápida e eficiente para o usuário que estiver se privilegiando do seu uso. os sistemas de informação têm como objetivo fornecer informações a partir de dados brutos. ou a descoberta de meios mais efetivos de administrar as atividades da empresa. Tais problemas podem significar a criação ou inovação em novos produtos e serviços. o seu comportamento deve ser aferido pela forma como cumpre os objetivos levantados e também a capacidade de fornecimento de dados e informações de maneira adequada. levando em consideração o seu formato. uma vez que se concentram em resolver problemas relacionados tanto ao desenvolvimento da empresa. oferecer novos produtos e serviços. O poder da informação e do conhecimento nas organizações .

1998). Esses dados e informações devem atender a todos os processos levantados anteriormente. Percebe‑se que o primeiro passo no planejamento de um sistema de informação está centrado no levantamento da visão estratégica. Da mesma forma que na engenharia de software.28 Para suportar o desenvolvimento de sistemas de informação. A partir dessas duas etapas. é focado nas informações que serão consumidas e geradas pelo SI.Metodologia para Planejamento de SI Visão Estratégica Engenharia de Processos de Negócios Engenharia da Informação Dados Corporativos Modularização Priorização Plano de Ação Fonte: Almeida (1998). faz‑se o levantamento dos requisitos do sistema a partir das necessidades do cliente e do usuário dos sistemas. na Figura 2 essa etapa é representada pelo quadrado “Engenharia de Processos de Negócios” (ALMEIDA. Essa etapa é dividia em 3 outras etapas. como o próprio nome sugere. Almeida (1998) apresenta uma metodologia para o seu planejamento que pode ser resumida na Figura 2: Figura 2 . inicialmente. pode‑se perceber isso no fato dos dois processos iniciais (levantamento da visão estratégica da organização e engenharia de processo de negócio) serem focados no entendimento da organização. a partir do estudo da organização. Pós-graduação . seus processos e necessidades. eles representam a entrada principal para a geração da informação por parte do SI. o próximo passo é a criação da definição de todos os processos que são desenvolvidos nos vários setores da organização. O quadrado apresentado na Figura 2 e intitulado de Engenharia de Informação. No planejamento do sistema de informação não é diferente. as quais são: •• Dados corporativos: são relevantes para a organização. são facilmente levantados os requisitos para o desenvolvimento do sistema de informação que irá auxiliar o processo decisório da organização em questão.

mas existem outros componentes que são tão importantes quanto o próprio SI para o seu sucesso. Analisando a Figura 3. para poder gerenciar as fontes de uma maneira mais efetiva. pois são vistos como peças fundamentais para o SI. segundo Almeida (1998). com a tecnologia e a gestão das atividades. como já foi visto nesta leitura. seja tomadores de decisão. 1998). é necessário a participação de pessoas qualificadas e ter uma gestão das atividades que serão apoiadas com a saída do SI. A Figura 3 ilustra melhor esta afirmação: Figura 3 . 29 •• Modularização: nessa fase é construída a estrutura informacional da organização (ALMEIDA.Composição de um sistema de informação Ambiente externo Pessoas Gestão de atividades Sistema de informação Tecnologia Fonte: Gouveia e Ranito (2004). objetivando a apresentação das diretrizes e metas para o desenvolvimento do SI. É onde as fontes são organizadas. entre outros. os módulos de informação são organizados por prioridade. esse plano é o resultado do encadeamento das informações obtidas nas fases anteriores. •• Priorização: nesta última fase analisa‑se qual dos grupos de informações levantados na fase anterior é mais prioritário. O poder da informação e do conhecimento nas organizações . O uso dos sistemas de informação é muito importante para a organização. percebe‑se claramente que sem a combinação das pessoas. O recurso humano tem uma grande importância para os sistemas de informação. ou seja. Percebe‑se que o uso de sistemas de informação de maneira só não é eficiente. produtores de informação e construtores de conhecimento. Conclui‑se que a informação é estratégica para a camada tomadora de decisão. a organização não terá um sistema de informação atuando efetivamente. A última etapa é o “Plano de ação”. e que os sistemas de informação são um meio para se chegar até elas.

Rio de Janeiro: LTC. 1999. 2001. Acessado em 15 Dez. Sistemas de informação: uma abordagem gerencial. p. 1999.. Judith. Luís B. Aires J. Portugal: Sociedade Portuguesa de Inovação.. João. 001. 2010. O conhecimento nas organizações como um sistema adaptativo complexo. BIO. 2006. MAÑAS. CECI. Pós-graduação . GORDON. v. In: ROVER. New York. GOUVEIA. (Org. Antonio Vico..php?script=sci_arttext&pid=S0103‑65131998000200003&lng=en&nrm=iso>. São Paulo: Érica. Sistemas de informação de apoio à gestão. LAUDON. R. LAUDON.. Sérgio Rodrigues. O sujeito do conhecimento na sociedade em rede. 001 ed. Florianópolis: Editora: Fundação José Arthur Boiteux. 207‑2010 GORDON. Um modelo de decisão para a priorização no planejamento de sistemas de informação. 8.).. scielo. São Paulo: Atlas. São Paulo: Prentice Hall. M. 3. ed.30 Referências ALMEIDA. Adiel Teixeira de. 1996. RANITO. 1998. n. Sistemas de informação gerenciais: administrando a empresa digital.. CARVALHO Marisa A. 2. Steven R.br/scielo.. Administração de sistemas de informação. Sistemas de informação: um enfoque gerencial. Harnessing Complexity: Organizational Implications of a Scientific Frontier. Porto. Dec. COHEN. D. v. Free Press. Available from <http://www. Kenneth C. 2004. Prod. 2011 AXELROD. São Paulo. Jane P. Flavio.

indicando simulações de cenários estruturados. 31 Classificação dos sistemas de informação Gláucio Adriano Fontana e Flávio Ceci Os sistemas de informação nas empresas podem ser classificados de muitas maneiras. Os Sistemas de Nível Estratégico são direcionados para situações e decisões não estruturadas. compras. posicionamento da empresa. e podem ser divididos em dois tipos de sistemas: os Sistemas de Informações Gerenciais (SIG). indicando o nível das vendas. Os Sistemas de Nível Operacional são direcionados ao suporte das atividades fins da empresa. representando diferentes possibilidades de uso. Uma classificação. direcionados a apoiar a decisão em situações não rotineiras e semiestruturadas. formando a base de informações para os Sistemas de Informações Gerenciais (SIG) e Sistemas de Apoio à Decisão (SAD). Os sistemas de informação estão presentes em vários níveis da organização. permitindo acompanhar o andamento e comparar desempenhos e os Sistemas de Apoio à Decisão (SAD). emissão de notas fiscais. com base na comunicação e utilização de informações externas (LAUDON. aos quais os sistemas de informação dão suporte operacional. Esses sistemas estão ligados diretamente às operações e ao dia a dia. a figura a seguir ilustra está afirmação: O poder da informação e do conhecimento nas organizações . LAUDON. apresentada por Laudon e Laudon (2001) é feita por meio dos níveis hierárquicos. sendo um sistema direcionado à média gerência. acompanhando a rotina. mudanças no ambiente interno ou externo. gerencial ou estratégico. Os Sistemas de Nível Gerencial são direcionados ao controle e monitoramento das atividades relacionadas ao nível operacional. 2001). agregando dados internos e apresentando resumos das transações operacionais. fluxo de caixa. tais como: tendência. e são classificados como Sistemas de Suporte aos Executivos (SSE). e são denominados Sistemas de Informações Transacionais (SIT). que são destinados ao suporte de atividades.

fornecendo informações entre si. Carreira. Carreira e Moreti (2009).32 Figura 1 . mas esse não busca reforçar as decisões operacionais. isto é. Tipos de Sistemas de Informação As organizações utilizam vários tipos de Sistemas de Informação porque esses possuem funções diferentes. automatizando tarefas. Moreti. é centrado na camada gerencial da organização. Segundo Oliveira. 2009. Os sistemas foram classificados de acordo com seus objetivos e tipos de informações que manipulam e podem ser classificados em mais de um tipo. Os sistemas transacionais ou de apoio à operação estão atuando diretamente sobre a base da pirâmide. CARREIRA. mas as estratégicas. também se faz uso dos sistemas de apoio à decisão. que procuram prover ferramentas para auxiliar as decisões organizacionais. onde se tem como objetivo atuar junto à base de dados operacional. nesse caso. 2009). a visualização dos tipos de sistemas operacionais a partir de um organograma auxilia no seu entendimento: Pós-graduação . (OLIVEIRA. suportando uns aos outros. A camada de “Apoio à Tomada de Decisão Empresarial” é coberta pelos sistemas de apoio à decisão. ou seja. MORETI. 2004 apud Oliveira. O nível mais alto da pirâmide conta com o “Apoio às Estratégias para Vantagem Competitiva. embora possam funcionar em conjunto.SI em relação com a hierarquia organizacional Apoio às Estratégias para Vantagem Competitiva Apoio à Tomada de Decisão Empresarial Apoio às Operações e aos Processos Fonte: O’Brien.

Esses sistemas atuam sobre repositório de dados dimensionais (data warehouses) e bases de dados com valores consolidados. vê‑se a divisão por apoio às operações da organização ou apoio à tomada de decisão gerencial. O poder da informação e do conhecimento nas organizações . 2004 apud Oliveira. 33 Figura 2 . 2009. Percebe‑se que a Figura 2 está dividindo os sistemas de informação pela sua aplicação dentro da organização. no nível logo abaixo da caixa “Sistemas de informação”. entregam para os usuários dados resultantes de consultas e informações para apoio operacional. a que está ligada às atividades estratégicas. a fim de facilitar a entrega de informações estratégicas para apoio à decisão. Abaixo da caixa dos sistemas de apoio às operações estão os sistemas de processamento de transação. Os sistemas de apoio à decisão estão diretamente ligados com a camada gerencial da organização. Eles atuam diretamente sobre os dados operacionais armazenados nos bancos de dados da organização.Tipos de Sistemas de Informações Sistemas de Informação Sistemas de Apoio à Apoio às Sistema de Apoio às Tomada de Operações Apoio Gerencial Decisão Gerencial Operações Sistema de Sistemas de Sistemas de Sistemas de Sistemas de Sistemas de Processamento Controle Informação Apoio à Informação Colaborativos de Transações de Processos Gerencial Decisão Executiva Processamento Controle de Colaboração entre Relatórios Apoio Interativo Informação de Transações Processos Equipes e Grupos Padronizados à Decisão Elaborada Industriais de Trabalho para os Gerentes Especificamente para Executivos Fonte: O’Brien. Carreira. Moreti. de controle de processos e os colaborativos.

incluindo documentação rápida e eficiente. Eles apoiam as funções operacionais da organização. redução de pessoal e custos e melhor comunicação (interna entre setores ou externa com clientes e fornecedores). Geralmente. estoque e contabilidade. ordenar e apresentar de forma simples dados para os usuários. A razão é que são os mais fáceis e baratos de serem implementados (ou adquiridos). matrícula de um aluno. produtos e fornecedores. •• os sistemas de automação comercial: que incluem apoio às vendas. Outros benefícios podem ser conseguidos com esse tipo de sistema. armazenar e recuperar dados (consultas simples). apesar de essa não ser necessariamente uma regra. como de clientes.34 Sistemas de Informação Transacionais Os sistemas de informação transacionais são os mais simples e os mais comuns nas organizações. alteração e consulta). existem inúmeros pacotes de software prontos (já implementados) para serem adquiridos. com uso de terminais ponto de venda (PDV) e centrais automatizadas. a preços bem acessíveis. automatizar ou apoiar todos os processos de uma organização de forma integrada. Pós-graduação . são: •• os sistemas de gestão empresarial (ERP): responsáveis por administrar. etc. sistemas de vendas e distribuição (pedidos. folha de pagamento. dar baixa no estoque. busca acelerada de informações e cálculos rápidos e precisos.). balanços. como. os sistemas de contabilidade (contas a pagar e a receber. Dois casos especiais de SI’s rotineiros.). isto é. como se vê em supermercados e lojas em geral. fluxo de caixa. Incluem‑se entre eles: sistemas de cadastro em geral (inclusão. controle de estoque. Seu benefício principal é a agilização nas rotinas e tarefas. entregas). além de darem origem aos sistemas mais avançados (gerenciais e de apoio à decisão). por exemplo. fazer cálculos. emissão de uma receita médica. confiabilidade. As informações têm de ser reunidas e armazenadas de alguma maneira! Esses sistemas têm por objetivo processar dados. aquelas realizadas no dia a dia. são facilmente identificados no nível operacional da organização (fechamento de um pedido. o que pode ser mais vantajoso do que desenvolver o software por conta própria ou com terceiros. exclusão. hoje. No mercado. Por isso. de acordo com Loh (2009). são os primeiros a serem implantados. emitir uma nota fiscal etc.

do ponto de vista segmentado: •• Coleta: os dados são coletados de fontes internas e externas. O usuário deve solicitar. gráficos de modo a transformar a mesa do executivo em um centro de controle. pode‑se verificar a produção por produto específico ou por categorias de produto. sempre que houver alguma decisão sendo tomada (LOH. Os SIG’s aparecem nos 3 níveis da pirâmide administrativa (estratégico. Esse último caso é o preferido pelos administradores. de alguma forma. Com o passar do tempo. são sistemas que fornecem relatórios. Por outro lado. os SIG’s surgiram com o intuito de auxiliar gerentes em suas funções. •• Armazenamento: os dados armazenados devem espelhar a situação atual e as tendências. •• Processamento: programas que disponibilizam resumos. que possibilitam diferentes visões dos dados de uma organização. O resumo em abundância deve ser evitado para não correr riscos de omissão de detalhes importantes para a tomada de decisão. dando uma ideia das atividades sumarizadas de um departamento. em uma empresa que fabrica produtos de beleza. Por exemplo. pode‑se ver a produção por filial ou por região ou então analisar em detalhe o desempenho de cada gerente de produção (zoom in). ou seja. apresentando‑a da melhor maneira possível ao usuário. Eles atuam como um espelho de um setor.) a informação de que necessita e o SIG procura tal informação em seus registros. pois oferece mais informações em menor espaço (“uma figura vale por mil palavras”). de modo a facilitar o uso do gestor. esse tipo de sistema acabou sendo usado por qualquer funcionário que tome decisões. O objetivo de um SIG é fornecer informações para a tomada de decisões. Um caso especial de SIG são os EIS (Executive Information Systems). tático e operacional). Essa maneira pode ser textual (relatórios descritivos). 35 Sistemas de Informações Gerenciais e Sistemas de Informação Executiva Como o próprio nome diz. uso de comandos etc. (escolha por menus. Disponibilizam também meios de comunicação para comentar decisões com outros executivos. É importante que o relatório tenha o nível de detalhe adequado ao usuário: não pode ser muito detalhado ou extenso. Os EIS. O poder da informação e do conhecimento nas organizações . por meio de gráficos. 2009). por planilhas ou de modo gráfico. por meio de operações tipo zoom.

. nem indica que alternativas existem. da mesma forma que os sistemas de informações transacionais fazem parte do cotidiano de praticamente todos os segmentos. Kenneth C. LOH. o administrador pode avaliar qual é a melhor alternativa. Sistemas de informação gerenciais: administrando a empresa digital. •• Feedback: permite obter relatórios que indicam desvios dos objetivos. Thiago Moura. CARREIRA. tais como projeção e regressão. OLIVEIRA. A diferença para o SIG é que um SAD é interativo (o usuário pode entrar com várias alternativas) e ainda avalia as alternativas por meio de técnicas de what‑if (= e se eu fizer isso. Em Loh (2009) é dado um exemplo: qual o preço final de um produto? Para responder a essa pergunta. Jane P. André Luis B. Marcio Luis. como entrada. Referências LAUDON.. Acesso em: jul. Revista de Ciências Gerenciais. Vol XIII. Sistemas de Apoio à Decisão Um SAD recebe.ucpel. 2009. Material das disciplinas de Sistemas de Informação e Data Mining. São Paulo: Prentice Hall. Esses sistemas cada vez mais estarão presentes nas empresas.tche. Nº 17. Pós-graduação . Assim. Stanley. O SAD não decide qual é a melhor decisão. MORETI. Disponível em: atlas. 2001. é tipo de análise que testa mudança das variáveis e suas consequências).36 •• Distribuição: geram relatórios e gráficos que permitem ter o controle e tomar decisões.. 2009..br/~loh/. o que acontecerá. LAUDON. alternativas para solução de um problema e devolve as consequências para cada alternativa. Aprimorando a gestão de negócios com a utilização de tecnologias de informação. podemos utilizar as seguintes fórmulas: •• Lucro = receitas – total despesas •• Receitas = quantidade vendida X preço final •• Preço final = custo unitário X margem de lucro •• Total de despesas = custo de produção + despesas gerais •• Custo de produção = quantidade produzida X custo unitário Percebe‑se que os sistemas de apoio à decisão são a resposta para os problemas da falta de agilidade na tomada de decisão por parte da camada gerencial das organizações.

tentativas e erro. pode‑se verificar que os sistemas de informação possuem vários tipos de classificação. experiência do tomador de decisão. •• Sistemas de apoio gerencial: são sistemas focados no auxilio a atividades estratégicas da organização. pode‑se classificar decisões da seguinte forma: •• Decisão estruturada: possui procedimentos operacionais padrão. as organizações atuais competem entre si para entregar soluções aos clientes de maneira mais eficiente. envolvem heurísticas. muitas organizações. Segundo Gouveia e Ranito (2004). bem como para auxiliar a tomada de decisão. fatos e resultados bem definidos. voltados para camada mais de base da organização. o motivo para tal é pela vasta quantidade de sistemas já desenvolvidos para os inúmeros segmentos com preços acessíveis. São difíceis de formalizar. Conta com sistemas de informação simples. Tento as operações e transações da organização suportadas por sistemas de informação. inicialmente. entre outros. quais são: •• Sistemas de apoio às operações: sistemas caracterizados por apoiar as atividades operacionais da organização. contas a receber. O poder da informação e do conhecimento nas organizações . uma poderosa ferramenta para a gestão das suas operações cotidianas. como por exemplo: controle de estoque. Atualmente. Tendo em vista essa classificação. auxiliar os processos no nível de transações. apoiando a camada tomadora de decisão. Conta fortemente com a intuição. Na leitura anterior. •• Decisão não estruturada: não possuem qualquer padrão de procedimento operacional. médio ou grande porte). mas o que são decisões? Para Bidgole (1989) e Mittra (1996) apud Barbosa e Almeida (2002). cadastro de clientes. informações que possam auxiliar nessas soluções são tidas como estratégicas e de muito valor para a tomada de decisão. Pode‑se contar em partes com o apoio de sistemas de informação. bem definidos e muito bem projetados. de modo que o produto e/ou serviço seja de maior qualidade e de baixo custo. Até aqui se fala muito em tomada de decisão. independente do seu tamanho (de pequeno. para as organizações. ou seja. possuem sistemas de apoio as suas operações. passou‑se a buscar soluções computacionais para apoiar as decisões de maneira estratégica. tem‑se. talvez a mais natural seja pela sua atividade foco. 37 Sistemas de apoio à decisão Flávio Ceci Os sistemas de informação são. dois principais grupos de sistemas de informação. programáveis e baseado em lógica clássica. •• Decisão semiestruturada: não possui procedimento bem definidos. mas inclui aspectos de estruturação.

a tomada de decisão pode‑se definir como um processo que consiste em optar (escolher) uma. Para ilustrar a interação entre as três fases do processo de tomada de decisão Cabral (2001) apresenta a seguinte figura: Figura 1 . finaliza‑se o processo de decisão. que é dividido em 3 fases iterativas e interativas: •• reconhecimento: consiste no levantamento do problema ou oportunidade de mudança. é facilmente percebido o motivo para a caracterização das fases como iterativas e interativas. •• desenho: consiste na verificação e na estruturação das decisões opcionais. ele levanta as possíveis alternativas para o problema em questão (fase de desenho). o gestor pode tomar uma decisão (fase de escolha). a partir dessa informação. o ponto é que em algumas dessas alternativas pode‑se verificar que será gerado outro problema ou oportunidade. 2001. levando em consideração os possíveis reflexos presentes e futuros que a escolha pode gerar. •• escolha: relaciona‑se com as avaliações e com a escolha da melhor alternativa.38 O processo de tomada de decisão teve um modelo desenvolvido por Simon (1960) apud Cabral (2001). Como já foi apresentado anteriormente. entre várias alternativas para a realização de uma ação.Interação entre as fases da tomada de decisão Reconhecimento Desenho Escolha Fonte: Cabral. Pós-graduação . Segundo Heinzle. Pela análise da figura acima. faz‑se necessário que voltemos para a etapa de Reconhecimento. Com isso. caso contrário. Gauthier e Fialho (2010). um gestor percebe que determinado produto não está gerando lucros para a organização (fase de reconhecimento). Se a decisão resolver o problema em questão. ou algumas. por exemplo. os sistemas de apoio à decisão são os sistemas de informação responsáveis a auxiliar os gestores das organizações na etapa de tomada de decisão. pode‑se voltar para a fase inicial. após levantar todas as possibilidades.

sumular e apoiar a escolha de alternativas. a arquitetura é composta por três subsistemas: O poder da informação e do conhecimento nas organizações . Gauthier e Fialho (2010). mas somente em 1971 esse termo foi apresentado numa publicação de Gorry e Scottmorton. Nos anos seguintes. Segundo Heinzle (2010). •• São sistemas focados em auxiliar o gestor na tomada de decisão a problemas semiestruturados e não estruturados. ele apresenta algumas características que diferenciam esse tipo de sistema dos demais tipos de sistemas de informação: •• Disponibilizar para o usuário flexibilidade. os SAD são sistemas computadorizados que possibilitam comparar. Em seu trabalho. Turban (1990) apud Cabral (2001) apresentam outras características: •• Incorporam modelos e dados. •• Permitir apoio para as decisões e problemas para os quais as soluções não podem ser identificadas previamente. •• O objetivo é melhorar a qualidade das decisões e não a eficiência em que as decisões são tomadas. os sistemas de apoio à decisão têm como objetivo dar suporte aos processos decisórios que apresentam problemas de estruturação. •• Funcionar com pouco ou nenhum suporte de programadores. •• Dão suporte à tomada de decisão. as organizações passaram a utilizar computadores para auxiliar no seu ambiente de trabalho. o desenvolvimento deste tipo de sistema tornou‑se muito comum. acarretando em evoluções muito significativas para a área. além de apresentarem características tecnológicas estruturais e de utilização específica. analisar. •• Permitir iniciar e controlar os processos de entrada e saída. Ainda sobre as características dos sistemas de apoio à decisão. e respostas rápidas. os gestores tinham condição de ter os seus sistemas de apoio à decisão personalizados à realidade da sua empresa (CABRAL. •• Utilizar‑se de análises sofisticadas e de ferramentas de modelagem. dessa maneira. mas dependem da avaliação do gestor. 2001). Os SAD visam a apoiar decisões semi e não estruturadas. Para Heinzle. 39 Os sistemas de apoio à decisão (SAD) começaram a surgir no final da década de 60. com base na criação de cenários que incluem um significativo número de variáveis relacionadas ao domínio de um processo decisório. Segundo Barbosa e Almeida (2002). Na década de 80. com a popularização do uso dos computadores devido à significativa redução do preço do software e do hardware. Laudon (2001) chama os SAD como “sistemas de suporte a decisão”. Os sistemas de apoio à decisão possuem uma arquitetura básica.

Também podem existir motores de inferência para auxiliar o processamento dos dados. por meio de uma interface gráfica. Neste subsistema estão as estratégias analíticas que atuam sobre os dados disponibilizados pelo subsistema de dados. transformação e carga de dados.Arquitetura de um SAD Sistema de Apoio à Decisão Dados Internos Modelos Internos e Externos e Externos Banco de Banco de Dados Modelos Gerenciador Gerenciador de Dados de Modelos Software SAD Interface Usuário Fonte: Sprague e Watson (1989) apud Heinzle (2010). gerando informações e conhecimentos valiosos para a etapa de tomada de decisão.40 •• Subsistema de dados: é composto pelo gerenciador de dados. componentes para auxiliar a análise das informações processadas no subsistema de modelo. Pós-graduação . Também se pode utilizar de repositórios de dados ao estilo Data Warehouse. Nesse subsistema estão contemplados sistemas de extração. A figura 2 apresenta como os subsistemas se interagem na arquitetura de um SAD: Figura 2 . Esse subsistema também pode suportar processadores de linguagens naturais. que tem como responsabilidade a construção e gerência do banco de dados. •• Subsistema de interface: como o próprio nome sugere. •• Subsistema de modelos: é composto pelo banco de modelos e seu gerenciamento. Oferece. é responsável pela interação entre o sistema e o usuário. que possui dados relacionados com o domínio do problema.

2005. geralmente. utilizam‑se da modelagem dimensional. segundo Fourlan e Gonçalves Filho (2005). Os subsistemas de modelo da arquitetura clássica de SAD são atendidos por ferramentas de mineração de dados (Data mining). Gonçalves Filho. organiza‑os na forma de dimensões e fatos para auxiliar a etapa de analise. A arquitetura de BI traz alternativas para os três subsistemas apresentados na arquitetura clássica dos sistemas de apoio à decisão. é a evolução dos sistemas de apoio à decisão. a partir dos sistemas de informação da organização: Figura 3 . que auxiliem no processo decisório. A partir dos dados operacionais provenientes dos sistemas de informação da organização. a fim de gerar informações mais relevantes. que pode acessar diretamente o subsistema de dados para apresentar o resultado de uma consulta.Arquitetura de BI Data Mining ERP Fonte de dados Sistema de Operacionais Gestão da Empresa Data Warehouse Fonte de dados OLAP Operacionais Metadados Metadados Metadados Business Intelligence Fonte: Fourlan. O poder da informação e do conhecimento nas organizações . esses. essas têm como função explicitar as informações e conhecimentos implícitos nas bases de dados da organização. Atualmente. No subsistema de dados são utilizados geralmente repositórios do tipo Data Warehouse. todas as requisições são feitas ao subsistema de interface. a implementação dessa arquitetura mais utilizada é a de Business Intelligence (BI) que. ou ainda aplicar um processo de análise sobre os dados. 41 Como se pode observar na Figura 2. A Figura 3 apresenta uma arquitetura de BI e como é o seu fluxo de carga dos dados.

São Paulo: Prentice Hall. Porto. Ostuni. Gilka Rocha. Um modelo de engenharia de conhecimento para sistemas de apoio à decisão com recursos para raciocínio abdutivo. Roberto. 2005. GONÇALVES FILHO.. 2010. GAUTHIER. a fim de apoiar o processo decisório. Gestão e Produção. Fernando A. Kenneth C. Pós-graduação . Revista da Unifebe. LAUDON. 2010. FOURLAN. é representado na arquitetura de BI pelas ferramentas OLAP. Pedro da Costa Brito.. Uma proposta de aplicação de Business Intelligence no chão‑de‑fábrica. p. Jane P. Adiel Teixeira de. v. Referências BARBOSA. Artigo 14. Dissertação para obtenção do grau de Mestre em Sistemas de Informação Geográfica. Portugal. LAUDON.12. Marcos Roberto. que são responsáveis pela apresentação e pelo cruzamento das informações. 2001.42 O último dos três subsistemas da arquitetura clássica de SAD. o subsistema de interface. Universidade Técnica de Lisboa. Semântica nos sistemas de apoio à decisão: o estado da arte. Sistemas de apoio à decisão sob o enfoque de profissionais de TI e de decisores. HEINZLE. Florianópolis. RANITO. n.1. Tese para obtenção do grau de Doutor em Engenharia e Gestão do Conhecimento. Sistemas de informação de apoio à gestão. 2001. 1. 2004. Universidade Federal de Santa Catarina. 2002. p. XXII Encontro Nacional de Engenharia de Produção. João. 55‑66. FIALHO. CABRAL. Luís B. Francisco Antonio P. Portugal: Sociedade Portuguesa de Inovação. Sistemas de informação gerenciais: administrando a empresa digital. GOUVEIA. ALMEIDA. V. Eduardo V. Sistemas espaciais de apoio à decisão – O Sistema de Apoio ao Licenciamento da Direção Regional do Ambiente do Alentejo. HEINZLE. Curitiba. Roberto.

f. (  ) O subsistema de modelo da arquitetura clássica de SAD é equivalente ao Data Warehouse da arquitetura de BI. (  ) Os Sistemas de Informação possuem uma classificação muito bem definida. não se esqueça de comentar as respostas dos seus colegas. (  ) A arquitetura clássica de um Sistema de Apoio à Decisão é composta por três subsistemas: de dados. g. em mídias sociais) pode auxiliar os sistemas de apoio à decisão na entrega de uma informação mais estratégica para a organização? O poder da informação e do conhecimento nas organizações . e. (  ) As ontologias são estruturas formadas para representação de dados. sua eficiência e é utilizado até hoje na Nova Engenharia do Conhecimento. h. (  ) Uma organização pode ser vista como um sistema. você estudou uma série de conceitos relacionados com sistemas de informação e de apoio à decisão. b. (  ) O processo de síntese é utilizado na transformação da informação para o conhecimento. assinale as alternativas verdadeiras com V e as falsas com F: a. Atividade colaborativa Nesta unidade. desde que ela faça uso de computadores. O uso de dados disponíveis na Web (como por exemplo. (  ) Pode‑se afirmar que Business Intelligence é uma evolução de sistemas de apoio à decisão. de modelo e de interface. 43 Atividades de Autoaprendizagem 1) Levando em consideração o conteúdo apresentado nesta unidade. d. Responda à pergunta a seguir utilizando a ferramenta Fórum. ao longo do tempo. c. (  ) O “paradigma de transporte” demonstrou.

GAUTHIER.pdf>.1.unifebe. Marcos Roberto.br/pdf/%0D/gp/v12n1/a06v12n1. Uma proposta de aplicação de Business Intelligence no chão‑de‑fábrica. Após isso.pdf>. Saiba Mais Artigos muito interessantes que valem a pena serem lidos para complementar o estudo desta unidade. Por fim. qual a sua utilidade e como se pode classificá‑los. Francisco Antonio P. FOURLAN. foi visto o que são sistemas de informação. 2005. v. Disponível em: <http://www.scielo.12. Disponível em: <http://www. Roberto. quais as suas fronteiras e sua aplicabilidade.44 Síntese Nesta unidade foi apresentada uma visão geral entre dado. n. GONÇALVES FILHO. Fernando A. 1. informação e conhecimento.br/ revistadaunifebe/2010/artigo014. Artigo 14. p. Semântica nos sistemas de apoio à decisão: o estado da arte. FIALHO. 55‑66.edu. p. Revista da Unifebe. foi apresentada uma visão geral sobre os sistemas de apoio à decisão e como eles podem agregar valor à camada gerencial das organizações. V. Pós-graduação . 2010. Gestão e Produção. HEINZLE. Eduardo V. Ostuni.

. combinado com a crescente quantidade de dados digitais gerados de maneira desordenada e distribuída em vários setores da organização. Esse contexto. As utilizações de estratégias de BI estão cada vez mais presentes nas organizações. como suporte computacional para a camada tomadora de decisão. de modo que seja gerado ferramental computacional para ajudar a camada gerencial no ganho de agilidade na tomada de decisão. será que existem pesquisadores que estão pensando em sua evolução de modo a sempre acompanhar as tendências do mercado? Este capítulo tem como objetivo dissertar sobre essas perguntas. mas será que o BI por si só resolve os problemas citados anteriormente? E qual o futuro do BI. Teorias baseadas na ideia da complexidade são aplicadas sobre o modelo organizacional. •• Identificar o BI em diferentes meios. Unidade 2 Colocando inteligência nos negócios Objetivos de Aprendizagem •• Assimilar conceitos básicos de Business Intelligence. para ter‑se um melhor entendimento e uma possível previsão de modificação em curto prazo. Introdução As organizações estão inseridas num cenário que está em constante modificação e mutação. •• Examinar a arquitetura básica de um sistema de BI e suas partes. gera uma série de demandas para o departamento de TI.

pelos povos antigos. mas. deve‑se ao fato de que “Avanços significativos na tecnologia de informação tornaram possível obter. os seus pontos históricos. A sociedade do Oriente Médio antigo utilizava‑se dos princípios básicos de BI quando cruzavam informações obtidas pela natureza Pós-graduação . são apresentados mais detalhes sobre Business Intelligence (BI).46 O que é Business Intelligence? Flávio Ceci Nesta leitura. a Tecnologia da Informação (TI) tem sido considerada como um fator importante para potencializar o desenvolvimento dos processos produtivos e da gestão das organizações. sua evolução. com isso. na prática. entre os recursos tecnológicos. como vastamente confundido. GORDON. além de oferecer oportunidades sem precedentes para melhoria dos processos internos e dos serviços prestados ao consumidor final. Ao afetarem o ambiente empresarial. É importante entender que a TI prove ferramental para que a camada gerencial possa tomar as decisões.5). Aplicar inteligência a negócios não é sinônimo de TI. grupos e organizações façam a gestão de suas informações de maneira eficiente. que são obrigadas a buscar meios para garantir sua sobrevivência. Pode‑se fazer uma analogia com a relação que existe entre a engenharia do conhecimento e a gestão do conhecimento. Nesse contexto. Ainda conforme Gordon e Gordon (2006). A engenharia do conhecimento é responsável por gerar ferramental computacional e metodológico para apoiar os processos da gestão do conhecimento. essas mudanças fazem as organizações repensarem sua estrutura para se adaptar às novas exigências do mercado (GORDON. A TI possui a capacidade de atuar diretamente sobre a necessidade de uma melhora na qualidade e disponibilidade de informações e conhecimento organizacionais. mas significa que a primeira não vive sem a segunda. a TI permite que as pessoas. gerir e usar quantidades enormes de informação a um custo relativamente baixo” (GORDON. p. melhorarem o desempenho empresarial e. entre outras informações relevantes. promover seu crescimento em mercados cada vez mais competitivos. Histórico O termo Business Intelligence foi patenteado pela empresa Gartner. esse conceito já era aplicado muito antes do invento dos computadores. As constantes mudanças nas relações econômicas afetam substancialmente a administração das organizações. 2006). objetivos. 2006. GORDON.

GOLDY. A Figura 1 apresenta a evolução dos recursos analíticos em relação à possibilidade de interação dos usuários na análise em questão. A interação com o usuário é muito baixa. as planilhas eletrônicas. dando suporte a arquitetura de BI (RASMUSSEN. Colocando inteligência nos negócios . facilitaram ainda mais a análise de dados.Processamento analítico online 1992 Investigação . é basicamente uma “fotografia” de um cenário ou situação. As planilhas eletrônicas fizeram tanto sucesso que são utilizadas até hoje pelas empresas. SOLLI. em modelos dimensionais. a partir da década de 70 os pacotes de softwares analíticos começam a surgir no mercado. O uso de consultas utilizando SQL possibilitou ainda o desenvolvimento de sistemas baseados em modelos relacionais e. 2002). No contexto computacional. Goldy e Solli (2002).Sistemas de Informação Executiva 1985 Agregação . Os relatórios são utilizados até hoje pelas organizações. posteriormente. como Lotus 1‑2‑3 e. 47 para auxiliar na tomada de decisão das aldeias. Figura 1 ‑ Evolução a partir de relatórios estáticos para business intelligence Alto 2002 Ação .Sistemas de Informação Gerencial Baixo Relatórios Baixo Recursos analíticos Alto Fonte: Adaptado de Rasmussen. esses pacotes de dados trabalhavam na gestão dos dados transacionais. posteriormente. Analisando a figura acima. permitindo apenas o consumo do seu conteúdo. a movimentação e posicionamento dos astros era a forma de obter informações que serviam de base para a tomada de decisões importantes para a comunidade (PRIMAK. o levantamento dos períodos chuvosos e de seca.Mineração de Dados Análise .BI Interação com o usuário 1996 Aconselhar . A análise do comportamento das marés. o Excel. possibilitando a utilização de filtros e a construção de gráficos de maneira simples. 2010). Na década de 90. vê‑se que os primeiros recursos analíticos apresentados são os relatórios. o seu uso possibilita a apresentação de dados e informações de maneira estática.

é possível entrar com consultas. p. afirma que business intelligence: consiste na transformação metódica e consciente dos dados provenientes de quaisquer fontes de dados (estruturados e não estruturados) em novas formas de proporcionar informação e conhecimento dirigidos aos negócios e orientados aos resultados. Essa característica é possibilitada pelos sistemas construídos em cima de uma arquitetura de business intelligence. o de análise (OLAP) e o de aconselhar (mineração de dados). Mas afinal.32). de modo que as técnicas de inteligência artificial utilizadas possam explicitar muitas informações estratégicas para a camada tomadora de decisão. Pós-graduação . É importante ressaltar que a partir da década de 90 surge a necessidade das organizações serem capazes de fazer análises e planejamentos de modo a reagir a mudanças dos negócios rapidamente. Nesse período. são inseridas “inteligências” nos sistemas de informação. provendo uma grande interação por parte dos usuários.48 Entre a década de 80 e 90 surgem os recursos analíticos classificados como de agregação (sistemas de informação gerencial) e de investigação (sistemas de informações executivas). O motivo para tal é um mercado cada vez mais competitivo e um consumidor cada vez mais exigente (SASSI. Silva (2011. Ainda a partir da década de 90. Definição Percebe‑se que as práticas de business intelligence representam uma das abordagens mais modernas da evolução dos sistemas de apoio às decisões tradicionais. esses recursos permitem uma interação com o usuário maior. business intelligence é um conjunto de conceitos e metodologias que visam a apoiar a tomada de decisões nos negócios. percebe‑se mais duas características dos recursos analíticos. é inserida a característica de ação aos recursos analíticos. permitindo uma análise muito mais detalhada. 2010). o que é business intelligence? Segundo Côrtes (2002) apud Sell (2006). o que permitia uma melhor investigação dos fatos nas informações retornadas pelos sistemas de informação. A partir de meados da década de 90. a partir da transformação do dado em informação e da informação em conhecimento.

entre outros (BROHMAN et al. tendo em vista a sua transformação em depósitos estruturados de informações. fornecendo a todos os níveis das organizações informações relevantes sobre suas operações internas e o ambiente externo. para a tomada de decisão. não levando em consideração a sua origem. informações e conhecimentos que permitam a organização agir com mais eficiência em uma abordagem evolutiva de modelagem de dados. 2006). Para Almeida et al. Para Reginato e Nascimento (2007). NASCIMENTO. Colocando inteligência nos negócios . implantações bem‑sucedidas de soluções de BI proveem uma visão integrada do negócio. as técnicas de BI objetivam definir regras e técnicas para a formatação adequada dos dados. ajudando na distribuição uniforme dos dados entre os usuários. parceiros e fornecedores (SELL. como tecnologia. O ambiente externo inclui ainda variáveis independentes que possam impactar no negócio. com base nos seus sistemas transacionais (SILVA. Objetivos O foco de soluções de BI é facilitar o entendimento do negócio das organizações. BI objetiva usar os dados da organização para apoiar decisões bem informadas. leis e economia mundial. de modo a possibilitar uma visão sistêmica do negócio e auxiliar na distribuição uniforme dos dados entre os seus usuários. 49 Pode‑se conceituar BI também como a utilização de várias fontes de informação para firmar estratégias de competitividade nos negócios da organização (NAPOLI. também se pode definir BI como um “guarda‑chuva” conceitual. 2011). 2000 apud SELL 2006). estendem as capacidades analíticas dos usuários e impulsionam a formação de expertise nas organizações. assim. (1999) apud Sell (2006). Segundo Napoli (2011). 2007). capaz de promover a estruturação da informação em repositórios retrospectivos e históricos (REGINATO. As ferramentas provenientes da arquitetura de BI podem fornecer uma visão sistêmica dos negócios da organização. O investimento em BI por parte das organizações é incentivado pela necessidade de criação de um ambiente pró‑ativo para a tomada de decisão. possibilita a descoberta de novas oportunidades. De acordo com Sharma e Gupta (2004) apud Sell (2006). tendo em vista que tem como preocupação capturar dados. incluindo clientes e competidores.. 2011). BI tem como objetivos transformar grandes quantidades de dados em informações de qualidade. facilitando o acesso e a análise de dados.

As aplicações de BI podem auxiliar em vários segmentos das organizações. antecipando as transformações das exigências dos clientes”. segundo Xavier e Pereira (2009). Pós-graduação . em conjunto com a evolução das ferramentas analíticas. Como por exemplo. 2002. 2006). essas aplicações podem auxiliar a análise de: •• tendências de transformação do mercado. •• alterações no comportamento de clientes e padrões de consumo. mas o acesso à informação era dificultado devido à complexidade dos sistemas da época (SELL. que trabalhar sobre extensos relatórios para extrair elementos básicos de informação. o acesso aos relatórios digitais foi disseminado. fica claro como elas se enquadram na arquitetura clássica de um sistema de apoio à decisão. KIMBALL et al. •• preferências de clientes. mídias e desafios. Os usuários tinham. Evolução A evolução das soluções de BI está relacionada com a evolução do papel dos sistemas de informação nas organizações.50 Ao analisar os objetivos da aplicação de soluções de BI. soluções de processamento e impressão de relatórios em lote dominavam a cena do processo de apoio à decisão. •• condições de mercado. Com a proliferação dos terminais de acesso aos mainframes. A segunda fase dos sistemas de apoio à decisão é marcada pelo surgimento do Data Warehouse (DW). percebe‑se que muito dos objetivos são comuns. nos anos 70 e até meados dos anos 80. Inicialmente. evoluindo conforme vão surgindo novos recursos. então. que. repositórios de dados integrados e preparados para o apoio à decisão. 1998).. ofereceu performance e poder analítico para o nível tático e executivo nas organizações (INMON. É importante ressaltar que as soluções de BI acompanham a necessidade da organização. •• recursos das empresas. a preocupação de tratamento dos dados e a transformação deles em informação ou a disponibilização dessa informação focada no processo decisório pela camada gerencial da organização. Os autores ainda afirmam que sistemas de BI permitem que as organizações: “coletem informações sobre as tendências do mercado e ofereçam produtos e serviços inovadores.

OLAP junto a alternativas inovadoras. o foco do DW estava muito orientado à tecnologia de consolidação dos dados. Colocando inteligência nos negócios . apresentando um comparativo entre BI 1. upgrades e uso simplificados. O termo BI 2. Aplicações de geração de relatórios Relatórios orientados para a impressão. como serviços na Web (via XML). e não somente aos armazenados no DW existe um foco na independência. disponibilizadas para a empresa como um todo. na medida em que for necessário. •• o foco das soluções de BI está no acesso e na distribuição de informação para o apoio à decisão.0 e BI 2. gráficos circulares segmentados. Função de alto custo e considerada Soluções econômicas e rentáveis um luxo dentro da organização.Comparativo entre BI e BI 2. Gráficos com barras estatísticas e Visualização de dados intuitiva.0 vem sendo cada vez mais utilizados em notícias e artigos científicos. OLAP para análise. Consumo estático de relatórios. e soluções de BI suportam o acesso a todos os dados da organização. BI para todos dentro da organização. BI para uns poucos usuários especializados. Segundo Almeida et al. colaboração ativa e compartilhamento imediato das informações. mas também ao fornecimento de soluções que integram pacotes verticais de aplicativos e metodologias para diversos segmentos de negócio. e de alto consumo de tempo.0 e apostar nos dados colaborativos.0 BI BI 2. seus próprios relatórios ou assinando as informações de que necessitam. com usuários elaborando estáticos para os usuários. menos complexas e de alto desempenho e geração ad hoc de relatórios. interativas e baseadas na Web. (1999) apud Sell (2006). Xavier e Pereira (2009) desenvolveram o quadro a seguir. relatórios ou em HTML estáticos. estruturados e não estruturados. Fornecimento de informações dinâmicas Envio e apresentação de relatórios e interativas. Relatórios integrados com eventos e Relatórios baseados no desktop processos automatizados. 51 A terceira fase corresponde ao surgimento do BI. dinâmica e interativa. Instalação. ele se refere a uma próxima geração do BI que promete seguir a mesma linha da web 2.0 Comunidades de usuários dinâmicas. Ainda segundo os autores.0: Quadro 1 . as vantagens de projetos de BI em relação aos de DW são: •• soluções de BI não são orientadas unicamente à aplicação de tecnologia de informação de última geração. upgrade e uso complexos Instalação.

livre e exploração de dados. Pesquisas dinâmicas ou de estilo Parâmetros de pesquisa predefinidos. Fonte: Xavier e Pereira (2009).52 BI BI 2. •• Combinação dos dados dos repositórios da organização com dados disponíveis na Web. Como características principais apresentadas no quadro podem‑se levantar: •• Aumento da quantidade de usuário à aplicação de BI na organização (mais setores a utilizam. Segundo os autores em questão. de usuários altamente interativas. •• Aplicações mais simples e intuitivas. •• RF002 – Permitir a utilização às regras de negócio para apoiar o processo analítico. a maior deficiência das soluções tradicionais de BI está na latência entre o acontecimento do evento e a tomada de decisão. Pós-graduação . os autores sugerem a adição de recursos semânticos para auxiliar nessa tarefa.0 Aplicações baseadas na Web com Aplicações de geração de relatórios para ambientes de usuários ricos e interfaces desktop. A utilização de semântica para auxiliar as soluções de BI não é uma ideia muito nova. inclusive dados não Dados estruturados. Na visão de Pintas e Siqueira (2011). o BI 2. Nesse contexto. percebe‑se que muitos dos pontos levantados como característicos do chamado BI 2. tirando o foco somente da camada gerencial).0 já foram atendidos pelo BI tradicional. estruturados e serviços XML da Web. Essa classificação não é “oficial”. O autor apresenta alguns requisitos funcionais para possibilitar o Semantic Business Intelligence: •• RF001 – Possibilitar a navegação sobre as fontes de dados a partir dos conceitos do negócio e seus relacionamentos. Sell (2006) apresenta em seu trabalho “Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas” uma série de informações sobre essa abordagem. com Active‑X e smart client. Analisando o quadro desenvolvido por Xavier e Pereira (2009). com melhora no tempo de resposta. é mais uma terminologia adotada por alguns autores para caracterizar a utilização das estratégias de BI ao longo dos anos e momentos. Conjunto ampliado de tipos de dados suportados. assim como mixagem de seu conteúdo.0 tem como foco atacar essa latência.

Segundo Napoli (2011). •• RF006 – Suportar recomendação proativa de recursos aos usuários para apoiar o processamento analítico. o repositório de ontologias permite o mapeamento da semântica do negócio. •• RF005 – Permitir a composição de serviços para a extensão de funcionalidades exploratórias.Arquitetura para Semantic Business Intelligence OLAP Relatórios Portais Clientes Gerenciador de Análises Módulos Funcionais Gerenciador Gerenciador de Serviços de Ontologias Mecanismos Infraestrutura WSS Reasoner de Inferência Ontologia do Domínio Repositórios de Ontologias Ontologia Ontologia de Serviços BI Data Warehouse Fontes de Dados Fonte: Sell (2006). o que permite os recursos semânticos e viabiliza os requisitos apresentados anteriormente. Sell (2006) apresenta a arquitetura de solução para viabilizar o BI semântico: Figura 2 . que possibilitam a representação de um conhecimento ou conceitos de domínio. 53 •• RF003 – Propiciar flexibilidade para modificações dos conceitos de regras do negócio. •• RF004 – Permitir a extensão às funcionalidades exploratórias a partir e aplicações existentes na Web ou na organização. dos dados da organização e dos serviços necessários para o apoio ao processo decisório. Colocando inteligência nos negócios . Tendo os requisitos a mão. Um ponto muito importante apresentado na figura da arquitetura são as ontologias.

Sistemas de informação: uma abordagem gerencial. Percebe‑se que as propostas de BI 2. Padova (Itália). De maneira geral. M. A próxima leitura está focada na utilização e na descrição dos principais componentes de uma arquitetura de Business Intelligence. Steven R. 379 p. 3. 2011). Pós-graduação . Judith. Ingegneria Informatica. 1998. e que até hoje essa abordagem é muito utilizada e pesquisada pelas organizações e universidades. 2011. LUNARDI. 1997. Sean W. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento.0 são respostas a eventos que as organizações vivem. Juliano T. NAPOLI.0 para arquiteturas de BI que fazem uso de fontes de dados não estruturadas a partir de mídias sociais. KIMBALL. 2011. Rio de Janeiro: Campus. a análise de opinião sobre os produtos e serviços da organização (LUNARDI. os mecanismos de inferência permitem a realização de processamento de regras sobre ontologias. PINTAS. 2006. O papel da semântica no Business Intelligence 2. Data warehouse toolkit. Essas informações são muito importantes para a organização e podem auxiliar a inteligência competitiva. Para Napoli (2011). GORDON. 2011. 388 p.. o autor também afirma que esse recurso possibilita a capacidade de filtrar os dados reunidos na análise ou a expansão dos dados por meio da definição das regras. H. que possibilitam “raciocinar” sobre os conceitos das ontologias e instâncias da base de conhecimento. Riccardo. ed. VII Simpósio Brasileiro de Sistemas de Informação. Referências GORDON. SIQUEIRA. Como construir o Data Warehouse. Salvador. Tese (Doutorado) 2011 ‑ Universita Degli Studi di Padova. Florianópolis. São Paulo: Makron Books. Facolta di Ingegneria. Rio de Janeiro: LTC.0 e BI 3. Dissertação (Mestrado) ‑ Universidade Federal de Santa Catarina. Marcio. percebe‑se que algumas das práticas de BI já eram utilizadas muito antes do invento do computador. W. Existem trabalhos que utilizam o termo Business Intelligence 3. Aplicação de ontologias para apoiar operações analíticas sobre fontes estruturadas e não estruturadas. Ralph.0: Um exemplo no contexto de um programa de pós‑graduação..54 Outra contribuição importante desse modelo que não segue o clássico de BI é a presença dos mecanismos de inferência. Panoramic and main features of Business Analytics. INMON. 2011.

Decisões com B. 2011. Luciane. SOLLI. 2010. Leonardo Bruno R.. Rio de Janeiro: Editora Ciência Moderna. SELL. Editora Ciência Moderna. PEREIRA. São Carlos. Paul S. Nils. RASMUSSEN. SASSI. 2006. and Implementation. John Wiley and Sons. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. Uma arquitetura de business intelligence para processamento analítico baseado em tecnologias semânticas e em linguagem natural. Florianópolis. Per O. Denilson. Financial Business Intelligence – Trends. Colocando inteligência nos negócios . Centro Tecnológico. Technology. Revista Contabilidade & Finanças. 2006.69‑83. Software Selection. ENEGEP 2010. 2002. XXX Encontro Nacional de Engenharia de Produção. 2009. Programa de Pós‑Graduação em Engenharia de Produção. Florianópolis. Dhiogo Cardoso da. 2007. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. Inc. NASCIMENTO. Tese (Doutorado) ‑ Universidade Federal de Santa Catarina. GOLDY. Fabrício S. 2011. V. p. 55 PRIMAK.I. 2008. Um estudo de caso envolvendo business intelligence como instrumento de apoio à controladoria. Data Warehouse e Business Intelligence Operacional: Revistando a Tecnologia e Analisando as Tendências do Armazém de Dados. SILVA. SQL dos Conceitos às Consultas Complexas. Renato Jose. New York.. Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. XAVIER.. São Paulo. REGINATO. Fábio Vinícius. Auster Moreira. Rio de Janeiro.

é apresentado abaixo um quadro adaptado por Sell (2006). •• Operações do negócio. •• Economia. de análise •• Gestão de relacionamento com os clientes. Objetivos Eficiência. tecnologias e regulação. refinamento Utilização e reengenharia do Posicionamento no mercado.Características de utilização das soluções de BI FOCO AMBIENTE INTERNO AMBIENTE EXTERNO •• Segmentação. Aprendizagem das tendências de consumo.líderes. •• Clientes e fornecedores. com o surgimento e a grande utilização das redes sociais surgem trabalhos que alguns autores utilizam o termo business intelligence 3. •• Concorrência: -. Objetivos •• Aspectos regulatórios. junto à popularização e ascensão da área de Web Semântica. Dando continuidade aos nossos estudos. como sendo os que utilizam os dados desse tipo de mídia para auxiliar a análise e tomada de decisão nas organizações. Posicionamento no mercado. •• Perfil de compra. O termo em si ganhou mais representação quando suportado por ferramental computacional. Adaptado. •• Cadeia de suprimentos. À medida que novas tendências surgem. além dos componentes da arquitetura típica (clássica) de BI. Também são utilizadas técnicas avançadas de processamento de linguagem natural. desempenho do mercado. Pós-graduação .segmentação. É possível perceber essa linha de evolução olhando o surgimento do conceito de “Semantic Business Intelligence”. Essa leitura está mais focada na aplicação das soluções de BI. Análise. ou ainda. -. que exibe as características de utilização das soluções de BI: Quadro 1 . Identificação de riscos. bem como na sua arquitetura clássica.0. Modelagem e previsão do comportamento do mercado.56 Arquitetura típica de BI Flávio Ceci Muitas das práticas utilizadas no BI já eram utilizadas pelos povos antigos para auxiliar na sua prática na agricultura e pecuária. Fonte: Sell (2006). as arquiteturas de BI se moldam para atender os novos desafios e de modo a utilizar os novos recursos da organização. preferências e comportamentos dos clientes.

as quais podem dispor os dados de maneira mais natural para a análise e o processo de decisão. 57 As soluções de BI não são guiadas unicamente a aplicações de TIC (tecnologia da informação) de última geração. •• Repositório de dados analíticos: são representados pelos Data Warehouses (DW). Essa camada pode‑se utilizar de uma série de técnicas e / ou ferramentas para auxiliar o consumo e apresentação das informações armazenadas pelo DW. As arquiteturas tradicionais de BI utilizam vários elementos e técnicas para transformação (processamento) de dados em informação (SILVA. •• O último componente é a camada de apresentação. Vale lembrar que o foco das soluções de BI está no acesso e na distribuição de informações para auxiliar o apoio à decisão (SELL. pode‑se dividir a arquitetura de BI em três principais componentes: •• ETL (Extraction. 2011). por último. repositórios de dados que utilizam modelagens (geralmente modelagem dimensional). armazená‑las em um repositório que facilite o acesso às informações. Transformation and Loading). De maneira mais ampla. A figura a seguir adaptada por Silva (2011) do trabalho de Hodge (2011) representa a arquitetura tradicional de BI com os seus principais componentes e técnicas utilizadas: Colocando inteligência nos negócios . 2006). processo responsável por extrair os dados das bases operacionais (transacionais) da organização. mas também ao fornecimento de soluções que integram recursos verticais de aplicativos e metodologias para diversas áreas do negócio. efetuar transformações a fim de gerar informações válidas para a análise e apoio ao processo decisório e.

ou seja. •• Alertas. no data warehouse da organização. RH. •• Scorecards. perguntas específicas que procuram respostas. O processo de ETL recupera os dados dispersos pelas várias bases operacionais das organizações e após o processamento os concentra na forma de informações analíticas. cada organização possui um cenário particular e mais importante ainda. são as fontes de dados operacionais (transacionais) da organização.Arquitetura tradicional de BI com os principais componentes Fonte: Silva (2011).58 Figura 1 . O que temos em comum a todas as organizações é a arquitetura geral tradicional de BI. Suprimentos. Nessa camada estão todas as bases por setor: finanças. Os dados organizados no repositório podem ser consumidos pela camada de apresentação que é representada pelas várias técnicas de ferramentas: •• Relatórios. vendas. •• OLAP. P&D. •• Dashboards. serviços. É importante ressaltar que não existe solução de BI genérica. ou seja. Pós-graduação . clientes. Logística. A primeira camada é a chamada de “Sistemas Operacionais”.

os riscos. Colocando inteligência nos negócios . inicialmente. Essas ferramentas devem ler os dados armazenados nas várias bases operacionais da organização. é necessário que a organização esteja preparada para utilizar o sistema e saber como chegar às informações e aos conhecimentos implícitos. para isso se utilizam ferramentas ETL. nem tão pouco rápida! É necessário um bom planejamento e reservar uma boa parcela de tempo para ter sucesso nesse processo. suas bases de dados. Partindo para o desenvolvimento e implantação da solução de BI. carregá‑los nas tabelas do DW. Segundo Primak (2008). Esse procedimento que traça as principais metas e as estratégias para alcançá‑las. ter uma visão sistêmica da organização. deve ficar claro que apesar desses projetos envolverem o uso de ferramentas e soluções de Tecnologia da Informação (TI). 59 Iniciando um projeto de BI A implantação de uma solução de BI em nível organizacional não é uma tarefa fácil. além da avaliação da qualidade dos dados. processá‑los (de modo que os agrupe de modo mais natural para a análise) e. de modo que sejam facilmente identificados quais tipos de pergunta deseja‑se responder utilizando a solução de BI. que é constituída por tabelas de dimensões (filtros e informações que serão cruzadas) e tabelas fato (possuem uma série de valores já processados e distribuídos pelas dimensões em questão). deve‑se identificar quais técnicas de análises (mineração de dados) podem ser aplicadas para a extração de informações implícitas e até mesmo conhecimento. que são: •• Planejamento Estratégico Corporativo (PEC): explicitam as oportunidades. é importante entender que BI é um projeto de negócio aplicado para a empresa no contexto geral. Para Primak (2008). O que o autor quer dizer com a afirmação anterior é que o uso de uma solução de BI não é igual ao uso de um sistema de informação comum. Após a construção do DW. •• Planejamento Estratégico da Informação (PEI): é de responsabilidade da área de administração de dados e visa a identificar todos os sistemas da organização. Geralmente esses repositórios utilizam para a organização a modelagem dimensional. deve‑se. Quando essas informações já tiverem sido levantadas. pode‑se partir para a modelagem do repositório único dos dados e informações (DW). é necessário criar rotinas para carga. posteriormente. existem dois tipos de planejamento que devem ser feitos para a execução bem‑sucedida de um projeto de BI. os pontos fortes e fracos da organização. Tendo os repositórios de dados e informações modelados e devidamente carregados.

SELL. Florianópolis. 2006. Dhiogo Cardoso da.com/a/ paulhodge. Florianópolis. Centro Tecnológico. P. 2008. Acesso em 21 de Janeiro de 2012. De modo geral. em todas as etapas. PRIMAK. Tese (Doutorado) ‑ Universidade Federal de Santa Catarina.60 Devem‑se combinar as técnicas de mineração de dados com o ferramental da área de apresentação para auxiliar o consumo de informação e conhecimento proveniente da solução de BI. médio e longo prazo? •• Questões de base: quais são as competências da minha organização para atingir a meta e o que eu devo procurar no mercado? •• Investimentos e riscos: quanto vai custar o projeto de BI? Quanto e o que eu espero de retorno? •• Levantar os interessados: verificar quem. Fábio Vinícius. Programa de Pós‑Graduação em Engenharia de Produção. Rio de Janeiro: Editora Ciência Moderna. Uma arquitetura de business intelligence para processamento analítico baseado em tecnologias semânticas e em linguagem natural. é necessário que a organização esteja preparada para usufruir dos seus recursos. serão os beneficiados com a solução de BI. percebe‑se que as soluções de BI não são apenas tecnológicas. 2011. O que se deve levar em conta para a implementação de uma solução de BI numa organização? Primak (2008) apresenta algumas questões que devem ser verificadas: •• Questões de balanceamento de metas: quais são as metas para o curto. 2006. bem como adotar atividades que utilizem tais recursos para um maior aproveitamento da solução. Os próximos capítulos apresentam mais detalhes sobre cada uma das camadas da arquitetura de business intelligence tradicional. Disponível em <http://sites. Decisões com B.com/www/architecture>. Denilson. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. Pós-graduação . •• Avaliação dos resultados: deve‑se sempre avaliar os resultados. Referências HODGE. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. de modo que seja o mais natural para a tomada de decisão. 2011.I. pois mudanças podem ser necessárias para um maior sucesso. SILVA. Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. Business intelligence Architecture.google. no contexto organizacional.

0. f.0. O uso de recursos semânticos permite uma séria de possibilidades para as análises de informações disponíveis pelo BI. (  ) As práticas de BI só foram possíveis com o advento dos computadores. (  ) A ideia de adicionar recursos semânticos à arquitetura de BI é anterior aos chamados BI 2..0 e BI 3. 61 Atividades de Autoaprendizagem 1) Levando em consideração o conteúdo apresentado nesta unidade. qual a sua origem.0. Colocando inteligência nos negócios . e. (  ) DW nada mais é do que um banco de dados que utiliza como modelagem de dados a abordagem relacional. Atividade colaborativa Nesta unidade. é estudado com mais detalhes a arquitetura de BI.). quais possibilidades são essas? Como elas podem auxiliar na análise das informações? Síntese Nesta unidade. Responda à pergunta a seguir utilizando a ferramenta Fórum. b.. c. como se deu a sua evolução. (  ) O planejamento estratégico corporativo e da informação são planejamentos que devem ser feitos para um projeto de BI bem sucedido. Também é apresentado como iniciar um projeto de BI e quais são os principais componentes de uma arquitetura de BI. assinale as alternativas verdadeiras com V e as falsas com F: a. não se esqueça de comentar as respostas dos seus colegas. BI 3. (  ) A chamada área de apresentação é onde as informações são organizadas e centralizadas. você estudou uma série de conceitos relacionados com sistemas de informação e sistemas de apoio à decisão. quais as suas tendências (BI 2. d. (  ) ETL é o processo de mineração de dados previsto pela arquitetura de BI. quais são os seus principais objetivos. seus fatores históricos.

SILVA. José L. InTech. Dhiogo..intechopen. Marcio.Disponível em: <http://www. In. GHISI.. TODESCO. Denilson. Business Intelligence: Solution for Business Development. Pós-graduação . C. Adding Semantics to Business Intelligence: Towards a Smarter Generation of Analytical Tools. NAPOLI. 2012. vale muito a pena esta leitura: SELL.62 Saiba Mais O artigo abaixo foi publicado em 2012 e traz uma visão geral sobre BI e como as tecnologias semânticas podem dar suporte as suas análises. Fernando B.com/articles/show/title/ adding-semantics-to-business-intelligence-towards-a-smarter-generation-of- analytical-tools>.

Desse modo. acaba dificultando a visualização e a análise dos dados pela camada gerencial. como suporte ao armazenamento das informações das organizações. Unidade 3 Data Warehouse Objetivos de Aprendizagem •• Compreender a construção e o funcionamento dos Data Warehouses. é importante a utilização de repositórios de dados centralizados. •• Identificar as principais características de um Data Warehouses. Além da disponibilização dos dados em um repositório. . assim. sua arquitetura. quais as etapas necessárias para a sua implantação e como é feita a integração e a carga dos seus dados. de maneira distribuída pelos vários setores e ferramentas. mais eficiente. Esta unidade é focada no estudo dos repositórios de dados do tipo Data Warehouse (DW). sendo. também é necessário que esses repositórios possuam os dados organizados de maneira mais natural para a análise. que facilitam o acesso aos dados e permitam que eles possam ser cruzados e comparados. •• Entender o que é modelagem dimensional. Introdução A crescente produção de dados pelos sistemas transacionais da organização. como ele pode ser desenvolvido.

variáveis no tempo. João realizou diversas compras de cerveja e macarrão durante dois anos. que poderia ser muito melhor aproveitada pela organização. agora. compra cerveja. novas oportunidades. novos produtos. ele se casou. Pós-graduação . E ele passou a comprar fraldas. 2008. que é solteiro. 2001). um DW é um grande repositório de dados históricos da organização. O fato de ele ter mudado seu perfil de compra após o casamento não seria registrado pelo banco de dados transacional. refrigerante e fraldas. a fim de apoiar o processo decisório. logo. DW é uma grande base de dados que organiza e armazena informações integradas a partir de bases de dados operacionais. por exemplo. Os Data Warehouse (DW) têm como função atuar neste contexto. As decisões serão embasadas em fatos e não em intuições. direcionar a visão do negócio da empresa. o que dificulta a análise deles. INMON. isso pode e deve se tornar um diferencial competitivo para as empresas. Em um exemplo simples e claro: A empresa X possui um cliente chamado João. na base de dados (BD). Segundo Teorey.64 Componentes de um DW Flávio Ceci e Gláucio Adriano Fontana Com o aumento do uso dos sistemas de informações transacionais. Tendo uma ferramenta desse porte na mão. criado para dar suporte à decisão. Para Xavier e Pereira (2009). João agora é casado. o executivo pode decidir com muito mais eficiência e eficácia. seria informação perdida. necessários ao pensamento estratégico e à tomada de decisões (CIELO. não volátil. como nos bancos de dados transacionais. que atua transversalmente. esta abordagem mantém todos os dados operacionais distribuídos entre vários sistemas. podem‑se criar relações melhores com clientes. Além de não possuir uma visão integrada das operações da organização. cada vez mais são armazenados dados em bases não centralizadas. Isto é. que podem ser integrados. Então. poderão ser descobertos novos mercados. de maneira não modificável. Lightstone e Nadeau (2007). conhecendo hábitos mais a fundo e com mais detalhes do que se poderia imaginar. Uma análise nesse BD dos produtos comprados por um cliente iria nos informar que João é casado. DW é um conjunto de dados orientado por assuntos. sincronizados e integrados. O DW permite ter uma base de dados integrada e histórica para análise dos dados. macarrão. além de não possuir uma garantia de que estão corretos. pois não traz uma visão sistêmica das operações organizacionais. O que funciona bem para o controle operacional dos setores da organização apresenta um problema para a camada gerencial. variável com o tempo e integrado. pois neste ínterim dados passados são históricos.

existem tabelas que trazem as dimensões que serão cruzadas para chegar a uma informação. seja qual for a visão que se quer ter. Existem basicamente duas operações. Observe que tudo girará em torno dos assuntos. Já no Warehouse. acontecem somente cargas de dados e consultas. falando tecnicamente. e não há updates. 2008). A Figura 2 apresenta mais detalhes sobre esta característica: Data Warehouse . Além do assunto central. há somente selects e inserts. são os lucros da empresa de Telecom. ou seja. conforme Cielo (2008). Então. nesse caso. do negócio da empresa. quando um arquiteto de Warehouse for desenhar esse modelo. o faturamento. empresas. o principal assunto é o cliente. A volatilidade refere‑se ao Warehouse não sofrer mumificações como nos sistemas tradicionais. obrigatoriamente é consolidada e distribuída por ano. nada mais que isso (CIELO. a carga e a consulta. nada mais é do que o direcionamento que se dá da visão que será disponibilizada. todos os dias há inclusões e alterações de novos clientes. Como se pode observar na Figura 1. 65 A orientação por assunto. por exemplo: no sistema de faturamento de uma empresa. a visão financeira da empresa também girará em torno disso. ou seja. nesse caso. deve levar em consideração essas premissas e dividir as visões de acordo com o que o decisor quer ver. seja a inadimplência. as tabelas estão centradas num determinado assunto. e esses clientes podem ser residenciais. telefonia pública etc. A Figura 1 ilustra está situação: Figura 1 ‑ Exemplo de disposição de tabelas por assunto Empresa Cliente Lucro Telefonia Pública Ano Fonte: Elaboração do autor (2012). Por exemplo: em uma empresa de Telecom. novos produtos e consumo. a lucratividade etc.

e isso acontece da mesma forma com o Data Warehouse. p. A tabela azul representa como os dados estão organizados numa base operacional. seria por hora. Esse tipo de decisão deve ser tomada pensando no tipo de análise que se pretende efetuar e da distribuição da massa de dados. cada nova venda ou baixa no estoque gera uma nova requisição. mas ela retrata exatamente a sua situação naquele exato momento do tempo. e com isso é possível poder traçar uma análise histórica e comparativa entre os fatos. quando recém nascido. e compare. Já os DW são carregados de tempos em tempos. Poderia ser feita por mês ou ano. consolidados por dia na tabela do DW. Pós-graduação . armazenando dados já consolidados. alteração. representado pela tabela verde da Figura 3.1) utiliza uma interessante analogia com fotografias: pegue uma fotografia sua. A Figura 3 ilustra a situação da analogia da fotografia. É importante destacar que a consolidação dos dados poderia ser feita sobre outra unidade atômica de tempo que não seja dia.34. ou seja. os dados estarão armazenados. Com certeza muitas modificações ocorreram. p. posteriormente só terão acesso a essas informações.66 Figura 2 ‑ Relacionamento de volatilidade entre bases operacionais e DW Base Operacional Data Warehouse Alteração Acesso Inserção Acesso Acesso Remoção Carga Remoção Inserção Alteração Acesso Registro por registro/ Carga em massa/ Manipulação de dados acesso aos dados Fonte: Adaptado de Inmon (2007). depois. Ele sempre retrata a situação que estamos analisando em um determinado ponto do tempo. remoção ou acesso. onde cada operação de venda para um cliente gera uma linha inserida na tabela. Após o processo de transformação representado pela seta vermelha. A Figura 2 demonstra como as bases operacionais recebem requisições em nível de operação. As operações podem ser de inserção. Nós guardamos fotografias dos assuntos em determinados pontos do tempo. caso tivesse muitas operações. Variável com o tempo é uma característica ímpar no Warehouse. Cielo (2008. pegue outra quando você tinha 5 anos.

Transformação e Carga). na fase de ETL (Extração. todos os formatos são convertidos em um único padrão. porém. ou seja. que é decidido com o usuário final e então carregado no Warehouse. em alguns casos. Como sabemos. A integração talvez seja a parte mais importante desse processo. 67 Figura 3 ‑ Demonstrando a analogia da “fotografia” dos dados Fonte: Elaboração dos autores (2012). já no outro. Isso geraria um grande problema na hora da análise. isso tudo vira uma coisa só. e é necessário integrar antes de carregarmos no DW. Data Warehouse . dados externos. esse dado está guardado no formato M para masculino e F para feminino. pois ela será responsável por sincronizar os dados de todos os sistemas existentes na empresa e colocá‑los no mesmo padrão. o mesmo dado está guardado como 0 para masculino e 1 para feminino. como a cotação do dólar. Em um sistema. Um exemplo clássico é o do sexo. o Warehouse extrai dados de vários sistemas da empresa e. geralmente os dados não estão padronizados. Porém. devido aos problemas que citamos acima.

Visão geral do DW O uso dos Data Warehouse traz uma série de benefícios para a tomada de decisão da camada gerencial da organização. está por extenso. nesse caso. ou seja. ou seja.68 Figura 4 ‑ Exemplo da padronização das informações Fonte: Elaboração dos autores (2012). na tabela vermelha é utilizado M para masculino e F para feminino. Lightstone e Nadeau (2007). desenvolveram uma tabela que compara os sistemas transacionais (OLTP – on‑line transaction processing): Pós-graduação . os autores Teorey. em todas as tabelas do DW que tiver referência para sexo. é M para masculino e F para feminino. já no caso da tabela laranja. Nesse exemplo vê‑se que a informação relacionada com o sexo é apresentada de três maneiras completamente diferentes. A tabela em verde demonstra a integração dos dados. será utilizado um identificador que. essa tabela representa uma dimensão “Sexo” que possui um identificador padrão. no caso da tabela azul. A Figura 4 representa como funciona a integração dos dados das tabelas azul. vermelha e laranja. registros em várias bases de dados distribuídos pelos sistemas transacionais da organização. o sexo masculino é representado pelo número inteiro 0 e o feminino pelo 1.

pode‑se utilizar a ideia de data marts. O Quadro 1 apresenta características muito importantes dos DWs. que corresponde a uma pequena parcela de funcionários da organização. Segundo Xavier e Pereira (2009). o seu uso é focado na camada gerencial. A ideia de ter um repositório de dados implica diretamente armazenar uma grande quantidade de dados. são apresentados como orientados a processo de negócio. consultas muito complexas. é uma versão reduzida de um DW que se concentra na exigência de um departamento específico (TURBAN et al. ou seja. Fonte: Teory. os data warehouse são repositórios integradores de informações relevantes à organização. e de tempos em tempos. Data Warehouse . Na visão de data mart de Kimball um data mart é um DW orientado por assunto ou área organizacional. Lightstone e Nadeau (2007). dados esses que são armazenados de maneira história. consolidados por um período de tempo específico. Primeiramente. Por esse motivo. Como foi comentado anteriormente. data mart é um pequeno data warehouse que possibilita apoio à decisão de um pequeno grupo de pessoas e assuntos. poucas colunas por tabela) (poucas tabelas com muitas colunas) Atualizações em lote Atualização contínua (processo de carga de tempos em tempos) Consultas de simples a complexas Normalmente. a carga do DW é feita em lote. 69 Quadro 1 – Comparativo entre OLTP e DW OLTP Data Warehouse Orientado a transação (operação) Orientado ao processo do negócio (a assuntos) Poucos usuários Milhares de usuários (normalmente a camada gerencial) Geralmente utiliza pouco espaço Utiliza muito espaço (MB até vários GB) (de milhares de GB a vários TB) Dados atuais Dados históricos (fotografias) Dados normalizados Dados não normalizados (muitas tabelas. ou seja. Pelo fato do DW armazenar informações dispostas de modo a facilitar a análise. são projetados pensando nos “assuntos” relacionados à organização que se deseja tratar. 2009). Para facilitar o seu consumo.

8. 7.. 3. reunir os vários dados espalhados pelas bases transacionais no DW. 2. Os dados devem estar centralizados ou distribuídos fisicamente. faz‑se necessária a presença de uma série de componentes. Os dados podem ter vários níveis de granularidades. permitir análises hipotéticas do tipo: “o que acontece se.”. 4. compras etc. por si só. 5. de tempo entre outras. Também deve‑se utilizar o recurso de limpeza de dados. Lightstone e Nadeau (2007) elaboraram uma lista de requisitos e princípios para um projeto de DW: 1. além dos requisitos é importante identificar os principais componentes de um DW. e deverá suportar uma visão lógica centralizada. Deve ter a capacidade de “reescrever a história”. como por exemplo. mas eles. Possuem orientação por assunto. ou seja. ou seja. não trazem suporte às etapas de apoio à decisão. isso quer dizer que podem ser consolidados por várias dimensões diferentes. 6. por exemplo: vendas. Muitos dos requisitos apresentados já haviam sido abordados nessa leitura. no geral utiliza‑se SQL. Para viabilizar um projeto de DW. O DW deve ser suficientemente flexível para dar suporte rapidamente às necessidades constantes de mudança. Principais Componentes de um DW Sabe‑se que os data warehouses são repositórios de dados. Devem ter a capacidade de integração. Deverá suportar uma interface de usuário para interagir com os dados armazenados. áreas de interesses como. gerenciamento de projetos.. Turban et al (2009) desenvolveram a seguinte figura para ilustrar esses componentes e suas interações: Pós-graduação . esses são apresentados a seguir.70 Requisitos de um Data Warehouse Os autores Teorey. Os dados são caracterizados como não voláteis e são carregados em lote.

transformação e carga dos dados no DW. •• Ferramentas de Middleware: permite o acesso ao DW de maneira mais padronizada. por exemplo: OLTP. A partir da análise da Figura 5 são apresentados mais detalhes sobre os componentes: •• Fontes de dados: são as várias bases de dados transacionais espalhadas pela organização. Data Warehouse . como uma interface de acesso. •• Extração de dados: é o chamado processo de ETL. MDDB) Engenharia Mineração de Dados Fonte: Turban et al (2009). p. 61. para que outros serviços possam interagir com as informações armazenadas. •• Área de estagiamento: é uma camada intermediária entre os dados operacionais e a carga do DW. •• Metadados: são mantidos para que sejam acessados pela equipe de TI e pelos usuários. serve para o processo de limpeza dos dados antes que eles ingressem no DW. o processo de extração. Facilitam a recuperação e organização dos dados armazenados. ou seja. 71 Figura 5 ‑ Principais componentes de um DW Aplicações Aplicações Personalizadas Acesso Ferramentas A de produção Replicação Data P de relatórios Seleção Mart I S Legados Marketing Ferramenta Extrair Relatórios de de consulta metadados M relacional Transformar i Visualização Data d OLTP Mart de Informação Integrar Data d warehouse Gestão l OLAP/ROLAP Manter empresarial e Externos de Risco w Preparação a Sistemas Data r Mart Navegadores operacionais/ Banco de dados alvo e Web dados (HDB. ERP (sistemas integrados de gestão). que fazem parte dos sistemas de informações operacionais como.

Referências ANGELONI. Rio de Janeiro.uol. NADEAU. PEREIRA.. R. INMON. Ralph. Leonardo Bruno R. 266 p. 388 p. Pós-graduação . Data warehouse toolkit.. 2008. Artigo on line. Disponível em <http://www. H. 2007. Editora Ciência Moderna. H.com. São Paulo: Makron Books. São Paulo: Berkeley. Toby. Porto Alegre. Como construir o Data Warehouse. XAVIER.always. Claudia. 379 p. TERDEMAN. 1997. CIELO. 2009. Artigo online. Data Warehousing: como transformar informações em oportunidades de negócios. Fabrício S. 2009. KIMBALL.. Maria Terezinha. Disponível em <http://imasters. Sam. Ivã. V. Rio de Janeiro: Campus. TEOREY. Tom. W. H. Efraim et al. INMON. Editora Bookman. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. Elsevier.72 É importante lembrar que há outros componentes participando. LIGHTSTONE.html> Acesso em: julho de 2008. W.. 363 p. São Paulo: Saraiva. como por exemplo. é muito provável que será necessário a presença de ferramentas de processamento de linguagem natural. BONOMO. Organizações do conhecimento: infraestrutura. se a abordagem de BI que utiliza o DW em questão tiver recursos semânticos. TURBAN. Rio de Janeiro. IMHOFF. 2001. SQL dos Conceitos às Consultas Complexas. Projeto e Modelagem de Bancos de Dados.br/artigo/11178> Acesso em: julho de 2009. de anotação de conteúdo e até mesmo de ontologias e bases de conhecimento. pessoas e tecnologias. 1998. Peeter.br/site2005/internet_clip07. Construção de Data Warehouse (DW) e Data Mart (DM).com. Data Warehouse como diferencial competitivo.

Lightstone e Nadeau (2007). Para facilitar o entendimento do ciclo. os autores desenvolveram a Figura 1 a seguir. Segundo Teorey. melhorando o seu consumo por soluções de BI. 157. com a intenção de facilitar a análise desses dados. ou seja. 73 Ciclo de vida de desenvolvimento Flávio Ceci Cada vez mais as organizações estão utilizando repositórios centrais de dados e informação. Mas como se deve desenvolver um DW? Existe alguma arquitetura ou metodologia para facilitar a implementação desse tipo de projeto? Essa leitura tem como foco responder a essas questões. Data Warehouse . p. o ciclo de vida se inicia com uma conversa para determinar o plano de projeto e as necessidades do negócio. baseada no livro de Kimball e Ross (2002): Figura 1 ‑ Ciclo de vida de um DW Fonte: Teorey. possui fases necessárias para a obtenção do sucesso. Lightstone e Nadeau (2007). A implantação de um projeto de DW possui um ciclo de vida para o seu desenvolvimento. Os Data Warehouses (DW) são os maiores representantes das soluções de repositórios de dados analíticos.

como é sua estrutura. •• Modelagem de dados: nesta frente é concebida a modelagem dos dados a partir dos assuntos levantados na etapa de “definição das necessidades de negócios”. levantam‑se quais abordagens analíticas são mais indicadas para responder às questões levantadas anteriormente. essa etapa é muito importante.74 Inicialmente. Essa leitura trará mais detalhes sobre esta frente. custos estimados. entre outras atividades. pode‑se passar pelas duas atividades várias vezes. Após as três frentes concluídas. deve‑se passar por elas até ter o plano completamente alinhado com as necessidades da organização. O próximo passo é a identificação de ferramental que possa auxiliar esses processos. pois aqui serão levantados os “assuntos” que o repositório tratará. é necessário atualizar o planejamento do projeto para contemplar as informações e requisitos levantados. o que acarreta no retorno à etapa de planejamento. Segundo Dill (2002). ligando o novo repositório com os sistemas de carga e com as ferramentas que consumirão as informações armazenadas. parte‑se para a execução que está dividida em três frentes: •• Arquitetural: essa frente inicialmente está focada no projeto técnico da arquitetura do DW. Com o entendimento das necessidades. qual o perfil dos executores e envolvidos. a estrutura física dos componentes. O próximo passo é fazer um levantamento das necessidades do negócio. uma arquitetura de DW é um conjunto de normas que possibilitam uma visão da sua estrutura e auxilia no entendimento de como ocorre o fluxo dos dados ao longo do processo. ou seja. pode‑se detectar mudanças nos requisitos. bem como quais perguntas se deseja responder. essa interação entre as duas primeiras atividades iniciais do ciclo são cíclicas. deve‑se partir para a implementação do DW como um todo. tanto de carga quanto de consumo de informação e defini‑se a interface de acesso. o mesmo acontece caso encontre alguma possível manutenção. como estão organizados e relacionados. verba disponibilizada. Ao longo do uso do DW. Arquitetura As implementações de Data Warehouse possuem algumas possíveis arquiteturas para a sua implantação. na verdade. •• Analítica: para esta frente. Entende‑se como arquitetura de um DW. Pós-graduação . Tendo as duas primeiras etapas concluídas. Nesta frente também são levantadas as dimensões de análise para o cruzamento das informações. é feito o planejamento prévio do projeto como o levantamento dos recursos necessários.

ambiente de desenvolvimento. com a camada que contém as ferramentas ETL. ela é de cunho gerencial e deve‑se levar em conta principalmente a infraestrutura atual existente. onde cada camada pode ser: •• O próprio DW que contém os dados. é possível ter até uma única camada. que tem como função fornecer informações sobre os relacionamentos dos dados armazenados no DW. representada pelo próprio repositório o DW. 2002. •• Data Warehouse: ou na visão de Dill (2002). responsável pela manutenção dos metadados. A única das camadas que é obrigada a existir é a central. além do DW. Nessa etapa. disponibilidade de recursos financeiros e equipe para desenvolvimento (DILL. •• Ferramentas analíticas: usuários acessam DW por meio de ferramentas de análise e exploração de dados. O trabalho de Dill (2002) apresenta mais detalhes sobre cada uma das camadas: •• Ferramentas ETL: ou “população do warehouse”. A Figura 2 apresenta uma visão das três camadas comentadas anteriormente e como elas estão integradas: Figura 2 ‑ Arquitetura clássica de DW em três camadas Ferramentas ETL Ferramentas analíticas Data Warehouse Fonte: Elaboração do autor (2012). efetuar seu processamento e transformação e. segundo Turban et al (2009). está concentrado o maior volume de trabalho. tem como função a coleta dos dados armazenados nas bases operacionais. A arquitetura de duas camadas conta. Data Warehouse . •• Os softwares de aquisição e extração de dados. •• Softwares clientes que são utilizados para consumir e apresentar as informações solicitadas. escopo de implementação. Essas ferramentas produzem informações para suporte à decisão. “administração do warehouse”. por fim. Existem algumas arquiteturas que são clássicas. p. a carga do DW.17). as arquiteturas de duas e três camadas são bastante comuns. 75 A escolha da arquitetura do DW é uma decisão muito importante.

Dill (2002) demonstra uma possível extensão da arquitetura em três camadas. Basicamente nesta arquitetura são adicionados data marts focados em setores específicos da organização. A Figura 4 apresenta essa arquitetura com mais detalhes: Pós-graduação . 19 A extensão da arquitetura apresentada na Figura 3 mostra a inserção de data marts focados em setores da organização. A Figura 3 a ilustra com mais detalhes: Figura 3 ‑ Arquitetura de três camadas estendida Data Fonte Warehouse Corporativo Data Data Warehouse Warehouse Integração Departamental Departamental Fonte de Dados Transformação de Dados Fonte Usuários Fonte: Dill (2002). p. como apresentado por Oliveira (2002). algumas focadas na camada das ferramentas de ETL.76 Existem variações a partir da arquitetura genérica. Esse tipo de abordagem facilita a organização e o consumo das informações. em que para cada base de dados operacional é desenvolvida uma ferramenta de ETL e entre as ferramentas e o DW existe o chamado integrador. Existem outras variantes possíveis de arquiteturas.

metadados. com DBA. •• Altos custos •• Carga de trabalho operacionais e normalmente •• Latência de dados.48). posta na estação de trabalho. tecnicamente. redundantes. Data Warehouse . •• Fáceis de construir interfaces de usuários de plataforma e relatórios. consistência de ETL. empresa indisponível •• Visualização da •• Problemas com •• Custos redundantes empresa desafiadora. •• Dados podem ser separada. p. Fonte: Turban et al (2009). •• Viável apenas para •• Visualização da um volume pequeno. Existem outras possibilidades de arquiteturas para empreendimentos de data warehouse. reutilizados. com dados. •• Altos custos com aplicações. operacionais e com DBA. na unificação. Turban et al (2009) elaboraram a tabela a seguir para apresentar essas alternativas de arquiteturas ilustrando os seus prós e contras: Tabela 1 ‑ Prós e contras para as arquiteturas de DW Dados centralizados Data marts Deixar os dados Data marts integrados com independentes onde estão dependentes acesso direto •• Visualização da •• Não há necessidade •• Fáceis de construir •• Facilidade de empresa. •• Custo com dados •• Problemas com •• Altos custos com ETL. •• Exige liderança e Contras largura de banda e complexidade •• Altos custos visão corporativa. customização de de projeto e qualidade Prós •• Não há necessidade dos dados. 77 Figura 4 ‑ Arquitetura utilizando o conceito de integrado Consultas Data Warehouse Integrador Extrator Extrator Extrator BD BD BD Fonte: Adaptado de Oliveira (2002. organizacionalmente.

captura e entrega das alterações feitas nas fontes de dados da organização. a integração de dados possui três grandes processos: •• Acesso aos dados: a capacidade de acesso e extração de dados de qualquer fonte. ele garante que os dados que alimentarão o DW sejam de qualidade e representativos para os assuntos escolhidos. pois é por meio dessas ferramentas que os DW são alimentados. anteriormente. o processo de integração de dados está presente em quase todas as arquiteturas. O próximo processo é organizar os dados coletados e verificar em quais “assuntos” se encaixam melhor. O último processo (captura de alterações) é muito importante. são montadas as instruções INSERTs para o repositório DW. No processo de acesso aos dados é necessário. quais consultas devem ser feitas para extrair os dados desejados.78 Como se pode observar. o acesso é possível via requisição HTTP? •• O uso de crawler auxiliaria neste processo? Com o acesso a todas as fontes já mapeadas. •• Captura de alterações: baseado na identificação. •• Federação de dados: integração das visualizações de negócios em diversos data stores. O próximo passo é verificar os recursos tecnológicos. nesse ponto. é necessário qualificar quais dados são relevantes. Segundo Turban et al (2009). algumas perguntas podem ser feitas para auxiliar: •• Todas as bases são acessíveis pela mesma rede onde será abrigado o DW? •• Se não está na mesma rede. ou seja. Entende‑se por alteração como: alteração (Δ) = situação atual – situação armazenada. isso ocorre. pois é por meio dele que são detectadas as atualizações nos dados organizacionais. Pós-graduação . Integração de dados O processo de integração de dados é uma dos mais importantes relacionados com o ciclo de vida de um data warehouse. identificar todas as bases de dados operacionais da organização que devem ser fontes para o DW.

mas no caso do mês atual deseja‑se verificar as vendas até o momento. até o momento. web services e fontes dimensionais. ou seja. a modelagem de dados utilizados pelos DWs os organizam como “fotografias” de um período específico. O processo de ETL é responsável pela carga das tabelas do DW. Como já é sabido. faz parte dos objetivos de um data warehouse a integração de dados de múltiplos sistemas. neste cenário o sistema de integração de dados deve ser configurado para ter ciclos num intervalo menor de tempo (por exemplo. Seu foco é na integração das funcionalidades da aplicação. todos os dados estariam agrupados por mês e distribuídos pelas dimensões. Segundo Turban et al (2009). no intervalo de tempo escolhido para compor as “fotografias”. Assim. Agora imagine se os gestores dessa organização querem os dados agrupados por mês. Extrai dados dos sistemas fontes para atender ao pedido da informação. •• Integração de informações corporativa (EII): promete a entrega da informação em tempo real. A seguir é apresentado um exemplo: Imagina‑se que a unidade mínima de tempo utilizada seja “um mês”. pode‑se configurar o sistema de integração de dados para rodar a cada final de mês. existem várias tecnologias que permitem a integração de dados e metadados: •• Integração de aplicações corporativas (EAI): possibilita um meio para transportar dados dos sistemas de origem para o data warehouse. •• Extração. inserir esses registros no repositório. Caso os gestores da organização tenham interesse apenas nos dados do mês “fechado”. 79 Esse processo é mais complexo que apenas identificar as alterações nos dados. o que permite a reutilização da aplicação e flexibilidade. Tendo em vista essas características. do mês com todas as vendas e compras finalizadas. a cada hora). Para isso. elaborada por Turban et al (2009). deve‑se verificar todos os novos dados inseridos nas bases operacionais. ilustra este processo: Data Warehouse . a seguir. transformação e carga (ETL): este processo é apresentado com mais detalhes a seguir. a partir de diversas fontes relacionais. as alterações que se devem levar em conta seriam todas as operações feitas no período da primeira hora do mês corrente. A Figura 5.

•• Dados inválidos (essa deficiência deve ser atacada pelo processo de limpeza). o autor apresenta alguns desses problemas: •• Chaves primárias inconsistentes. O processo “transformar” aplica as regras de negócio levantadas em cima dos requisitos baseados nos assuntos do DW. O uso de bases de estagiamento para manter os dados pós‑extração e durante os processos de transformação e limpeza é bastante comum.72. que não são descritivos). Por fim. Por ser um processo de integração de dados. dados redundantes não são fáceis de reconhecer). Pós-graduação . •• Sinônimos e homônimos (ou seja. •• Inconsistências nos dados. A etapa de “Limpar” os dados consiste em retirar os que não respeitam as regras de negócio levantadas ou que estão incompletos. Segundo Napoli (2011). as transformações podem ser complexas quando os dados são extraídos de um ambiente heterogêneo. •• Lógica de processo embutido (valores identificadores do tipo 0 e 1.80 Figura 5 ‑ Processo ETL Fonte de dados temporários Aplicação pronta Data warehouse Sistema Extrair Transformar Limpar Carregar legado Outras Data mart aplicações internas Fonte: Turban et al (2009). os dados já transformados e limpos são persistidos no repositório data warehouse. a fim de normalizar os dados que serão armazenados no repositório. as ferramentas ETL incorporam as operações já mencionadas. O processo “Extrair” do processo de ETL é o mesmo apresentado no processo de acesso aos dados. p.

Dissertação (Mestrado) ‑ Universidade Federal de Santa Catarina. Uma metodologia para desenvolvimento de Data Warehouse e Estudo de Caso. NADEAU. Florianópolis. Data Warehouse. Data Warehouse . Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. Margy. TURBAN. Universidade Federal de Santa Catarina. Visual Books. TEOREY. 2007. 2011. Wilson J. 2009. Sérgio Luis. Aplicação de Ontologias para apoiar operações analíticas sobre fontes estruturadas e não estruturadas. 2011. 81 Referências DILL. Porto Alegre. Editora Bookman. 2002. Florianopolis. Rio de Janeiro. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. ROSS. Toby. NAPOLI. Sam. KIMBALL. Florianópolis. Projeto e Modelagem de Bancos de Dados. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Elsevier. Wiley. Tom. OLIVEIRA. LIGHTSTONE. Dissertação submetida para obtenção do grau de Mestre em Ciência da Computação. Ralph. Efraim et al. 2002. Marcio. 2002.

Como foi dito anteriormente. é necessário. bem como o seu entendimento. que são os modelos entidade‑relacionamento. pois é por meio dela que são levantadas as perguntas a que se deseja responder. aqui representado pelos Data Warehouse. geralmente os dados de bases relacionais encontram‑se em modelos que evitam redundância e possíveis inconsistências geradas por meio de inserções ou atualizações. um DW é orientado ao assunto. Para Silva (2011). contendo três ou mais dimensões. Após o entendimento das necessidades e do próprio contexto organizacional. A modelagem de um DW é chamada de Modelagem Dimensional. pode‑se atacar três frentes em paralelo: a arquitetura do DW. para isso. Esse modelo é eficiente para os sistemas transacionais. inicialmente. Segundo Sell (2006). também conhecimento como esquema estrela. que é representado pelas tabelas fato. organiza os dados de uma forma intuitiva. como será a camada de análise dos dados e informações armazenadas nele. esse modelo remete à ideia do cubo. Segundo Sell (2006). o modelo dimensional. mas não é propício às análise que envolvam grande volume de dados. Essa fase é muito importante. Uma das fases iniciais do ciclo de vida de desenvolvimento de um DW é a identificação das necessidades do negócio.82 Modelagem Dimensional Flávio Ceci Para um projeto de um repositório de dados analíticos. qual a modelagem de dados utilizada. a sua modelagem dimensional. onde cada uma representa um atributo diferente. Esta leitura é focada no processo de modelagem dimensional. Segundo Silva (2011). é preciso verificar os dados necessários e que podem ser obtidos junto aos sistemas transacionais. que é focado no alto desempenho das consultas e é orientado à estratificação de informação. Uma das principais diferenças entre os repositórios do tipo DW e das fontes de dados transacionais é a forma como eles estão organizados. A modelagem dimensional apresenta‑se como alternativa ao modelo entidade‑relacionamento para auxiliar a análise de grandes volumes de dados. uma das primeiras fases de um projeto de um repositório é a identificação do modelo de dados. ou seja. Pós-graduação . com a análise dos dados e informações contidas no DW e também como ele será organizado. esse nome é dado devido à forma com que as dados estão organizados. a definição de uma estratégia de implementação e implantação.

também apresenta um conjunto de entidades menores (dimensões). A modelagem dimensional também é conhecida como modelo estrela. que representa a evolução dos negócios do dia a dia de uma organização. quanto menor a granularidade de uma tabela fato. ligada às dimensões nas pontas. maior será o nível de detalhamento armazenado. na composição típica o modelo dimensional possui uma grande entidade central (fato). 2012. como variáveis de análise do fato. Segundo Oliveira (2002). em qua cada medida dessa é tomada segundo a interseção de todas as dimensões. arranjadas ao redor da entidade central e utilizadas de maneira combinada. As dimensões podem ser classificadas como resposta a quatro perguntas: •• Quando? •• Quem? •• Onde? •• O quê? Data Warehouse . A Figura 1 ilustra essa analogia: Figura 1 . Segundo Kimball e Ross (2002). as tabelas fato contêm muitos registros de valores e medidas relacionadas a vendas e transações de compras na empresa. esse nome é dado devido à tabela fato estar ao centro. 83 Para Napoli (2011).Exemplo da modelagem em estrela Fonte: Elaborado pelo autor.

Representam o desempenho de Refletem a evolução São os balizadores de um indicador de Objetivo dos negócios. denominados hierarquias. participaram desse fato. dos elementos que participam de um fato. pela combinação da produtividade dos das dimensões que grupos de pesquisa. e elas geralmente são utilizadas como variáveis de corte ou filtros. ele serve como uma unidade básica de entrada e saída para todos os operadores definidos em um banco de dados. dimensões e medidas: Quadro 1: Tabela descritiva de fatos. uma análise evento de negócio. análise de dados. representam um fato negócios. p. como por Escopo uma transação ou um e são determinados exemplo. que são utilizados como base para regras de agrupamentos. Segundo Datta e Thomas (1999) apud Napoli (2011). longo do tempo. Para Napoli (2011). e são utilizadas como variáveis de corte e para auxiliar em filtros de ferramentas OLAP. pois são Podem possuir Tipo de dado numéricos (medidas) somente descritivas uma hierarquia de que variam ao e classificatórias composição de seu valor. medidas e dimensões FATOS DIMENSÕES MEDIDAS São os atributos Determinam o contexto numéricos que de um assunto de Representam um item. as dimensões contêm descrições textuais das dimensões do negócio. um cubo de dados é uma das peças fundamentais na criação e construção de um banco de dados dimensional. Segundo Oliveira (2002). negócios relativo às dimensões que participam de um fato. isso leva a crer que os sistemas de controle de processos das empresas armazenam os dados direto na base operacional (relacional). ele contém células as quais são valores ou Pós-graduação .31. Normalmente não São representados por possuem atributos conjuntos de valores numéricos. Sell (2006) desenvolveu um quadro que faz o comparativo entre fatos. Sabe‑se que o DW trabalha com dados consolidados por tempo. Fonte: Sell (2006). as dimensões podem ser formadas por um conjunto de atributos. quebras e filtros em consultas a uma tabela de fato.84 É nas dimensões que são armazenadas as informações complementares aos dados cadastrados na tabela fato.

A fase frontal do cubo apresentado na Figura 2 representa o assunto venda. Estudo de caso: Concepção de um modelo dimensional O cenário escolhido para ilustrar esse estudo de caso é o de uma biblioteca universitária. é possível perceber as dimensões utilizadas para chegar no valores apresentados. a reitoria disponibilizou uma verba bastante significativa para a construção de um DW que auxilie na tomada de decisão. Para facilitar o entendimento do processo de concepção de um modelo dimensional é apresentado a seguir um estudo de caso. 85 medidas que tomam como base um conjunto de dimensões. cujo assunto é as vendas de uma loja. ou seja. Essa biblioteca faz parte de uma das maiores universidades do Brasil. Data Warehouse . foram combinadas as dimensões produto x loja. A Figura 2 apresenta um exemplo de cubo multidimensional. Figura 2 ‑ Cubo multimensional de vendas de uma loja Produto 253 10 541 40 36 103 698 30 457 66 269 20 399 620 87 Loja 10 3 2 1 Período 01/2003 02/2003 03/2003 Fonte: Campos (2005). o cubo foi movido de maneira que foi apresentada a quantidade de vendas de produtos por lojas. Como a área de pesquisa dessa universidade não para de crescer. ela conta com mais de 20 mil usuários e é conhecida nacionalmente pelo seu vasto acervo. a tabela do tipo fato “vendas”. ou seja.

existe um sistema transacional que gerencia as operações diárias dessa biblioteca.86 Como base de dados para a carga do DW. quais necessidades eles possuem e quais perguntas eles gostariam de obter respostas por meio da implantação do DW. como por exemplo: •• Gerenciamento de usuários. Após o entendimento do cenário base. para isso é necessário identificar quais títulos são mais solicitados. 2012. •• Gerenciamento do acervo. Além desse ponto. A Figura 3 apresenta a modelagem relacional da base de dados utilizados por esse sistema: Figura 3 ‑ Modelo relacional da biblioteca universitária Fonte: Elaboração do autor. o sistema transacional que o utiliza gerencia as operações diárias da biblioteca. deseja‑se Pós-graduação . para a compra de mais exemplares. O modelo apresentado acima serve como base para a carga do DW. junto aos gestores da biblioteca. foi levantado. •• Controle das multas referente a atrasos na devolução de livros. O que foi identificado junto aos gestores é que se deseja ganhar agilidade na compra dos livros.

Após identificar os “assuntos” que o DW irá tratar. para facilitar a previsão na aquisição de novos títulos por assunto. “quando?”. num modelo dimensional. Identificando o “quando?” pode‑se passar para as questões “o quê?”.. distribuídos pelos meses do ano. ele é representado por uma tabela fato. é previsto que ela se expanda para as cidades próximas. pois os gestores falaram que se deseja agrupar valores por mês. A próxima pergunta é “quando?”. “o quê?” e “onde?”. esse é o assunto em questão que se deve trabalhar no DW. mas é importante lembrar que num modelo dimensional podem existir muitas tabelas fato. Como foi falado anteriormente. É sabido que a modelagem dimensional é centrada em “assuntos”. os valores que são totalizados são relacionados aos empréstimos feitos. analisando o modelo relacional e as informações dadas pelos gestores. mas em nenhum momento os gestores fizeram perguntas do tipo: “quem são os associados que. sabe‑se que. Tanto a análise para compra quanto a análise para a distribuição é centrada nos empréstimos feitos. devemos responder a questões do tipo: “quem?”.. Como foi verificado que todas as decisões que se deseja tomar são relacionadas aos valores dos empréstimos.”. devem‑se levantar as dimensões que são utilizadas para agrupar e cruzar as informações contidas no DW. é fácil verificar que associado está diretamente relacionado com a pergunta quem. caso aconteça e expansão da universidade. ou seja. 87 identificar quais assuntos são mais solicitados. quais os assuntos que estão sendo mais solicitados? Data Warehouse . Iniciando pelo “quem?”. dessa maneira pode‑se dispensar essa dimensão. não existe a necessidade de ter outras tabelas fato. A dimensão livro ajuda a saber quais títulos não estão suprindo a necessidade e devem ser comprados imediatamente. o DW deve auxiliar a compra de novos livros e na distribuição deles entre as cidades. ou seja. ou seja. Como a universidade não para de crescer. com isso. remetendo a: o que é emprestado? A resposta nos guia para a dimensão: Livro. então. Identificando o assunto. os quais tiverem registros de empréstimo na base relacional. tem‑se uma dimensão que possui todos os meses no formato “mês/ano”. essa será a unidade atômica de tempo. Outra informação que é importante ser utilizada como dimensão e está relacionada com Livro é Assunto. para isso. ou seja. é importante saber se existem interesses em comum entre os moradores da cidade em questão.

Sempre que se fala em data warehouse. podem‑se levantar as seguintes dimensões: tempo. é apresentanda a abordagem de Inmon. Mas vale lembrar que existem várias outras abordagens para o desenvolvimento de um DW. Para facilitar a visualização é apresentada a modelagem dimensional. que se pode entender como “de cima para baixo” ou em inglês top down. que é um dos requisitos apresentados na descrição das necessidades da camada gerencial. Inicialmente. Concluído isso. Segundo Dill (2002). é perguntado “onde?” e pode‑se chegar à resposta de cidade. a partir das informações levantadas na Figura 4: Figura 4 ‑ Modelagem dimensional para o DW da biblioteca Fonte: Elaboração do autor. Por meio do modelo apresentado são facilmente respondidos quais foram os assuntos de livros mais requisitados por moradores de uma cidade no período de um ano. O modelo responde às necessidades solicitadas pela gerência da biblioteca e permite. livro. assunto e cidade. de maneira mais intuitiva e rápida. cada um desses autores apresenta abordagens diferentes. a abordagem de Inmon requer que o planejamento e o projeto sejam Pós-graduação . Abordagens para desenvolvimento de um DW Para a modelagem e desenvolvimento do DW do estudo de caso apresentado anteriormente. o autor segue alguns passos. apresentadas a seguir. apenas fazendo cruzamento das dimensões e totalizando os valores da tabela fato_empréstimo.88 Por fim. 2012. é difícil não se lembrar dos autores principais desse assunto: Inmon e Kimball. o consumo das suas informações.

p. o que não necessita do envolvimento de todos os setores na primeira fase de planejamento e projeto. Discussão do Bastante detalhada Bastante leve projeto físico Modelagem de dados Orientada por assunto Orientada por processo Acessibilidade ao Baixa Alta usuário final Proporcionar uma solução Proporcionar uma solução que facilite aos usuários finais técnica sólida com base Objetivo fazer consultas diretas aos em métodos e tecnologias dados e ainda obter tempos comprovadas de banco de dados razoáveis de resposta Fonte: Turban et al (2009. primeiramente. e chega‑se Abordagem geral empresa (atômico) “alimenta” os à consistência da empresa por bancos de dados departamentais meio de um barramento de dados e do ajustar‑se às dimensões Complexidade Bastante complexo Bastante simples do método Comparação com Processo de quatro passos. Nessa abordagem. metodologias uma fase dos métodos de Derivado da metodologia espiral consagradas de sistema de gerenciamento de desenvolvimento banco de dados relacional. Na abordagem de Kimball ou de “baixo para cima”. Segundo Dill (2002). os data marts são carregados a partir dos dados existentes nas bases operacionais. 78). No livro de Turban et al (2009). e o DW vai tendo os data marts incorporados dentro dele. construir os data marts por setor. é apresentado um quadro com o comparativo das duas abordagens.Comparativo da abordagem de Inmon e Kimball Característica Inmon Kimball Metodologia e De cima para baixo De baixo para cima arquitetura Os data marts modelam um único DW para toda a processo de negócio. o que traz a necessidade de envolver pessoas de todos os departamentos envolvidos na implementação do DW. a criação dos data marts são feitas a partir do DW já construído e não diretamente dos dados operacionais. 89 efetuados no início do projeto. Data Warehouse . não necessitando da visão global do repositório. O DW é construído à medida que os data marts são feitos. trabalha com a ideia de. em inglês bottom up. o mesmo pode ser observado no Quadro 2: Quadro 2 .

. 36) apresenta mais detalhes sobre os DW 2. Near line e Archival.0. 2002). 2007. é sabido que o chamado BI 2. Qualidade de dados em Data Warehouse. pois faz com que essa abordagem acompanhe a evolução dos cenários que as emprega. No livro de Inmon. O trabalho de Silva (2011. a evolução do DW para o DW 2. Nessa nova abordagem. INMON. p. Ralph.. W. STRAUSS. o DW não se preocupa apenas em integrar dados de várias bases operacionais. D. Integrated.0 considera também a análise dos dados não estruturados. mas também integrar dados estruturados com dados não estruturados (texto livre).0: a segunda geração do DW apresenta distintos setores conforme a necessidade de acesso e a temporalidade da informação. KIMBALL. G.0 segue as mesmas tendências previstas para a evolução da área de business intelligence. Margy. Evolução do DW A ideia do uso dos repositórios do tipo DW está cada vez mais presente nas organizações. que utiliza vantagens específicas de cada modelo para o seu cenário em questão (DILL. por conta dessa demanda. R. Wiley. Referências CAMPOS. 2002. o que é muito bom. que trata da chamada segunda geração dos data warehouse. Centro de Ensino Superior de Juiz de Fora. ROSS. 2005. Como pode ser observado. Esses setores são: Interactive. A. precisam de um ambiente comum e uma estrutura local para cada componente das plataformas de BI. foi cunhado o termo DW 2. TCC (Graduação em Bacharelado em Sistemas de Informação). Juiz de Fora.0 e BI 3. Strauss e Neusjloss (2007). tanto técnicos quanto de negócio.90 Alguns autores afirmam que é possível trabalhar com uma abordagem mista. bem como o cruzamento das informações do repositório com os provenientes da web. Outra mudança importante é que os metadados. é comum novos trabalhos sobre esse tema. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling. Pós-graduação . DW 2.0 The Architecture for the Next Generation of Data Warehousing. NEUSHLOSS.

2006. Florianópolis. Denilson. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. SELL. 2011. Data Warehouse . Wilson J. 2011. Florianópolis. Programa de Pós‑Graduação em Engenharia de Produção. 91 NAPOLI. Florianopolis. Uma arquitetura de business intelligence para processamento analítico baseado em tecnologias semânticas e em linguagem natural. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. Tese (Doutorado) ‑ Universidade Federal de Santa Catarina. Dissertação (Mestrado) ‑ Universidade Federal de Santa Catarina. Florianópolis. Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. TURBAN. 2009. Data Warehouse. 2002. Efraim et al. Aplicação de Ontologias para apoiar operações analíticas sobre fontes estruturadas e não estruturadas. 2011. Visual Books. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. Marcio. Editora Bookman. 2011. Centro Tecnológico. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. SILVA. 2006. Porto Alegre. OLIVEIRA. Dhiogo Cardoso da.

foi estudado sobre os repositórios data warehouse. (  ) As abordagens de DW estão em constante evolução. também foi visto que Inmon. Sendo assim.0 e BI 3.0. assinale as alternativas verdadeiras com V e as falsas com F: a. e. Atividade colaborativa Nesta unidade. (  ) Pode‑se fazer uma analogia das dimensões de um DW com filtros a serem aplicados numa consulta. Nesta unidade. faça um paralelo dessa evolução com a evolução do BI. (  ) Os dados nas tabelas fato são agrupados e consolidados de modo a facilitar o consumo da informação. c. não se esqueça de comentar as respostas dos seus colegas. você estudou uma série de conceitos relacionados com sistemas de informação e sistemas de apoio à decisão. b. a prova disso é a concepção do chamado DW 2.92 Atividades de Autoaprendizagem 1) Levando em consideração o conteúdo apresentado nesta unidade.0. considerado como um dos pais dessa abordagem já trabalha com o conceito do DW2. Pós-graduação . d.0. f. (  ) As medidas de um DW é uma nomenclatura equivalente a tabelas fato. Responda à pergunta a seguir utilizando a ferramenta Fórum. (  ) A utilização dos repositórios do tipo DW estão cada vez mais presentes nas empresas. BI 2. (  ) O processo de integração dos dados é algo bastante simples e rápido de conceber.

quais as suas possíveis abordagens e construções. falando sobre as novas tendências dos Data Warehouse e mais detalhes sobre DW2. bem como qual o seu ciclo de vida de desenvolvimento. 93 Síntese Nesta unidade.com/issues/20060401/1051111‑1. Saiba Mais Bill Inmon apresenta um artigo para o site Information Management.0.html Data Warehouse . sua arquitetura básica. qual a sua importância para a tomada de decisão.information‑management. é uma leitura bastante interessante. vale a pena: http://www. como se dá a integração e carga dos seus dados. são estudados os componentes de um DW.

.

. que possuem repositório de dados unificados. devem‑se utilizar soluções baseadas em descoberta de conhecimento. pré‑processados e com uma organização focada para facilitar a análise dos seus dados. Esta unidade está focada nas estratégias de descoberta de conhecimento. ••Julgar o uso de cada técnica levando em consideração o contexto do problema. •• Conhecer técnicas de mineração existentes e aplicáveis em um sistema de Business Intelligence. Unidade 4 Descobrindo o conhecimento Objetivos de Aprendizagem •• Compreender as fases do processo de descoberta de conhecimento em volume de dados. utilizando como fonte bancos de dados ou textos não estruturados. Para conseguir chegar ao conhecimento que está implícito nesses dados e nos repositórios de documentos. Com a evolução desses sistemas nascem as soluções de Business Intelligence. que sejam relevantes para o domínio da organização. Introdução O conhecimento junto aos ativos intangíveis das organizações está cada vez mais ganhando espaço como um dos bens mais valiosos para as chamadas organizações do conhecimento. Os sistemas de apoio à decisão surgiram como resposta à falta de sistemas focados em auxiliar a camada gerencial.

manipulação. o DW tem os seus dados modelados utilizando a modelagem dimensional. ou seja. estão em livros. Os dados não estruturados são armazenados geralmente em linguagem natural. tanto humana quanto computacional. novas relações e informações serão descobertas (CARVALHO. Desse modo. o próximo passo para a descoberta de conhecimento é aplicar métodos de análises estatísticas e de inteligência artificial (IA). como os Data Warehouse. entre outros. representação. Essas fontes podem armazená‑los não estruturados ou estruturados. Cada vez mais as organizações estão dando atenção para as suas informações e conhecimentos implícitos nas bases de dados e documentos. Entende‑se como dados estruturados aqueles que possuam uma estrutura que facilite a sua organização. manuais. A recuperação de informação para esse tipo de dado é muito mais complexa. nas redes sociais. dessa maneira. auxilia a organizar os dados espalhados pelas várias bases da organização e os modela de modo a facilitar a análise. revistas. entre outros. em arquivos XML. a informação e o conhecimento vêm movimentando o desenvolvimento mundial. utiliza‑se o processo chamado de: descoberta de conhecimento em banco de dados. blogs. pode‑se citar como exemplo aqueles armazenados em bancos de dados. Para a análise de dado estruturada. e cada vez mais são necessárias pessoas especializadas e ferramentas para auxiliar na aquisição. Tradicionalmente. apresentação e armazenamento. Normalmente. 2005). Com os dados organizados e armazenados no DW. A descoberta de conhecimento é a etapa que visa a entregar conteúdo de mais valor para os tomadores de decisão da organização. Varejão e Ferraz (2005). armazenamento e recuperação. já que não existe um padrão pré‑definido que facilite a sua organização. Segundo Garcia. para a análise dos dados não estruturados utiliza‑se a técnica descoberta de conhecimento em Pós-graduação . em inglês: Knowledge Discovery in Database (KDD). o acesso à informação fica muito mais fácil e rápido. a descoberta de conhecimento é sensível aos tipos de dados que se utiliza como fonte. Tendo em vista os dois tipos de dados apresentados anteriormente existem técnicas específicas para a análise de cada tipo. JSON.96 Introdução à descoberta de conhecimento Flávio Ceci A utilização de repositórios centralizados de informação. que os organiza de maneira mais apropriada para a análise.

caro e altamente subjetivo. 2005). o que é um processo lento. trataremos os termos KDD e mineração de dados como sinônimos. Descoberta de conhecimento e mineração de dados Embora muitos autores usem o termo mineração de dados (data mining) como sendo um passo particular do KDD. em inglês: Knowledge Discovery in Text (KDT). Nesse contexto. que consiste na aplicação de algoritmos específicos para a extração de padrões a partir das bases de dados. neste texto. o qual está baseado em diversos autores e em concordância com vários deles. A grande quantidade de dados existentes em bancos de dados ou via internet tornou‑se um desafio para as pessoas cuja função é a tomada de decisão. faz‑se necessária uma metodologia capaz de extrair informações úteis para o suporte às decisões. a Figura 1 mostra graficamente as informações apresentadas nesse parágrafo: Figura 1 .Tipos de descoberta de conhecimento Descoberta de conhecimento KDT KDD Banco de Dados Documentos não estruturados Fonte: Elaboração do autor (2012). 97 bases textuais. estratégias de marketing e campanhas promocionais. A esse processo dá‑se o nome de Descoberta de Conhecimento em Banco de Dados (REZENDE. entre outras. a fim de encontrar padrões e regularidades neles. A busca por essas informações é realizada utilizando‑se sofisticadas técnicas na análise daqueles dados. Os métodos tradicionais de transformação de dados em conhecimento dependem da análise e da interpretação pessoal deles. Descobrindo o conhecimento .

principalmente. permitindo às empresas um novo processo de tomada de decisão.Relação entre KDD e DM KDD Data Mining Fonte: Carvalho (2002). sistemas especialistas. baseado. Outra etapa muito importante é como apresentar e visualizar o conhecimento extraído a partir das informações. Existem muitas áreas que dão apoio ao processo de tomada de decisão.Áreas relacionadas com a descoberta do conhecimento Sistema Especialista Aprendizado Estatística de Máquina Descoberta de Conhecimento Visualização Processamento de Linguagem natural Fonte: Adaptado de Adriaans e Zantinge (1996). O processo de descoberta de conhecimento conta com a utilização de abordagens estatísticas. no conhecimento acumulado e. contido em seus próprios bancos de dados. Pós-graduação . O conhecimento provém da interpretação das informações apresentadas pelo sistema de banco de dados. veja a Figura 3: Figura 3 . deixado de lado. A informação pode ser vista como uma representação ordenada e enxuta dos dados resultantes de uma consulta que permite a visualização e interpretação deles. entre outras.98 A Figura 2 apresenta a relação entre KDD e data mining: Figura 2 . processamento de linguagem natural. aprendizagem de máquina. Um dado é a estrutura fundamental sobre a qual um sistema de informação atua. As ferramentas de data mining podem prever futuras tendências e comportamentos. frequentemente.

Economia. CARVALHO. 1996. 99 Referências ADRIAANS. Data Mining: A Mineração de Dados no Marketing. VAREJÃO. Ana Cristina B. GARCIA. Inhaúma N. 2005. Organização: REZENDE. Editora Manole. Engenharia e Administração. São Paulo. 2005. Aquisição de Conhecimento. REZENDE. 2002. England. FERRAZ. Editora Ciência Moderna... In Sistemas Inteligentes: Fundamentos e Aplicações.. Flávio M. P. D. Data mining. Fundamentos e aplicações. São Paulo: Ed. Tese Doutorado – PUCPR. Medicina. 2005. CARVALHO. Luís Alfredo V. Sistemas Inteligentes. Descobrindo o conhecimento . D. ZANTINGE. Um método híbrido árvore de decisão / algoritmo genético para data mining. Addison Wesley Longman. Curitiba. Manole. R. Rio de Janeiro. Solange O. Solange.

. É preciso ressaltar um detalhe que costuma passar despercebido na literatura. por meio do processo de Data Mining. um aspecto que não pode ser desprezado em nenhum projeto que queira ser bem sucedido. As tarefas de mineração de dados (ou processo de descoberta de conhecimento em bancos de dados – KDD ‑ Knowledge Discovery in Database) auxiliam esse processo de aquisição de conhecimento. Além disso. talvez a definição mais importante de Data Mining ou Mineração de Dados tenha sido elaborada por Fayyad et al. Navega (2002) expõe ainda que esse processo vale‑se de diversos algoritmos (muitos deles desenvolvidos recentemente). a condução (direcionamento) da exploração de dados é também tarefa fundamentalmente confiada a analistas humanos. embora os algoritmos atuais sejam capazes de descobrir padrões “válidos e novos”. o Data Mining ainda requer uma interação muito forte com analistas humanos. novos e valiosos”. KDD consiste. Junta‑se a isso a vontade dos empreendedores de extrair o máximo de vantagem de suas informações. assimilações. na transformação. que processam os dados e encontram esses “padrões válidos. na estruturação do banco de dados. Pós-graduação . preparação e pré‑processamento dos dados. novos. Data Mining é parte de um processo maior de conhecimento denominado Knowledge Discovery in Database (KDD). fundamentalmente.100 O processo de KDD Flávio Ceci e Gláucio Adriano Fontana As tecnologias para armazenamento de informação são tão comuns quanto numerosas. Esses elementos tornam a mineração de dados e a busca de conhecimento a partir de banco de dados uma área de conhecimento em crescente expansão nos dias de hoje. em última instância. uma empresa ou organização que não invista nas tecnologias do conhecimento. na seleção. no processo de Data Mining. que são. e nas análises. padrões válidos. potencialmente úteis e ultimamente compreensíveis”. Diversos algoritmos de mineração existem e cada um possui uma particularidade e aplicação. os principais responsáveis pela determinação do valor dos padrões encontrados. ainda não temos uma solução eficaz para determinar padrões valiosos. Segundo Navega (2002). Será rara. interpretações e uso do conhecimento extraído do banco de dados.. Por essa razão.] o processo não‑trivial de identificar. adequação e redução da dimensionalidade dos dados. (1996) apud Navega (2002). em dados. em um futuro próximo. “[.

baseando‑se no lucro da rede e no volume de vendas. mas o resultado pode não ser tão efetivo. Caso a organização não disponha. não estão presente nas bases operacionais das organizações. não se poderá deduzir a evolução da lucratividade de itens individuais. são subestimadas durante o planejamento dos cronogramas para a execução dos projetos. facilitando a sua análise. Aplicações incluem aprovação de crédito. se a tecnologia corrente em bancos de dados não puder acomodar diretamente a história das vendas. utilizando como base uma base operacional. As atividades de obtenção e limpeza dos dados geralmente consomem mais da metade do tempo dedicado ao trabalho. Descobrindo o conhecimento . se há um registro de vendas de produtos em um supermercado. o qual os armazena de maneira centralizada e já pré‑processados. É recomendado que se utilize um repositório de dados como Data Warehouse (DW). Em se tratando de regras de classificação (uma das técnicas de mineração de dados que se propõe a agrupar conjuntos de padrões semelhantes para análise). preparação e validação dos dados extraídos e a alocação de recursos no cliente e. o que dificulta o trabalho das técnicas e das ferramentas de mineração de dados. Vale lembrar que todas as transformações. o que reflete numa quantidade de dados maior e não orientadas à análise. pode‑se utilizar uma base operacional. limpezas e agrupamentos feitos pelo processo de ETL para o DW. pode‑se particionar conjuntos de produtos como ‘altamente lucrativos’. Por exemplo. Isto é. determinação de perfil de clientes etc. frequentemente. refletindo diretamente na performance da análise. é a falta de agilidade na resposta. ‘na média’ ou ‘não lucrativos’. Outro problema que pode ocorrer. 101 As tarefas concernentes ao processo de KDD incluem dificuldades com a extração. a maioria das ferramentas de data mining se reporta a problemas de classificação que atentam a encontrar regras que particionam dados em conjuntos disjuntos. a descoberta de conhecimento é feita em cima do banco de dados da organização. Origem dos dados Como o próprio nome sugere no processo KDD. e sim a processo.

é importante que essa etapa seja realizada em conjunto com um engenheiro de conhecimento. Tendo em vista esse detalhe. quando incorporadas nos dados de análise. o termo processo remete ao entendimento que existem vários passos envolvendo preparação de dados. Para se ter certeza do impacto. Romão (2002) diz que se deve considerar os seguintes questionamentos: •• Quais características dos dados afetam mais a mineração de dados? •• Como estas características interagem entre si? •• Os dados podem ser caracterizados de forma a melhorar a descoberta de conceitos? Percebe‑se que são necessárias etapas para preprocessar esses dados antes de submetê‑los aos algoritmos de mineração de dados. Esse passo utiliza o domínio do especialista para identificar problemas importantes e os itens necessários para resolvê‑los. de forma bastante significativa. tais como número de registros. Conhecimento do domínio da aplicação: inclui o conhecimento relevante anterior e as metas da aplicação. e quantidade de erros. 2. Entretanto. avaliação de conhecimento e refinamento. Criação de um banco de dados alvo: definir o local de armazenamento e selecionar um conjunto de dados ou dar ênfase para um subconjunto de dados nos quais o “descobrimento” será realizado. Pós-graduação . dependem da constante interferência de um técnico especialista e se repetem de acordo com a necessidade: 1. tipo dos dados. são apresentadas as etapas do processo KDD. a escolha do algoritmo de aprendizagem se torna menos importante. ou seja. Todos esses passos são interativos e iterativos. A seguir. Etapas do processo de KDD Segundo Dias (2002).102 Características dos dados Sobre as características de dados. pode‑se concluir que comparada com os efeitos de algumas características dos dados. procura por padrões. afetam diretamente a exatidão da aprendizagem. ou seja. a identificação do problema. Romão (2002) afirma que elas.

determinando um método de mineração particular a ser aplicado. se necessário. ou encontrar representações invariáveis para os dados. 103 3. adotando ações baseadas no conhecimento. onde se nota facilmente que não influenciam na solução das perguntas que se deseja responder. como remover ruídos ou subcamadas. Utilização do conhecimento obtido: inclui a necessidade de incorporar este conhecimento para a melhora de performance do sistema. Referem‑se a dados que provavelmente contenham erros de digitação ou valores absurdos. É a fase mais trabalhosa e frequentemente a mais demorada de todo o processo. 6. 4. bem como decidir quais modelos e parâmetros podem ser apropriados. Interpretação: inclui a interpretação dos padrões descobertos e o possível retorno a algum passo anterior. removendo aqueles redundantes ou irrelevantes e traduzindo os úteis em termos compreendidos pelos usuários. coletando informação para modelar. Mineração de dados (Data Mining): A fase que muitas vezes dá nome ao processo de KDD inclui a decisão do propósito do modelo derivado do algoritmo de mineração. Pré‑processamento: inclui operações básicas. ou simplesmente documentando e reportando esse conhecimento para grupos interessados. decidindo estratégias para manusear (tratar) campos. Descobrindo o conhecimento . Além dessa decisão. é necessário selecionar métodos para serem usados na procura por padrões nos dados. dependendo da meta do processo e o uso de redução de dimensões e métodos de transformação para diminuir o número efetivo de variáveis que deve ser levado em consideração. Transformação de dados e projeção: consiste em encontrar formas práticas para representação dos dados. além de uma possível visualização dos padrões extraídos. 7. 5.

104 Figura 1 .Processo KDD na visão de Romão (2002) Dados Dados Integração Pré Processamento Mineração dos Dados Pós Processamento Conhecimento Fonte: Romão (2002). Pós-graduação . A Figura 2 apresenta os processos KDD na visão de Romão (2002): Figura 2 . A Figura 1 apresenta a interação e o fluxo entre as sete etapas apresentadas do processo KDD. vale lembrar que alguns autores podem considerar mais ou menos etapas.Fases do processo KDD Fonte: Imasters. 2012.

aplicação de métodos (algoritmos) de mineração de dados para extrair os padrões deles. parte‑se para o processo de pré‑processamento que contempla a seleção de atributos e transformações sobre os dados. A interação entre as classes de usuário é bastante importante para o processo como um todo. Descobrindo o conhecimento . Ele pode ser o analista de sistemas. 105 Analisando a Figura 2. estatístico ou administrador de banco de dados da organização. •• Usuário final: é frequentemente aquele que utiliza o conhecimento extraído no processo de KDD para auxiliá‑lo em um processo de tomada de decisão. Durante a etapa de análise de dados. a interação e comunicação entre o analista. as classes de usuários envolvidos são: •• Especialista do Domínio: é o responsável por deter o entendimento do domínio da aplicação. •• Analista: é responsável pela execução do processo KDD. o autor parte do processo de integração dos dados das bases e/ou uso de repositórios. Classe de usuários envolvidos no processo KDD O processo KDD possui alguns perfis de usuários que são auxiliares e participam do processo KDD. se o contexto analisado for o de vendas o especialista pode ser o diretor de marketing. como por exemplo. A seguir são apresentados os tipos de usuários envolvidos no processo de KDD. por fim. durante a realização do processo KDD. o especialista é sensível a qual área está sendo analisada. Deve possuir amplo conhecimento das etapas que fazem parte desse processo. Segundo Oliveira (2000). especialista do domínio e usuário final é muito importante uma vez que o sucesso da extração de conhecimento depende da comunicação entre eles. Segundo Oliveira (2000). é avaliado o resultado da etapa de mineração de dados para identificar os padrões considerados como conhecimento.

Universidade Federal de Santa Catarina. (Dissertação) Ciência da Computação. Florianópolis. Robson Butaca Taborelli de. Especialização em Informática Empresarial. Anais do Infoimagem. O trabalho do autor apresentado anteriormente foi desenvolvido há. Cenadem 2002. Wesley. 10 anos. OLIVEIRA. No trabalho de Dias (2002) foram identificados alguns desafios para a área: •• Grandes conjuntos de dados e alta dimensionalidade. Disponível em: <http://www. Universidade de São Paulo. •• Gerenciamento de mudança de variáveis e conhecimento. Acesso em: março de 2012.106 Pesquisas sobre KDD atuais O uso do KDD é uma prática bastante utilizada e atual. Unesp. •• Interação. Descoberta de Conhecimento em Banco de Dados para Apoio à Tomada de Decisão. as pesquisas nessa área continuam constantes. 2000. 2002. ROMÃO. e muitos desses desafios não foram solucionados ainda. São Carlos. pelo menos. (Tese) Programa de Pós‑Graduação em Engenharia de Produção. 2002.com/reports/i2002. Cristiano Araujo. •• Multimídia e dados orientados a objetos. O Processo de Extração de Conhecimento de Base de Dados Apoiado por Agentes de Software. Referências DIAS. Pós-graduação . Sergio. Guaratinguetá. NAVEGA. 2002. Pode‑se encarar também como o “futuro” ou o presente das pesquisas relacionadas com KDD a utilização de conteúdo semântico na cruzada de informação dimensional.intelliwise. •• Dados perdidos. Descoberta de Conhecimento Relevante em Banco de Dados sobre Ciência e Tecnologia. •• Interação com o usuário e conhecimento anterior adquirido. Princípios do DataMining. tendo em vista isso.htm>.

um dos grandes problemas atuais é a produção desordenada de dados a partir das operações de um indivíduo ou organização. Segundo Witten e Frank (2000). Processos da mineração de dados Para que as técnicas de mineração de dados obtenham sucesso na sua análise e atuem na resolução dos problemas. No entanto. Junto ao armazenamento. O uso das técnicas de mineração de dados (em inglês Data Mining) com a criação de repositórios de dados organizacionais representam processos imprescindíveis para a descoberta de conhecimento. surge a necessidade de recuperação. Para Rezende (2003). Essa grande quantidade faz emergir a necessidade de discos de armazenamento maiores. o que faz as organizações se preocupar em como organizar esses dados. ou seja. o uso de técnicas de mineração de dados se dá pela combinação de uma série de algoritmos que definem um paradigma de extração de conhecimento. 107 Técnicas de Mineração de Dados Flávio Ceci e Gláucio Adriano Fontana A evolução da computação permitiu a automatização de uma série de processos organizacionais. junto a essa evolução nasce a explosão na quantidade de dados produzidos. bem como a comunicação interna e externa. e esse processo nunca para. A Figura 1 foi retirada do trabalho de Quoniam et al (2001). É sabido que por trás dos dados brutos se esconde uma grande quantidade de informações e conhecimento valiosos para a tomada de decisão. é necessário que sejam efetuados alguns processos. de maneira rápida e eficiente. que apresenta todos os seus processos. é importante destacar que para uma mesma técnica pode‑se utilizar mais de um algoritmo. Descobrindo o conhecimento . sempre será necessário comprar um novo disco rígido maior.

A terceira etapa está focada na preparação dos dados.Processos para a mineração de dados Base de Dados Bruta Visualiza 2ª Etapa de Seleção Limpa dos Dados 1ª Etapa Base de Dados Data Mining Problema que será de Trabalho objeto de estudo 3ª Etapa de Análise dos Preparação dos Dados resultados Assimilação do Conhecimento 4ª Etapa de Análise dos dados Fonte: Quoniam et al (2001).108 Figura 1 . Inicialmente. A segunda etapa do processo é a seleção e organização dos dados que serão utilizados como base para a análise. Na quarta e última etapa é feita a análise propriamente dita e aplicado o algoritmo para a mineração de dados. Além disso. na próxima seção são apresentadas essas áreas com mais detalhes. é identificado qual (quais) problemas se deseja resolver utilizando as técnicas de mineração de dados. pode‑se partir para o levantamento das perguntas que se deseja responder com a sua utilização. a fim de explicitar novas informações e conhecimentos de domínio da organização. A utilização das técnicas de mineração de dados não estão limitadas ao domínio da computação. Agora eles são organizados de modo a serem melhor analisados pelos algoritmos utilizados. Pós-graduação . muitas outras áreas também a utilizam. Essas duas etapas iniciais são comuns no processo de implementação de um data warehouse e podem ser reaproveitadas. é o pré‑processamento.

segundo Carvalho (2005). •• Supermercados: algumas redes de supermercados utilizam‑se de técnicas de mineração de dados para oferecerem ofertas a seus clientes de maneira personalizada. 109 Segmentos para o uso de mineração de dados Muitas são as áreas e segmentos que fazem uso das técnicas de mineração de dados. Muitas são as técnicas utilizadas de mineração de dados para os mais variados fins. treinamento sobre esse conjunto. levantados do livro desse autor: •• Aplicações do governo: o governo americano utiliza mineração de dados há bastante tempo para identificação de padrões de transferências de fundos internacionais. as mais utilizadas são: •• Classificação de dados (data classification): consiste no processo de encontrar propriedades comuns e um determinado conjunto de objetos de um banco de dados e classificá‑los em diferentes classes. muitos são os exemplos do seu uso. Segundo Martinhago (2005). Os passos básicos são: definição de um conjunto de exemplos conhecidos (treinamento). com os dados de um grande banco de dados. A seguir são apresentados alguns desses exemplos. de acordo com um modelo de classificação. adicionalmente. cada tupla contém um rótulo marcado com a identificação de uma classe conhecida associada a ela. seus algoritmos e suas possíveis aplicações. que se pode definir com uma linha de uma tabela do banco de dados. a partir dos dados anteriores de suas compras. •• Na medicina: o uso de mineração de dados para auxiliar na detecção de doenças a partir de sintomas e do histórico de saúde do paciente. consiste em um conjunto de múltiplos atributos comuns das tuplas de um grande banco de dados e. não existe uma só técnica que pode ser aplicada a fim de solucionar um problema ou fazer uma análise. um banco de dados de exemplo é definido como o conjunto de treinamento. que se parecem com a manipulação do dinheiro pelo narcotráfico. O objetivo da classificação de dados é primeiro analisar o conjunto de treinamento e desenvolver uma apurada descrição ou modelo para futuros testes. gerar regras de classificação ou descrição. Descobrindo o conhecimento . onde cada tupla. mas existem técnicas que são mais eficientes para resolver melhor alguns problemas. Para construir um modelo de classificação. por esse motivo deve‑se conhecer bem as técnicas de mineração de dados.

110

•• Clusterização: instintivamente, as pessoas visualizam os dados
segmentados em grupos discretos, como, por exemplo, tipos de
plantas ou animais. Na criação desses grupos discretos pode‑se
notar a similaridade dos objetos em cada grupo. Enquanto a análise
de grupos é frequentemente feita de modo manual em pequenos
conjuntos de dados, para grandes conjuntos, um processo automático
de clusterização (dataclustering), por meio da tecnologia de mineração
de dados é mais eficiente. Em adição, os cenários existentes são
muito similares, tornando‑os competitivos, requerendo a utilização de
algoritmos complexos, que determinem a segmentação mais apropriada.
Nesse método de mineração, considerado do tipo “divisão e conquista”,
o algoritmo deve criar as classes por meio da produção de partições do
banco de dados em conjuntos de duplas. Essa partição é feita de modo
que duplas com valores de atributos semelhantes, ou seja, propriedades
de interesse comuns sejam reunidas dentro de uma mesma classe.
•• Estimativa: estimar algum índice é determinar seu valor mais provável
diante de dados de outros índices semelhantes sobre os quais se
têm conhecimento. Suponha que se deseja saber o gasto de famílias
cariocas com lazer e que para isso existam índices de gastos de famílias
paulistanas com lazer em função da faixa etária e padrão sociocultural.
Não sabemos exatamente quanto as famílias cariocas gastam com lazer,
mas podemos estimar, baseados nos dados das famílias paulistanas.
Certamente, essa estimativa pode nos levar a erros, uma vez que
Rio de Janeiro e São Paulo são cidades com geografias diferentes e
oferecem diferentes opções de lazer a seus frequentadores. A arte de
estimar é exatamente esta: determinar da melhor forma possível um
valor, baseando‑se em outros valores de situações idênticas, mas nunca
exatamente iguais.
•• Previsão: resume‑se na avaliação do valor futuro de algum índice,
baseando‑se em dados de comportamento passado a esse índice.
A previsão pode incluir tarefas como: se o índice da bolsa de valores X
irá subir ou descer amanhã, quanto o valor da bolsa irá variar, qual será
a população de uma cidade Y daqui a dez anos, entre outras. O único
meio de verificarmos se uma previsão foi bem feita é aguardar o
acontecimento do fato e conferir se ela se verificou ou não.
•• Regras de associação: determinam que fatos ocorrem simultaneamente
com probabilidade razoável de co‑ocorrência, ou que itens em uma
massa de dados estão presentes juntos (correlação). Vendas casadas ou
a análise de um carrinho de supermercado para ver quais itens os clientes
compram conjuntamente, são exemplos desta técnica. Uma regra de
associação é definida como: “Se X então Y” ou “X ÞY”, onde X e Y são

Pós-graduação

111

conjuntos de itens e X Ç Y = Æ. Diz‑se que X é o antecedente da regra,
enquanto que Y é o consequente dela. Um algoritmo baseado em
regras de associação consiste em descobrir esse tipo de regra entre os
dados preparados para a garimpagem. Medidas estatísticas revelam a
frequência de uma regra no universo dos dados garimpados.

Para clarificar o entendimento de como funcionariam técnicas de mineração de
dados aplicadas sobre uma massa de dados, seja ela proveniente de informações
de um DW, de um banco de dados transacional ou da Web (webmining), são
demonstrados dois exemplos de regras de associação e de clusterização,
mostrando como se pode descobrir nova informação e assumi‑la como regra,
isto é, conhecimento.

Utilizando Regras de Associação para venda casada
Pense em uma cadeia de lojas de farmácias. Deseja‑se saber quais produtos
desencadeiam a compra de outros.

Por exemplo, ao encontrar a seguinte associação {mercúrio, gaze, esparadrapo}
Þ {algodão} (0,78), significando que 78% dos clientes que compram mercúrio, gaze,
esparadrapo também compram algodão, o gerente de uma farmácia pode veicular
campanhas publicitárias utilizando esses produtos, dispô‑los em lugares próximos
na prateleira, entender o porquê de uma possível queda nas vendas de alguns dos
produtos, entre outras conclusões. Muitos algoritmos foram desenvolvidos com
o objetivo de descobrir regras de associação. Desses, o mais utilizado é o Apriori,
sendo que os demais ou são extensões deste ou o utilizam (AGRAWAL, 1995 apud
CARVALHO, 2000).

O algoritmo Apriori realiza a garimpagem em dois passos: geração e poda.
No primeiro, é feita uma varredura sobre o arquivo, a fim de gerar todos os
conjuntos de combinações de valores de colunas que aparecem no arquivo.
No segundo, são considerados apenas aqueles conjuntos que aparecem no
arquivo com uma frequência não menor que um valor mínimo pré‑fixado, são
os chamados grandes conjuntos. A medida da frequência de um conjunto X de
valores é chamada de suporte, assim definido:

Nº de registros que contêm os elementos do conjunto X
Suporte (X) =
Nº total de registros do arquivo

Descobrindo o conhecimento

112

E o fator de confiança da regra é dado por:

Nº de registros com X e Y
Confiança (R) =
Nº de registros com X

Na tabela seguinte, exemplificando um espaço amostral de dez registros,
considera‑se 1 para produto comprado por cada cliente.

Tabela 1 ‑ Transações de vendas a clientes

Transação Gaze Esparadrapo Mercúrio
1 1 1 0
2 1 1 0
3 1 1 1
4 1 1 1
5 1 1 1
6 1 1 1
7 1 0 1
8 1 1 1
9 0 1 1
10 1 1 1
Fonte: Carvalho (2000).

E considerando‑se um grau de confiança mínimo de 0,80, os cálculos denotaram
as seguintes relações válidas (com grau de confiança superior ao mínimo):

Tabela 2 ‑ Regras com confiança maior que o mínimo

Regra Fator de confiança
{Gaze}=Esparadrapo 0,88
{Esparadrapo}=Gaze 0,88
{Gaze}=Mercúrio 0,77
{Mercúrio}=Gaze 0,87
{Esparadrapo}=Mercúrio 0,77
{Mercúrio}= Esparadrapo 0,87
{Gaze, Esparadrapo}=Mercúrio 0,75
{Gaze, Mercúrio}= Esparadrapo 0,85
{Esparadrapo, Mercúrio}=Gaze 0,85
Fonte: Carvalho (2000).

Pós-graduação

O precedente normalmente será o carro‑chefe das vendas. Mapeando cada atributo em uma coordenada unidimensional. q2. Podemos. leva gaze (87% dos clientes). Essa técnica. A distância euclidiana entre dois pontos p = (p1. considera o conjunto e a renda representando pessoas. ele chamará o cliente para dentro do estabelecimento e o fará consumir mais. Ela contém valores diferentes e regras inválidas e válidas. a análise de cluster se baseia na proximidade entre os valores de seus atributos. Para medir a similaridade entre itens. já que identifica grupos de registros correlatos. em que cada ponto representa um item (ou pessoa). A partir dos valores dos atributos desses itens. q) = i=1 ( pi qi ) O exemplo abaixo. apresentado por Aragão (2008). leva mercúrio. Criando classes – Clusterizando Fazer grupos e procurar características em comum entre vários itens e aproximar os semelhantes é o que se chama Clusterizar. como um algoritmo de clusterização faria. KAMBER. como precedente e consequente. itens compostos por “m” atributos podem ser representados como pontos em um espaço euclidiano m‑dimensional. p2.….…. 113 Quem leva mercúrio também leva gaze? Vale comentar aqui que essa relação nem sempre é comutativa. conforme a Tabela 3. como um processo que permite agrupar itens. pm) e q = (q1. Veja as linhas 3 e 4 da tabela. qm) é definida como: m 2 dist ( p. 2008). simplesmente modificando a ordem dos produtos. Um cluster é um agrupamento de itens que são similares a outros dentro do mesmo agrupamento e diferentes em outros agrupamentos (HAN. muitas vezes. então. Os círculos representam os clusters ou agrupamentos mais próximos. Como você pode notar. Descobrindo o conhecimento . respectivamente. é uma das primeiras etapas dentro de um processo de Data Mining. 2006 apud ARAGÃO. mas está abaixo do limiar afirmar que quem leva gaze. ou clusterização. pode‑se confiar que quem leva mercúrio. podemos formar o gráfico bidimensional apresentado na Figura 2. de forma a maximizar a similaridade dentro da mesma classe e a minimizar a similaridade entre as classes. definir a análise de cluster.

600.00 46 4. Mas.00 42 1.000. para ter uma renda tão alta em tal faixa etária.00 29 3. C2: “Jovens Iniciando a Carreira”. como provavelmente não possuem formação superior nem experiência.114 Tabela 3 .200. Por exemplo: C1: “Crianças”. C4: “Altos Executivos”. portanto.000.00 10 0.00 27 3. C3: “Profissionais com Curso Superior”. Nesses clusters temos apenas crianças. Nesses clusters temos pessoas que já têm experiência e pelo patamar salarial provavelmente também possuem formação superior. têm uma renda relativamente baixa.00 18 500.00 6 0.000.000.500.00 22 1. sua renda é nula. provavelmente fazem parte de alto escalão gerencial. que não podem trabalhar.500.200. C5: “Profissionais sem Curso Superior”. provavelmente não possuem curso superior.500.00 39 4. precisamos antes identificá‑los e nomeá‑los adequadamente.00 39 1. por terem uma renda relativamente baixa.00 Fonte: Aragão (2008) Para usar esses clusters como classes.00 31 3.00 42 5.Valores dos atributos Idade Renda 5 0. Nesses clusters temos pessoas com idade próxima à mínima para poder trabalhar.00 20 800. Nesses clusters temos pessoas de certa idade que. Pós-graduação .00 40 1. Nesses clusters temos pessoas de certa idade que.

estamos prospectando negócios.000 4. conhecer diferenças entre hábitos de consumo de diferentes clientes em uma loja que vende diferentes produtos. e onde vivem esses clientes com gostos e comportamentos semelhantes.000 2.000 C3 Renda 3. contribuindo para o entendimento didático. A mineração de dados é utilizada hoje em vários segmentos de mercado. como por exemplo: área médica. Talvez seja interessante abrir uma filial próxima a eles. não? Criando classes. Essa descoberta de conhecimento se dá a partir da aplicação de técnicas baseadas em estatísticas e na inteligência artificial para encontrar padrões e informações implícitas nos dados armazenados nos repositórios das organizações.Gráfico bidimensional 6. por exemplo. Descobrindo o conhecimento . Pensar em agrupar pode ser muito útil se quisermos. marketing. possibilitaa descoberta de conhecimento a partir dos seus repositórios de dados. geologia.000 C1 0 0 10 20 30 40 50 Idade Fonte: Aragão (2008). e já possuem interpretação mais em cima. de acordo com o resultado da clusterização.000 C2 C5 1. entre outras áreas. usando esses dados como exemplos de treinamento para um algoritmo de classificação. economia. podemos associar a cada item sua respectiva classe. qual produto determinado cliente leva e quem mais compra este produto. Sazonalidade de compras. engenharias. Após a identificação e nomeação dos clusters (ou classes).000 C4 5. Conclusão O uso das técnicas de mineração de dados para apoiar o processo de tomada de decisão pela camada gerencial. administração. 115 Figura 2 . A identificação e nomeação acima são apenas aproximadas e ilustrativas.

1998. Engenharia e Administração.116 Referências AGRAWAL. Eibe. n. Brasília. SRIKANT. NAVEGA. 2000. Data Mining: A Mineração de Dados no Marketing. Curitiba. Inteligência obtida pela aplicação de data mining em base de teses francesas sobre o Brasil. 2003. Pedro O. 2001. R. Editora Ciência Moderna. Sérgio. Universidade Federal da Paraíba. Monografia (Graduação em Tecnologia)‑Faculdade de Tecnologia de São Paulo. Morgan Kaufmann Publishers. Discovering Unexpected Patterns in Temporal Data using Temporal Logic. Padhraic. Data Mining – Practical Machine Learning Tools and Techniques with Java Implementations. Medicina. Sergio. Manole. Ian H. Usama M. 2002.Advance. Proceedings of Eleventh International Conf on Data Engineering. FRANK. Sistemas Inteligentes – Fundamentos e aplicações. (Dissertação) Mestrado em Métodos Numéricos em Engenharia. Stanley. 2008. Gideon et al. Descoberta de Conhecimento sobre o Processo Seletivo da UFPR. PIATESTSKY‑SHAPIRO. v. Knowledge Discovery and Data Mining. Utilização de técnicas de datamining para reconhecimento de caracteres manuscritos. QUONIAM. Disponível em: atlas. WITTEN. Luís Alfredo V.ucpel. 30. MARTINHAGO. Ciência da Informação. 1996. 2005. Mining Sequential Patterns. BERGER. ARAGÃO. CARVALHO. Um estudo sobre conceitos e técnicas de mineração de dados. 2000.tche. Solange. 2005. São Paulo: Ed. Universidade Federal do Paraná. R. 20‑28. Pós-graduação . SMYTH. Heidelberg: Ed Springer‑Verlag. Princípios do DataMining. et al. São Paulo. Ramasamy. Acesso em: jul. REZENDE.. p.2.br/~loh/. Rio de Janeiro. CARVALHO. 2008. Luc. FAYYAD. Economia. Material das disciplinas de Sistemas de Informação e Data Mining. 2009. Cenadem 2002. Anais do Infoimagem.. UTHURUSAMY. LOH. Temporal Databases ‑ Research and Practice. Juliano et al. Gregory. 1995.

Segundo Feldman e Hirsh (1997). 2010). mas nesse caso usam‑se técnicas de processamento de linguagem natural para extrair conceitos de texto e mais uma vez análises estatísticas. Text Mining é a aplicação do Data Mining sobre textos não estruturados. Tendo em vista essa afirmação. Por “não trivial” Bovo (2011) explica que isso envolve alguma busca ou inferência. O processo KDT é bastante similar ao processo KDD. de modo que não é apenas uma computação direta de valores pré‑definidos. mas para recuperar padrões e técnicas de visualização. notas de compra e venda.Etapas do processo KDD Interpretação/Avaliação Mineração de Dados Transformação Conhecimento Pré-processamento Seleção Padrões Dado Dado Transformado Base de Data set Pré-processado Dados Fonte: Gonçalves (2006). Segundo Turban (2009). em relatórios. é apresentado o Processo de Descoberta de Conhecimento em Texto (ou em inglês KDT – Knowledge Discovery in Text). e‑mails. A Figura 1 apresenta as etapas mais comuns de um processo de descoberta de conhecimento em banco de dados. 2006). por exemplo. O fato é que muito dos conhecimentos organizacionaisl estão disponíveis nos mais variados meios e já formados. permitindo análises interativas (GONÇALVES. com algum grau de certeza. Figura 1 . que trazem muito valor para a tomada de decisão. é basicamente o processo de extração de padrões relevantes e não triviais a partir de bases de dados semi ou não estruturadas. Grande parte está disponível como documento textual não estruturado. (CECI et al. os padrões encontrados devem ser válidos perante os novos dados. manuais. o processo de extração de conhecimento em texto é não trivial de informações implícitas nos documentos organizacionais. 117 O processo KDT Flávio Ceci O processo de descoberta de conhecimento traz uma série de benefícios para a camada de decisão. Esse processo de conhecimento em banco de dados (KDD) é o mais conhecido e utilizado pelas organizações. Descobrindo o conhecimento . Também utiliza técnicas da mineração de dados.

a seção a seguir apresenta as etapas do processo de Descoberta de Conhecimento em Texto. matrizes. Dado o modelo estabelecido. o processo KDT se assemelha e muito ao processo KDD. em que há uma redução da dimensionalidade do modelo criado no passo anterior. a etapa de transformação do texto é iniciada. as técnicas de KDT podem ser usadas no passo seguinte. o primeiro passo é eleger o conjunto de textos que será utilizado. Para explicar melhor o processo KDT Ceci et al (2010) p. 3676.118 Após verificar se as etapas do processo KDD na Figura 1. Portanto. Etapas do processo de Descoberta de Conhecimento em Texto Como já foi afirmado anteriormente. com aprendizado supervisionado e não supervisionado. ocorre a normalização do texto e sua transformação e representação no formato de vetor. existem muitos métodos de descoberta de padrões em textos. apresenta o seguinte parágrafo: Dados os objetivos que se deseja alcançar com o processo. Por fim. com a escolha do algoritmo. visto que cada palavra pode ser uma dimensão do vetor ou matriz. termos não relevantes (stop‑words). A partir desse conjunto de documentos. o último passo do processo KDT constitui a interpretação dos resultados obtidos e a obtenção do conhecimento. Conforme o objetivo do problema. analogamente aos métodos de descoberta em banco de dados. Nessa etapa. tabela. etc. Após o pré‑processamento. As próximas etapas são a seleção e a projeção dos dados. correções ortográficas e outros aspectos morfológicos e também sintáticos que as expressões textuais possuem. reduzir a dimensionalidade é importante para que o resultado seja encontrado com maior eficiência e desempenho. de modo que se pode ter uma visão comparativa entre os dois processos.Etapas do processo KDT Interpretação/Avaliação Mineração de Textos Conhecimento Pré-processamento Extração de Informação Padrões Dado Data set Pré-processado Texto Fonte: Gonçalves (2006). O propósito do pré‑processamento é eliminação de ruídos. Os textos têm a característica de possuírem alta dimensionalidade. Pós-graduação . inicia‑se o processo de pré‑processamento dos dados. e a escolha das palavras relevantes. A Figura 2 apresenta as etapas desse processo. redução das palavras aos seus radicais (stemming). Figura 2 .

a escolha de uma ou outra técnica apresentada na tabela 1 depende essencialmente do negócio. Estatística. algoritmos e exemplos de aplicações disponíveis na mineração de dados tradicional. processos. algoritmos genéticos. temporais controle de inventário. avaliação de riscos. redes neurais. redes neurais. Podem ser utilizadas também técnicas da mineração de dados tradicional. Análise de mercado Padrões sequenciais Estatística. fazendo as devidas modificações. teoria dos conjuntos.Funções e algoritmos da mineração de dados Funções Algoritmos Aplicações Associação Estatística. Turban (2009) apresenta algumas: •• Encontrar o conteúdo implícito dos documentos. Classificação neurais. 119 A etapa de mineração de texto apresentada na Figura 2 utiliza‑se de técnicas de agrupamento. redes Controle de qualidade. teoria dos conjuntos. adicionando relações adicionais. •• Relacionar documentos que possuam conteúdos similares. Gonçalves (2006) apresenta uma tabela demonstrando as principais funções. Árvores de decisão. Segmentação de mercado. sumarização de documentos. da aplicação e da quantidade e qualidade dos dados em questão. Fonte: Gonçalves (2006). Previsão de séries Previsão de vendas. Tabela 1 . modelo de preços. Uso de mineração de texto A mineração de texto pode ser utilizada para auxiliar a organização em várias situações. Agrupamento Redes neurais. Análise de mercado. controle de Modelagem linear. Segundo Gonçalves (2006). pode‑se fazer uma analogia da conversão dos dados presentes Descobrindo o conhecimento . •• Recuperar documentos completos a partir de buscas. estatística. •• Descobrir entidades que possam fazer sentido no modelo relacional. sobre o tempo. Para viabilizar as situações apresentadas acima é necessário que os documentos não estruturados sejam antes de qualquer coisa convertidos para uma estrutura que seja fácil de processar. regras de associação e análise de ligações. Regressão linear e não Ranking de clientes. classificação.

a saber: •• indexação de texto completo. o índice possui uma estrutura composta dos seguintes termos: •• DocCnt: identifica em quantos documentos o termo está contido.120 nas bases operacionais de uma organização para os repositórios do tipo data warehouse. Por conta disso. o que proporciona a construção de uma estrutura chamada índice. à qual esse trabalho está intrinsecamente ligado. similarmente ao que acontece com o processo “homônimo” utilizado convencionalmente em bancos de dados. Segundo Igarashi (2005). a indexação é uma das tarefas mais importantes para a recuperação de informação (CECI. •• Posição termo: identifica a posição do termo no documento. Os autores classificam a indexação em quatro tipos distintos. Segundo Ebecken. •• indexação semântica latente. relacionado com a área de computação. Pós-graduação . 2010). O objetivo do índice é selecionar os documentos de maior relevância. •• indexação temática. Os dados contidos nos documentos da organização são transformados para os chamados índices textuais. A indexação para Wives (2002) consiste na identificação de características para um dado documento. filtrando‑os entre os irrelevantes. a indexação tem como função permitir que se efetue uma busca em texto sem a necessidade de varrer o documento inteiro. •• Freq: número de vezes em que o termo se encontra no documento. com o intuído de facilitar a análise na mineração de dados tradicional. pois organiza os dados presentes no texto de uma forma que seja facilmente recuperado. Essa estruturação descrita aqui pode ser realizada de forma manual – normalmente utilizada pela área de biblioteconomia – ou por um processo automatizado. •• FreqCnt: identifica a frequência total do termo em relação a todos os documentos. Lopes e Costa (2003). Indexação O processo de indexação é fundamental para a mineração de texto. •• indexação por tags. que são apresentados com mais detalhes na próxima seção.

Após o processamento. Esse documento é associado a uma lista invertida de palavras‑chave. ou seja. 121 Uma das técnicas mais utilizadas é a baseada em índice invertido. na verdade. a lista fica dividida em dois arquivos. A Figura 3 apresenta um exemplo de um índice invertido: Figura 3 . Na próxima seção são mencionados alguns tratamentos que podem ser utilizados na etapa de “extração de informação” e “pré‑processamento”. Pré‑processamento Esta etapa não possui um único algoritmo ou técnica disponível. 2005). de modo a explicitar as informações latentes do corpus de documentos. utiliza‑se: Descobrindo o conhecimento . um de vocabulário e outro de endereçamento. Quando a semântica não é importante. O processo de indexação faz parte da etapa marcada como “Extração de informação”. existem algumas operações que podem ser feitas dependendo diretamente do contexto e da análise pretendida. não será feita nenhuma análise baseada em processamento de linguagem natural. apresentada na Figura 2. Essas palavras‑chave possuem um peso. que passa a ser ordenada por ordem alfabética. onde cada palavra está ligada ao documento que a possui. de acordo com Baeza‑Yates e Ribeiro‑Neto (1999 apud AIRES. uma aplicação focada em busca completa a documentos textuais (recuperação de informação). Após a indexação dos documentos são aplicados algoritmos de inteligência artificial para extrair os padrões e possibilitar as análises.Exemplo de índice invertido Dicionário Apontadores Term Doc # Freq Term N docs Tot freq Doc # Freq a 2 1 a 1 1 1 1 aid 1 1 aid 1 1 1 1 all 1 1 all 1 1 and 1 1 2 1 the 2 1 come 1 1 1 1 their 2 1 Fonte. Elaboração do autor. A Técnica de Arquivo (ou Índice) Invertido trabalha com uma lista de palavras‑chave ordenadas. como por exemplo.

•• Calculo de correlação: identificação de relação direta ou indireta de dois elementos. na base do foco da aplicação. Essas técnicas também podem ser utilizadas na etapa de extração de informação antes da indexação dos documentos. A primeira delas é o fato de influenciarem no grau de frequência das palavras do documento. como por exemplo: •• Calculo de coocorrência: esse tipo de cálculo pode levantar informações sobre quantas vezes duas palavras aparecem próximas em uma frase. esse tipo de solução é diretamente dependente do contexto do problema que se deseja resolver. que é de fato descoberto novos conceitos e relacionamentos. pois elas ocorrem várias vezes. •• Retirada de stopwords: as palavras consideradas como stopwords contidas em um documento trazem consigo duas influências para os SRI. Eles não se apegam ao contexto da palavra. já a segunda. Mineração de texto Como já foi afirmado anteriormente. Na etapa de pré‑processamento também utilizam‑se métodos estatísticos para levantar mais informações para auxiliar a mineração e análise das informações contidas nos documentos. Pode‑se reparar que não existe uma única forma para trabalhar com mineração de dados e texto. a partir da análise dos textos. Nessa etapa.122 •• Stemmer: os algoritmos de stemming tratam isoladamente todas as palavras do texto. sempre tentando trabalhar com a sua possível palavra‑raiz. •• Agrupamento: montar grupos de documentos agrupados pelo seu conteúdo. a busca. é o processamento desnecessário proveniente dessas palavras que não auxiliam na busca do usuário (KORFHAGE. 2005). ou seja. pois os ganhos obtidos em precisão não justificam a grande quantidade de erros decorridos de uma análise de sentido equivocado (AIRES. 1997). ou do tipo de informação que pretende extrair. as técnicas de mineração de texto são baseadas em métodos estatísticos e algoritmos da área de inteligência artificial. Na próxima seção são apresentados alguns exemplos de técnicas de mineração para descoberta de conhecimento. Pós-graduação . Todas as técnicas apresentadas nessa seção têm como foco levantar informações e preparar os dados para facilitar a descoberta de conhecimento a partir dos documentos da organização.

por exemplo. pode‑se utilizar uma técnica chamada de Reconhecimento de Entidades Nomeadas (NER – Named Entity Recognition). para isso pode‑se obter tais termos a partir da frequência que eles ocorrem nos documentos relevantes para o contexto organizacional. o processo de indexação minimiza esse problema. como identificar uma palavra composta. no meio de um texto que nada mais é que um conjunto de palavras? Para resolver esse problema. Como já foi apresentado. Problema 2: identificação do limite (fronteiras) das palavras. voltar no índice gerado e identificar as relações dos termos. É importante destacar que as técnicas utilizadas podem compor etapas diferentes em situações diferentes. como por exemplo. 123 Para exemplificar uma situação vamos imaginar que uma organização pretende desenvolver um mapa de conhecimento baseado nos principais termos que a representam. também classificar este termo. Problema 1: quantidade de documentos para serem analisados. a utilização da técnica de reconhecimento de entidades na etapa de pré‑processamento para já levantar esses termos anteriormente e utilizá‑los para anotar os documentos semanticamente. Problema 3: como relacionar os termos encontrados para formar o mapa? Para isso pode‑se utilizar a técnica apresentada anteriormente. com”Unisul Virtual”. ou seja. de modo que seja fácil recuperar tanto os documentos quanto a análise do seu conteúdo. é apresentado o estudo de caso do trabalho de Ceci et al (2010). Essa técnica tem como objetivo encontrar as “fronteiras” de um termo no texto e se disponível uma base de conhecimento. mantendo todo o conteúdo dos documentos estruturados. pode‑se reconhecer o termo “Unisul Virtual” e apresentá‑lo como uma organização. como por exemplo. Alguns problemas que são encontrados inicialmente. o cálculo de co‑ocorrência. Ou seja. que irá pegar os termos reconhecidos pela técnica de NER. Para ilustrar a última etapa do processo KDT “Interpretação/avaliação”. Descobrindo o conhecimento .

em diversos países. Alexandre Leopoldo Gonçalves possui Bachareladol em Ciências da Computação pela Fundação Universidade Regional de Blumenau (1997). com ênfase em Engenharia do Conhecimento. Flávio atua na área de Ciência da Computação. Os autores os utilizaram como dados de entrada para a descoberta de conhecimento em bases textuais. com ênfase em Sistemas de Informação. traz o resumo do currículo lattes de quatro pesquisadores. Flávio é mestrando do curso de Engenharia e Gestão do Conhecimento pela Universidade Federal de Santa Catarina. é colaborador e líder da Unidade de Produto do Instituto Stela. mineração de textos e extração e engenharia do conhecimento. em coautorias de trabalhos científicos. assim como softwares com e sem registro. fazendo o levantamento dos termos em memória e numa estrutura própria do modelo proposto pelos autores. principalmente. Atualmente. mestrado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2000) e doutorado em Engenharia de Produção pela Universidade Federal de Santa Catarina (2006). Em suas atividades profissionais interagiu com 13 colaboradores. Atualmente. participa de 3 projetos de pesquisa. nos seguintes temas: extração e recuperação de informação. Possui 6 softwares e outro item de produção técnica. população de ontologias. mantidos pelo CNPq. não foi necessário construir um índice textual. Pós-graduação . atuando. Atualmente. técnicas de inteligência artificial aplicada à engenharia do conhecimento. Alexandre tem experiência na área de Ciência da Computação. principalmente. é Desenvolvedor do Instituto Stela. nos seguintes temas: reconhecimento de entidades. Entre 2004 e 2007 participou de 4 projetos de pesquisa. Pelo fato do tamanho do texto não ser muito grande. de Ceci et al (2010). descoberta de conhecimento em bases textuais e recuperação de informação. atuando. A Plataforma Lattes é a base de dados de currículos.124 Interpretação / avaliação do conhecimento O estudo de caso apresentado no artigo “Towards a Semi‑Automatic Approach for Ontology Maintenance”. O texto a seguir foi o utilizado na pesquisa: “Flávio Ceci concluiu a graduação em Ciência da Computação pela Universidade do Sul de Santa Catarina em 2007. Desde 2001 participa tanto na atuação quanto na coordenação de projetos de pesquisa no Brasil e no exterior. instituições e grupos de pesquisa das áreas de Ciência e Tecnologia. Possui trabalhos publicados em periódicos especializados e em eventos nacionais e internacionais.

nos seguintes temas: Business Intelligence. principalmente. No momento. atuando. Os autores submeteram o texto apresentado a uma técnica de reconhecimento de entidades nomeadas que utilizava como base de conhecimento alguns termos retirados das palavras‑chaves dos currículos. Atualmente. com ênfase em Sistemas de Informação. Denilson co‑orientou 5 dissertações de mestrado. Em suas atividades profissionais interagiu com 55 colaboradores. além de ter orientado 2 trabalhos de conclusão de curso nas áreas de Ciência da Computação e Administração. Por fim. Analista de Sistemas do Instituto Stela e Professor da Universidade do Estado de Santa Catarina. Participou de 3 eventos no exterior e 6 no Brasil. A partir dos termos reconhecidos. sendo 1 com registro e outros 11 itens de produção técnica. Dhiogo tem experiência na área de Ciência da Computação. Entre 1997 e 2005 participou de 11 projetos de pesquisa. Possui 16 softwares . é mestrando de Engenharia do Conhecimento da Universidade Federal de Santa Catarina. participa de 5 projetos de pesquisa. com ênfase em Sistemas de Informação. bem como uma lista de áreas de conhecimento e instituições. em 2007. Publicou 1 artigo em periódico especializado e 16 trabalhos em anais de eventos. Data Warehousing e Text Mining”. Atualmente. em coautorias de trabalhos científicos. Atualmente Dhiogo é colaborador do Instituto Stela. Recebeu 2 prêmios e/ou homenagens. foi aplicado um cálculo de correlação que identificou as ligações e o peso delas entre os termos em questão. sendo que coordena 2 deles. 125 Denilson Sell concluiu o doutorado em Engenharia de Produção pela Universidade Federal de Santa Catarina. A Figura 4 apresenta uma dessas árvores hiperbólicas geradas a partir do estudo de caso: Descobrindo o conhecimento . Dhiogo Cardoso da Silva possui graduação em Bacharelado em Sistemas de Informação pela Universidade Federal de Santa Catarina (2007). o resultado foi apresentado na forma de uma árvore hiperbólica para facilitar a análise das informações descobertas. é Professor da Universidade Federal de Santa Catarina. Atua na área de Ciência da Computação. Web Semântica.

mas não conseguiu classificá‑los. tanto essa abordagem quanto a mineração de dados representa uma importante evolução para os sistemas de apoio à decisão. Agora a descoberta mais significativa que está disponível para a análise do especialista é a relação indireta entre os pesquisadores “alexandre” e “denilson”. em nenhum momento no currículo deles é apresentada uma relação direta entre os dois. como por exemplo: “mineração de texto” e “engenharia do conhecimento”. instituições como: “universidade federal de santa catarina” e “universidade do estado de santa catarina” estão presentes. Pós-graduação . Pode‑se verificar todo o poder do uso da descoberta de conhecimento em texto para as organizações. Também são apresentados alguns termos que a aplicação identificou como importantes. mas também com conhecimento.126 Figura 4 . Os dois pesquisadores também estão relacionados pelas organizações: “Universidade Federal de Santa Catarina” (os dois fizeram a pós‑graduação nesta instituição) e pelo “instituto stela” (instituto de pesquisa que ambos trabalhavam na época da pesquisa). passando a não lidar apenas com dados e informações.Árvore hiperbólica que representa a relação entre as entidades reconhecidas Fonte: Ceci et al (2010). mas por meio da análise da figura é fácil verificar que os dois pesquisadores estão ligados pelas áreas de conhecimento: “ciência da computação” (curso de graduação dos dois) e “engenharia de producão” (que foi o programa de pós‑graduação que ambos fizeram o mestrado e doutorado). Na Figura 4 é facilmente identificada uma série de termos que representam o contexto dos resumes.

. 2010. Efraim et al. F. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. UFSC.). FELDMAN. Myrian C. 2005. Florianópolis (SC). 95 f. Solange O. New York: Wiley Computer Publishing. IGARASHI. Universidade de São Paulo‑USP. Universidade Federal de Santa Catarina. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. LOPES. EBECKEN. R. BOVO. TURBAN. Flavio.. 2011. 1997. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. SILVA. Descobrindo o conhecimento . 1997. São Paulo: Manole. UFSC. Alessandro Botelho. SELL. HIRSH. CECI. Editora Bookman. Dissertação (Mestrado) – Programa de Pós‑Graduação em Engenharia de Produção e Sistemas. 2005. Maria Celia S. Flavio. Florianópolis (SC). Uso de marcadores estilísticos para a busca na Web em português. Robert R. São Carlos (SP). (Coord. 127 Referências AIRES. GONÇALVES. UFSC. Um modelo semiautomático para a construção e manutenção de ontologias a partir de bases de documentos não estruturados. 127 (Doutorado). CECI. Information storage and retrieval. A. Universidade Federal do Rio Grande do Sul. L. Tese (Doutorado) Programa de Pós Graduação em Ciências da Computação e Matemática Computacional – Instituto de Ciências e Matemáticas e de Computação‑ICMC. 2010. 7 CONTECSI ‑ International Conference on Information Systems and Technology Management. Monografia apresentada ao Exame de Qualificação do Programa de Pós‑Graduação em Computação. Mineração de texto. Porto Alegre.. WIVES. Journal of Intelligent Information System. Leandro Krug. Um modelo de descoberta de conhecimento baseado na correlação de elementos textuais e expansão vetorial aplicado à engenharia e gestão do conhecimento. Sistemas inteligentes: fundamentos e aplicações. Programa de Pós‑Graduação em Engenharia de Produção.. Nelson F. H. 196 (Doutorado). Wagner. 2006. In: REZENDE. 2005. Dhiogo C. KORFHAGE. Tecnologia de descoberta de conhecimento em textos aplicados à inteligência competitiva. Florianópolis (SC). Alexandre L. 202 f. Construção automática de vocabulários temáticos e cálculo de aderência curricular: uma aplicação aos fundos setoriais. 2009. São Paulo. 131 (Mestrado). Towards a Semi‑Automatic Approach for Ontology Maintenance. Exploiting Background information in Knowledge discovery from text. USP. GONÇALVES. Porto Alegre. Um modelo de descoberta de conhecimento inerente à evolução temporal dos relacionamentos entre elementos textuais. A. Rachel Virgínia Xavier. Florianópolis (SC). 2002. COSTA. Denilson.

não se esqueça de comentar as respostas dos seus colegas.128 Atividades de Autoaprendizagem 1) Levando em consideração o conteúdo apresentado nesta unidade. não tendo nenhuma relação. (  ) A mineração de dados e texto é viável pela utilização de algoritmos. e. d. sabendo que muito do conhecimento organizacional está disponível em documentos não estruturados. Dessa forma. (  ) Os processos KDT e KDD utilizam como fonte soluções do tipo DW. (  ) As técnicas utilizadas no processo KDD são completamente diferentes das utilizada no processo KDT. foram estudados conceitos de descoberta de conhecimento em bases de dados e em texto. Responda à pergunta a seguir utilizando a ferramenta Fórum. c. assinale as alternativas verdadeiras com V e as falsas com F: a. (  ) Os Data Warehouse são uma alternativa ao processo KDD. (  ) Reconhecimento de entidades nomeadas pode ser utilizada para facilitar o processo KDT. As redes sociais são hoje um dos principais canais de comunicação das organizações com o seu cliente final. é possível utilizar a descoberta de conhecimento em texto a fim de extrair informações para contribuir com a base de conhecimento da organização e auxiliar no processo decisório? Pós-graduação . (  ) A mineração de dados é responsável pela modelagem do conhecimento da organização. f. com base estatística e de inteligência artificial. b. Atividade colaborativa Nesta unidade.

uol.br/gestao/2012/03/19/data-mining-comeca-a-conquistar-espaco-na- estrategia-empresarial/ Descobrindo o conhecimento . são conjuntos de técnicas para se obter conhecimento de uma determinada base de dados. Saiba Mais Déborah Oliveira. normalmente em Linguagem Natural. O processo KDT funciona igual ao processo KDD. os métodos mais utilizados são a Extração de informação e o Processamento de Linguagem Natural. da Computerworld. tanto utilizando como base repositórios DW quanto por meio da análise dos seus documentos. No caso. leitura bastante recomendada: http://cio. O KDD utiliza bases já estruturadas para descobrir informações e o KDT usa textos. são estudados os processos de descoberta de conhecimento. também para descobrir informações. 129 Síntese Nesta unidade. apresenta um artigo com o seguinte título: “Data mining começa a conquistar espaço na estratégia empresarial”.com.

.

As soluções OLAP apresentam uma alternativa para a publicação dos dados e informações vindas dos modelos dimensionais. Introdução As soluções de Business Intelligence são compostas por uma série de componentes tecnológicos que possibilitam um ambiente propício à tomada de decisão. . •• Examinar as funcionalidades exploratórias do processamento OLAP. Unidade 5 Processo OLAP Objetivos de Aprendizagem •• Identificar o processo OLAP. para a camada de apresentação dos dados e das informações utilizam‑se as soluções OLAP. bem como as suas características. tanto dos dados históricos armazenados nos repositórios data warehouse. Essas soluções podem combinar os componentes para cada situação. bem como os dados reais para auxiliar o processo decisório. •• Entender qual a sua participação numa arquitetura de BI. A apresentação dessas informações pode ser de maneira tabular ou gráfica.

as quais possuem como função explicitar os conhecimentos implícitos. Esses sistemas se referem a uma grande quantidade de atividades normalmente executadas por usuários finais no ambiente on‑line. As funções ou algoritmos normalmente encontrados em ferramentas OLAP são funções de modelagem descritiva. Pode‑se verificar que as soluções de visualização de informação e conhecimento podem utilizar as práticas da mineração de dados. Normalmente. são funções de descoberta de padrão e modelagem explicativa (THOMSEN. Inclui como suas atividades a geração e a resposta de consultas. seja nos repositórios ou nos seus documentos.132 O que é processo OLAP? Flávio Ceci Uma arquitetura de Business Intelligence é composta por vários componentes. mas qual a relação entre essas duas abordagens? A distinção entre OLAP e mineração de dados vai além das distinções entre dados de resumo e detalhes. •• Sistemas OLAP: sigla para a expressão processamento analítico on‑line (em inglês. posteriormente. •• alocações. solicitações de relatórios e gráficos ad hoc e a execução deles (TURBAN et al. que podem ser combinados para se obter a melhor solução ao problema em questão da organização. Thomsen (2002) apresenta os algoritmos utilizados pelos sistemas OLAP e pelos baseados em mineração de dados: Funções e algoritmos utilizados pelos sistemas OLAP: •• agregação. o próximo passo é identificar qual a melhor abordagem para consumir os dados e apresentar as informações e conhecimentos descobertos. transformando os dados em informações e conhecimento para. 2002). o seu processamento. •• razões. pode‑se utilizar duas abordagens diferentes para a etapa de consumo e processamento. Veja quais são as abordagens: •• Mineração de dados: técnicas e ferramentas com base estatística ou de inteligência artificial. bem como as dos sistemas OLAP. On line Analytical Processing). Pós-graduação . Após finalizar a concepção dos repositórios de dados. no caso da mineração de dados. 2009).

•• clustering. Gouveia et al (2011) afirmam que é uma solução desenvolvida para a recuperação das informações‑chave. •• ROLAP: utiliza como base um banco de dados com modelo relacional. •• entre outros. Pode‑se caracterizar como possuindo consultas rápidas devido às informações já terem sido consolidadas. com o intuito de proporcionar facilidade e flexibilidade para a análise de dados da organização como um todo. linguagens OLAP (Data Definition Language – DDL. Tipos de arquiteturas OLAP Existem várias abordagens para os processos OLAP. a multidimensionalidade é uma característica que faz parte desse conceito. Turban et al (2009) apresentam a descrição dos principais deles: •• MOLAP: ou OLAP multidimensional é implementado por um banco de dados multidimensional especializado. camadas de produto OLAP (geralmente residem sobre os bancos de dados relacionais e geram SQL como saída) e produtos OLAP completos. isso quer dizer que se pode ver uma análise em diferentes graus de detalhamento. Processo OLAP . Sobre o conceito de OLAP. que foi modelado o repositório de origem dos dados. Data Representation Language – DRL e seus analisadores e compiladores). refere‑se aos dados OLAP acessíveis de um navegador web. Para Vinci e Narciso (2006). •• árvores de decisão. Funções e algoritmos utilizados na mineração de dados: •• regressões. Cria visões multidimensionais dinâmicas. 133 •• produtos. mas pelo fato de não serem pré‑processadas utilizam‑se de consultas complexas e com tempo de resposta bastante significativo. pode‑se falar em conceitos de OLAP (múltiplas dimensões hierárquicas que podem ser utilizadas em várias escalas). os dados são organizados em estruturas de cubos em que os usuários podem girá‑lo de modo a visualizar várias “fases” dos dados. •• WOLAP: também conhecido com Web OLAP. Data Manipulation Language – DML. chegando até no nível atômico. •• redes neurais. Segundo Thomsen (2002). permitindo uma melhor tomada de decisão pela camada gerencial.

134 Segundo Gouveia et al (2011). A Figura 2 apresenta este brinquedo. assim. No seu trabalho. Para entender os conceitos por trás do cubo multidimensional. é caracterizado por unir o alto desempenho da arquitetura MOLAP com a alta escalabilidade da arquitetura ROLAP. as soluções do tipo OLAP surgiram na década de 60 e continuam evoluindo até os dias de hoje. o processamento pesado do lado do servidor. •• DOLAP: (Desktop On line Analysis Processing) é reconhecida pela sua capacidade de diminuir o tráfego na rede. Nesse brinquedo. que mesmo com o surgimento de todas as arquiteturas mencionadas a principal característica que está presente em todas as abordagens é o cubo multidimensional. Os autores Gouveia et al (2011) ainda completam sobre as arquiteturas. isso ocorre pelo fato de todo o processamento de dados do cubo multidimensional ser feito na própria máquina. a pessoa deve mover as fases do cubo e chegar até a situação em que todas as fases fiquem com a mesma cor. pode‑se fazer uma analogia com o brinquedo “cubo mágico ou cubo de Rubik)”. tirando. Figura 1 - Cubo multidimensional Fonte: Gouveia et al (2011). Pós-graduação . capaz de filtrar os dados por diversas formas e modos customizados pelo usuário. são apresentadas duas outras arquiteturas: •• HOLAP: (Hybrid On line Analysis Processing) surgiu na década de 90 e utiliza como base os dois conceitos de ROLAP e MOLAP. A Figura 1 apresenta uma representação para o cubo multidimensional. é bastante utilizada até os dias de hoje.

a diferença é que se teria um processamento a mais para organizar e consolidar as informações antes de apresentar em forma de cubo (ROLAP). poderia se ter uma base relacional normal. mas não precisaria necessariamente ser uma base modelada nesta abordagem.Representação de um modelo dimensional Fonte: Elaboração do autor (2012). 135 Figura 2 . 2010. Figura 3 . que mesmo assim teríamos um cubo multidimensional. Com o modelo dimensional fica bastante fácil relacionar as dimensões com as fases do cubo. Processo OLAP . ao mover uma das dimensões do cubo gera‑se uma nova visão sobre os mesmos dados do repositório. Cada dimensão que o cubo possui pode ser uma tabela de dimensão de um modelo dimensional como o apresentado na Figura 3. no cubo dimensional. Da mesma forma que quem manipula o brinquedo movendo uma das fases tem uma nova visão sobre o mesmo brinquedo. Essa interação entre as dimensões possibilita uma análise muito maior e chega a informações antes não conhecidas.Cubo de Rubik Fonte: Ciência Hoje.

entre outras. Thomsen (2002) pensou numa série de requisitos que são apresentados a seguir. como por exemplo. o tempo não possa exceder 5 segundos. alocar. a necessidade de integração de dados de plataformas diferentes. matrizes ou diagramas. Essas análises devem ser compostas por fórmulas que devem ser utilizadas para: agregar. Gonçalves e Cazarini (2004) apresenta outros requisitos físicos para uma solução OLAP.136 Requisitos de uma solução OLAP Para se ter um solução OLAP. comparar. A seguir são apresentados os requisitos de uma ferramenta OLAP. •• Especificação eficaz de dimensões e cálculos: agregar dos valores e permitir a utilização de ferramentas analíticas sobre esses valores. questões de conectividade. como: •• Acesso rápido à informação: mesmo com o recurso de aumento de nível de detalhes em consultas (drill‑down). A falta de separação entre estrutura e representação é um problema enfrentado pelas planilhas eletrônicas. O trabalho de Castro. •• Não é necessário possuir suporte a multiusuários. Os requisitos aqui apresentados estão diretamente ligados a questões arquiteturais e da solução OLAP como um todo. •• Separação de estrutura e representação: permite que os modos de exibição sejam reorganizados por um usuário final sem a necessidade de modificação dos dados. os usuários possuem requisitos particulares que devem ser atendidos no projeto OLAP. mas esse requisito esta cada vez mais presente entre as organizações que adotam esta tecnologia. sejam elas gráficas. Espera‑se que mesmo com esse recurso. O usuário pode selecionar como a informação é mapeada para o formato de visualização. Segundo Anzanello (2002). a fim de se ter uma solução eficiente: •• Utilização de uma estrutura dimensional para garantir uma alta performance e análise dos dados. são necessárias grandes quantidades de dados e um cálculo desses. além dos requisitos já preestabelecidos. Pós-graduação . explicar e deduzir. •• Flexibilização: possibilitar as visualizações das informações de várias maneiras. analisar.

ou combinadas com técnicas de mineração de dados e texto. como por exemplo. Concluindo De maneira geral. As ferramentas OLAP geram relatórios analíticos em tempo de execução. possibilitando a modificação da posição de uma informação. elas podem ser utilizadas de maneira isolada numa arquitetura de Business Intelligence. ver as informações agrupadas por ano. no trabalho de Anzanello (2002). pode‑se verificar que as soluções OLAP possuem uma grande importância para a tomada de decisão. a partir das interações com o cubo multidimensional resultante. de maneira a tornar mais fácil a análise por parte do usuário e girar o cubo sempre que necessário. ou seja. a seguir são apresentados: •• Consultas ad‑hoc: geradas pelo usuário final. Com drill down pode‑se visualizar as informações de maneira resumida. semana. conforme a sua necessidade de relacionar e cruzar informações de uma forma não prevista anteriormente. 137 Requisitos de uma ferramenta OLAP Muitas são as ferramentas disponíveis no mercado para soluções OLAP. permitindo uma visualização mais detalhada ou mais resumida. Os requisitos apresentados anteriormente são muito importantes para garantir a efetividade das ferramentas OLAP. a partir do cruzamento de informações podem‑se gerar vários relatórios dinâmicos. mês. •• Drill down/up: permite explorar em diferentes níveis de detalhes da informação. mas que facilite a descoberta do que procuram. foram levantados alguns requisitos comuns a essas ferramentas. dia até chegar no nível de operação (caso essa seja a unidade atômica de agrupamento). até a forma mais detalhada. Processo OLAP . trocas de linha por coluna. •• Slice and Dice: permite a alteração da perspectiva de visão.

Integração Access‑Excel para produzir um sistema de apoio à decisão que simula um Data Warehouse e OLAP. Porto Alegre. n. Pós-graduação . THOMSEN. CAZARINI. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. Sergio A. OLAP Solutions: building multidimensional information systems.138 Referências ANZANELLO. Editora Bookman. 2004. Marcelo G.. VINCI. Simpósio de Engenharia de Produção. OLAP Conceitos e Utilização. Revista Eletrônica de Sistemas de Informação e Gestão Tecnológica. TURBAN. Wilson L. et al.. 2009. Erik. Aplicação da ferramenta OLAP em diferentes módulos de um sistema ERP melhorando a tomada de decisão. XIII SIMPEP. Inc. 2002. Pablo R. Edson W. John Wiley & Sons. Bauru.. 2nd Edition. Henrique C. 2011. Vol. O uso do OLAP na estratégia de vendas em uma indústria de calçados alavancando a gestão de cadeia de suprimentos. CASTRO. GONÇALVES. NARCISO. XXIV Encontro Nacional de Engenharia de Produção. Efraim et al. 01. 01. 2006. GOUVEIA. A. 2002. C. Florianópolis. Universidade Federal do Rio Grande do Sul (UFRGS).

para consumir esse dados. No trabalho de Anzanello (2012). Para Oliveira (2002). que envolve uma análise de muitos itens de dados em relacionamentos complexos. Uma solução de Business Intelligence (BI) é composta por uma série de componentes e etapas que possuem arquiteturas e ferramentas particulares. OLAP é uma abordagem para fornecimento de respostas rápidas para consultas analíticas de fonte multidimensional. é apresentada uma tabela comparativa entre os requisitos funcionais e de desempenho entre aplicações OLAP e OLTP: Tabela 1 - Comparação entre aplicações OLAP e OLTP Características OLTP OLAP Operação Típica Atualização Análise Telas Imutável Definida pelo usuário Nível de Dados Atomizado Altamente Sumarizado Idade dos Dados Presente Histórico. Processo OLAP . o motivo para tal é a falta de ferramentas eficientes e focadas na tomada de decisão. atual e projetado Recuperação Poucos registros Muitos registros Orientação Registro Arrays Modelagem Processo Assunto Fonte: Anzanello (2012). o processo OLAP é focado na transformação de dados em informação. tendências e exceções. basicamente uma solução de BI é composta por um repositório unificado de dados. explica que o OLTP é focado em processamento de transações repetitivas em grande quantidade e de manipulação simples. ou seja. utilizando um conjunto de tecnologias para acesso e análise ad‑hoc de dados. dessa forma. transformando em informação e possibilitando uma melhor análise. O processo OLAP se diferencia do processo de transações on‑line (OLTP). geralmente na forma de um Data Warehouse (DW). Segundo Xavier e Pereira (2009). 139 Características do processamento OLAP Flávio Ceci As soluções de Business Intelligence tem ganhado cada vez mais espaço entre as organizações. diferente do OLAP. buscando padrões. a fim de dar suporte ao processo de tomada de decisão de uma maneira amigável e flexível ao usuário em um tempo hábil. são utilizadas as ferramentas do tipo OLAP (On Line Analytical Processing). segundo Turban (2009). é focado no suporte a decisão.

Essa abordagem é adotada. No caso das aplicações OLAP. a análise multidimensional representa uma das maiores utilidades da tecnologia OLAP. Entende‑se como cubo de dados o resultado proveniente de uma consulta num modelo dimensional por uma ferramenta OLAP. •• Planejamento orçamentário.140 Uma informação bastante importante apresentada nessa tabela. a modelagem é focada nos processos. Percebe‑se que as soluções OLAP são muito utilizadas quando se deseja fazer análise sobre dados organizados de maneira dimensional. Podem‑se utilizar soluções OLAP para vários segmentos de organizações. ou seja. Segundo Vinci e Narciso (2006). e de vários níveis de agregação. No caso de aplicações OLTP. Business Process Management (BPM). transformando‑os em informações. possuindo os dados muitas vezes agrupados e já pré‑processados. •• Projeções. é na modelagem adotada entre os dois tipos de aplicação. cada operação gerenciada pela aplicação gera pelo menos uma nova linha na base de dados referente à operação. pois é mais indicada para a análise dos dados. a modelagem é focada no assunto em questão. •• Gerenciamento de processos de negocio em inglês. permitindo ver determinados cubos de dados de diferentes ângulos e faces. A Figura 1 foi desenvolvida por Silve e Saias (2011) e representa exatamente este cubo: Pós-graduação . segundo Xavier e Pereira (2009). o uso das soluções OLAP geralmente relaciona‑se aos seguintes seguimentos: •• Geração de relatórios empresariais para vendas. •• Marketing. •• Geração de relatórios de gerenciamento.

subir e descer dentro de uma hierarquia. Valor 3) (1ª dimensão) 5 4 Atributo 3 3 (3ª dimensão) 2 3 2 1 1 1 2 3 4 Atributo 2 (2ª dimensão) Fonte: Silva e Saias (2011). Nessa Figura 1 verificam‑se as várias dimensões resultantes de uma mesma consulta e como se organiza a visualização desse cubo de várias maneiras e a granularidade dos dados em questão. O trabalho desenvolvido por Vinci e Narciso (2006) apresenta as principais características dessas soluções: •• Slice and dice: possibilita a análise de informações de diversos ângulos. Muitas das características das soluções OLAP estão diretamente ligadas à utilização dos cubos de dados e uso da multidimensionalidade. ou seja. Valor 5. chegando a outras visões e visualizando informações de outras formas. Processo OLAP . Atributo 1 Atributo 3.Valor 4. eles são utilizados para representar dados em conjunto com alguma medida de interesse. Segundo Turban (2009). É justamente pela análise de cubo que permite os usuários realizarem consultas por meio da busca de uma série de visualizações de relatórios. •• Drill Down‑UP: torna possível a interação do usuário com vários níveis de agrupamento. tridimensional ou com apenas uma dimensão. permitindo responder os questionamentos que deseja. 141 Figura 1 - Representação gráfica de um cubo de dados Indicador 1 = (Atributo 1. os cubos de dados possibilitam obter informação para suporte à decisão de maneira eficiente. •• Consultas ad‑hoc: permite que o usuário gere consultas nunca antes utilizadas em tempo de execução da aplicação. além da utilização de métodos que auxiliem a encontrar o que procuram. com visões de informações ainda não exploradas. Atributo 2. podendo ser bidimensional. permitindo que o usuário faça muitas combinações.

agrupadas pela sua natureza. sem precisar passar por semestre. por exemplo. a de geração de consultas mais amigáveis. Pós-graduação . •• Filtering: apresentação de consultas com restrições sobre atributos ou fatos. caso se deseja saber as informações detalhadas da venda em questão. pulando um nível intermediário. O autor comenta que nem todas as implementações apresentadas na lista anterior são comuns a todas as soluções OLAP. não precisa ser necessariamente numérica. o autor Sell (2006) baseou‑se nos trabalhos de Codd (1995).142 No livro escrito por Oliveira (2002). que. •• Break: permite separar o resultado de uma análise por grupos de informação. segundo o Sell (2006) e Thomsen (2002). de modo que o resultado da sua pesquisa apresenta 12 características. originalmente levantadas por Codd (1995). Sell (2006) apresenta mais algumas: •• Drill Across: permite alterar o nível de análise dentro da dimensão em questão. de modo que seja feita de maneira simples. que. possibilitando assim a subtotalização de valores para cada grupo. amigável e transparente. torna mais fácil o entendimento das mesmas. é apresentada mais uma característica. •• Drill Through: permite que o usuário passe de uma informação contida em uma dimensão para outra. a análise é alterada diretamente de ano para mês. pode‑se acessar uma base operacional que abriga tal informação. Donald (1997) e Thomsen (2002). caso necessário. nesse caso. •• Alerts: permite que seja enviado um sinal caso uma situação definida anteriormente aconteça. é verificar a quantidade de vendas em uma semana. Sobre as características principais do processamento OLAP. •• Drill Out: é um detalhamento de uma determinada informação contida em uma base externa. por exemplo. •• Ranking: possibilita o agrupamento de resultados numéricos por ordem de tamanho. Todas as características apresentadas no trabalho de Vinci e Narciso (2006) são apresentadas no trabalho de Sell (2006) como funcionalidades exploratórias. Além das funcionalidades já mencionadas. •• Paging: paginação do resultado das consultas. •• Sort: permite a ordenação das informações. fazendo com que o usuário final tenha um conhecimento mínimo em informática para chegar até as informações desejadas.

Acessibilidade Disponibiliza uma visão lógica única dos dados da empresa Permite que a ferramenta OLAP rode em um cliente. Arquitetura Cliente/Servidor acesse dados e faça operações em um servidor. 143 Primeiramente. são apresentadas as características marcadas como básicas. segundo Sell (2006). A estrutura criada no servido deverá possibilitar a criação Dimensões e níveis de de tantas dimensões e cubos quanto necessário para se agregação limitados analisar o negócio. baseando‑se no trabalho de Thonsen (2002) são: Tabela 2 - Características básicas do OLAP Característica Descrição Possibilitar a ação direta sobre as células e os recursos Manipulação de dados intuitiva dos gráficos. que. O terceiro e último grupo de características apresentadas por Sell (2006) é chamado de características dimensionais e são apresentadas na tabela a seguir: Tabela 4 - Características dimensionais Característica Descrição Visão conceitual A visão conceitual do usuário analista deve possibilitar multidimensional a análise do negócio sobre diferentes perspectivas. Permite inserir as funcionalidades OLAP dentro do Transparência contexto de uma aplicação do domínio do usuário final. colunas e páginas. Suporte para multiusuários Possibilitar operações simultâneas de leitura e escrita. Permitir cálculos e manipulação de dados por meio Operações irrestritas de de qualquer quantidade de dimensões e relacionamento dimensão cruzada de dados. Cada dimensão deve ser equivalente tanto em sua estrutura Dimensionalidade genérica quando nas capacidades exploratórias aplicáveis. são as seguintes: Tabela 3 - Características de relato Característica Descrição Apresentar dimensões de um cubo por meio de Relato flexível diferentes combinações de linhas. que se baseou no trabalho de Thomsen (2002). Fonte: Sell (2006). Preservar o desempenho da apresentação à medida Desempenho coerente do relato que o volume de dados e dimensões aumente. Fonte: Sell (2006) Processo OLAP . Fonte: Sell (2006). Tratamento dinâmico A organização física dos dados deve ser sensível à mudança de matriz esparsa das características dos dados ao longo do tempo. Segundo Sell (2006). O segundo grupo de características é chamado de características de relato.

Pós-graduação . Programa de Pós‑Graduação em Engenharia de Produção. 1997. F. SQL dos Conceitos às Consultas Complexas. Integração Access‑Excel para produzir um sistema de apoio à decisão que simula um Data Warehouse e OLAP. Inc. Efraim et al. T. PEREIRA. John Wiley & Sons. TURBAN. João. 2nd Edition. 2006.. As características apresentadas na Tabela 4 são centradas nas operações diretamente ligadas ao DW ou modelo dimensional. SALLEY. DONALD. SILVA. Fabrício S. B.ly/I0WoEb>. Porto Alegre. Porto Alegre. CODD. 2006. Referências ANZANELLO. Wilson L. VINCI. 2011. High performance Oracle Data Warehousing. Marcelo G. S.. 2002. Denilson. 1995. THOMSEN. OLAP Solutions: building multidimensional information systems. 2002. Erik. SAIAS. OLAP Conceitos e Utilização. Tese (Doutorado) – Universidade Federal de Santa Catarina. Na Tabela 3 são apresentadas características relacionadas à operação de geração de relatórios pelas ferramentas OLAP. Portugal. Centro Tecnológico.. Data Warehouse. Leonardo Bruno R. 2009.144 A Tabela 2 apresenta características básicas e compartilhadas por todas as ferramentas OLAP. José. Editora Bookman. NARCISO. Cynthia A. Editora Ciência Moderna. 2009. Instituto de Informática – Universidade Federal do Rio Grande do Sul. XAVIER. C. Acessado em: 10 de abril de 2012. Providing OLAP (on‑line analytical processing) to user‑analysts: An IT mandate. JIUE 2011. 2th Jornada de Informática da Universidade de Évora. USA: The Coriolis Group. Visual Books.. Wilson J. CODD. Bauru. OLIVEIRA. Florianopolis. Business Intelligence – Um enfoque gerencial para a inteligência do negócio. Disponível em: <http://bit. B. OLAP em âmbito hospitalar: transformação de dados de enfermagem para análise multidimensional. Simpósio de Engenharia de Produção. Rio de Janeiro. Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. V. SELL. Florianópolis. 2006. XIII SIMPEP. E.

4). Nesta leitura. Da mesma forma que existem processos para o desenvolvimento de uma solução de BI. 2002. Inmono. são apresentadas as etapas práticas para o projeto e implantação de uma solução OLAP.H. ou ainda para a definição de um cenário utilizando técnicas de descoberta de conhecimento. 145 Desenvolvendo um projeto OLAP Flávio Ceci O uso das soluções OLAP combinadas a estratégias de Business Intelligence (BI) são abordagens bastante requisitadas atualmente. a partir do livro escrito por Thomsen (2002). p. se já foi investido anteriormente no desenvolvimento de um DW e agora gostaria de trabalhar com as informações contidas nele. p. Esta seção não deve ser encarada como uma metodologia. se a fonte de dados está em uma planilha eletrônica. Segundo um dos maiores nomes da área W. legibilidade e fusão de teoria e prática. Inicialmente. deve‑se identificar os pontos do cenário atual onde se deseja desenvolver e implantar a solução OLAP. recomendo este livro. ou ainda como o próprio autor explica essas orientações: “Elas foram escritas para o projetista e o implementador do modelo OLAP“ (THONSEN. 2002. ou se não existe nada desenvolvido ainda. de modo a apoiar o processo decisório da camada gerencial da organização. Sua função é processar os dados para gerar informações e transformá‑las em conhecimento. ou para a modelagem e implantação de um repositório Data Warehouse (DW).302). Processo OLAP . Em termos de inteireza. descreve da seguinte maneira: “O livro de Erik Thomsem se aprofunda onde outros livros não se aprofundaram. Etapas práticas para o projeto e a implementação de modelos OLAP na visão de Thomsen (2002) Um dos livros mais conceituados e utilizados como referência base para as áreas relacionadas com OLAP é o livro de Erik Thomsen.” (THONSEN. guiando para o sucesso desse projeto. com certeza. como por exemplo. mas sim como um guia que explica as etapas práticas associadas ao projeto e implementação da solução OLAP. também existem etapas para o projeto e implementação de modelos OLAP. tanto essas soluções como as baseadas em técnicas de descoberta de conhecimento estão na extremidade do usuário final.

acesso aos dados ou a distribuição de informações baseada em evento. Thomsen (2002. ou seja. pode‑se adotar um sequência de passos de “baixo para cima”. Por exemplo. O autor sugere que para identificar o ponto de partida. As regras poderiam estar codificadas ou nas mentes do pessoal chave. Conhecendo o cenário atual É importante lembrar que antes mesmo de iniciar de fato o projeto do modelo ou qualquer tarefa de implantação. De maneira geral. para isso. •• Definir nível e/ou hierarquias de dimensão.146 Dos cenários apresentados acima. nesse caso. o mais complicado é o para iniciar a concepção de uma solução OLAP a partir do zero. Thomsen (2002) afirma que para a concepção de um projeto OLAP deve‑se cumprir as seguintes etapas: •• Entender o fluxo de dados atual e ideal. mas não tem certeza sobre todas as finalidades para as quais os usuários finais irão utilizá‑los. deve‑se procurar o ponto em que o projetista se sinta mais à vontade e confiante sobre o que é feito ou que precisa ser feito e trabalhar a partir disso. Você também precisa entender as regras comerciais relevantes. •• Definir dimensões. você precisa descobrir a respeito dos esquemas dos usuários e de quaisquer esquemas relevantes aos dados de origem. A interação do projetista com a equipe de usuários finais da aplicação OLAP é fundamental para o sucesso do projeto. p. membros e vínculos.304) faz a seguinte afirmação: Não importa as ferramentas específicas que estão sendo usada. •• Definir agregação e outras formas. ou seja. como as regras sobre limites de desempenho. Pós-graduação . dos dados para a função. é necessário entender o problema e a situação atual. sem nenhum dos outros componentes de uma arquitetura ou solução de BI já criado. •• Definir cubos. pode‑se elaborar algumas perguntas para auxiliar no entendimento da situação atual. caso ele tenha domínio sobre os dados em questão.

147 Thomsen (2002) elaborou um questionário para se chegar até o levantamento da situação real: 1) Com que frequência quais tipos de usuários usam o sistema? a. Segundo Thomsen (2002). Processo OLAP . este diagrama representa o que é importante para origens e usuários que utilizarão a solução em questão. Quantas visões distintas são necessárias por tipo de usuário final? 2) Em geral. Em que velocidade os vínculos são atualizados? d. Que aspecto de integração e refinamento forma envolvidos nos dados de origem? 4) Que cálculos ocasionais normalmente são realizados no servidor? 5) Que cálculos são pré‑realizados no servidor? 6) Que cálculos normalmente são realizados no cliente? 7) Que máquinas. Quantos dados existem? c. qual é o seu esquema? b. Quais tipos de ferramentas do usuário final estão sendo usadas para navegar e analisar os dados? g. Quantos usuários existem para cada tipo (classe de usuários do sistema)? b. A Figura 1 apresenta um exemplo desse diagrama. Quantos dados atravessam a rede em resposta às consultas típicas para cada tipo de usuário? e. o projetista deveria estar apto para preencher o chamado diagrama de origem e uso. quais sistemas operacionais e configurações de redes são usados? A partir das respostas dadas às perguntas apresentadas anteriormente. quantos dados dão entrada no sistema? 3) Quantas origens de dados distintas existem? a. Que tipo de diálogo cada tipo de usuário tem com o sistema? c. Quantos dados cada tipo de usuário examina durante uma sessão típica? d. Para cada origem. Quais são as características de informação normalmente navegadas por cada usuário? f.

essas restrições podem ser: •• o tipo de máquina. ou ainda quais perguntas podem ser respondidas. deve‑se levantar a documentação dos requisitos dos usuários finais. Informações sobre restrições também são bastante importantes para o projeto. •• o número de usuários do sistema. •• entre outros. Esses requisitos também podem ser provenientes dos sistemas transacionais da organização.000 linhas 25 relatórios diários 128 colunas 500 relatórios semanais Númerico 100.3 Forest & Trees Unix Approach Dell NT Fonte: Thomsen (2002). •• a dependência de softwares de terceiros.000 navegações semanais 02 = dados de Marketing 25 relatórios diários U2 = Gerente regional Semanal Oracle 7. Da mesma forma que praticamente todas as metodologias de desenvolvimento de software são guiadas por requisitos de usuário. Pós-graduação .000 navegações semanais Diário Dados OLAP 25 relatórios diários 100. Após entender a situação real e atual. •• o sistema operacional em questão. •• o tamanho do conjunto de dados. •• os tipos de dados válidos. nesse caso não é diferente. Esses problemas podem ser de natureza física ou lógica. •• a topologia de rede. Esse tipo de informação pode ajudar e muito no trabalho de identificação das fontes de dados e até mesmo para saber que tipo de informação poderá ser gerada. levantam‑se algumas perguntas sobre possíveis problemas que os usuários estão experimentando.148 Figura 1 - Diagrama de origens e uso Origens Usuários 2 origens 2 usuários (tipos) 01 = Dados de vendas U1 = analista de marketing M204 Excel MVS 1 milhão de linhas 30 relatórios diários Windows 95 IBM 32 colunas 200 relatórios semanais Compaq 586 Númerico 100.

Para o desenvolvimento desse modelo pode‑se utilizar de qualquer metodologia já conhecida para esta etapa. pois. •• Fórmulas. nem é necessário se preocupar com isso. •• Hierarquias múltiplas. deve‑se investir tempo no levantamento de informações sobre as agregações e análises mais complexas. essa definição nada mais é que a concepção do modelo multidimensional. o autor chama a atenção para alguns pontos que são apresentados abaixo: •• Cubos e dimensões. que aparecem em ambientes multidimensionais e podem atrapalhar o processo analítico. No geral. Agregações e análises mais complexas O autor afirma que existem várias formas de se iniciar um projeto OLAP e que na maioria dos casos é deixado para o final questões mais complexas. •• Refinar a quantidade de dimensões. •• Quais vínculos devem existir no modelo? •• Hierarquias da dimensão. •• Membros da dimensão. 149 Projeto da solução O primeiro passo para a definição do projeto da solução é a definição do modelo lógico. dependendo da situação. Tendo em vista esse fato. Os pontos apresentados anteriormente têm como função auxiliar o projetista na validação e conclusão do modelo multidimensional necessário para a ferramenta OLAP. o autor apresenta questões de descrições derivadas. é necessário levar em consideração pelo menos as questões relacionadas às agregações básicas. •• O contexto da decisão. Processo OLAP . •• Verificar as dimensões que mudam com o tempo. Tento em vista a utilização de uma metodologia para auxiliar a criação do modelo multidimensional. Após finalizar o projeto de solução.

2002. mas caso não esteja preparad. por esse motivo. É percebido que não existe uma metodologia formada para o desenvolvimento de uma solução OLAP. deve‑se dar um foco especial nesse modelo. Inc. Erik. Referências THOMSEN. John Wiley & Sons. pode gerar análises com erros para o usuário.150 Dados de entrada intermediária: esse caso gira em torno de análises que têm dependência com dados de entrada vindos de outras fontes (dados operacionais). A solução OLAP tem dependência direta do modelo dimensional. OLAP Solutions: building multidimensional information systems. 2nd Edition. mas sim uma sequência de passos para auxiliar o desenvolvimento do seu projeto e implantação. Pós-graduação .

Essas ferramentas geralmente possuem um ambiente em que se pode configurar o tipo de consulta desejada. esse e os demais exemplos serão tirados desse portal.gov. Figura 1 - Painel para elaboração das consultas OLAP Fonte: Anvisa. 2012. 151 Exemplo de uma solução OLAP Flávio Ceci As ferramentas OLAP têm como função apresentar um caminho mais amigável para que o seu usuário final navegue pelas informações mantidas nos seus repositórios de dados e informações.br). de modo que graficamente o usuário pode combinar uma série de dimensões na forma de linhas e colunas.anvisa. a Figura a seguir foi retirada de um dos ambientes do Diretório de Conhecimento da Vigilância Sanitária (http://dcvisa. Para facilitar a visualização. além de aplicar filtros e paginadores. Processo OLAP .

Esse mesmo resultado apresentado pela ferramenta pode ser facilmente convertido em um gráfico. 2012. conhecer o domínio em questão. pode‑se utilizar recursos do tipo drag‑and‑drop para arrastar as dimensões que se deseja alocar como linha ou como coluna. principalmente. já que é bastante intuitivo e permite que o seu usuário final não precise ser um especialista em computação. A Figura 2 apresenta esse recurso com mais detalhes: Figura 2 ‑ Recurso drag and drop da ferramenta OLAP Fonte: Anvisa. possibilitando visualizar mais dados. bastando apenas ter um conhecimento médio em informática e. como apresentado na Figura 4: Pós-graduação . Pode‑se facilmente cruzar as dimensões funcionário com estado e chegar à seguinte situação: Figura 3 - Tabela de funcionários por estado Fonte: Anvisa. 2012. Esse tipo de ambiente traz uma série de benefícios.152 No caso do ambiente apresentado na Figura 1.

153 Figura 4 - Selecionando a opção de visualização a partir de gráfico Fonte: Anvisa. 2012. 2012. Processo OLAP . Figura 5 - Representação gráfica para os dados apresentados na planilha resultante Fonte: Anvisa. A Figura 5 apresenta a configuração demonstrada na Figura 4. possibilitando a visualização do mesmo resultado de maneira gráfica.

2012. cada gráfico segue o conceito de widget. ver um widget em tela cheia. Esse recurso também pode estar presente na visualização de forma tabelar. possibilitando que o usuário chegue até a informação grão. Pós-graduação . pode‑se ver o detalhe até chegar no grão. pode estar na forma de um dado na base operacional. O dashbord ilustrado na Figura 6 apresenta a visão de um usuário do sistema em que foram construídas três projeções. O resultado foi publicado na forma gráfica. de modo que ao clicar no valor totalizado de uma célula. como ocorre com o caso da representação gráfica. A Figura 6 apresenta um exemplo de um dashbord criado a partir de três consultas: Figura 6 - Dashbord do usuário Fonte: Anvisa. Outro recurso bastante interessante de uma ferramenta OLAP é a criação de dashbords. em que é possível verificar as informações na forma tabular. muitas vezes.sendo atualizadas em tempo real. a qual. em que o usuário pode manter alguns gráficos resultantes de consultas (cruzamento entre dimensões).154 A representação gráfica permite eventos de clique.

tanto para descobrir informações implícitas quanto para montar simulações para a previsão de situações futuras. As soluções OLAP são hoje uma das soluções gráficas mais utilizadas e efetivas para apresentar os dados e informações contidos nos modelos dimensionais. Acesso em: 16 jul. 155 O conceito de dashbord permite que o usuário tenha um painel no qual se pode acompanhar a evolução dos dados para apoiar a decisão gerencial da organização.gov. Vale lembrar que as soluções OLAP apresentam os dados históricos e para acompanhamento em tempo real da situação da organização. John Wiley & Sons.br. 2012. 2nd Edition. onde é projetada a quantidade de produção distribuída por ano e. Processo OLAP . Erik. A combinação dessas soluções com as técnicas de descoberta de conhecimento possibilitam a construção de previsões a partir dos dados passados. também são apresentadas duas linhas em que demostra a situação ideal e a de risco. THOMSEN. 2002. Por exemplo. Inc. pode‑se demonstrar o gráfico “Produção por ano”. Disponível em: http://dcvisa.anvisa. Diretório de Conhecimento da vigilância Sanitária. Referências ANVISA. OLAP Solutions: building multidimensional information systems.

(  ) Pode‑se fazer uma analogia das soluções OLAP com o brinquedo cubo mágico. você acha que existem outras formas de navegação? Se sim. HOLAP. assinale as alternativas verdadeiras com V e as falsas com F: a. (  ) OLAP e OLTP são siglas para o mesmo tipo de processo. (  ) Para o desenvolvimento de soluções OLAP. (  ) ROLAP é um tipo de arquitetura OLAP que utiliza como base um banco de dados com modelo relacional. (  ) MOLAP. Responda à pergunta a seguir utilizando a ferramenta Fórum. DOLAP são tipos de arquiteturas OLAP. existem várias metodologias que se podem seguir para obter sucesso no mesmo. d. não se esqueça de comentar as respostas dos seus colegas.156 Atividades de Autoaprendizagem 1) Levando em consideração o conteúdo apresentado nesta unidade. f. Pós-graduação . e. Atividade colaborativa Nesta unidade. b. As ferramentas OLAP apresentam uma forma amigável de navegar entre as dimensões modeladas na base de dados. fale sobre elas e apresente quais as suas vantagens e desvantagens. essa forma é geralmente tabelar (por meio de tabelas). c. você estudou sobre as soluções OLAP. (  ) A mineração de dados é uma técnica utilizada para compor a base de dados consumida pelas ferramentas OLAP.

os seus conceitos. vale a pena ler este material: http://www. quais as suas dependências tecnológicas e exemplos. de modo a apoiar a tomada de decisão.edu. essas soluções têm como função auxiliar no consumo e explicitação dos dados e informações.pdf Processo OLAP . a fim de acompanhar os dados de entrada para apoiar o processo decisório de maneira mais ágil. escreveu um ótimo artigo falando sobre OLAP e suas utilizações. também é possível acompanhar os dados em tempo real.br/professores/limanzke/Administra%E7%E3o%20de%20 Sistemas%20de%20Informa%E7%E3o/OLAP. como são montadas. 157 Síntese Nesta unidade. As soluções OLAP são baseadas na disposição das informações disponíveis nos modelos dimensionais.fag. Saiba Mais A professora Cynthia Aurora Anzanello. da Universidade Federal do Rio Grande do Sul. são estudadas as soluções OLAP.

.

foi abordada uma revisão sobre o conceito de dado. repositórios de dados e informação para apoiar os processos analíticos. utilizam‑se. Para concluir os estudos Chegamos ao final deste livro sobre Business Inteligence. Dentro dessa abordagem. proveniente dos sistemas de informação transacionais da organização. Quando se deseja visualizar os dados e informações históricos. Para isso. Os conceitos relacionados a Business Inteligence (BI) nasceram muito antes da era da computação. utiliza‑se a modelagem dimensional para esse tipo de proposta. podem fazer um acompanhamento em tempo real das operações da organização. informação e conhecimento. mas que iríamos nos concentrar no tipo de sistemas de informação chamado de sistemas de apoio à decisão. utilizam‑se ferramentas ETL. pode‑se utilizar de técnicas de mineração de dados. A partir dessa coleta. além de navegação pelos dados históricos. utilizam‑se as soluções OLAP. Inicialmente. onde passamos pelas principais áreas que estão relacionadas com essa proposta. as quais têm como função a coleta de dados das bases operacionais. normalmente. as quais podem auxiliar no reconhecimento de padrões e gerar indicativos para acontecimentos futuros. Nesse tópico verificou‑se que não existe uma classificação única. Costumeiramente. Quando se deseja descobrir conhecimento implícito nos repositórios. de modo a chegar em novas informações. chegando aos sistemas de informação. é feita a transformação e limpeza dos dados e posteriormente a carga no repositório do tipo DW. Para consumir e apresentar esses dados e informações contidos nos repositórios pode‑se utilizar algumas abordagens. que. Os Data Warehouse (DW) são responsáveis pelo armazenamento centralizado dos dados e informações. garantindo uma qualidade muito maior na sua fonte de informação. . de maneira dimensional e pré‑processada. podendo cruzar várias dimensões. mas nesse contexto as ferramentas de BI são representadas como evolução dos sistemas de apoio á decisão.

160 Pode‑se verificar que cada vez mais os dados não estruturados estão fazendo parte das soluções de BI. O cruzamento e carga dessas informações é cada vez mais comum nos repositórios e bases de conhecimento. Pós-graduação . além dos dados não estruturados provenientes dos documentos da organização. podendo auxiliar e muito no processo de tomada de decisão. que representam um canal direto do cliente com as organizações. o motivo para tal é que muito do conhecimento organizacional está implícito nas bases de documentos. Também. cada vez mais estão utilizando como base os dados publicados em mídias sociais.

é Mestre em Engenharia do Conhecimento pela Universidade Federal de Santa Catarina (UFSC‑2010) e. é doutorando em Engenharia do Conhecimento. . Processamento de linguagem natural e Análise de sentimentos. Minicurrículo Flávio Ceci É graduado em Ciência da Computação pela Universidade do Sul de Santa Catarina (Unisul‑2007). desde 2007. atualmente. também pela Universidade Federal de Santa Catarina. Extração de conhecimento. no Instituto Stela. Business Intelligence. Suas áreas de pesquisa incluem: Recuperação de informação. Trabalha com desenvolvimento de softwares desde 2005 e na concepção de sistemas de apoio à decisão.

.

Comentário: A nova engenharia do conhecimento é baseada no paradigma de modelagem. Respostas e comentários das atividades de autoaprendizagem e colaborativas Unidade 1 Atividades de Autoaprendizagem 1) Gabarito: F – V – F – F – V – V – F – F a. Exemplo: sistema digestivo. . Comentário: Um sistema é qualquer ambiente que seja composto de três processos básicos: Entrada. g. Comentário: os Data Warehouse são equivalentes ao subsistema de dados e não de modelo da arquitetura clássica de um SAD. ( F ) As ontologias são estruturas formais para a representação de dados. c. Comentário: Essa afirmação não está correta. ao longo do tempo. ( F ) O subsistema de modelo da arquitetura clássica de SAD é equivalente ao Data Warehouse da arquitetura de BI. ( F ) O “paradigma de transporte” demonstrou. desde que ela faça uso de computadores. devido à falta de sucesso do paradigma de transporte na concepção dos sistemas de apoio à decisão. sua eficiência e é utilizado até hoje na Nova Engenharia do Conhecimento. processamento e saída. Comentário: As ontologias são estruturas formais para a representação de conhecimento. até hoje os pesquisadores dessa área ainda não chegaram em um consenso sobre a classificação dos sistemas de informação. h. ( F ) Os Sistemas de Informação possuem uma classificação muito bem definida. d. ( F ) Uma organização pode ser vista como um sistema.

( F ) A chamada área de apresentação é onde as informações são organizadas e centralizadas. e.164 Atividade colaborativa O uso de dados disponíveis na Web (como por exemplo. as mídias sociais representam um canal direto entre as organizações e seus clientes. ( F ) DW nada mais é do que um banco de dados que utiliza como modelagem de dados a abordagem relacional. serviço e atendimento. processamento. ( F ) As práticas de BI só foram possíveis com o advento dos computadores. c. Unidade 2 Atividades de Autoaprendizagem: 1) Gabarito: F – F – F – V – F ‑ V a. Cada vez mais as organizações estão utilizando essas informações para montar campanhas de marketing. e até cruzar essas informações com as internas. que até mesmo em tempos remotos já existiam técnicas de BI inseridas nas suas atividades produtivas. que é mais indicada para análise de dados. transformação e carga desses dados no DW. a sociedade egípcia. Comentário: O processo de ETL é responsável pela coleta dos dados das bases operacionais. Comentário: Um DW utiliza como modelagem para os seus dados a modelagem dimensional. ( F ) ETL é o processo de mineração de dados previsto pela arquitetura de BI. Comentário: Essas características são dos repositórios DW. em mídias sociais) pode auxiliar os sistemas de apoio à decisão na entrega de uma informação mais estratégica para a organização? Comentário: Atualmente. nelas podem‑se encontrar informações sobre um produto. b. Comentário: É apresentado durante a unidade 2 que as técnicas de BI não possuem dependência com sistemas computacionais. como por exemplo. Pós-graduação . para auxiliar na tomada de decisão.

No caso do chamado BI2.0 e BI3. BI 2. ( F ) As medidas de um DW é uma nomenclatura equivalente a tabelas fato. Os artifícios semânticos podem estar presentes tanto no processamento das informações.0.0 e BI 3. mas também conteúdo disponível na internet. 165 Atividade colaborativa O uso de recursos semânticos permite uma séria de possibilidades para as análises de informações disponíveis pelo BI. foram estudados os repositórios data warehouse. quais possibilidades são essas? Como elas podem auxiliar na análise das informações? Comentário: O uso de recursos semânticos está cada vez mais presente na web (web semântica) e dentro das organizações. Unidade 3 Atividades de Autoaprendizagem: 1) Gabarito: V – F – V – V – V ‑ F b. ( F ) O processo de integração dos dados é algo bastante simples e rápido de conceber. também foi visto que Inmon. sabendo qual a melhor maneira de apresentá‑la. que são colunas de uma tabela fato.0 é também é previsto que seja utilizado conteúdo não estruturado. já trabalha com o conceito do DW2. Comentário: O chamado DW 2. Comentário: As medidas representam os valores totalizados.0. Dessa forma. Business Intelligence .0 é baseado na utilização de fontes não estruturadas. Comentário: Sabe‑se que o processo de integração de dados é um dos mais custosos e demorados. junto à modelagem dimensional. bem como na apresentação das informações. utilizando‑se de recursos de processamento de linguagem natural e web semântica. podendo classificá‑las levando em consideração o contexto do dado em questão. o não só conteúdo interno para apoiar a tomada de decisão. f. Atividade colaborativa Nesta unidade. faça um paralelo dessa evolução com a evolução do BI. considerado como um dos pais dessa abordagem.

sabendo que muito do conhecimento organizacional está disponível em documentos não estruturados. diferente do processo KDD. ( F ) Os Data Warehouse são uma alternativa ao processo KDD não tendo nenhuma relação. foram estudados conceitos de descoberta de conhecimento em bases de dados e em texto. f. não se esqueça de comentar as respostas de seus colegas. ( F ) Os processos KDT e KDD utilizam como fonte soluções do tipo DW. diferenciando mais da etapa de processamento dos dados e informações de entrada (dado estruturado ou não estruturado). b. d.5ada no processo KDT. que têm como função analisar e apoiar a descoberta de conhecimento. Comentário: Os Data Warehouse são responsáveis por armazenar os dados estruturados que serão consumidos pelo processo KDD. Comentário: A mineração de dados é baseada em técnicas estatísticas e apoiadas por algoritmos da inteligência artificial. que utiliza como base dados estruturados geralmente provenientes de um DW. ( F ) As técnicas utilizadas no processo KDD são completamente diferentes das utiliz11. Atividade colaborativa Nesta unidade. ( F ) A mineração de dados é responsável pela modelagem do conhecimento da organização. Comentário: O processo KDD e KDT compartilha de várias técnicas. Responda à pergunta a seguir utilizando a ferramenta Fórum. Pós-graduação . Comentário: O processo KDT utiliza como base textos e dados não estruturados.166 Unidade 4 Atividades de Autoaprendizagem: 1) Gabarito: F – F – V – F – V ‑ F a.

Comentário: Não são todos os processo diferentes. Unidade 5 Atividades de Autoaprendizagem: 1) Gabarito: F – V – V – F – F ‑ V a. Responda à pergunta a seguir utilizando a ferramenta Fórum. é possível utilizar descoberta de conhecimento em texto para extrair informações para contribuir para a base de conhecimento da organização e auxilia no processo decisório? Comentário: A resposta é sim. 167 As redes sociais são hoje um dos principais canais de comunicação das organizações com o seu cliente final. de forma a atuar diretamente na tomada de decisão. d. os dados em questão são analíticos. Por meio desses canais. Comentário: Existem recomendações para a construção de soluções OLAP. Atividade colaborativa Nesta unidade. as redes sociais são hoje um dos principais canais de comunicação entre pessoas e até mesmo entre organizações e seus clientes. mas ambos atuam no consumo dos dados e informações para apresentar informações e conhecimentos para o usuário da solução. é possível identificar opiniões e até mesmo cruzar essas informações para auxiliar na predição de tendências. ( F ) OLAP e OLTP são siglas para o mesmo tipo de processo. Comentário: A mineração de dados pode ser utilizada combinando com as soluções OLAP. ( F ) A mineração de dados é uma técnica utilizada para compor a base de dados consumida pelas ferramentas OLAP. você estudou sobre as soluções OLAP. Business Intelligence . ( F ) Para o desenvolvimento de soluções OLAP. existem várias metodologias que se podem seguir para obter sucesso no mesmo. e. não se esqueça de comentar as respostas dos seus colegas. mas nenhuma metodologia é consolidada ou definida. no caso do processo OLAP.

fale sobre elas e apresente quais as suas vantagens e desvantagens. Comentário: A grande vantagem das ferramentas OLAP é a facilidade na navegação entre as informações e no entendimento dos resultados. por outro lado.168 As ferramentas OLAP apresentam uma forma amigável de navegar entre as dimensões modeladas na base de dados. você acha que existem outras formas de navegação? Se sim. o usuário pode não saber o que perguntar e não chegará a encontrar as informações implícitas. existem outras maneiras para fazer esse tipo de navegação. Uma solução bastante interessante é a baseada em “perguntas e respostas”. onde o usuário pode fazer uma pergunta em linguagem natural e a aplicação retorna uma face do cubo dimensional. Essa forma é geralmente tabelar (por meio de tabelas). Uma grande vantagem é que não existe aprendizado para saber como interagir com a ferramenta. já que a interface com a aplicação é uma pergunta escrita. Pós-graduação . No entanto.

202 f. 1996. . 2002. Prod. Monografia (Graduação em Tecnologia)-Faculdade de Tecnologia de São Paulo. Um modelo de decisão para a priorização no planejamento de sistemas de informação. Maria Terezinha. Adiel Teixeira de. Acessado em 15 Dez. BARBOSA. Pedro O. New York.. ARAGÃO. Rachel Virgínia Xavier. Heidelberg: Ed Springer-Verlag. Sistemas de Apoio à Decisão sob o enfoque de Profissionais de TI e de Decisores. SRIKANT. São Paulo. Mining sequential patterns. 2. Addison Wesley Longman. 2005. Available from <http://www.br/scielo. Tese (Doutorado) Programa de Pós Graduação em Ciências da Computação e Matemática Computacional – Instituto de Ciências e Matemáticas e de Computação-ICMC. 2008. 1998. OLAP: conceitos e utilização. R.. Organizações do conhecimento: infraestrutura. D. Discovering unexpected patterns in temporal data using temporal logic. pessoas e tecnologias. C. São Paulo: Saraiva. Universidade de São Paulo-USP. n. Um estudo sobre conceitos e técnicas de mineração de dados. São Paulo. 2008. AGRAWAL. Adiel Teixeira de. XXII Encontro Nacional de Engenharia de Produção. v.. 2002. Uso de marcadores estilísticos para a busca na Web em português. ALMEIDA.php?script=sci_arttext&pid=S0103- 65131998000200003&lng=en&nrm=iso>. ALMEIDA. England. Curitiba. AXELROD. Free Press. BERGER. 1999. AIRES. A. COHEN. R. São Carlos (SP). 363 p. 1998. Proceedings of Eleventh International Conf on Data Engineering. 1995. 8. ANZANELLO.. Data mining. D. Harnessing complexity: organizational implications of a scientific frontier. Dec. Gideon et al. Gilka Rocha.scielo. Universidade Federal do Rio Grande do Sul (UFRGS). R.Research and Practice. Referências ADRIAANS. ZANTINGE. Temporal Databases . 2008. 2011 ANGELONI. P. M.

Alessandro Botelho. Dissertação para obtenção do grau de Mestre em Sistemas de Informação Geográfica. Florianópolis (SC). XXIV Encontro Nacional de Engenharia de Produção. Juliano et al. Universidade Técnica de Lisboa. Artigo online. Sérgio Rodrigues. economia.170 BIO. 207-2010 Pós-graduação . CASTRO. CAZARINI. Portugal. 2011.. R. CABRAL. 2002. R. Flavio.uol. 1996. 2001. 001 ed. Curitiba. Tese Doutorado – PUCPR. Juiz de Fora. CARVALHO. engenharia e administração. O uso do OLAP na estratégia de vendas em uma indústria de calçados alavancando a gestão de cadeia de suprimentos. (Org. Sistemas espaciais de apoio à decisão – O Sistema de Apoio ao Licenciamento da Direção Regional do Ambiente do Alentejo.).com. O sujeito do conhecimento na sociedade em rede. 2000. Pablo R. Um método híbrido árvore de decisão / algoritmo genético para data mining. Rio de Janeiro. TCC (Graduação em Bacharelado em Sistemas de Informação).. Data mining: a mineração de dados no marketing. Aires J. Um modelo de descoberta de conhecimento inerente à evolução temporal dos relacionamentos entre elementos textuais. medicina. CARVALHO Marisa A. Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. Qualidade de dados em Data Warehouse. O conhecimento nas organizações como um sistema adaptativo complexo. CARVALHO. Utilização de técnicas de datamining para reconhecimento de caracteres manuscritos. Disponível em <http://imasters. CARVALHO. 001. Edson W. BOVO. Editora Ciência Moderna. 2005.. p. Centro de Ensino Superior de Juiz de Fora. Florianópolis. Florianópolis: Editora: Fundação José Arthur Boiteux. A. v. Sergio A. Luís Alfredo V. 127 (Doutorado).br/artigo/11178> Acesso em: julho de 2009. 2004. CAMPOS. GONÇALVES. BONOMO. 2005. In: ROVER. São Paulo: Atlas. UFSC. Pedro da Costa Brito. Sistemas de informação: um enfoque gerencial. 2010.. Construção de Data Warehouse (DW) e Data Mart (DM). D. Universidade Federal da Paraíba. Peeter. CECI.

SMYTH. Dissertação submetida para obtenção do grau de Mestre em Ciência da Computação. 2010. LOPES. Advance: knowledge discovery and data mining. SELL. CIELO. A. Flavio.pdf>. H. 2002..br/site2005/internet_clip07. CODD. Myrian C. Disponível em <http://www. F.. 171 CECI. 2005. Flavio. Florianópolis. Padhraic. Data Warehouse como diferencial competitivo. Florianópolis: Visualbooks.br/wp- content/uploads/2011/04/Fl%C3%A1vio_Ceci. Descoberta de conhecimento em banco de dados para apoio à tomada de decisão. FAYYAD. PIATESTSKY-SHAPIRO. DILL. F. Towards a semiautomatic approach for ontology maintenance. 1996. T. Especialização em Informática Empresarial.ufsc. CECI. USA: The Coriolis Group.. São Paulo. B. 1995. High performance oracle data warehousing. Mineração de texto. COSTA.. EBECKEN. GONÇALVES. SILVA. 2010. Artigo on line. Uma metodologia para desenvolvimento de Data Warehouse e Estudo de Caso. Providing OLAP (on-line analytical processing) to user-analysts: An IT mandate.egc. FELDMAN. Sistemas inteligentes: fundamentos e aplicações. Acesso em: 10 de dez.always. B.html>.com. Um modelo semiautomático para a construção e manutenção de ontologias a partir de bases de documentos não estruturados. FIALHO. USP. 2002.. Ivã. Denilson. 7 CONTECSI . Maria Celia S. In: REZENDE. Acesso em: julho de 2008. Business Intelligence . DIAS. Universidade Federal de Santa Catarina. Exploiting background information in knowledge discovery from text. 2010. Solange O. 1997. Guaratinguetá . Unesp. Journal of Intelligent Information System. DONALD. E. Cristiano Araujo. C. SALLEY. Sérgio Luis.. São Paulo: Manole. Francisco Antônio Pereira et al. 2011. Disponível em: <http://btd. Dissertação (Mestrado em Engenharia e Gestão do Conhecimento) – Universidade Federal de Santa Catarina. 1997. 2006. Dhiogo C. Alexandre L. HIRSH.International Conference on Information Systems and Technology Management. Usama M. Gestão do conhecimento e aprendizagem: as estratégias competitivas da sociedade pós-industrial. Ramasamy. Florianópolis. S.). Gregory. CODD. (Coord. R. UTHURUSAMY. Nelson F.

n. Fernando B. Roberto. UFSC. Um modelo de descoberta de conhecimento baseado na correlação de elementos textuais e expansão vetorial aplicado à engenharia e gestão do conhecimento... v. 2006. Florianópolis. RANITO. Francisco Antonio P. 196 (Doutorado). Solange O. HEINZLE. Um modelo de engenharia de conhecimento para sistemas de apoio à decisão. p. 2010. Revista da Unifebe. Editora Manole. CECI. Luís B. 1. GONÇALVES FILHO. Eduardo V. Portugal: Sociedade Portuguesa de Inovação. VAREJÃO. A.. Programa de Pós-Graduação em Engenharia de Produção. Fernando A. GHISI.google. Rio de Janeiro: LTC. et al. Inhaúma N. São Paulo. Artigo 14. 2005. com/a/paulhodge. Porto. FIALHO. 01. SELL. L. Business intelligence Architecture. 2011. HEINZLE. Florianópolis. Acesso em 21 de Janeiro de 2012. com recursos para raciocínio abdutivo. Marcos Roberto. GORDON. 2010. Semântica nos sistemas de apoio à decisão: O Estado da Arte. Sistemas de informação: uma abordagem gerencial. Denilson. Ostuni.1. 3. Vol. Aquisição de Conhecimento. Aspectos relacionados com a eficácia do processo de aquisição de conhecimento a partir de apresentação de informações numéricas: sumários textuais podem ser mais adequados que representações gráficas? 5º CIDI – Congresso Internacional de Design da Informação.. p. Judith. V. Florianópolis (SC).com/www/architecture>. ed.12. Revista Eletrônica de Sistemas de Informação e Gestão Tecnológica. Steven R. GORDON. GAUTHIER. Roberto. GONÇALVES. GOUVEIA. Disponível em <https://sites. n. Flávio M. FERRAZ. Gestão e Produção. 2004. HODGE. P. GARCIA.. Sistemas de informação de apoio à gestão. Tese para obtenção do grau de Doutor em Engenharia e Gestão do Conhecimento. Henrique C. Pós-graduação . Ana Cristina B. In: Sistemas inteligentes: fundamentos e aplicações. Uma proposta de aplicação de Business Intelligence no chão-de-fábrica. 2005. 55-66. 2011. 2006. Organização: REZENDE. Flávio. Universidade Federal de Santa Catarina. GOUVEIA. 01. João.172 FOURLAN. Aplicação da ferramenta OLAP em diferentes módulos de um sistema ERP melhorando a tomada de decisão.

. H. 2005. Descoberta de conhecimento sobre o processo seletivo da UFPR. Claudia. R. Rio de Janeiro: Campus. 388 p. Material das disciplinas de Sistemas de Informação e Data Mining. 2011. 2005. IMHOFF. DW 2. W. TERDEMAN. Antonio Vico. Jane P. Riccardo. Como construir o data warehouse. Data warehouse toolkit. Aplicação de ontologias para apoiar operações analíticas sobre fontes estruturadas e não estruturadas. LOH. Ralph. 2001. Panoramic and main features of Business Analytics.br/~loh/>. INMON. 95 f. 1997. LAUDON. Curitiba. São Paulo: Berkeley. São Paulo: Prentice Hall. Robert R. Margy. Dissertação (Mestrado) – Programa de Pós-Graduação em Engenharia de Produção e Sistemas. KORFHAGE. Data warehousing: como transformar informações em oportunidades de negócios. 2011. 2007. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. Florianópolis (SC). 1998. W. Tese (Doutorado) 2011 . H. 1997. INMON. Wagner. Information storage and retrieval. Facolta di Ingegneria. Padova (Itália). Business Intelligence . Kenneth C. Universidade Federal do Paraná. 2001. STRAUSS. INMON.. Administração de sistemas de informação.. Construção automática de vocabulários temáticos e cálculo de aderência curricular: uma aplicação aos fundos setoriais. Programa de Pós‑Graduação em Engenharia e Gestão do Conhecimento. 2002. Marcio. NAPOLI. G.Universita Degli Studi di Padova. NEUSHLOSS. 1999. 379 p. Ingegneria Informatica. 173 IGARASHI.0 The architecture for the next generation of data warehousing. MARTINHAGO. Florianópolis. MAÑAS. 2011. LUNARDI. Wiley. ROSS.. Sérgio.. W. KIMBALL. 266 p.ucpel. D. São Paulo: Érica. The data warehouse toolkit: the Complete guide to dimensional modeling. Universidade Federal de Santa Catarina. Stanley. Acesso em: julho de 2009. São Paulo: Makron Books. New York: Wiley Computer Publishing. Sistemas de Informação Gerenciais: administrando a empresa digital. LAUDON. H. (Dissertação) Mestrado em Métodos Numéricos em Engenharia. Disponível em <atlas. KIMBALL.tche. Ralph.

intelliwise. Pós-graduação . Um estudo de caso envolvendo business intelligence como instrumento de apoio à controladoria. REZENDE. Universidade Federal de Santa Catarina. Wesley. Acesso em: março de 2012. VII Simpósio Brasileiro de Sistemas de Informação. Brasília.htm>. Carlos André Reis. 2000. OLIVEIRA. PINTAS. 2007. O processo de extração de conhecimento de base de dados apoiado por agentes de software. Data Warehouse. Rio de Janeiro: Editora Ciência Moderna. Sistemas inteligentes: fundamentos e aplicações.. Decisões com B. Luciane. p. Wilson J. Florianopolis. PRIMAK. Visual Books. SOLLI. 2011. OLIVEIRA. Per O. QUONIAM. 2002. Anais do Infoimagem. Software Selection. Manole. Sergio. et al.0: um exemplo no contexto de um programa de pós-graduação. n. 2009. Vol XIII. CARREIRA. Financial Business Intelligence – Trends. Descoberta de conhecimento relevante em banco de dados sobre ciência e tecnologia. São Carlos. Nº 17. 2001. M.. Salvador. Fábio Vinícius. Robson Butaca Taborelli de. 2002.2. Paul S. Juliano T. André Luis B. Ciência da Informação. Rio de Janeiro: Ciência Moderna. Inteligência obtida pela aplicação de data mining em base de teses francesas sobre o Brasil. (Tese) Programa de Pós-Graduação em Engenharia de Produção.com/reports/i2002.. and Implementation.69-83. Florianópolis. ROMÃO. Princípios do data mining. São Paulo. Nils. RASMUSSEN. Universidade de São Paulo. Disponível em: <http://www. New York. Thiago Moura. 2002. v. Technology. John Wiley and Sons. 2005. 2008. SIQUEIRA. 20-28.. NASCIMENTO. MORETI. Marcio Luis.174 NAVEGA. 2002. OLIVEIRA. Sean W. GOLDY. Luc.I. 30. Revista Contabilidade & Finanças. Revista de Ciências Gerenciais. REGINATO. (Dissertação) Ciência da Computação. Inc. Cenadem 2002. Aprimorando a gestão de negócios com a utilização de Tecnologias de Informação. p. O papel da semântica no Business Intelligence 2. 2008. Solange. PINHEIRO. Inteligência analítica: mineração de dados e descoberta de conhecimento. São Paulo: Ed. Auster Moreira.

Florianópolis. Editora Globo S. 2006. Uma arquitetura para business intelligence baseada em tecnologias semânticas para suporte a aplicações analíticas. Dhiogo Cardoso da. Sam. FENSEL. 2th Jornada de Informática da Universidade de Évora. Projeto e modelagem de bancos de dados. 1998. Denilson. Fabrício S. XXX Encontro Nacional de Engenharia de Produção. IEEE Transactions on Data and Knowledge Engineering. 2nd Edition. Editora Ciência Moderna. NARCISO. NADEAU. Porto Alegre. Simpósio de Engenharia de Produção. LIGHTSTONE. 2011. Inc. Tese (Doutorado) . THOMSEN. SELL. XAVIER. 2007. Rio de Janeiro. Leonardo Bruno R. JIUE 2011. V. Rio de Janeiro. SAIAS. 2002. OLAP em âmbito hospitalar: transformação de dados de enfermagem para análise multidimensional. Programa de Pós-Graduação em Engenharia de Produção. BENJAMINS. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. STUDER. 2010. Renato Jose. Click: o que milhões de pessoas estão fazendo on-line e por que isso é importante. Wilson L. XIII SIMPEP. João. WILLIAMS. Richard. VINCI.. Editora Nova Fronteira. Knowledge engineering: principles and methods. 2009. 2006. Toby. Data warehouse e business intelligence operacional: revisando a tecnologia e analisando as tendências do armazém de dados. SILVA. 2009. OLAP Solutions: building multidimensional information systems. 2006. Bill. Centro Tecnológico. 2009. São Paulo.A. 2006. V. 2011. Editora Bookman. ENEGEP 2010. TEOREY. Rudi. São Carlos. Don. Business Intelligence – um enfoque gerencial para a inteligência do negócio. Business Intelligence . Elsevier. SQL dos conceitos às consultas complexas. Programa de Pós-Graduação em Engenharia e Gestão do Conhecimento. TURBAN. Anthony D. Uma arquitetura de business intelligence para processamento analítico baseado em tecnologias semânticas e em linguagem natural. SILVA. 2011. Portugal. Wikinomics: como a colaboração em massa pode mudar o seu negócio. Tom. Erik.Universidade Federal de Santa Catarina. John Wiley & Sons. TANCER. Rio de Janeiro.. Florianópolis. 175 SASSI. Dieter. José.. Integração access-excel para produzir um sistema de apoio à decisão que simula um data warehouse e OLAP. Bauru. Efraim et al. PEREIRA. Marcelo G. TAPSCOTT.

Universidade Federal do Rio Grande do Sul. Tecnologia de descoberta de conhecimento em textos aplicados à inteligência competitiva. Leandro Krug. Ian H. Data mining – practical machine learning tools and techniques with Java implementations. 2000. Monografia apresentada ao Exame de Qualificação do Programa de Pós-Graduação em Computação.. WIVES. FRANK. Morgan Kaufmann Publishers. Eibe. Pós-graduação . 2002. Porto Alegre.176 WITTEN.