You are on page 1of 2

Com base no artigo Minerao de Dados Conceitos, Aplicaes e Experimentos com WEKA responda

1- Defina KDD e suas fases. O processo KDD desponta como um conjunto de tcnicas e ferramentas capazes de contribuir amplamente para o problema de Aquisio de Conhecimento implcito em grandes volumes de dados. Definio do problema; Seleo dos dados; Limpeza dos dados; Pr-processamento dos dados; Codificao dos dados; Enriquecimento dos dados; Minerao dos dados (Data Mining) e a Interpretao dos resultados. 2- Explique com suas palavras o que um padro vlido, novo, potencialmente til e compreensvel. Padro - um subconjunto usado como termo de comparao em uma tomada de deciso. Vlida (Validao) - Uma vez descobertos os padres existentes em um banco de dados, eles sero vlidos para os novos dados com um determinado grau de certeza. Novo - Uma vez que a novidade pode ser medida com relao s mudanas nos dados ou no conhecimento, pode-se considerar que os padres so caracteristicamente recentes. Essa mudana estabelecida pela comparao dos valores atuais com os anteriores ou com os valores esperados, enquanto o conhecimento uma nova descoberta relacionada ao conhecimento anterior. Potencialmente til - Os padres podem ser potencialmente guiados por algumas aes teis, como medidas de alguma funo utilitria. Compreensvel Onde fcil de ser entendido. 3- Explique o que pode ser feito na fase de pr-processamento dos dados Etapa de pr-processamento que compreende as funes que se relacionam a captao, organizao e ao tratamento de dados, cujo objetivo preparar os dados para os algoritmos da etapa seguinte; etapa de Data Mining (Minerao de Dados) que realiza a busca efetiva de conhecimentos teis no contexto proposto para a aplicao do KDD; 4- O que Minerao de Dados? Minerao de dados ou data mining o processo de explorar grandes quantidades de dados procura de padres consistentes, como regras de associao ou seqncias temporais, para detectar relacionamentos sistemticos entre variveis, detectando assim novos subconjuntos de dados. 5- O que a tarefa de Classificao em Minerao de Dados?

Etapas de minerao de dados utilizam tcnicas e algoritmos de diferentes reas do conhecimento, principalmente inteligncia artificial (especialmente aprendizagem de mquina), banco de dados (recursos para manipular grandes bases de dados) e estatstica (comumente na avaliao e validao de resultados). 6- O que Seleo de Atributos? Explique esta tarefa de pr-processamento de dados. Em bases de dados encontram-se atributos que tm um peso maior ou at determinante nas tarefas de minerao de dados. Por exemplo, no caso do cliente, a sua renda com certeza um atributo determinante nos seus hbitos de consumo. Com algoritmos de seleo de atributos possvel determinar os atributos de fato relevantes para a minerao dos dados, separando-os dos atributos irrelevantes, como por exemplo, nome do cliente (que neste caso no influencia seus hbitos de consumo). O Weka disponibiliza vrios algoritmos para esta categoria de minerao, dentre eles InformationGain, PrincipalComponents e ConsistencyEval. 7- Proponha 2 aplicaes para a Minerao de Dados em um problema real de seu cotidiano. Utilizado para calculo do Seguro de um Bem. Calculo de financiamento.

You might also like