Professional Documents
Culture Documents
Aprendizagem de Maquina E1675288358
Aprendizagem de Maquina E1675288358
INFORMAÇÃO
Aprendizagem de Máquina
Livro Eletrônico
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Sumário
Apresentação......................................................................................................................................................................3
Aprendizagem de Máquina. . ........................................................................................................................................4
Inteligência Artificial.. ....................................................................................................................................................4
IA, IoT, Big Data..................................................................................................................................................................5
IA e a Ciência de Dados.. ................................................................................................................................................6
IA nas Organizações........................................................................................................................................................7
Ferramentas de IA......................................................................................................................................................... 10
Exemplos de Uso de IA nas Organizações Públicas.................................................................................. 10
Inteligência Computacional. . ....................................................................................................................................12
Aprendizado de Máquina/Machine Learning). ...............................................................................................13
Visão Geral..........................................................................................................................................................................13
Exemplos de Aplicações do Machine Learning.............................................................................................16
Tipos de Aprendizado de Máquina.. ......................................................................................................................16
Overfitting (Sobreajuste) e Underfitting (Sub-Ajuste) em Machine Learning...........................19
Visão Geral dos Algoritmos de Machine Learning. ....................................................................................23
Técnicas e Etapas de Construção do Modelo de Machine Learning.................................................31
Resumo................................................................................................................................................................................35
Questões Comentadas na Aula. . ............................................................................................................................40
Questões de Concurso................................................................................................................................................42
Gabarito...............................................................................................................................................................................46
Gabarito Comentado....................................................................................................................................................47
Referências........................................................................................................................................................................ 59
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 2 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Apresentação
Olá, querido (a) amigo (a), meus cumprimentos!
Que tal buscarmos inspiração na ÁGUIA!
Em nossas vidas, muitas vezes temos que nos resguardar por algum tempo para dar início
ao difícil processo de renovação, arrancando as velhas e pesadas penas, desprendendo de
nossos vícios, conscientes do caminho a percorrer para enfrentar os desafios vindouros.
Temos difíceis escolhas no decorrer de nossas trajetórias, no entanto, ao final, vale todo
o sacrifício!
Lembre-se sempre de que a LIBERDADE é uma conquista, o SUCESSO é um prêmio e a
RENOVAÇÃO é o ÚNICO CAMINHO PARA SE CHEGAR AOS NOSSOS OBJETIVOS!
Rumo então à aula que contempla os principais tópicos relacionados à Aprendizagem
de Máquina.
Em caso de dúvidas, acesse o fórum do curso ou entre em contato.
Um abraço.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 3 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
APRENDIZAGEM DE MÁQUINA
Inteligência Artificial
A inteligência artificial, geralmente referenciada pelas siglas IA (em português) e AI
(em inglês), é um campo de estudo que engloba várias outras ciências, como estatística,
matemática, computação etc.
Assim, a IA é uma área bem ampla, cujo objetivo é desenvolver ferramentas para máquinas
desempenharem tarefas como se um ser humano as estivesse executando, o que é bem
complexo para uma máquina.
É muito comum encontrar nos meios de comunicação notícias para o grande público utilizando
definições imprecisas do termo, como algo do tipo: “Inteligência artificial prevê câncer de mama
cinco anos antes” (GALILEU, 2019). Esse tipo de informação dá uma ideia de senso comum
de que a IA é apenas uma técnica ou uma ferramenta por si só, e não uma área de pesquisa.
Figura 2. Fonte:(https://blogs.correiobraziliense.com.br/maisbichos/
caes-e-gatos-podem-ser-melhores-amigos/)
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 4 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Isso dá uma ideia de como é complexo criar um programa de computador para fazer
a distinção entre gatos e cachorros, utilizando imagens desses animais, que fornecem as
informações estruturadas, tais como quantidade de membros, formato ou cor. E o programa
precisa através da análise dessas informações conseguir diferenciar esses animais. Esse é o
objeto de estudo pela ciência da inteligência artificial: desenvolver programas que executam
tarefas automaticamente, sem interação do ser humano, mas cujo resultado se assemelha
ao que o ser humano faria.
Portanto, a inteligência artificial é um campo de estudo que se caracteriza por métodos
computacionais que simulam a capacidade humana de raciocinar, perceber, tomar decisões e
resolver problemas, ou seja, a capacidade de ser inteligente. Em resumo, IA pode ser definida
como “tecnologia capaz de executar tarefas específicas tão bem quanto, ou até melhor, que
nós humanos conseguimos” (DATA BRIDGE BRIGADE, 2016).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 5 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
IA e a Ciência de Dados
Como vimos anteriormente, o avanço da tecnologia permitiu a criação e armazenamento
de quantidades crescentes de informações. É o que chamamos de Era da Informação (FIA,
2019). O mundo está se tornando cada vez mais “data driven” - orientado por dados, ou seja,
o volume dos dados armazenados cresce a cada hora do dia, embutindo uma riqueza de
informações que pode trazer benefícios transformadores para organizações e sociedades
como um todo, de modo que não é mais possível tomar uma decisão correta sem analisar
um volume gigantesco de informação disponível. Entre estas informações podemos citar
aquelas úteis para a otimização e o direcionamento de estratégias, para a compreensão das
tendências do cenário econômico e de seus reflexos no mercado, assim como informações
relevantes para conhecer a percepção dos consumidores em relação à marca, ou para fazer
uma previsão do potencial de vendas, lucros ou prejuízos, etc. O problema é que estamos
falando de tanta informação, que excede a capacidade de processamento dos seres humanos.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 6 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Portanto, para ter acesso a essas informações, precisamos interpretar esses dados, que
estão armazenados em bancos de dados e data lakes1. É aí que entra um dos campos de
estudo interdisciplinar, que apesar de existir há 30 anos, ganhou mais destaque nos últimos
anos devido ao surgimento e popularização de grandes bancos de dados e o desenvolvimento
de áreas como aprendizagem de máquina (em inglês machine learning), se tornando muito
promissor hoje em dia: a Ciência de Dados (ORACLE, 2021).
Ciência de Dados (em inglês: Data Science) é uma área interdisciplinar que combina
métodos das áreas de matemática, estatística, ciência da computação e engenharias, voltada
para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-
estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de
novas informações para possíveis tomadas de decisão, ou seja, envolve conhecimentos de
economia e administração de forma geral (CIÊNCIA E DADOS, 2021).
A ciência de dados engloba técnicas como mineração de dados, visualização de dados,
análise de dados e aprendizagem de máquina, buscando extrair informações a partir dos dados,
mais precisamente, do Big Data. O Big Data mudou a forma como gerenciamos, analisamos
e aproveitamos dados em qualquer indústria. E um cientista de dados não consegue fazer
milagres, mas consegue dar acesso a um conjunto de informações para que uma empresa
tome decisões assertivas, o que impacta diretamente no futuro e sucesso de um negócio.
IA nas Organizações
No mundo corporativo, as empresas recebem dados e informações a todo momento.
Sejam de fornecedores ou de clientes, estes dados ficam disponíveis para análise. Saber
extrair informações valiosas contidas neles é um diferencial para a empresa e, ferramentas
que têm como base a inteligência artificial conseguem compilar dados de uma maneira bem
mais eficiente do que um ser humano (STEFANINI, 2021).
Por isso, os últimos anos têm sido marcados pelo uso de análise de dados e Inteligência
Artificial nas empresas, independentemente do seu perfil de negócio. Ferramentas como
essas estão sendo empregadas para potencializar os resultados, aumentar a produtividade
e economizar tempo nas empresas, além de auxiliar profissionais a evitarem fraudes, terem
aplicações mais eficientes e criarem uma infraestrutura de TI cada vez mais confiável, apoiando
processos comerciais e proporcionando a otimização de atividades do dia a dia. Nos últimos
tempos, a IA deixou de ter uma aura de “ficção científica” e passou a fazer parte do dia a dia
de um gigantesco número de pessoas, no Brasil e no mundo.
Apesar dos desafios que a adoção de novas tecnologias impõe ao empreendimento, a IA
deve ser vista como um investimento estratégico. Soluções que possuem funcionalidades
1
O termo “data lake” (“lago de dados”, em português) foi criado por James Dixon, CTO da Pentaho. É apropriado descrever esse
tipo de repositório como um lago porque ele armazena um conjunto de dados em seu estado natural, como um corpo d’água que
não foi filtrado ou contido. Os dados fluem de diversas fontes para o lago e são armazenados no formato original (REDHAT,2020).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 7 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
baseadas em Inteligência Artificial podem otimizar com mais eficácia o ambiente corporativo e
causar um impacto maior nos índices de vendas. Dessa forma, a empresa pode manter-se eficaz
e pronta para lidar com as demandas de clientes e parceiros comerciais. As possibilidades
do uso de Inteligência Artificial no mundo empresarial são infinitas, como por exemplo:
implementar ferramentas de colaboração que usam a Inteligência Artificial;
fazer uso de ferramentas que usam a IA para a segurança de dados. A Inteligência Artificial
é uma aliada indispensável quando se trata de procurar por buracos nas defesas da rede de
computadores da empresa, elevando a segurança da informação a outro patamar;
aplicar a gestão de mudança para os funcionários adaptarem-se rapidamente ao novo
ambiente etc.
Diferentemente de um software convencional, soluções que exploram a inteligência
artificial conseguem “aprender” a melhorar o próprio serviço a que se destinam. Soluções
artificialmente inteligentes aumentam a performance, otimizam o cotidiano operacional e
proporcionam mais tempo para cuidar da estratégia da empresa. E esse ferramental tecnológico
não está acessível apenas para grandes empresas, com orçamentos milionários e alto poder
de investimento, pois também é realidade para pequenas e médias empresas, causando
uma revolução digital nos negócios, moldando processos e ajudando no desenvolvimento de
produtos cada vez mais personalizados (MJV, 2019).
Essa tecnologia alterou a maneira de fazer negócios em diversos segmentos do comércio,
da indústria e do varejo.
Algumas principais vantagens das aplicações de Inteligência Artificial nas empresas
(MJV, 2019):
• aumento da produtividade: Essa tecnologia tende a aumentar a produtividade de muitos
cargos. A expectativa, segundo dados divulgados no Blog da LG, é economizar 6,2 bilhões
de horas de atividades;
• redução da chance de erros nos processos: atividades que apresentam maior índice de
falhas humanas devem ser repassadas para a IA a fim de diminuir essas ocorrências, como
por exemplo: tirar pedidos de vendas, enviar solicitações de estoque, analisar materiais
específicos, como vídeos e traduções etc.;
• automação dos processos: facilitar as atividades rotineiras e aprender os recursos
preferidos pelos usuários, tornando os dados mais acessíveis para que as tomadas de
decisão sejam acertadas;
• melhoria do relacionamento com o cliente (Marketing): solucionar problemas com
agilidade e antecipar futuras compras. A experiência do cliente é aprimorada, o que
tende a aumentar as vendas. Além disso, a IA torna as plataformas de gerenciamento
de relacionamento com o cliente (CRM) mais potentes e precisas, pois é possível com
o autoaprendizado personalizar o atendimento com o intuito de fidelizar o consumidor.
Impactar seus clientes com a mensagem ideal, no momento certo de sua jornada de
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 8 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
compra, faz toda a diferença na hora de desenvolver uma campanha publicitária para o
lançamento de um novo produto. Ao entender o que os clientes precisam, é possível ser
mais competitivo e melhorar a experiência de compra para o lado deles;
• modernizar serviços financeiros: Bancos já trabalham para integrar IA em operações
bancárias regulares, como empréstimos hipotecários e suporte aos clientes. Chatbots
fornecem informações sobre gastos, cartões de crédito, ajudam nas transações cotidianas
e também fornecem respostas a perguntas frequentes.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 9 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
• os formuladores de políticas precisam tomar ações preventivas para limitar os riscos que
a inteligência artificial poderia representar para os setores e regiões mais vulneráveis.
Ferramentas de IA
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 10 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
www.grancursosonline.com.br 11 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Inteligência Computacional
A Inteligência Computacional é um ramo da área de Inteligência Artificial/IA), com o
objetivo de investigar e simular aspectos da cognição humana: percepção, raciocínio básico
e complexo, aprendizado etc. (POSITIVOTECNOLOGIA, 2020).
Então tem como particularidade o olhar sobre quem é esse agente das decisões, buscando
reproduzir suas estratégias para solucionar problemas.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 12 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
• Lógica Fuzzy (ou nebulosa): abordagem lógica que considera qualquer número real entre
0 e 1, opondo-se à booleana ou binária;
• máquinas de vetores de suporte: método que identifica padrões por meio de análises
como a classificação de regressão;
• aprendizagem de máquina (Machine Learning): investiga estratégias para que um software
proponha soluções e faça análises sobre os resultados para desenvolver outros métodos
ainda mais eficientes;
• aprendizagem profunda (Deep Learning): método similar ao Machine Learning, mas que adota
padrões de análise baseados em diversas camadas de dados, potencializando a identificação.
Obs.: Trata-se de uma representação que tem como objetivo criar um modelo (ou seja, uma
representação dos relacionamentos existentes nos dados por meio de uma fórmula
matemática), a partir de dados históricos para generalizar decisões (ENAP, 2020).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 13 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 14 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
ML não é mineração de dados, mas usa os padrões descobertos para aprender. E, relacionados
à Machine Learning, tem-se várias categorias de algoritmos de que podem ser utilizados.
Deep Learning (ou Aprendizado Profundo) é um deles, sendo considerado como um
subconjunto do aprendizado de máquina que usa redes neurais com muitas camadas para
aprender sobre uma grande variedade de dados. Ele permite resolver problemas bastante
complexos (como por exemplo visão computacional e processamento de linguagem natural).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 15 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
a) Aprendizado Supervisionado
• Abordagem mais comum de aprendizado de máquina.
• Existe um supervisor ou professor responsável por treinar o algoritmo.
• O supervisor conhece de antemão o resultado (rótulo/classe) e pode guiar o aprendizado
mapeando as entradas em saídas por meio do ajuste de parâmetros em um modelo capaz
de prever rótulos desconhecidos.
• Algoritmos de aprendizado supervisionado são realizados usando exemplos rotulados, como
uma entrada em que a saída desejada é conhecida. Exemplo: uma peça de equipamento
pode ter pontos de dados rotulados com “F” (com falha) ou “R” (em funcionamento)”
(MACHADO, 2018, p.147).
• O algoritmo de aprendizagem recebe um conjunto de entradas junto com as saídas
corretas correspondentes, e o algoritmo aprende comparando a saída real com as saídas
corretas para encontrar erros. Em seguida, modifica o modelo preditivo de acordo com
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 16 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
a eliminação desses erros. Por meio de métodos (Ex.: classificação, regressão, etc.), o
aprendizado supervisionado usa padrões para prever os valores do rótulo em dados
adicionais não rotulados (MACHADO, 2018, p.147).
Obs.: Conjunto de técnicas para treinar um modelo em que não se sabe a saída esperada
para cada dado usado no treinamento.
• Aqui não se utiliza rótulos/categorias para as amostras de treinamento.
• O algoritmo identifica as semelhanças nos dados apresentados e reage com base na
presença ou ausência dessas tais semelhanças.
• Busca agrupar os dados com base em características similares, não sendo necessário
apresentar o algoritmo à variável resposta (variável que se quer prever).
• Funciona bem em dados transacionais. Por exemplo, ele pode identificar segmentos de
clientes com atributos semelhantes que podem ser tratados de modo semelhante em
campanhas de marketing, ou então ele pode encontrar os principais atributos que separam
os segmentos de clientes uns dos outros (MACHADO, 2018, p.148).
• Grandes sub-grupos de aprendizado não supervisionado:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 17 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
a. agrupamentos (Clustering);
b. regras de Associação (Association Rules).
Exemplo: pode ser utilizado para identificar anomalias ou agrupar clientes com base em
comportamentos similares.
c) Aprendizado Semi-supervisionado
• Conforme Machado (2018), usa tanto dados rotulados quanto dados não marcados
para o treinamento – normalmente uma pequena quantidade de dados rotulados com
uma grande quantidade de dados não rotulados (pois os dados não rotulados são mais
baratos e precisam de menos esforço para serem adquiridos).
• Útil quando o custo associado à rotulagem é muito elevado para permitir um processo
de treinamento totalmente rotulado (MACHADO, 2018).
• Esse tipo de aprendizagem pode ser usado com métodos como a classificação, regressão
e previsão (MACHADO, 2018).
Obs.: Exemplo: identificação do rosto de uma pessoa em uma webcam (processo de iden-
tificação facial).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 18 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
a) Certa. Um veículo totalmente é equipado com sensores que auxiliam um sistema de controle
em seu objetivo de navegar autonomamente até um local desejado, ou seja, sem a necessidade
de atuação direta ou indireta de um condutor humano. Esse sistema deve ser capaz de dirigir
de maneira segura e consistente ao longo de todo seu percurso. Utilizaremos técnicas de
Aprendizagem por Reforço no treinamento dos sistemas utilizados por esses veículos, com o
objetivo de manter a direção do veículo dentro de uma pista.
b) Errada. Trata-se de uma tarefa de aprendizagem não supervisionada.
c) Errada. Trata-se de uma tarefa de aprendizagem não supervisionada.
d) Errada. Trata-se de uma tarefa de aprendizagem supervisionada, na qual se busca aprender
uma regra geral que mapeia entradas de dados em saídas de dados.
e) Errada. Trata-se de uma tarefa de aprendizagem supervisionada, na qual são apresentados ao
computador exemplos de entradas e saídas desejadas, fornecidas por um orientador/supervisor.
Letra a.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 19 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
É quando o modelo aprende demais sobre os dados, ou seja, acontece quando se tem
um modelo com bom desempenho com os dados treinados, mas que não trabalha bem
com novos dados.
Também é bem mais difícil de ser perceber.
Neste caso, mostra-se adequado apenas para os dados de treino, como se o modelo
Overfitting
tivesse apenas decorado os dados de treino e não fosse capaz de generalizar para
(Sobreajuste)
outros dados nunca vistos antes.
Quando isso acontece, os dados de treino apresentam resultados excelentes, enquanto
que a performance do modelo cai drasticamente com os dados de teste (BRANCO, 2022).
Podemos identificar que há sobreajuste quando comparamos a performance do modelo
em treino e teste, variando alguns parâmetros (como a quantidade de dados, por exemplo).
Indica que o modelo não conseguiu aprender o suficiente sobre os dados.
Underfitting É mais fácil de ser identificado.
(sub-ajuste) Ele acontece quando o erro do modelo é elevado em ambos os dados de treino e teste
(BRANCO, 2022).
A visualização gráfica pode nos fornecer um indício de que há problemas com overfitting/
underfitting, no entanto, nem sempre conseguimos identificar visualmente quando esses
problemas existem (BRANCO, 2022).
Vejamos na figura seguinte alguns exemplos de curvas.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 20 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Figura. Curva de complexidade do modelo vs erro para dados de treino e teste (BRANCO, 2022)
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 21 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Observe pela figura que os pontos verdes são os rótulos gerados pela máquina, enquanto a
linha preta indica o resultado esperado que seja gerado por ela.
No gráfico I temos uma situação de sub-ajuste. O underfitting, nesse caso, se dá em situações
em que os resultados gerados pela máquina são insatisfatórios, ou péssimos, tendo pouca
precisão e proximidade com o resultado esperado.
O gráfico III está em uma situação de equilíbrio, pois demonstra uma relação entre rótulos
esperados e rótulos gerados de forma melhor do que o II.
O gráfico II, por eliminação, está em situação de sobreajuste ou sobreajustado.
Letra d.
No resultado #1, a reta não se ajusta bem aos dados. Temos, portanto, uma situação de sub-ajuste
(underfitting), que se dá em situações em que os resultados gerados pela máquina são insatisfatórios,
ou péssimos, tendo pouca precisão e proximidade com o resultado esperado. Nesse contexto, o
modelo é excessivamente simples para modelar a real complexidade do problema para novos dados.
No resultado #2 a curva acompanha os dados, e corresponde ao melhor desempenho do algoritmo.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 22 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Isso mesmo! Overfitting (Sobreajuste) ocorre quando o modelo aprende demais sobre os dados,
ou seja, acontece quando se tem um modelo com bom desempenho com os dados treinados,
mas que não trabalha bem com novos dados. Assim, há poucos erros no treino, mas há muitos
erros no teste (erro de generalização).
Certo.
Conforme Branco (2022), o overfitting tem algumas causas principais, que podem direcionar
a solução do problema. São elas:
• Algoritmo muito complexo para os dados: pode-se simplificar o modelo escolhendo um
algoritmo mais simples, com menos parâmetros, caso seja possível, o que irá reduzir as
chances do modelo sofrer overfitting.
• Poucos dados de treinamento: talvez seja necessário coletar mais dados para treinar o modelo.
• Ruídos nos dados de treinamento: caso exista algum tipo de ruído (valores extremos
ou até mesmo valores incorretos nos dados), pode ser que o modelo aprenda sobre
ele, levando ao overfitting. Caberia um pré-processamento adequado para tratar essa
interferência (BRANCO, 2022).
No entanto, Branco (2022) destaca que se formos muito rigorosos nos tratamentos acima,
podemos ir para o outro extremo, o underfitting (Sub-ajuste). Nesse contexto tem-se:
• Algoritmo inadequado, pouco poderoso para os dados: aqui podemos amplificar o poder
do algoritmo escolhendo outro com mais parâmetros para solucionar o underfitting.
• Características não representativas: neste caso, pode ser que as características utilizadas
para treinar o modelo não sejam representativas (não tenham relação entre si ou não
sejam importantes para o modelo).
• Modelo com muitos parâmetros de restrição: o modelo torna-se inflexível, restrito, e não
se ajusta de forma adequada aos dados.
1. Regressão Linear
Trata-se de uma ferramenta estatística que nos ajuda a quantificar a relação entre uma
variável específica e um resultado que nos interessa enquanto controlamos outros fatores.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 23 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
A regressão linear é denominada dessa forma por ser uma reta traçada a partir de uma
relação em um diagrama de dispersão. Tal reta resume uma relação entre os dados de duas
variáveis e também pode ser utilizada para realizar previsões (ILUMEO, 2021).
A origem da regressão linear vem da correlação linear, que é a verificação da existência
de um relacionamento entre duas variáveis. Ou seja, dado X e Y, quanto que X explica Y. Para
isso, a regressão linear utiliza os pontos de dados para encontrar a melhor linha de ajuste
para modelar essa relação (ILUMEO, 2021).
O resultado da regressão linear é sempre um número. É utilizada adequadamente quando o dataset
apresenta algum tipo de tendência de crescimento/descrescimento constante (ILUMEO, 2021).
2. Regressão Logística
Método usado para problemas de classificação binária (problemas com dois valores de
classe), utilizando conceitos de estatística e probabilidade. É um algoritmo que lida com
questões e problemas de classificação, analisando diferentes aspectos ou variáveis de um
objeto para depois determinar uma classe na qual ele se encaixa melhor (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 24 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Figura. Regressão logística: Gráfico de uma curva de regressão logística mostrando a probabilidade de
aprovação em um exame versus horas de estudo (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 25 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O LDA pode ser usado em qualquer problema que possa ser transformado em um problema
de classificação. Exemplos: reconhecimento de velocidade, reconhecimento facial, química,
recuperação de imagens, biometria e bioinformática (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 26 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Os nós das folhas da árvore contêm uma variável de saída (y) que é usada para fazer uma
previsão. As previsões são feitas percorrendo as divisões da árvore até chegar a uma folha
e gerar o valor da classe nessa folha (ILUMEO, 2021).
As árvores são muito rápidas para fazer previsões. Eles também costumam ser precisas
para uma ampla gama de problemas e não exigem nenhuma preparação especial para seus
dados (ILUMEO, 2021).
Veja o exemplo citado por (ILUMEO, 2021): uma amostra de 30 alunos de uma escola,
com três variáveis: sexo (masculino ou feminino), classe (IX ou X) e altura (160 cm a 180
cm). Digamos também que dos 30 alunos, 15 deles jogam tênis no recreio. A partir disso,
como podemos criar um modelo para prever quem vai jogar tênis durante o recreio? Neste
problema, precisamos dividir os alunos que jogam tênis no recreio com base nas três variáveis
à disposição. Nesse ponto entra a árvore de decisão. Ela dividirá os alunos com base nos
valores das três variáveis e identificará a variável que cria os melhores conjuntos homogêneos
de alunos (que são heterogêneos entre si). No quadro seguinte, é possível ver que a variável
“sexo” é capaz de identificar os melhores conjuntos homogêneos em comparação com as
variáveis “altura” e “classe”.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 27 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
5. Naive Bayes
Algoritmo utilizado para categorizar textos baseado na frequência das palavras usadas.
Como exemplo, permite identificar se determinado e-mail é um spam ou também se uma
notícia é sobre tecnologia, política ou esportes... ou ainda pode verificar um pedaço de texto
que expressa emoções positivas ou emoções negativas (ILUMEO, 2021)
É simples, rápido e possui um desempenho relativamente maior do que outros classificadores.
Também, só precisa de um pequeno número de dados de teste para concluir classificações
com uma boa precisão (ILUMEO, 2021).
A principal característica do algoritmo, e também o motivo de receber “naive” (ingênuo)
no nome, é que ele desconsidera completamente a correlação entre as variáveis, tratando-as
de forma independente (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 28 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Ele pressupõe que itens semelhantes estão próximos um dos outros, então tenta encaixar
o dado em questão nos conjuntos de seus vizinhos. O parâmetro k representa a quantidade
de vizinhos mais próximos que deve ser considerada pelo algoritmo. Analisando o gráfico
apresentado e considerando o valor de k = 3, temos que o novo elemento (?) é classificado
como triângulo, pois é a quantidade de elementos mais próximos da nova observação.
Um dos seus usos é para serviços de recomendação, como produtos da Amazon, filmes na
Netflix, e vídeos no YouTube. No entanto, podemos ter certeza de que todos eles usam meios
mais eficientes de fazer recomendações devido ao enorme volume de dados que processam,
porque uma desvantagem do KNN é a lentidão à medida que o volume de dados aumenta,
tornando uma escolha impraticável em ambientes em que as previsões precisam ser feitas
rapidamente (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 29 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 30 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
9. Random Forest
Os algoritmos Random Forest são criados por várias árvores de decisão, geralmente
treinados com o método de bagging, cuja ideia principal é que a combinação de modelos
aumenta o resultado final (ILUMEO, 2021).
Como exemplo, pode ser usado nos bancos para detectar clientes que irão usar os serviços
bancários mais frequentemente que outros e pagar suas dívidas em dia. No e-commerce
pode ser utilizado para determinar se um cliente irá gostar do produto ou não, fazendo
recomendações dos mais alinhados ao seu perfil e que, provavelmente, façam mais sentido
comprar (ILUMEO, 2021).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 31 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 32 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 33 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Utilizada para treinar e validar um modelo com o mesmo conjunto de dados, dividindo-os
em partições.
Assim, a cada iteração, o algoritmo troca os dados de treino e teste com o objetivo de
obter um melhor desempenho.
• Métricas de desempenho
Uso de métricas para medir o desempenho de um modelo. Como exemplo, é possível medir
a acurácia (o percentual de previsões corretas em problemas de classificação).
• Otimização de hiperparâmetros
Cada algoritmo possui um conjunto de hiperparâmetros que podem ser alterados.
Essa técnica busca encontrar a combinação certa de valores com o objetivo de melhorar
a performance do modelo.
3. Avaliação do Modelo
Nesta etapa, os dados de teste são apresentados ao modelo e, com isso, são geradas
previsões. Essas previsões são comparadas com os resultados desejados para avaliar o
desempenho do modelo (ENAP, 2020).
4. Predição
Se o modelo avaliado apresentar um bom resultado, poderá ser utilizado para receber
novos dados e realizar previsões (ENAP, 2020).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 34 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
RESUMO
Vamos, inicialmente, destacar alguns termos utilizados para se referir a partes específicas
de um conjunto de dados.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 35 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
É quando o modelo aprende demais sobre os dados, ou seja, acontece quando se tem
um modelo com bom desempenho com os dados treinados, mas que não trabalha bem
com novos dados.
Também é bem mais difícil de ser perceber.
Neste caso, mostra-se adequado apenas para os dados de treino, como se o modelo
Overfitting tivesse apenas decorado os dados de treino e não fosse capaz de generalizar para
(Sobreajuste) outros dados nunca vistos antes.
Quando isso acontece, os dados de treino apresentam resultados excelentes, enquanto
que a performance do modelo cai drasticamente com os dados de teste (BRANCO, 2022).
Podemos identificar que há sobreajuste quando comparamos a performance do modelo
em treino e teste, variando alguns parâmetros (como a quantidade de dados, por
exemplo).
Indica que o modelo não conseguiu aprender o suficiente sobre os dados.
Underfitting É mais fácil de ser identificado.
(sub-ajuste) Ele acontece quando o erro do modelo é elevado em ambos os dados de treino e teste
(BRANCO, 2022).
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 36 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 37 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 38 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 39 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 40 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 41 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
QUESTÕES DE CONCURSO
006. (QUADRIX/CRO – SC/TÉCNICO EM INFORMÁTICA/2023) No que diz respeito às novas
tecnologias, julgue o item.
A inteligência artificial refere-se a um campo de conhecimento que não está associado à
aprendizagem, uma vez que esta é uma capacidade puramente humana; contudo, este campo
está associado à linguagem e à inteligência, ao raciocínio e à resolução de problemas.
007. (FGV/SEFAZ MG/AUDITOR FISCAL DA RECEITA ESTADUAL/ÁREA TECNOLOGIA DA
INFORMAÇÃO/2023) Machine Learning é um subconjunto da Inteligência Artificial que utiliza
dados e algoritmos para imitar o raciocínio humano.
Em relação aos algoritmos de machine learning, assinale a afirmativa incorreta.
a) Algoritmo de regressão: prevê valores de saída usando recursos de entrada dos dados fornecidos
ao sistema. Os algoritmos mais populares são Linear Regression, Logistic Regression Multivariate
Adaptive Regression Splines (MARS) e Locally Estimated Scatter plot Smoothing (LOESS).
b) Algoritmo de agrupamento: agrupamento de pontos de dados com base em recursos
semelhantes. Alguns algoritmos são KMeans, K-Medians e Hierárquical Clustering.
c) Algoritmo de regularização: é um processo de diminuir informações adicionais para evitar
o overfitting ou resolver um problema mal definido. Os algoritmos mais comuns são Least
Absolute Shrinkage and Selection Operator (LASSO), Least-Angle Regression (LARS) e Elastic
Net and Ridge Regression.
d) Algoritmos de redução de dimensionalidade: reduzem o número de características obtendo
um conjunto de variáveis principais. Alguns algoritmos são Principal Component Analysis (PCA)
e Principal Component Regression (PCR).
e) Algoritmos de regras de associação: é usado para descobrir a relação entre os pontos de
dados. Alguns algoritmos comuns são o algoritmo Apriori e o algoritmo Eclat.
008. (FGV/TRT-MA/2022) Com relação aos conceitos de aprendizado de máquina, assinale
V para a afirmativa verdadeira e F para a falsa.
I – Os três principais paradigmas de aprendizado de máquina são os de aprendizado supervisionado,
não supervisionado e por inteligência profunda.
II – Os algoritmos de classificação e clusterização estão correlacionados com paradigma de
aprendizado supervisionado.
III – Os algoritmos de Support Vector Machines e Random Forest são paradigmas do aprendizado
de inteligência profunda.
As afirmativas são, respectivamente,
a) V, V e V.
b) V, V e F.
c) V, F e V.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 42 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
d) F, V e V.
e) F, F e F.
009. (CESPE/POLÍCIA FEDERAL/ESCRIVÃO DE POLÍCIA FEDERAL/2018) Em um big data,
alimentado com os dados de um sítio de comércio eletrônico, são armazenadas informações
diversificadas, que consideram a navegação dos usuários, os produtos comprados e outras
preferências que o usuário demonstre nos seus acessos.
Tendo como referência as informações apresentadas, julgue o item seguinte.
Uma aplicação que reconheça o acesso de um usuário e forneça sugestões diferentes para cada
tipo de usuário pode ser considerada uma aplicação que usa machine learning.
010. (CEBRASPE/CESPE/ANALISTA BANCÁRIO/BNB/2018) Não podemos descartar a
operação humana por trás dos sistemas, muito menos a presença de analistas reais. Vamos
supor que um sistema de aprendizagem de máquina perceba que todas as pessoas com
índice de massa corporal regular tomam café com açúcar, enquanto todas as pessoas com
índice elevado tomam a bebida com adoçante. A inteligência artificial poderá inferir, assim,
que o adoçante é o responsável pela obesidade dos usuários, o que nós sabemos, pela nossa
inteligência humana, que não é bem assim.
O sistema de aprendizagem de máquina diminui a ocorrência de falsos positivos e deve contribuir
para cortes de gastos. Contudo, não podemos deixar de considerar uma pessoa que esteja por trás
do sistema, pronta para lidar com casos realmente duvidosos, que mereçam ser mais bem avaliados.
Correio Braziliense, 1º/10/2018, p. 14 (com adaptações).
Com relação às ideias do texto, julgue o item subsequente.
De acordo com o texto, a inteligência artificial cometeria um equívoco se associasse o adoçante
à causa da obesidade das pessoas com índice de massa corporal elevado.
011. (CESGRANRIO/EPE/ANALISTA DE GESTÃO CORPORATIVA/TECNOLOGIA DA
INFORMAÇÃO/2012) As técnicas de mineração de dados podem ser categorizadas em
supervisionadas e não supervisionadas. As técnicas de árvores de decisão, agrupamento e
regras de associação são categorizadas, respectivamente, como
a) não supervisionada, não supervisionada, não supervisionada
b) não supervisionada, supervisionada e não supervisionada
c) supervisionada, não supervisionada e não supervisionada
d) supervisionada, não supervisionada e supervisionada
e) supervisionada, supervisionada e supervisionada
012. (ENAP/2020) O termo inteligência artificial pode ser definido como:
Escolha uma opção:
a) Uma técnica que realiza tarefas de forma automática.
b) Um campo da ciência que estuda como computadores podem realizar tarefas simples para
humanos, mas complexas para sistemas de informática.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 43 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 44 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 45 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
GABARITO
1. E
2. a
3. d
4. c
5. c
6. e
7. c
8. e
9. C
10. C
11. c
12. b
13. c
14. a
15. C
16. C
17. E
18. b
19. E
20. C
21. C
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 46 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
GABARITO COMENTADO
006. (QUADRIX/CRO – SC/TÉCNICO EM INFORMÁTICA/2023) No que diz respeito às novas
tecnologias, julgue o item.
A inteligência artificial refere-se a um campo de conhecimento que não está associado à
aprendizagem, uma vez que esta é uma capacidade puramente humana; contudo, este campo
está associado à linguagem e à inteligência, ao raciocínio e à resolução de problemas.
A Inteligência Artificial (IA) é um avanço tecnológico que permite que sistemas simulem uma
inteligência similar à humana — indo além da programação de ordens específicas para tomar
decisões de forma autônoma, baseadas em padrões de enormes bancos de dados. Assim,
podemos definir IA, no grosso modo, como a capacidade das máquinas de pensarem como
seres humanos: aprender, perceber e decidir quais caminhos seguir, de forma racional, diante
de determinadas situações.
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 47 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
a) Certa. Algoritmo de regressão: prevê valores de saída usando recursos de entrada dos
dados fornecidos ao sistema. Os algoritmos mais populares são Linear Regression, Logistic
Regression Multivariate Adaptive Regression Splines (MARS) e Locally Estimated Scatter plot
Smoothing (LOESS).
b) Certa. Algoritmo de agrupamento: agrupamento de pontos de dados com base em recursos
semelhantes. Alguns algoritmos são KMeans, K-Medians e Hierárquical Clustering.
c) Errada. Algoritmos de regularização otimizam os dados utilizando pesos. Os mais comuns
são o LASSO e RIDE, conforme destaca
https://medium.com/turing-talks/turing-talks-20-regress%c3%a3º-de-ridge-e-lasso-a0fc467b5629.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 48 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Machine Learning: é uma área de estudo que busca dar aos computadores a habilidade de
aprender sem serem programados explicitamente. Segundo artigo da Data Science Academy
(2018), “a aprendizagem de máquina é um subconjunto da inteligência artificial (IA), o segmento
da ciência da computação que se concentra na criação de computadores que pensam da maneira
que os humanos”. A máquina aprende com seus erros e acertos e é capaz de fazer previsões e
tomar decisões baseadas em sua experiência, que pode ser compartilhada para outras máquinas.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 49 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
supor que um sistema de aprendizagem de máquina perceba que todas as pessoas com
índice de massa corporal regular tomam café com açúcar, enquanto todas as pessoas com
índice elevado tomam a bebida com adoçante. A inteligência artificial poderá inferir, assim,
que o adoçante é o responsável pela obesidade dos usuários, o que nós sabemos, pela nossa
inteligência humana, que não é bem assim.
O sistema de aprendizagem de máquina diminui a ocorrência de falsos positivos e deve contribuir
para cortes de gastos. Contudo, não podemos deixar de considerar uma pessoa que esteja por trás
do sistema, pronta para lidar com casos realmente duvidosos, que mereçam ser mais bem avaliados.
Correio Braziliense, 1º/10/2018, p. 14 (com adaptações).
Com relação às ideias do texto, julgue o item subsequente.
De acordo com o texto, a inteligência artificial cometeria um equívoco se associasse o adoçante
à causa da obesidade das pessoas com índice de massa corporal elevado.
Machine Learning (Aprendizado de Máquina) é uma área de estudo que busca dar aos
computadores a habilidade de aprender sem serem programados explicitamente. Segundo
artigo da Data Science Academy (2018), “a aprendizagem de máquina é um subconjunto da
inteligência artificial (IA), o segmento da ciência da computação que se concentra na criação de
computadores que pensam da maneira que os humanos”. A máquina aprende com seus erros
e acertos e é capaz de fazer previsões e tomar decisões baseadas em sua experiência, que
pode ser compartilhada para outras máquinas.
Na referida questão, o autor afirma a possibilidade de a inteligência artificial inferir “que o
adoçante é o responsável pela obesidade dos usuários”. No entanto, essa inferência, de acordo
com a “inteligência humana”, seria incorreta, conforme explicita o texto seguinte: “A inteligência
artificial poderá inferir, assim, que o adoçante é o responsável pela obesidade dos usuários, o que
nós sabemos, pela nossa inteligência humana, que não é bem assim.”
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 50 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Letra c.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 51 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O foco da inteligência artificial é permitir que um programa seja capaz de realizar atividades
simples para humanos, mas complexas para máquinas.
Não é uma técnica, é uma área de estudo, e não possui foco na melhoria do ser humano ou na
criação de robôs, ainda que possa ser utilizada para esse fim.
Letra b.
www.grancursosonline.com.br 52 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 53 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
A área de atendimento ao público é uma forte candidata para a adoção de soluções de inteligência
artificial. Existem diversas soluções que abstraem toda a complexidade de implementação
de uma solução de inteligência artificial e permitem a criação de chatbots apenas inserindo
exemplos de perguntas e respostas.
Chatterbot (ou chatbot) é um programa de computador que tenta simular um ser humano na
conversação com as pessoas. O objetivo é responder as perguntas de tal forma que as pessoas
tenham a impressão de estar conversando com outra pessoa e não com um programa de
computador. Após o envio de perguntas em linguagem natural, o programa consulta uma base de
conhecimento e em seguida fornece uma resposta que tenta imitar o comportamento humano.
Os chatbots já são considerados como o futuro do relacionamento com o cliente, tornando a
comunicação entre empresa e cliente mais próxima e personalizada, graças aos avanços da
inteligência artificial. Para as empresas, são uma alternativa interessante para interagir com
clientes em tempo integral. A seguir, tem-se um exemplo do chatbot da IFood Pizzaria:
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 54 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Também já existem chatbots que usam as técnicas de machine learning (aprendizado de máquina).
Nesses, os robôs conseguem aprender com o usuário. Através de inteligência artificial, o chatbot
tem a capacidade de aprender com perguntas e interações para saber como respondê-las no
futuro, mesmo que outra pessoa faça a pergunta usando palavras diferentes.
Certo.
Certo.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 55 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 56 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
Figura. Disciplinas envolvidas com Mineração de Dados (HAN & KAMBER, 2006)
É o processo de análise de conjuntos de dados que tem por objetivo a descoberta de padrões
interessantes e que possam representar informações úteis.
Errado.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 57 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 58 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
REFERÊNCIAS
ANYOHA, R. The History of Artificial Intelligence. Science in the News, Boston, 28 Aug. 2017.
Disponível em: http://sitn.hms.harvard.edu/flash/2017/history-artificial-intelligence/. Acesso
em: 7 dez. 2020.
BRANCO, H. Overfitting e Underfitting em Machine Learning. ABRACD. 2022. Disponível em: <
https://abracd.org/overfitting-e-underfitting-em-machine-learning/>. Acesso em: 25 jan. de 2023.
BOSCHETTI, A.; MASSARON, L. Python Data Science Essentials. 2. ed. Birmingham: Packt Pu-
blishing, 2016.
DATA BRIDGE BRIGADE. A diferença entre inteligência artificial, machine learning e deep
learning. Disponível em: <https://medium.com/data-science-brigade/a-diferen%C3%A7a-entre-
-intelig%C3%AAncia-artificial-machine-learning-e-deep-learning-930b5cc2aa42>. 2016. Acesso
em: 2 fev. 2021.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 59 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
EXAME. WAZE chega a 3 milhões de usuários em São Paulo. 2016. Disponível em: <https://exame.
com/tecnologia/waze-chega-a-3-milhoes-de-usuarios-em-sao-paulo/>. Acesso em: 7 dez. 2020.
FIA. Ciência de Dados ou Data Science: O que é, Aplicações e Perfil Profissional. Disponível
em: <https://fia.com.br/blog/ciencia-de-dados-data-science/>.2019. Acesso em: 02 mar. 2021.
FOLHAUOL. Aplicativo do Google, Waze depende de 30 mil voluntários. Disponível em: <https://
www1.folha.uol.com.br/tec/2019/09/aplicativo-do-google-waze-depende-de-30-mil-voluntarios.
shtml>. 2019. Acesso em: 02 mar. 2021.
FUTURE OF LIFE INSTITUTE. Research Priorities for Robust and Beneficial Artificial Intelligence.
2015. Disponível em: <https://futureoflife.org/data/documents/research_priorities.pdf>. Acesso
em: 2 fev. 2021.
GALILEU. Inteligência artificial prevê câncer de mama cinco anos antes. Disponível em: <https://
dirad.com.br/sala-de-imprensa/atualidades/344/inteligencia-artificial-preve-cancer-de-mama-
-cinco-anos-antes>. 2019. Acesso em: 2 fev. 2021.
GOMES, D.S. Inteligência Artificial: Conceitos e Aplicações. Revista Olhar Científico. V. 01, n.2,
Ago./Dez. 2010.
HACKELING, G. Mastering Machine Learning with scikit-learn. Birmingham: Packt Publishing, 2014.
IBM. Artificial intelligence in medicine. Watson Health Learning Hub, Armonk, [25 Aug. 2020].
Disponível em: https://www.ibm.com/watson-health/learn/artificial-intelligence-medicine. Acesso
em: 7 dez. 2020.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 60 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
ILUMEO. A tour of the top 10 Machine Learning algorithms. 2021. Disponível em: < https://ilumeo.
com.br/todos-posts/2020/06/22/um-tour-pelos-10-principais-algoritmos-de-machine-learning>.
Acesso em: 26 jan. 2023.
KUMAR, A. Learning Predictive Analytics with Python. Birmingham: Packt Publishing, 2016.
MJV. Vantagens da aplicação da Inteligência Artificial nas empresas. Disponível em: <https://
www.mjvinnovation.com/pt-br/blog/vantagens-da-aplicacao-da-inteligencia-artificial-nas-em-
presas/>. 2019. Acesso em: 02 abr. 2021.
NEC. A transformação do mundo low touch com a biometria. Disponível em: <https://blog.nec.
com.br/a-transformacao-do-mundo-low-touch-com-a-biometria>. Acesso em: 02 mar. 2021.
QUINTÃO, P. L. 1001 Questões Comentadas de Informática -Cespe, 2ª. Edição. Ed. Gen/Método, 2017.
RUSSEL, S.; NORVIG, P. Inteligência Artificial. 2. Ed. Rio de Janeiro: Campos, 2004.
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 61 de 63
Tecnologia da Informação
Aprendizagem de Máquina
Patrícia Quintão
SASIKUMAR, S. Data Science vs. Data Analytics vs. Machine Learning: expert talk. Simpli Learn,
San Francisco. 2020. Disponível em: <https://www.simplilearn.com/data-science-vs-data-analy-
tics-vs-machine-learning-article>. Acesso em: 7 dez. 2020.
SCHLEICHER, A. Schools for 21st-century learners: Strong leaders, confident teachers, innova-
tive approaches. International summit on the teaching profession. Paris: OECD Publishing. 2015.
SELDON, A. The Fourth Education Revolution: How Artificial Intelligence is Changing the Face
of Learning. The University of Buckingham Press, 2017.
Patrícia Quintão
Mestre em Engenharia de Sistemas e computação pela COPPE/UFRJ, Especialista em Gerência de Informá-
tica e Bacharel em Informática pela UFV. Atualmente é professora no Gran Cursos Online; Analista Legislati-
vo (Área de Governança de TI), na Assembleia Legislativa de MG; Escritora e Personal & Professional Coach.
Atua como professora de Cursinhos e Faculdades, na área de Tecnologia da Informação, desde 2008. É
membro: da Sociedade Brasileira de Coaching, do PMI, da ISACA, da Comissão de Estudo de Técnicas de
Segurança (CE-21:027.00) da ABNT, responsável pela elaboração das normas brasileiras sobre gestão da
Segurança da Informação.
Autora dos livros: Informática FCC - Questões comentadas e organizadas por assunto, 3ª. edição e 1001
questões comentadas de informática (Cespe/UnB), 2ª. edição, pela Editora Gen/Método.
Foi aprovada nos seguintes concursos: Analista Legislativo, na especialidade de Administração de Rede, na
Assembleia Legislativa do Estado de MG; Professora titular do Departamento de Ciência da Computação
do Instituto Federal de Educação, Ciência e Tecnologia; Professora substituta do DCC da UFJF; Analista de
TI/Suporte, PRODABEL; Analista do Ministério Público MG; Analista de Sistemas, DATAPREV, Segurança da
Informação; Analista de Sistemas, INFRAERO; Analista - TIC, PRODEMGE; Analista de Sistemas, Prefeitura
de Juiz de Fora; Analista de Sistemas, SERPRO; Analista Judiciário (Informática), TRF 2ª Região RJ/ES, etc.
Redes Sociais: @coachpatriciaquintao (Instagram) /profapatriciaquintao (YouTube) / @plquintao (Twitter) /
t.me/coachpatriciaquintao (Telegram)
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.
www.grancursosonline.com.br 62 de 63
O conteúdo deste livro eletrônico é licenciado para Nome do Concurseiro(a) - 000.000.000-00, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.