Professional Documents
Culture Documents
Email: aguinaldo.junior5@senaisp.edu.br
Abstract— In this article, we will delve into the exciting world of Artificial Neural Networks (ANNs) and explore
the creation of a neural network for handwritten digit classification using the MNIST dataset. ANNs are compu-
tational models that simulate the human neural system, employing synapses and neurons through mathematical
calculations. They have the ability to teach machines to solve complex problems, such as pattern recognition. To
understand the importance of ANNs, it is essential to go back in time and comprehend the emergence of the first
artificial neural networks. From their humble origins to the current scenario, where computational capacity has
enabled significant advances, ANNs have played a crucial role in various fields, particularly in supporting contin-
uous improvement in industrial processes. In this article, we will embark on a step-by-step journey, starting with
data preprocessing and culminating in the evaluation of our model’s performance. We will demonstrate how to
build a simple and effective neural network capable of accurately classifying handwritten digits. Along the way,
we will highlight fundamental concepts and best practices, making this reading valuable for both beginners and
those looking to deepen their knowledge of ANNs. So, get ready to explore the evolution of ANNs, understand
their functioning, and, ultimately, apply this knowledge in constructing a practical and efficient model for digit
classification.
Keywords— Artificial Neural Networks (ANNs), handwritten digit classification, Emergence of ANNs, Data
Preprocessing.
Resumo— Neste artigo, adentraremos no mundo das Redes Neurais Artificiais (RNAs) e exploraremos a cria-
ção de uma rede neural para a classificação de dı́gitos manuscritos usando o conjunto de dados MNIST. RNAs
são modelos computacionais que simulam o sistema neural humano, empregando sinapses e neurônios por meio
de cálculos matemáticos. Elas têm a capacidade de ensinar máquinas a resolver problemas complexos, como
o reconhecimento de padrões. Para compreender a importância das RNAs, é fundamental voltar no tempo e
compreender o surgimento das primeiras redes neurais artificiais. Desde suas origens modestas até o cenário
atual, onde a capacidade computacional permitiu avanços significativos, as RNAs desempenharam um papel
crucial em diversos campos, destacando-se no apoio à melhoria contı́nua dos processos industriais. Neste artigo,
embarcaremos em uma jornada passo a passo, começando pelo pré-processamento de dados e culminando na
avaliação do desempenho do modelo. Mostraremos como construir uma rede neural simples e eficaz que será
capaz de classificar dı́gitos manuscritos com precisão. Ao longo do caminho, destacaremos conceitos fundamen-
tais e melhores práticas, tornando esta leitura valiosa tanto para iniciantes quanto para aqueles que desejam
aprofundar seu conhecimento em RNAs. Portanto, prepare-se para explorar a evolução das RNAs, compreender
seu funcionamento e, finalmente, aplicar esse conhecimento na construção de um modelo prático e eficiente para
a classificação de dı́gitos manuscritos.
Palavras-chave— Redes Neurais Artificiais (RNAs), Classificação de Dı́gitos Manuscritos, Surgimento das RNAs,
Processamento de Dados
Uma camada de entrada com 784 neurônios (para • Accuracy (Precisão): A precisão indica a pro-
representar as imagens MNIST de 28x28 pi- porção de previsões corretas feitas pela rede
xels).Pelo menos uma camada oculta com uma em relação aos rótulos reais. A precisão deve
quantidade de neurônios de nossa escolha. Uma aumentar à medida que o modelo aprende..
camada de saı́da com 10 neurônios, um para cada
classe de dı́gito de 0 a 9. Função de Perda e Oti- • Validation Loss (Perda de Validação) e Vali-
mizador: Escolhemos a função de perda de en- dation Accuracy (Precisão de Validação): Es-
tropia cruzada categórica e o otimizador Gradi- sas métricas são calculadas usando o conjunto
ente Descendente Estocástico (SGD) para treinar de validação e fornecem uma avaliação im-
nosso modelo. parcial do desempenho da rede em dados não
vistos durante o treinamento. O objetivo é
evitar o superajuste e criar um modelo que
generalize bem para novos dados.
Figura 8: Dropout
Figura 10: Desempenho final
O relatório de classificação fornece métricas deta- Esta pesquisa demonstra a eficácia das redes neu-
lhadas para cada classe de dı́gito, incluindo pre- rais artificiais no reconhecimento de dı́gitos ma-
cisão, recall e F1-score. Essas métricas são úteis nuscritos e destaca o papel fundamental das bi-
para entender como o modelo se comporta em di- bliotecas TensorFlow e scikit-learn. Os resultados
ferentes categorias. A precisão ponderada e o F1- obtidos reforçam a importância do uso de RNAs
score ponderado são métricas agregadas que levam em uma variedade de aplicações, desde reconheci-
em consideração o desempenho em todas as clas- mento de caracteres até automação industrial. À
ses. medida que avançamos na era da IA, o reconheci-
mento de padrões, como o reconhecimento de dı́- Giulian, H. (2018). Uma abordagem para gera-
gitos, continuará a desempenhar um papel crucial ção de imagem baseada no uso de gpu e re-
em nossa sociedade. des neurais artificiais, Universidade Federal
As redes neurais artificiais, como demons- da Paráiba (1): 14–15.
trado neste projeto, desempenham um papel cru-
cial em várias aplicações de aprendizado de má- Jonathan Romeiro de Sousa, Juliana Fonseca An-
quina, incluindo o reconhecimento de dı́gitos. A tunes, A. d. O. J. C. R. L. T. M. d. S. M.
pesquisa destaca como as RNAs são capazes de S. T. G. S. d. S. (2020). Python e predição
aprender representações complexas e realizar tare- de dados usando redes neurais multicamadas,
fas de classificação com alta precisão. Além disso, Brazilian Journal of Development Braz p. 3.
a análise das métricas e da matriz de confusão Roberto Fray da Silva, Francis Melvin Lee, E.
mostra o desempenho da RNA em cada classe de S. G. (2018). A implementação de reposi-
dı́gito, o que pode ser útil em cenários práticos, tórios digitais e os requisitos dos usuários: o
como sistemas de reconhecimento de caracteres e caso do instituto hercule florence, Revista do
processamento de documentos. arquivo 2(6): 87–101.
Ademais durante o desenvolvimento dessa
pesquisa, atingimos diversos marcos importantes. Zanardo, J. (2016). Desafios do historiador na era
Primeiramente, um pré-processamento eficiente digital, Universidade de São Paulo pp. 3–4.
dos dados do conjunto MNIST, incluindo a norma-
lização das imagens e a codificação ”one-hot”dos
rótulos. Em seguida, a dividisão do conjunto de
dados em conjuntos de treinamento, validação e
teste para avaliar imparcialmente o desempenho
dos modelos. Projetado arquiteturas de redes neu-
rais com camadas ocultas variadas e a realização
de treinamento desse modelo utilizando o otimi-
zador Gradiente Descendente Estocástico (SGD)
e a função de perda de entropia cruzada categó-
rica, otimizando os hiperparâmetros para maximi-
zar o desempenho. Avaliação do desempenho dos
modelos utilizando métricas cruciais, como preci-
são, recall, F1-score e a matriz de confusão, pro-
porcionando uma análise detalhada do reconhe-
cimento de dı́gitos em todas as classes. explora-
ção da técnica de regularização conhecida como
Dropout para aprimorar o desempenho e evitar o
overfitting. Esses passos demonstram a robustez
da abordagem utilizada ao longo do projeto.
Referências