"A Transversalidade da Ciência, Tecnologia e Inovações para o Planeta"

5 a 7 de outubro de 2021

Trabalho 15747

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Inteligência Artificial
Setor Departamento de Física
Conclusão de bolsa Não
Primeiro autor Humberto Sousa Martins
Orientador ALVARO JOSE MAGALHAES NEVES
Outros membros Lara Romão Américo Ribeiro
Título Redes Neurais Convolucionais: solução para problemas do mundo real em um modelo simples
Resumo As redes neurais artificiais vêm ganhando notoriedade em diversas áreas da ciência e da vida cotidiana, com bom desempenho, por vezes super-humano, em tarefas e problemas que há poucos anos eram reservadas exclusivamente para humanos. As redes neurais são algoritmos computacionais inspirados no funcionamento do cérebro. Elas operam sem instruções específicas, podendo “aprender” a partir de exemplos de treinamento. Como ilustração, uma rede neural pode aprender a distinguir faces masculinas e femininas em fotografias, ao ser apresentada a vários exemplos de imagens devidamente classificadas. Depois desse treinamento, a rede faz a classificação mais acuradamente que a maioria das pessoas, mesmo para fotografias que não foram utilizadas no treinamento. A capacidade das redes de classificar ou localizar elementos específicos em imagens tem aplicações importantes em diversas áreas como na de veículos autônomos. Contudo, nesse campo como em vários outros, a transposição do ambiente de treinamento para o mundo real é frequentemente desafiadora. Com efeito, uma rede devidamente treinada e testada muitas vezes tem um desempenho decepcionante no tratamento de imagens obtidas com técnicas diferentes ou em ambientes diversos daquelas do treinamento e teste. O trabalho ilustra essa dificuldade em um problema simples e como ela pode ser contornada, escolhendo-se adequadamente a arquitetura da rede neural. Tratamos daquela que é considerada a cobaia dos experimentos com redes neurais – o problema de classificar, isso é, identificar dígitos manuscritos de diferentes pessoas. Diversas redes densamente conectadas foram treinadas com 60.000 exemplos e foram testadas na classificação de 10.000 imagens de dígitos de outras pessoas. Esse conjunto de imagens classificadas é o conhecido MNIST. Obtivemos uma acurácia de até 98,5% no teste. Entretanto, constatou-se com surpresa que a acurácia era cerca de duas vezes menor na classificação de 80 imagens fora do MNIST (dígitos gerados pelos autores). Demonstramos que a queda de desempenho se devia, sobretudo, ao fato dessas imagens não estarem perfeitamente centralizadas, e conterem diferenças estilísticas marcantes em relação aos dados de treinamento. Conjecturamos que essa dificuldade seria suplantada pelo uso de redes convolucionais. Com efeito, elas foram capazes de classificar as imagens externas ao MNIST com uma acurácia de até 85%. Investigou-se ainda como o desempenho das redes depende do número de neurônios, de camadas e de dados de treinamento. As redes neurais foram implantadas, treinadas e testadas em Python, versão 3.6 , e são baseadas no pacote TensorFlow versão 2.0.
Palavras-chave rede neural convolucional, inteligência artificial, tensorflow
Forma de apresentação..... Vídeo
Link para apresentação Vídeo
Gerado em 0,63 segundos.