Resumo |
A identificação de pragas agrícolas é uma tarefa essencial para garantir a qualidade e o rendimento das culturas, sendo fundamental para a segurança alimentar e a sustentabilidade do setor agrícola. Contudo, a grande diversidade de espécies, suas diferentes fases de desenvolvimento e as variações regionais tornam a tarefa desafiadora. Nesse contexto, este trabalho investiga o uso de técnicas de deep learning para a classificação automática de pragas em imagens digitais, avaliando o desempenho de diferentes arquiteturas e estratégias de treinamento. Foram analisadas quatro arquiteturas de redes neurais profundas: AlexNet, ResNet-50, EfficientNet-B4 e Vision Transformer (ViT), selecionadas por suas distintas abordagens de extração de características. Utilizou-se o Agricultural Pests Dataset, composto por 5.494 imagens distribuídas em 12 classes de pragas, já particionado em conjuntos de treino e teste. Após uma etapa de otimização de hiperparâmetros, os modelos foram ajustados via fine-tuning com transfer learning, empregando a entropia cruzada como função de perda e o otimizador Adam. Além das arquiteturas, foram testadas quatro estratégias de aumento de dados (data augmentation), incluindo combinações de operações como rotações, flips, alterações de cor e random erasing, a fim de avaliar seu impacto no desempenho dos modelos. O ViT destacou-se ao atingir a maior acurácia no conjunto de teste (0,9572), mesmo sem o uso de data augmentation, possivelmente em virtude de seu mecanismo de atenção, capaz de capturar relações espaciais globais. Por outro lado, as CNNs tradicionais, AlexNet, ResNet-50 e EfficientNet, mostraram-se significativamente beneficiadas pelas técnicas de aumento de dados, evidenciando sua importância para melhorar a generalização desses modelos. Os resultados foram avaliados com base em métricas tradicionais de classificação (acurácia, precisão, recall e F1-score), considerando médias macro e ponderada. Os testes confirmaram a superioridade do ViT em todos os cenários, embora ResNet-50 e EfficientNet-B4 tenham apresentado desempenhos competitivos quando combinados às estratégias de data augmentation. Este estudo reforça o potencial das técnicas de deep learning na classificação automática de pragas agrícolas, destacando sua capacidade de apoiar profissionais no monitoramento de culturas e na tomada de decisões. Como perspectivas futuras, pretende-se investigar novas arquiteturas, estratégias de aumento de dados mais avançadas e técnicas que promovam maior robustez e capacidade de generalização em cenários reais e datasets mais complexos. |