Resumo |
A cultura da soja ocupa um papel estratégico na economia brasileira e mundial, sendo amplamente utilizada na indústria alimentícia, na produção de rações e biocombustíveis, além de gerar significativa contribuição econômica. Contudo, o cultivo de soja é frequentemente ameaçado por pragas que afetam diretamente a produtividade. Nesse contexto, o controle eficaz dessas pragas depende da identificação precoce, fator crucial para a tomada de decisões no manejo agrícola. Este estudo tem como objetivo aplicar e comparar o desempenho de arquiteturas modernas de redes neurais profundas, ResNet-50 e Vision Transformer (ViT-B-16), na tarefa de classificar imagens de folhas de soja em três categorias: saudáveis, infestadas por lagartas (Caterpillar) ou infestadas por Diabrotica speciosa. A proposta visa automatizar e otimizar o processo de detecção, contribuindo para soluções práticas no campo. A pesquisa utilizou o banco de dados público Images of Soybean Leaves, composto por imagens obtidas em condições reais de campo. Os modelos foram treinados em ambiente Google Colab, com uso das bibliotecas PyTorch e Torchvision, adotando uma divisão de dados em 60% para treinamento, 20% para validação e 20% para teste. O treinamento seguiu configuração padrão de hiperparâmetros: taxa de aprendizado de 0,001, a função de perda foi a entropia cruzada, tamanho do lote 64 e 50 épocas de treinamento. O desempenho dos modelos foi avaliado por meio da matriz de confusão, permitindo o cálculo de métricas como acurácia, precisão, recall e F1-score. Os resultados preliminares mostraram que ambas as arquiteturas alcançaram desempenho satisfatório, com acurácia próxima de 93%, demonstrando bom equilíbrio entre as classes. A ResNet-50 apresentou convergência mais rápida, enquanto o ViT-B-16 obteve leve superioridade nas métricas. Apesar dos bons resultados, foram observados indícios de overfitting, ressaltando a necessidade de aprimorar as estratégias de aumento de dados (data augmentation). O projeto segue em andamento, com foco na aplicação de técnicas mais avançadas de data augmentation e ajustes finos de hiperparâmetros, visando elevar a acurácia e robustez dos modelos, além de melhorar sua capacidade de generalização. Este trabalho deve contribuir para o avanço de soluções baseadas em Visão Computacional aplicada à agricultura, oferecendo uma abordagem promissora para o diagnóstico precoce de pragas. A automação deste processo, apoiada por técnicas de aprendizado profundo, pode auxiliar agricultores na tomada de decisões mais rápidas e assertivas, otimizando o uso de recursos, minimizando perdas e promovendo a sustentabilidade no manejo da lavoura. |