ISSN |
2237-9045 |
Instituição |
Universidade Federal de Viçosa |
Nível |
Graduação |
Modalidade |
Pesquisa |
Área de conhecimento |
Ciências Exatas e Tecnológicas |
Área temática |
Ciência da computação |
Setor |
Instituto de Ciências Exatas e Tecnológicas - Campus Rio Paranaíba |
Bolsa |
PIBIC/CNPq |
Conclusão de bolsa |
Sim |
Apoio financeiro |
CNPq |
Primeiro autor |
Matheus Vieira da Silva |
Orientador |
JOÃO FERNANDO MARI |
Outros membros |
LARISSA FERREIRA RODRIGUES |
Título |
Análise da influência de métodos de aumento de dados no treinamento de redes neurais convolucionais para classificação de células em imagens de microscopia |
Resumo |
O aumento de dados é um procedimento chave em muitas tarefas de classificação de imagens baseadas em aprendizado de máquina, principalmente para contornar o problema de treinar classificadores com conjuntos de imagens reduzidos. A maior parte dos trabalhos descritos na literatura selecionam as políticas de aumento de dados, assim como os parâmetros associados, de forma empírica. Entretanto, neste trabalho o aumento de dados é explorado como um problema de otimização. Os métodos propostos foram testados na classificação imagens de eritrócitos (glóbulos vermelhos) obtidas por microscopia e utilizadas no apoio ao diagnóstico da anemia falciforme. A anemia falciforme é uma doença hereditária causada por uma mutação genética na hemoglobina resultando na hemoglobina anormal S (HbS). Dessa forma, o eritrócito assume uma forma irregular tornando-se uma célula falciforme. Estima-se que anualmente cerca de 300.000 crianças nascem com anemia falciforme no mundo. Neste estudo, propõe-se uma abordagem para automatizar a seleção das melhores políticas de aumento de dados usando um algoritmo de otimização Bayesiana. Na abordagem proposta, as melhores políticas de aumento de dados são selecionadas automaticamente a partir dos próprios dados, as políticas são modeladas como variáveis de decisão e a acurácia do modelo é a função objetivo a ser maximizada. As estratégias de aumento de dados foram aplicadas durante o treinamento de três arquiteturas de redes neurais convolucionais: uma nova arquitetura leve, proposta para este problema (denominada Model-A) e duas arquiteturas clássicas (LeNet-5 e AlexNet). O conjunto de imagens utilizado foi o erythrocytesIDB. A abordagem proposta seleciona um conjunto de políticas de aumento de dados que, juntamente com os parâmetros, são utilizadas para treinar os modelos. Todos os experimentos foram validados usando validação cruzada k-fold com k = 5 e o melhor resultado foi 92,54% de acurácia considerando a arquitetura Model-A e a estratégia de aumento de dados por otimização Bayesiana. Os resultados sugerem que a seleção de políticas de aumento de dados usando otimização supera os resultados obtidos quando não se aplica aumento de dados ou outras estratégias para seleção das políticas são aplicadas. Até onde se tem conhecimento este é o primeiro trabalho a aplicar otimização das políticas de aumento de dados em imagens biomédicas e abre caminho para aplicações deste método em outras áreas. |
Palavras-chave |
imagens biomédicas, redes neurais convolucionais, aumento de dados |
Forma de apresentação..... |
Vídeo |