Bioeconomia: Diversidade e Riqueza para o Desenvolvimento Sustentável

22 a 24 de outubro de 2019

Trabalho 12737

ISSN 2237-9045
Instituição Universidade Federal de Viçosa
Nível Graduação
Modalidade Pesquisa
Área de conhecimento Ciências Exatas e Tecnológicas
Área temática Teoria e Tecnologia da informação
Setor Instituto de Ciências Exatas e Tecnológicas
Conclusão de bolsa Não
Primeiro autor Danilo Ferreira da Silva
Orientador LARISSA FERREIRA RODRIGUES
Título Classificação de imagens de endoscopia para detecção de anormalidades baseada em Redes Neurais Convolucionais
Resumo Os problemas de estômago estão cada vez mais comuns na vida das pessoas, gerando anormalidades como: gastrite, câncer, sangramentos e úlcera. O câncer de estômago é o quinto mais comum e a terceira causa de morte por câncer em todo o mundo e no Brasil é classificado como o terceiro tipo de câncer mais frequente em homens e o quinto entre as mulheres. O método convencional para auxiliar no diagnóstico e acompanhamento de doenças estomacais é a endoscopia digestiva. Se anormalidades são encontradas, uma biópsia é realizada e a amostra retirada é enviada para análise laboratorial. No entanto, a análise de imagens de endoscopia requer interpretação visual de um médico especialista, sendo uma tarefa subjetiva e demorada. O uso de técnicas de visão computacional é essencial para aplicações de diagnóstico médico auxiliado por computador e as imagens podem ser coletadas, compartilhadas e analisadas localmente em vários lugares, incluindo países emergentes. Portanto, a principal contribuição deste trabalho reside em aplicar técnicas de visão computacional, especificamente de Aprendizado Profundo considerando Redes Neurais Convolucionais (CNNs), para classificar imagens de endoscopia para identificação de anormalidades. As CNNs conseguem extrair representações hierárquicas de alto nível dos dados e superam os métodos tradicionais baseados em extração manual de características. O presente trabalho é o primeiro a utilizar CNNs para classificação automática de imagens de endoscopia do conjunto de dados EndoVis - disponibilizado para a competição MICCAI 2015, composto por 698 imagens e categorizadas em duas classes: saudáveis e com lesões. O conjunto de treinamento é composto por 465 imagens, sendo 205 imagens saudáveis e 260 imagens de lesões. O conjunto de teste é composto por 233 imagens, sendo 104 imagens saudáveis e 129 imagens de lesões. Também é avaliado o impacto do aumento de dados com treinamento baseado em fine-tuning. Além disso, a validação cruzada k-fold é usada para melhor estimar a acurácia e gerar resultados mais confiáveis. Para o pré-processamento das imagens são considerados os módulos Scikit-Image da linguagem Python e para a implementação das CNNs o framework PyTorch. Os resultados preliminares demonstram que a arquitetura ResNet-18 quando treinada em 50 épocas, com imagens sem pré-processamento e com aumento de dados baseado em cortes, flips horizontais, flips verticais e rotações de 45º a 325º com etapas de 25º, obtém uma acurácia próxima de 93%, significando um avanço no estado da arte. Os próximos passos desta pesquisa consistem em avaliar outras estratégias de aumento de dados e comparar outras arquiteturas CNNs. Por fim, espera-se definir um conjunto de técnicas baseadas em CNNs que permitirá a classificação e identificação eficiente de anormalidades em imagens de endoscopia e, assim, auxiliar os especialistas em medicina no diagnóstico e acompanhamento de doenças digestivas.
Palavras-chave doenças estomacais, classificação de imagens de endoscopia, redes neurais convolucionais.
Forma de apresentação..... Painel
Gerado em 0,61 segundos.